Em Desenvolvimento
Esta documentação ainda está em desenvolvimento. Agradecemos sua paciência!
Pular para o conteúdo principal

Uma publicação com a etiqueta "ia"

Ver todas as etiquetas

🤖 Novo Módulo IA Gemini

· 3 min para ler
Filipe Santos
Desenvolvedor

🤖 IA Gemini: Classificação e Extração Inteligente de Documentos

Apresentamos o Módulo IA Gemini, a mais nova adição ao ecossistema Capture/HTF. Com ele, o sistema passa a utilizar o modelo de linguagem Google Gemini para entender, classificar e extrair informações de documentos automaticamente — sem regras manuais, sem OCR tradicional, sem configurações complexas de indexação.


O que o módulo faz? 🧠

O IA Gemini oferece três capacidades que podem ser combinadas em um único fluxo de captura:

  • Classificação automática: O Gemini analisa o conteúdo do PDF e identifica o tipo do documento — Nota Fiscal, Contrato, Boleto, ou qualquer outro tipo que você definir. 📄
  • Divisão inteligente (Splitter): Um único PDF com múltiplos documentos é automaticamente separado em arquivos individuais, com cada parte classificada pelo seu tipo. ✂️
  • Extração de campos: O sistema extrai informações específicas do documento — número, data, CNPJ, valor total — com base em instruções em linguagem natural que você mesmo escreve. 🔍

Como configurar? ⚙️

Tudo começa no ScanDesigner. A partir do ícone de Análise Inteligente de Documento na toolbar, você cria templates associados ao fluxo de captura aberto. Cada template representa um tipo de documento e reúne:

  • Um Prompt principal — a instrução que diz ao Gemini qual tipo de documento procurar.
  • Campos de extração — cada campo tem um ID, uma instrução de extração em linguagem natural e uma Expression em Ruby para validar ou transformar o valor retornado.

No ScanDesigner, o node App.ClassificableFile carrega automaticamente os templates cadastrados e cria um grupo de propriedades independente para cada tipo de documento, onde você configura destino, metadados, workflow e muito mais. Os valores extraídos pelo Gemini ficam disponíveis como variáveis no padrão #field_nomedofield#, podendo ser usados em qualquer propriedade do grupo.


Conferência e tratamento de erros 🛡️

Quando um documento não é reconhecido pelo Gemini, o módulo oferece duas saídas:

  • Conferência ativada: o documento é pausado e enviado para a fila do Capture Conference no Share, onde um operador pode preencher os dados manualmente ou recusar o documento.
  • Conferência desativada: o documento segue diretamente para as definições de recusa configuradas no node.

Múltiplas chaves de API 🔑

O módulo suporta o cadastro de múltiplas chaves de API do Google em alfresco-global.properties. O sistema gerencia automaticamente qual chave utilizar em cada requisição, alternando de acordo com a disponibilidade de tokens — garantindo continuidade mesmo quando um limite é atingido.

O histórico completo de chamadas ao Gemini pode ser consultado na página 3rd Integrations - Gemini no Alfresco Share.


Saiba mais 📚

Consulte a documentação completa do módulo para entender como criar templates, configurar campos, usar variáveis no ScanDesigner e administrar as chaves de API:

👉 Documentação: IA Gemini