OCR Full
O OCR (Optical Character Recognition) Full, ou reconhecimento óptico de caracteres completo, é uma técnica utilizada no processo de digitalização de documentos para converter todo o texto presente em uma imagem digitalizada em texto pesquisável.
Em termos simples, quando um documento é digitalizado, ele é convertido em uma imagem. O OCR Full é aplicado para identificar e extrair todo o texto contido nessa imagem, convertendo-o em formato digital, o que possibilita a pesquisa e indexação eficientes do conteúdo do documento.
Essa técnica é especialmente útil quando se deseja preservar o conteúdo textual de documentos físicos ou de imagens digitalizadas, permitindo que esses documentos sejam facilmente acessíveis, pesquisáveis e editáveis em formatos digitais. O OCR Full é amplamente utilizado em ambientes onde a manipulação e processamento eficientes de grandes volumes de documentos são necessários, como em escritórios, bibliotecas, arquivos e empresas que lidam com documentos em papel.
Esta funcionalidade pode ser habilitada no App.File(Arquivo) → Pesquisável (OCR)
O ECM Alfresco Community possui mecanismo para extração de texto de documentos já pesquisáveis e armazenamento de tais dados como metadados, permitindo assim uma busca rápida por palavras chaves contidas no corpo do documento.
Saiba mais sobre esta funcionalidade em: https://docs.alfresco.com/content-services/7.4/using/search/
Atenção: Ao utilizar este recurso, verifique as variáveis abaixo para o correto dimensionamento da infraestrutura computacional:
- O volume de documentos digitalizados (Páginas/dia);
- Quantidade de dispositivos de captura (Scaners/Mobile etc.) a serem utilizados simultaneamente
- Tipo de documento (Quantidade de texto/tamanho de pagina/Resolução etc).
- Outros fluxos de digitalização com tratamentos pesados(Leitura codigos de barras, auto rotacionamento,etc) que planeja executar simultaneamente.