23/11/2024
Favor marcar esta página.
óptico caracteres reconhecimento (OCR)
é a conversão eletrônica ou mecânica de imagens de texto digitado, manuscrito ou impresso em texto codificado por máquina, seja de um documento digitalizado, uma foto de um documento, uma foto de cena (por exemplo, o texto em placas e outdoors em uma paisagem fotografia), ou do texto da legenda sobreposto a uma imagem (por exemplo: de uma transmissão de televisão).
Amplamente utilizado para inserir dados de registros impressos em papel – sejam passaportes, faturas, extratos bancários, recibos computadorizados, cartões de visita, correspondências, impressões de dados estáticos ou qualquer outra documentação adequada – é um método comum de digitalização de textos impressos para que possam ser editado eletronicamente, pesquisado, armazenado de forma mais compacta, exibido on-line e usado em processos de máquina, como computação cognitiva, tradução automática e (extraído) texto-para-sp OCR é um subcampo de estudo de reconhecimento de padrões que engloba inteligência artificial e visão computacional.
As versões anteriores exigiam treinamento com fotografias de personagens individuais e trabalhavam em um único tipo de letra por vez. Sistemas avançados capazes de fornecer um alto grau de precisão de identificação para a maioria dos tipos de letra estão agora amplamente disponíveis, assim como sistemas que aceitam vários formatos de arquivos de imagens digitais como entradas. Certos sistemas são capazes de replicar a saída formatada o mais semelhante possível à página original, incluindo gráficos, colunas e outros componentes não textuais.