Pessoal,
estou elaborando um algoritmo para reconhecer campos de formulários digitalizados utilizando visão computacional. Estou trabalhando principalmente com openCV e mahotas, ambas bibliotecas para visão computacional, além do ambiente de desenvolvimento do Google Colab.
O algoritmo consiste em localizar e extrair formas geométricas retangulares, categorizando-as como campos de escrita.
Este algoritmo cumpre o objetivo didático, logo que na prática existem outras características relevantes ao extrair campos de formulários padronizados que devem ser consideradas, uma vez que , a estrutura do formulário pode variar, a escrita pode extrapolar o retângulo, entre outros...
O experimento foi realizado em uma guia do tipo SP/SADT no padrão TISS. As imagens a seguir mostram os resultados na seguinte sequência: 1) guia original; 2) após aplicação de filtros; 3) após identificação das formas; por fim, extração dos campos.
1)
