Pós-Graduação em Ciência da CompTutação – UFPE

Defesa de Tese de Doutorado Nº 643

Aluno: Rodrigo Barros Bernardino
Orientador: Prof. Rafael Dueire Lins
Título: Assessing Binarization Algorithms for Document Images
Data: 09/09/2024
Hora/Local: 11h – Virtual – Interessados em assistir entrar em contato com o aluno
Banca Examinadora:

Prof. Silvio de Barros Melo (UFPE / Centro de Informática)
Prof. Cleber Zanchettin (UFPE / Centro de Informática)
Prof. Steve J. Simske (Colorado State University – USA / Systems Engineering)
Prof. Valdemar Cardoso da Rocha Junior (UFPE / Departamento de Eletrônica e Sistemas)
Prof. Gabriel de França Pereira e Silva (UFRPE / Unid. Acadêmica do Cabo de Santo Agostinho)

RESUMO:

Os algoritmos de binarização desempenham um papel crucial no processamento, análise, compressão e reconhecimento de documentos. O desempenho desses algoritmos é significativamente influenciado por várias características dos documentos, como a textura do papel e o ruído. Esta tese apresenta novos algoritmos e metodologias para avaliar os algoritmos de binarização, com foco na qualidade da imagem, tempo de processamento e tamanho do arquivo. Em torno de setenta esquemas de binarização foram testados utilizando cinco versões diferentes de documentos históricos e modernos, incluindo imagens
digitalizadas e fotografadas. Uma inovação importante deste trabalho é o desenvolvimento de uma ferramenta automática de seleção de algoritmos de binarização baseada na textura do papel, que demonstrou resultados satisfatórios em diversos casos. Além disso, a tese aborda a crescente importância dos documentos capturados por smartphones. Três novas medidas de avaliação para este tipo de documento foram propostas e extensivamente testadas: a proporção de pixels pretos na imagem binária, uma versão normalizada da distância de Levenshtein e uma combinação de ambas. Essas medidas foram aplicadas em uma avaliação de imagens capturadas por dispositivos móveis envolvendo seis dispositivos amplamente utilizados, sobdiferentes condições, incluindo configurações de flash, ângulo de captura e variações de posição. O tamanho da imagem comprimida usando o esquema de compressão TIFF Grupo 4 provou ser uma métrica valiosa para fornecer uma avaliação mais holística da eficácia dos algoritmos. Finalmente, este trabalho resultou em uma expansão significativa dos conjuntos de dados existentes para binarização de imagens de documentos, com a adição de 24 novas imagens de documentos históricos com ground-truth gerado manualmente e 296 novas imagens capturadas por dispositivos móveis.

Palavras-chave: Algoritmos de binarização; documentos históricos; documentos escaneados; documentos fotografados; smartphones; avaliação de desempenho

Comentários desativados

Sobre este site

Portal institucional do Centro de Informática – UFPE

Encontre-nos

Endereço
Av. Jornalista Aníbal Fernandes, s/n – Cidade Universitária.
Recife-PE – Brasil
CEP: 50.740-560

Horário
Segunda–Sexta: 8:00–18:00