Receba o boletim diário da Aleteia gratuitamente no seu email.
Aleteia

Como a inteligência artificial está ajudando a decifrar os códigos do Arquivo Secreto do Vaticano

VATICAN SECRET ARCHIVES
Fregonese Daniele | Vatican Secret Archives | AFP
Compartilhar
Comentar

Um novo software pode fazer com que séculos de documentos escritos em latim sejam disponibilizados na internet

O Archivum Secretum Vaticanum ou Arquivo Secreto do Vaticano (ASV) parece algo tirado das teorias conspiratórias de ficção, bem ao estilo do escritor Dan Brown.

Mas, na realidade, os ASV são simplesmente um conjunto de arquivos privados (melhor tradução para a palavra “secretum”) do Papa. Porém, desde que o Papa Leão XIII abriu o arquivo a alguns estudiosos, em 1881, ele deixou de ser particular.

Teoricamente, desde o século VIII, todos os textos, documentos históricos, atas promulgadas pelo Vaticano, livros de contas e correspondências dos papas estão disponíveis aos pesquisadores qualificados para isso.

O único problema é que o enorme volume de arquivos os torna virtualmente inacessíveis.

De acordo com um artigo de Sam Kean publicado no The Atlantic, dos 85 quilômetros de fila de estantes do Arquivo Secreto do Vaticano, somente poucos milímetros de páginas foram escaneados, transcritos e preparados para ficarem acessíveis aos serviços de busca na internet.

Agora, o In Codice Ratio, um programa que utiliza inteligência artificial e reconhecimento ótico de caracteres (OCR) para transcrever automaticamente conteúdos, está sendo utilizado para digitalizar os arquivos do Vaticano.

Porém, segundo Kean, o OCR faz maravilhas com documentos escritos à máquina, mas não pode processar o texto manuscrito. As letras tendem a se misturar e nem sempre o que se encontram são “exemplos claros e nítidos” das letras que supostamente representam.

É aí que entra em jogo a inteligência artificial. Os pesquisadores recrutaram estudantes de um instituto italiano sem nenhum conhecimento em latim medieval. Com base em exemplos de letras que o software de OCR já havia identificado, os estudantes deveriam comprovar se elas correspondiam ou não aos símbolos corretos. Tudo o que eles tinham que fazer era comprovar os padrões visuais. O software anotou os apontamentos que os estudantes fizeram e corrigiu os erros.

Quando o projeto teve início, “a ideia de envolver os estudantes era desacreditada”, contou Paolo Merialdo, cientista da Codice Ratio. “Mas, agora, a máquina está aprendendo com os esforços dos estudantes. É incrível como uma pequena e simples contribuição de muitas pessoas pode ajudar a solucionar um problema tão complexo”, comemora Paolo.

Transcrever ao computador os antigos escritos também não está sendo tarefa simples. Um terço das palavras continha erros, o que atrapalhava a leitura. Mas o trabalho já foi considerado um grande avanço.

“As transcrições imperfeitas podem oferecer informações suficientes sobre o contexto do manuscrito em questão”, contou Merialdo a Kean.

Além disso, os cientistas que estão por trás do projeto esperam que o software melhore com o tempo, já que, quanto mais se aprende com a inteligência artificial, melhores são os resultados obtidos.

Para ler o artigo completo do The Atlantic (em inglês), clique aqui.

 

Tags:
vaticano