Crono.Data: entre os paradigmas da ciência de dados e da ciência aberta

0
Figura 1: Layout de apresentação da ferramenta.

As potencialidades do Crono.Data para a visualização de constelação de autoras(es), de menções, de citações, de dicionários lexicográficos, contribuem para as pesquisas em história da historiografia, em história intelectual, em história conceitual, em história das ideias, em história da recepção e em teoria da história, além de espaços de trabalho afins, por intermédio de saberes transdisciplinares. Envolvem-se saberes filosóficos, linguísticos, matemáticos, artísticos e, até mesmo, âmbitos de conhecimento considerados mais distantes, como a computação. Abre-se todo um horizonte para as data science em humanidades em geral.

Figura 1: Layout de apresentação da ferramenta.

Figura 1: Layout de apresentação da ferramenta.

Fonte: Crono.Data

Se por um longo tempo as humanidades e as ciências apresentaram poucos canais dialógicos consistentes, mantendo-se, majoritariamente, junto aos debates sobre conhecimentos do espírito e saberes da natureza no século XIX, ou então às contribuições da linguagem analítica, atualmente essa interação pode ser redesenhada a partir das chamadas humanidades digitais. Dito isso, e avançando na argumentação, a iniciativa de construir um banco de dados para pesquisa em história veio de uma situação adversa criada pela pandemia, o que movimentou pelo mundo iniciativas correlatas e inspiradoras. Em meio a situação em que os arquivos estavam fechados, sendo impossível o acesso a documentos pouco estudados sobre a variedade do discurso histórico, as obrigatoriedades nas rotinas das pesquisadoras e dos pesquisadores foi alterada, sendo as investigações impactadas pela contingência.

Nesse processo, o qual deixamos em evidência para conhecerem a história do Crono.Data. passou-se, então, ao desenvolvimento de todo um sistema de indexação de documentos históricos, capaz de realizar buscas e visualização de conceitos, de categorias, de palavras-chave, de expressões, de constelações de autores(as) (ou intelectuais isolados(as)), além de citações.[1] O intuito foi, e ainda é, o de contribuir com a pesquisa pública e de qualidade desenvolvida em nosso país, sobretudo, em diálogo com os paradigmas atuais da ciência aberta e, também, com as novas políticas de gestão de dados. Esforço sendo motivado, ainda mais, face ao evento da pandemia e suas consequências.

Ao longo das pesquisas para o desenvolvimento do Crono.Data, deparamo-nos com o movimento pensante denominado Humanidades Digitais, que consiste em ver o digital como uma nova camada interpretativa, a partir de perspectivas epistemológicas específicas, sobrepostas aos, antes, saberes estabelecidos.[2] Nesse processo, que contou com interlocutoras(es) importantes, sobretudo aquelas(es) atuantes no Centro de Humanidades Digitais (CHD), sediado na Unicamp, foi debatido as escolhas das ferramentas, das linguagens de programação, do formato dos arquivos capazes de modificar as experiências das pessoas na interação com a tecnologia, sejam elas cientistas da computação ou não. Tudo foi pensado, e o software está, ainda, em desenvolvimento, para o acesso democrático do conhecimento.[3]

De maneira geral, buscaremos algumas explicações propedêuticas, as linguagens de programação podem ser divididas em linguagens de baixo e alto nível, sendo a classificação dada conforme a proximidade ao nível de programação de máquina, como o código binário e o assembly. Linguagens como o C, que compõe boa parte dos sistemas operacionais Windows e Linux, podem ser consideradas de baixo nível, principalmente se comparada com linguagens como o Java. O nível da linguagem é dado conforme a sua capacidade de abstração. Segundo Robert W. Sebesta, cada linguagem de programação oferece possibilidades e restrições diferentes ao representar os elementos do mundo através de dados.[4] Linguagens como o Python, por estarem mais próximas da linguagem humana, exigem menos abstrações computacionais, sendo uma das preferidas quando o assunto é ciência de dados, em razão da sua facilidade e da sua versatilidade. É como escrever uma carta em inglês para o computador respeitando uma determinada configuração. Durante toda essa dinâmica foram feitas escolhas e estabelecidos critérios para se chegar ao resultado desejado. Dessa forma, foram desenvolvidos métodos alicerçados nas ciências de dados, objetivando o controle total sobre o processo de criação das informações e do conhecimento.

Figura 2- Curva do uso da palavra historiografia considerando os acervos históricos digitalizados da Revista do IHGB, Biblioteca Brasiliana Guita y José Mindlin, Junta de História e Numismática Americana e Biblioteca de Obras Raras da UFRJ.

 Fonte: Crono.Data

Nesse sentido, o Chorono.Data é um visualizador de dados desenvolvido para pesquisas plurais em que se pode analisar constelações autorais, oferecendo a oportunidade do rastreamento de grandes epistemes.[6] O Chorono.Data é, para que se possa ser entendido, apenas a interface visual dos dados que colhemos com métodos variados. Basicamente, após transferir os documentos históricos digitalizados, eles são processados por um Reconhecimento Ótico de Caracteres (OCR), página por página, e convertidos novamente em texto. Em seguida realizamos as pesquisas por motores de busca e rotulamos os termos que são pertinentes, convertendo os textos tradicionais em matrizes de bancos de dados. As matrizes são cruzadas interativamente pelo Visual Basic retornando gráficos que possibilitam outra representação dos dados. No caso de documentos históricos digitalizados opera-se, pois, uma conversão, porque são estruturas analógicas representadas no digital. Conforme escreveu Lev Manovich: “é bem adequado (e mais interessante) usar o termo mapeamento, para descrever o que as novas mídias fazem às mídias antigas”, porque os “softwares permitem-nos re-mapear os objetos das mídias antigas em novas estruturas[7]

A aproximação entre as humanidades e outras áreas do saber também ocorre pelos ideais da ciência aberta, que demandam o compartilhamento de dados sobre uma pesquisa enquanto ela se realiza. Estão surgindo plataformas especializadas na divulgação dos dados, respeitando os critérios autorais e permitindo mais dinâmica na produção do conhecimento. O Repositório de Dados de Pesquisa (REDU), da Unicamp, ou o Enslaved, da Journal of Slavery and Data Preservation, são exemplos das novas práticas de pesquisa, em vias de tornarem-se tendência, para o século XXI. É como se uma historiadora ou um historiador pudesse compartilhar os seus fichamentos e os seus recortes de documentos históricos para dar maior abertura para entender como chegaram às suas conclusões, bem como oferecer materiais extras (suplementos?) além da tradicional narrativa histórica. Tal procedimento é extremamente rico para a história da historiografia, que procura problematizar as diversas camadas sobrepostas na composição de um texto, em um movimento feito de trás para frente.

Nesse sentido, convidamos todas e todos a conhecerem e navegarem pela ferramenta, que ainda está sendo aperfeiçoada. Por hora possui versão apenas para computador e as aplicações ainda estão no formato beta (estágio). Convidamos as nossas comunidades científicas e educadoras, além de qualquer cidadão e de qualquer cidadã interessados, para caminhar por sua interface e por seus recursos já disponíveis. Sugestões de periódicos, temas, conceitos, redes intelectuais são bem-vindas para indexar no banco de dados.

 

 

 


NOTAS

[1] A ferramenta Crono.Data pode ser acessada em <humanistasdigitais.coml> ou <chd.ifch.unicamp.br>. Todos os dados citados nesta pesquisa bem como outros dados já indexados podem ser visualizados com alguns clicks. Para mais detalhes sobre os procedimentos adotados Cf. Rota, Alesson R.. 2022. «El Uso De La minería De Datos Como heurística Para La teoría De La Historia Y La Historia De La historiografía». Amoxtli, n.º 7 (mayo). Santiago, CL. https://doi.org/10.38123/amox7.205. ROTA, Alesson R. Mineração de História em Arquivos Digitalizados. NICODEMO et al.  Caminhos da História Digital no Brasil. Vitória: Edirota Mil Fontes.2021.

[2] NICODEMO, Thiago, ROTA; Alesson; Ian, Marino. Introdução: Das humanidades digitais à história digital. IN: Caminhos da História Digital no Brasil. Vitória: Edirota Mil Fontes.2021.

[3] MANOVICH, Lev. The language of new media. MIT press, 2002.

[4] SEBESTA, Robert W. Conceitos de linguagens de programação. 9. ed. – Dados eletrônicos. – Porto Alegre: Bookman, 2011.

[6] Realizamos um estudo sobre diversas ferramentas de visualização de dados, como Data Studio, Tableau, Data Deck, SemRush e o Power Bi foi o que apresentou mais recursos disponíveis na versão gratuita.

[7] MANOVICH, Lev. Visualização de dados como uma nova abstração e anti-sublime. IN: LEÃO, Lúcia. Derivas: Cartografias do ciberespaço. São Paulo: Sesc. P.151.

 

 

 


Créditos na imagem: Fonte: Crono.Data

 

 

 

SOBRE O AUTOR

Piero Detoni

Historiador, professor e psicanalista. Graduado e mestre em História pela UFOP, doutor em História Social pela USP e pós-doutor em História pela UNICAMP. Realiza pesquisa de pós-doutoramento na UFRRJ com bolsa Faperj Nota 10. Em sua tese de doutorado, abordou a experiência historiográfica no IHGB na Primeira República. Estuda, atualmente, a recepção da filosofia de Friedrich Nietzsche no Brasil. Tem interesse nos seguintes temas: Teoria da História, História da Historiografia, História Intelectual, História da Leitura e da Recepção, Ensino de História, além de História do Brasil Republicano e História Moderna e Contemporânea.

SOBRE O AUTOR

Alesson R. Rota

Sou historiador, doutorando pela Unicamp e entusiasta de tecnologias. Nas horas vagas dedico-me ao canal História da História.

No comments

Veja:

Uma flor metálica

Silêncios doem como doem as lâminas de facas afiadas e perfuram como as palavras que de tão certeiras, não vieram. Sentenças não ditas Ficam ferroando, ...