Google lança nova ferramenta de busca para dados científicos

Plataforma Dataset Search foi desenhada para facilitar o acesso a conjuntos de dados dispersos em milhares de repositórios.

FÁBIO DE CASTRO

Voltada especialmente para a comunidade acadêmica, uma nova ferramenta de busca lançada pela Google promete facilitar o acesso de pesquisadores a conjuntos de dados científicos que atualmente estão pulverizados em milhares de repositórios online mantidos por instituições de pesquisa.

Lançada em setembro, a ferramenta, chamada Dataset Search, ajuda pesquisadores a encontrar facilmente os dados completos de estudos disponíveis em repositórios dos mais variados tipos – como sites de editoras, agências governamentais e instituições de pesquisa, em bibliotecas digitais e em páginas pessoais de cientistas, por exemplo.

A empresa já havia lançado um serviço voltado para a comunidade científica, o Google Scholar – em português Google Acadêmico –, que é uma ferramenta de busca de artigos e relatórios de pesquisa. Havia demanda, porém, para um sistema de busca específico para dados, já que, segundo a empresa, “no mundo atual, cientistas de muitas disciplinas e um número crescente de jornalistas vivem e respiram dados” e eles estão dispersos na internet.

Bons resultados

A nova ferramenta será de grande importância para a ciência, especialmente em áreas que utilizam grandes volumes de dados, segundo o professor Marcelo Finger, chefe do Departamento de Ciências da Computação do Instituto de Matemática e Estatística (IME) da Universidade de São Paulo (USP).

“É surpreendente que a Google, que lida com um público da ordem de bilhões de usuários, lance mais uma ferramenta voltada para a comunidade científica, que é um público numericamente limitado. Mas ela será sem dúvida muito importante para a comunidade”, disse Finger.

Convidado por Direto da Ciência para testar o Dataset Search, Finger – que é um dos coordenadores da área de Ciência e Engenharia da Computação da Fapesp – considerou a ferramenta útil para aumentar a disponibilidade de dados.

“Fiquei bem impressionado e cheguei a recomendar para um aluno. Ainda há algumas limitações – notei, por exemplo, que quando se faz uma busca só aparecem os dez primeiros resultados. Mas, do ponto de vista científico, para quem desenvolve trabalhos com bases em dados, já é muito útil. A disponibilidade de dados é fundamental para a ciência, porque permite elevar o grau de reprodutibilidade das pesquisas”, disse Finger.

Maior disponibilidade de dados

O pesquisador diz acreditar que o Dataset Search crescerá rapidamente. “Quem possui dados de pesquisa em um repositório, ou é responsável por uma biblioteca de dados online, vai se interessar por tornar seus dados mais disponíveis e por indexá-los na ferramenta”, afirmou.

Natasha Noy, pesquisadora em inteligência artificial da Google, divulgou que a empresa estimulará fornecedores de dados a adotarem o padrão aberto desenvolvido pela empresa para descrever as informações relacionadas a seus dados, aos metadados e à própria instituição que os produziu.

“Desenvolvemos diretrizes para que os fornecedores de conjuntos de dados descrevam seus dados de uma forma que o Google possa entender melhor o conteúdo das páginas: quem criou, quando foi publicado, como os dados foram coletados, quais são os termos de uso, etc.”, disse a pesquisadora no Blog da Google.

“Notei que, além de dar acesso aos conjuntos de dados, a ferramenta também indica artigos da literatura científica que mencionam, utilizam, ou descrevem esses dados. Acredito que será de grande utilidade em todas as áreas do conhecimento – biologia, linguística, física, oceanografia e assim por diante. Minha área de pesquisas, em processamento de linguagem natural, vai se beneficiar muitíssimo”, afirmou Finger.

Segundo Natasha Noy, a ferramenta foi lançada com foco em dados de ciência ambiental, ciências sociais e de pesquisa governamental, mas a quantidade de conjuntos de dados disponível aumentará continuamente à medida que o serviço se torne mais popular.

“Esse tipo de busca tem sido um sonho para muitos pesquisadores nas comunidades de dados abertos de ciência”, disse ao blog da Google o chefe da área de dados da agência Administração Oceânica e Atmosférica Nacional dos Estados Unidos (NOAA, na sigla em inglês), Ed Kearns.

“Para a NOAA, cuja missão inclui o compartilhamento de nossos dados com outros cientistas, essa ferramenta é chave para que tornemos nossas informações mais acessíveis para uma comunidade de pesquisadores cada vez maior”, disse Kerns.

Na imagem acima, sede da Google em Mountain View, na California, Estados Unidos. Foto: Noah Loverbear, sob licença Creative Commons Attribution-Share Alike 3.0 Unported.

 

 

Fonte: http://www.diretodaciencia.com

Deixe uma resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *