Plataforma do INCT-Materials Informatics consolida banco de dados estratégico para ciência de materiais

O Instituto Nacional de Ciência e Tecnologia em Materials Informatics (INCT-Materials Informatics) acaba de colocar em operação uma plataforma que representa um avanço significativo para a ciência de materiais no Brasil. Trata-se da Materials Informatics Database (MIDB), um banco de dados público e altamente flexível, desenvolvido para armazenar, organizar, visualizar e compartilhar dados experimentais e computacionais produzidos na área. A plataforma já está disponível em www.midb.cloud e começa a ser utilizada em artigos científicos publicados por pesquisadores do próprio INCT-Materials Informatics.
Desde a concepção do projeto do INCT-Materials Informatics, a criação de um banco de dados aberto foi pensada como uma das principais entregas da iniciativa. “A base de dados já estava prevista no projeto submetido ao CNPq. A ideia sempre foi criar uma plataforma pública, com dados fáceis de acessar, filtrar e fazer o download”, explica James Moraes de Almeida, pesquisador do INCT e um dos responsáveis diretos pelo desenvolvimento da MIDB.
Dados diversos, infraestrutura flexível
A MIDB foi concebida para ser o mais abrangente e flexível possível. Atualmente, a plataforma já recebe dados de simulações computacionais, com suporte implementado para o código VASP, amplamente utilizado na ciência de materiais, e com integração em andamento para outros softwares, como Quantum Espresso, SIESTA e ORCA, sendo estes de código aberto.
Além das simulações, a base também armazena dados experimentais, como espectros de absorção de raios-X, incluindo conjuntos de dados minerados diretamente da literatura científica. Outro diferencial é a incorporação de informações obtidas por meio de processamento de linguagem natural, utilizando modelos de linguagem para extrair e estruturar dados de artigos científicos.
“São dados muito variados. Para cada tipo de informação, são desenvolvidos códigos específicos que processam e analisam os dados. Isso permite que o usuário visualize gráficos, espectros, estruturas cristalinas ou moleculares de forma direta e intuitiva”, detalha James.
“O progresso da humanidade sempre esteve associado a descoberta de novos materiais. Agora, na era da Inteligência Artificial, precisamos alimentá-la com dados. Este é o nosso objetivo com a criação do MIDB”, comenta Adalberto Fazzio, coordenador do INCT-Materials Informatics.
Visualização, download e acesso programático
Um dos pontos fortes da plataforma é a forma como os dados podem ser acessados. O usuário pode realizar downloads diretamente pelo site, selecionando entradas específicas ou conjuntos completos de dados. Nesse caso, o sistema gera automaticamente um arquivo e envia um link por e-mail para o pesquisador.
Outra funcionalidade é o acesso via API (Application Programming Interface), que permite consultas e downloads de forma programática. “O pesquisador pode usar a API dentro do seu próprio código, em Python ou qualquer outra linguagem, aplicar filtros — como tipo de átomo, método de simulação ou propriedades calculadas — e fazer download dos dados diretamente, sem precisar entrar no site”, explica James.
Ciência aberta e apoio à publicação científica
A MIDB também foi pensada para atender às exigências crescentes de ciência aberta, cada vez mais presentes em revistas científicas internacionais. A plataforma já foi utilizada como infraestrutura de dados em um artigo recentemente publicado na npj Computational Materials, por pesquisadores ligados ao INCT.
Segundo James, a base permite tanto o compartilhamento público quanto o acesso restrito a dados durante o processo de revisão por pares. “O pesquisador pode enviar seus dados, manter tudo privado e gerar um link seguro para compartilhar apenas com editores e revisores. É uma chave aleatória, impossível de ser deduzida, garantindo segurança durante a avaliação do artigo”, afirma.
Alternativa estratégica para o Brasil
Embora existam bases de dados consolidadas no exterior, como Materials Project, NOMAD e Materials Cloud, o desenvolvimento de uma plataforma nacional é visto como estratégico. “Essas bases estão hospedadas nos Estados Unidos, Alemanha ou Suíça. É importante termos uma alternativa brasileira, pelo menos para os dados produzidos aqui. Nunca sabemos se, por questões geopolíticas ou econômicas, o acesso a plataformas externas pode ser restringido no futuro”, destaca James.
“Estamos oferecendo à comunidade nacional um serviço importante, que nem todos os países são capazes de prover. Um trabalho totalmente nacional, o que significa que são tecnologias e desenvolvimentos que tivemos que dominar localmente e que vai gerar aqui uma massa crítica para desenvolvimento desse tipo de tecnologia”, disse Augusto Alves Junior, responsável pelo projeto e pós-doutorando sênior do INCT-Materials Informatics.
Inicialmente, a base está sendo alimentada majoritariamente por dados de pesquisadores vinculados ao INCT-Materials Informatics, o que garante uma massa crítica de informações. A expectativa, no entanto, é ampliar o alcance gradualmente. “Qualquer pessoa já pode criar uma conta e explorar a plataforma. No futuro, com mais dados disponíveis, a ideia é atrair cada vez mais pesquisadores, inclusive de fora do Brasil”, afirma.
Segurança e desafios técnicos
Entre os principais desafios enfrentados no desenvolvimento da MIDB está a segurança da plataforma. “Os dados são públicos, mas precisamos garantir que ninguém invada o sistema, apague informações ou comprometa a infraestrutura. Por isso, trabalhamos com múltiplas camadas de segurança e backups em diferentes locais”, explica James.
Outro desafio é justamente a flexibilidade. “A maioria das bases de dados suporta apenas um tipo de código ou dado. Nosso objetivo é permitir diferentes formatos, diferentes softwares e diferentes tipos de informação, sem perder a qualidade da visualização e da análise”, completa.
Com uma infraestrutura robusta, visualização amigável e alinhamento com os princípios da ciência aberta, a MIDB se consolida como uma ferramenta estratégica para a pesquisa em ciência de materiais e um passo importante para a soberania científica e tecnológica do Brasil.
Antonio Augusto Alves Jr, o responsável pela arquitetura e desenvolvimento do DB, tem tomado todo o cuidado para implementar especificações de segurança estritas, sem perder de vista a usabilidade da interface e desempenho das operações.
Confira tutorial completo para o uso do MIDB:

