IA falha em distinguir sinais de nova física, revela pesquisa de Princeton

A inteligência artificial tem sido saudada como ferramenta capaz de acelerar a descoberta de leis ainda desconhecidas da Natureza. Contudo, um estudo conduzido por Veena Krishnaraj e Adrian Bayer, da Universidade de Princeton (EUA), conclui que os modelos atuais de IA podem estar presos justamente ao conhecimento que buscam superar. Os resultados indicam que, ao se apoiar em dados gerados por teorias já consolidadas, os algoritmos tendem a interpretar como “velhos conhecidos” sinais que poderiam apontar para novas explicações físicas.

Dependência de dados consolidados cria bloqueio cognitivo

O ponto de partida da investigação foi o modelo cosmológico padrão Λ-CDM, pilar teórico que descreve a expansão do Universo, a distribuição de galáxias e diversos outros fenómenos observáveis. Embora bem-sucedido, esse arcabouço não responde a questões críticas sobre matéria escura, energia escura, neutrinos massivos e possíveis anomalias gravitacionais. Detectar essas lacunas é a porta de entrada para uma “nova física”, objetivo que motivou o uso extensivo de IA em laboratórios e observatórios ao redor do mundo.

Para avaliar o real potencial dos algoritmos, a equipa de Princeton analisou conjuntos vastos de simulações numéricas. Primeiro, treinou redes neurais exclusivamente em dados gerados pelo Λ-CDM. Depois, introduziu cenários alternativos que incorporam partículas com massa (neutrinos) ou pequenas variações na força da gravidade. A expectativa era que o sistema identificasse diferenças sutis e, assim, sugerisse interpretações além da teoria convencional.

Em vez disso, emergiu o fenómeno conhecido como transferência negativa. Diante de efeitos não previstos pela física padrão, a rede neural recorria a parâmetros familiares para explicar o que “via”. Foi o caso da influência de neutrinos massivos, cujas assinaturas se confundiram com variações no parâmetro σ₈ — indicador da intensidade de agrupamento da matéria já presente no Λ-CDM. Resultado: o algoritmo atribuiu o novo comportamento a uma simples oscilação de um fator antigo, mascarando qualquer pista de física inexplorada.

Transferência negativa desafia aplicações cosmológicas

Segundo Krishnaraj, a transferência negativa não se manifesta ao acaso; ela decorre de degenerescências físicas — situações em que diferentes parâmetros produzem fenómenos visivelmente semelhantes. “Quando dois mecanismos geram padrões quase idênticos, a IA prefere a explicação que já ‘conhece’”, observou a pesquisadora. A consequência prática é grave: variações impulsionadas por novas partículas ou forças podem permanecer invisíveis sob o verniz de interpretações consagradas.

O problema ganha dimensão adicional devido ao volume de dados estudado na cosmologia contemporânea. Experiências como o telescópio espacial James Webb, o observatório Vera C. Rubin ou mesmo colisores de partículas produzem terabytes de informação diariamente. Filtrar, classificar e comparar cada evento sem auxílio computacional robusto é inviável. Por isso, a comunidade depositou grandes esperanças em redes neurais profundas e modelos generativos. A pesquisa de Princeton chama atenção para o risco de essas ferramentas travarem num ciclo autorreferente, reproduzindo a teoria que deveriam contestar.

Aprendizagem por transferência: avanço com limites

Para contornar parte das limitações, Bayer testou a aprendizagem por transferência. O método resume-se a dois passos: primeiro, um pré-treinamento em simulações relativamente baratas do Λ-CDM; em seguida, o refinamento em conjuntos menores, porém mais complexos, que incluem cenários de nova física. A estratégia reduziu em mais de dez vezes a quantidade de simulações de alta precisão necessárias para atingir um nível mínimo de desempenho, economia relevante em termos de custo computacional.

IA falha em distinguir sinais de nova física, revela pesquisa de Princeton - TECNOLOGIA E INOVAÇÃO

Imagem: TECNOLOGIA E INOVAÇÃO

Entretanto, o alívio não veio sem ônus. O mesmo pré-treinamento que acelerou a convergência reforçou a propensão do sistema a aplicar rótulos antigos sobre dados inéditos. Em outras palavras, a transferência negativa permaneceu ativa, apenas em etapa posterior. “Ganhamos velocidade, mas também herdamos o viés”, resumiu Bayer. Como consequência, as redes continuam pouco sensíveis a fenómenos que escapam aos contornos da teoria padrão.

Implicações para o futuro da pesquisa em física fundamental

Os autores sustentam que, apesar das barreiras identificadas, a IA segue promissora para explorar espaços de parâmetros onde métodos tradicionais esbarram em limites práticos. Porém, advertem que os modelos precisarão “desaprender” parte do conhecimento assimilado para tornarem-se realmente criativos em contextos científicos. Entre as possíveis soluções em discussão estão:

desenvolver algoritmos com penalização explícita para ajustes excessivos a hipóteses preexistentes;
criar conjuntos de dados sintéticos onde novos fenómenos sejam reforçados artificialmente, exigindo que a rede neuronal os reconheça como entidades distintas;
introduzir etapas de verificação estatística independentes da fase de treinamento, de modo a rastrear quando uma explicação padrão está a ser aplicada de forma inadequada.

Outra frente envolve a própria cultura de pesquisa. Várias equipas avaliam que a colaboração entre especialistas em física teórica e cientistas de dados precisa ser intensificada. A ideia é operar modelos de IA não como caixas-pretas, mas como sistemas cujas decisões possam ser auditadas à luz dos princípios físicos. Esse esforço de “explainable AI” (inteligência artificial explicável) ganha importância na medida em que as previsões se tornam mais sutis e interdisciplinares.

Supercomputação continua indispensável

Mesmo com as economias proporcionadas pela aprendizagem por transferência, o estudo conclui que a demanda por supercomputadores de última geração continua elevada. Simulações aptas a cobrir todas as hipóteses relevantes de nova física ainda consomem milhares de horas de processamento especializado. Assim, laboratórios planeiam atualizar infraestruturas ou recorrer a consórcios internacionais que compartilhem recursos de alto desempenho.

Para Krishnaraj e Bayer, a combinação entre hardware potente, métodos de IA menos enviesados e novos desenhos experimentais deve definir o próximo salto na busca por teorias além do Λ-CDM. Até lá, os resultados de Princeton servem como alerta: sem cuidados adicionais, a inteligência artificial corre o risco de confirmar apenas o que já sabemos, adiando a descoberta de respostas que podem transformar o entendimento do cosmos.