Google libera Gemini Flash: IA edita fotos por comando e preserva rostos

O Google passou a disponibilizar o Gemini 2.5 Flash ao público, modelo de inteligência artificial que permite modificar imagens a partir de instruções de texto sem alterar detalhes essenciais, como fisionomias humanas ou traços de animais. O recurso está acessível pelo endereço gemini.google.com desde ontem e funciona diretamente no navegador, sem necessidade de instalação adicional.

Funcionalidades oferecidas

Para utilizar a ferramenta, o utilizador envia uma fotografia à interface do Gemini e descreve, em linguagem natural, a transformação desejada. A plataforma interpreta o comando e gera uma nova versão da imagem respeitando as características originais de rostos, expressões e objetos presentes.

Entre as possibilidades, a IA pode:

Inserir a pessoa retratada em diferentes cenários, como arenas, consultórios ou palcos;
Criar variações de cabelo, maquiagem ou figurinos sem distorcer a face;
Compor imagens com elementos de duas fotos distintas, por exemplo, juntar um humano e um cão num mesmo enquadramento;
Alterar cores de paredes, trocar mobiliário ou testar combinações de decoração em ambientes internos;
Colorizar fotografias originalmente em preto e branco, oferecendo uma projeção de tonalidades possíveis.

Todos os resultados incluem uma pequena marca-d’água no canto inferior direito, indicando a origem sintética do conteúdo. Segundo a empresa, o símbolo segue o padrão que o setor vem adotando para alertar sobre material gerado por IA.

Proteções e limitações

O Google afirma ter implementado travas que bloqueiam pedidos de natureza sexual ou que violem políticas de uso responsável. Além disso, o Gemini procura evitar “alucinações” — fenômeno comum em modelos de geração de imagem que inserem ou removem elementos sem solicitação explícita. A preservação de rostos e de detalhes anatómicos foi destacada pela companhia como diferencial em relação a soluções concorrentes.

Apesar do sinal de identificação, a localização discreta da marca-d’água permite que ela seja facilmente removida por corte. A empresa não informou planos para impedir que o aviso seja suprimido, mas ressaltou que investiga métodos complementares de rastreio de conteúdo.

Google libera Gemini Flash: IA edita fotos por comando e preserva rostos - Tecnologia, Educação e Gadgets em 2025 Guia Completo com Tendências e Inovações

Imagem: Tecnologia, Educação e Gadgets em 2025 Guia Completo com Tendências e Inovações

Contexto de mercado

Com a estreia pública do Gemini 2.5 Flash — apelidado internamente de “Nano Banana” — o Google busca reforçar sua posição num segmento dominado, em visibilidade, pelo ChatGPT da OpenAI. O lançamento sucede uma fase de testes fechados em que o modelo foi avaliado em benchmarks de geração de imagem sob o codinome confidencial.

Empresas de tecnologia têm acelerado investimentos em editores visuais baseados em IA, atraídas pela procura de criadores de conteúdo, publicitários e utilizadores domésticos. A abordagem do Google se diferencia ao integrar o recurso diretamente ao seu ecossistema de serviços, dispensando aplicativos externos ou plug-ins.

Como utilizar

Para experimentar o Gemini Flash, basta aceder à interface web, carregar uma fotografia e digitar o comando em inglês ou português. A resposta surge em poucos instantes, com opção de descarregar o arquivo resultante ou iniciar um novo pedido. O serviço é gratuito nesta fase inicial; o Google não divulgou detalhes sobre eventuais planos pagos ou limites de uso.

Com o novo modelo, a empresa pretende demonstrar avanços na edição de imagens assistida por IA, ampliar a adoção do seu chatbot e recuperar protagonismo num mercado em rápida evolução.