Introdução ao Gemini 2.5 Flash, Veo 2 e atualizações da API Live Saiba mais

Esta página foi traduzida pela API Cloud Translation.

Notas da versão

Esta página documenta as atualizações da API Gemini.

7 de maio de 2025

Lançamos gemini-2.0-flash-preview-image-generation, um modelo de visualização para gerar e editar imagens. Para saber mais, consulte Geração de imagens e Geração de imagens de pré-visualização do Gemini 2.0 Flash.

6 de maio de 2025

Lançamos gemini-2.5-pro-preview-05-06, uma nova versão do nosso modelo mais poderoso, com melhorias no código e na chamada de função. gemini-2.5-pro-preview-03-25 vai apontar automaticamente para a nova versão do modelo.

17 de abril de 2025

Lançamos o gemini-2.5-flash-preview-04-17, um modelo de pré-lançamento do Gemini otimizado para preço-desempenho e pensamento adaptativo. Para saber mais, consulte Visualização do Gemini 2.5 Flash e Pensamento.

16 de abril de 2025

O armazenamento em cache de contexto foi lançado para o Gemini 2.0 Flash.

9 de abril de 2025

Atualizações de modelos:

Lançamos o veo-2.0-generate-001, um modelo de texto e imagem para vídeo com disponibilidade geral (GA) capaz de gerar vídeos detalhados e artisticamente sutis. Para saber mais, consulte a documentação do Veo.
Lançamos a gemini-2.0-flash-live-001, uma versão de visualização pública do modelo da API Live com o faturamento ativado.
- Melhoria na confiabilidade e no gerenciamento de sessões
  - Ressuscitação de sessão:mantenha as sessões ativas em interrupções temporárias de rede. A API agora oferece suporte ao armazenamento de estado da sessão no servidor (por até 24 horas) e fornece identificadores (session_resumption) para se reconectar e retomar de onde você parou.
  - Sessões mais longas com a compactação de contexto:ative interações estendidas além dos limites de tempo anteriores. Configure a compactação da janela de contexto com um mecanismo de janela deslizante para gerenciar automaticamente o comprimento do contexto, evitando terminações abruptas devido a limites de contexto.
  - Notificação de desconexão suave:receba uma mensagem do servidor GoAway que indica quando uma conexão está prestes a ser encerrada, permitindo o tratamento suave antes do encerramento.
- Mais controle sobre as dinâmicas de interação
  - Detecção de atividade de voz (VAD) configurável: escolha os níveis de sensibilidade ou desative a VAD automática e use novos eventos do cliente (activityStart, activityEnd) para o controle de turno manual.
  - Gerenciamento de interrupção configurável:decida se a entrada do usuário vai interromper a resposta do modelo.
  - Cobertura de turno configurável:escolha se a API processa todas as entradas de áudio e vídeo continuamente ou apenas as captura quando o usuário final está falando.
  - Resolução de mídia configurável:otimize a qualidade ou o uso de tokens selecionando a resolução da mídia de entrada.
- Saída e recursos mais avançados
  - Opções de voz e idioma ampliadas:escolha entre duas novas vozes e 30 novos idiomas para saída de áudio. O idioma de saída agora pode ser configurado no speechConfig.
  - Streaming de texto:receba respostas de texto incrementalmente à medida que são geradas, permitindo uma exibição mais rápida para o usuário.
  - Relatórios de uso de tokens:entenda melhor o uso com as contagens de tokens detalhadas fornecidas no campo usageMetadata das mensagens do servidor, divididas por modalidade e fases de solicitação ou resposta.

4 de abril de 2025

Lançamos o gemini-2.5-pro-preview-03-25, uma versão de pré-lançamento público do Gemini 2.5 Pro com faturamento ativado. Você pode continuar usando o gemini-2.5-pro-exp-03-25 no nível sem custo financeiro.

25 de março de 2025

Lançamos o gemini-2.5-pro-exp-03-25, um modelo experimental público do Gemini com o modo de pensamento sempre ativado por padrão. Para saber mais, consulte Gemini 2.5 Pro Experimental.

12 de março de 2025

Atualizações de modelos:

Lançamos um modelo experimental do Gemini 2.0 Flash capaz de gerar e editar imagens.
Lançamento do gemma-3-27b-it, disponível no AI Studio e na API Gemini, como parte do lançamento do Gemma 3.

Atualizações da API:

Adição de suporte a URLs do YouTube como uma fonte de mídia.
Foi adicionado suporte para a inclusão de um vídeo inline de menos de 20 MB.

11 de março de 2025

Atualizações do SDK:

Lançamos o SDK da IA generativa do Google para TypeScript e JavaScript na prévia pública.

7 de março de 2025

Atualizações de modelos:

Lançamos o gemini-embedding-exp-03-07, um modelo de embeddings experimental baseado no Gemini em pré-lançamento público.

28 de fevereiro de 2025

Atualizações da API:

Suporte para a Pesquisa como ferramenta adicionado a gemini-2.0-pro-exp-02-05, um modelo experimental baseado no Gemini 2.0 Pro.

25 de fevereiro de 2025

Atualizações de modelos:

Lançamos o gemini-2.0-flash-lite, uma versão de disponibilidade geral (GA) do Gemini 2.0 Flash-Lite, otimizado para velocidade, escala e eficiência de custo.

19 de fevereiro de 2025

Atualizações do AI Studio:

Suporte para outras regiões (Kosovo, Groenlândia e Ilhas Faroé).

Atualizações da API:

Suporte para outras regiões (Kosovo, Groenlândia e Ilhas Faroé).

18 de fevereiro de 2025

Atualizações de modelos:

O Gemini 1.0 Pro não é mais compatível. Para conferir a lista de modelos compatíveis, consulte Modelos do Gemini.

11 de fevereiro de 2025

Atualizações da API:

Atualizações sobre a compatibilidade com as bibliotecas da OpenAI.

6 de fevereiro de 2025

Atualizações de modelos:

Lançamos a imagen-3.0-generate-002, uma versão de disponibilidade geral (GA, na sigla em inglês) da Imagen 3 na API Gemini.

Atualizações do SDK:

Lançamos o SDK da IA generativa do Google para Java para pré-lançamento público.

5 de fevereiro de 2025

Atualizações de modelos:

Lançada a gemini-2.0-flash-001, uma versão de disponibilidade geral (GA) do Gemini 2.0 Flash que oferece suporte a saída somente de texto.
Lançamos o gemini-2.0-pro-exp-02-05, uma versão de pré-lançamento pública experimental do Gemini 2.0 Pro.
Lançamos o gemini-2.0-flash-lite-preview-02-05, um modelo de visualização pública experimental otimizado para eficiência de custos.

Atualizações da API:

Foi adicionado suporte à entrada de arquivo e saída de gráfico à execução do código.

Atualizações do SDK:

Lançamos o SDK de IA generativa do Google para Python para disponibilidade geral (GA).

21 de janeiro de 2025

Atualizações de modelos:

Lançamos o gemini-2.0-flash-thinking-exp-01-21, a versão de pré-lançamento mais recente do modelo por trás do modelo Gemini 2.0 Flash Thinking.

December 19, 2024

Atualizações de modelos:

Lançamos o modo Flash Thinking do Gemini 2.0 para pré-lançamento público. O modo de pensamento é um modelo de computação no momento do teste que permite ver o processo de pensamento do modelo enquanto ele gera uma resposta e produz respostas com recursos de raciocínio mais fortes.

Leia mais sobre o modo Flash Thinking do Gemini 2.0 na nossa página de visão geral.

11 de dezembro de 2024

Atualizações de modelos:

Lançamos o Gemini 2.0 Flash Experimental para pré-lançamento público. A lista parcial de recursos do Gemini 2.0 Flash Experimental inclui:
- Duas vezes mais rápido que o Gemini 1.5 Pro
- Streaming bidirecional com nossa API Live
- Geração de respostas multimodais em forma de texto, imagens e fala
- Uso de ferramentas integradas com raciocínio de vários turnos para usar recursos como execução de código, pesquisa, chamada de função e muito mais

Leia mais sobre o Gemini 2.0 Flash na nossa página de visão geral.

21 de novembro de 2024

Atualizações de modelos:

Lançamos o gemini-exp-1121, um modelo experimental da API Gemini ainda mais poderoso.

Atualizações de modelos:

Atualizamos os aliases de modelo gemini-1.5-flash-latest e gemini-1.5-flash para usar gemini-1.5-flash-002.
- Mudança para o parâmetro top_k: o modelo gemini-1.5-flash-002 aceita valores de top_k entre 1 e 41 (exclusivos). Valores maiores que 40 serão alterados para 40.

14 de novembro de 2024

Atualizações de modelos:

Lançamos o gemini-exp-1114, um modelo experimental avançado da API Gemini.

8 de novembro de 2024

Atualizações da API:

Adicionamos suporte ao Gemini nas bibliotecas da OpenAI / API REST.

31 de outubro de 2024

Atualizações da API:

Adicionamos suporte ao Embasamento com a Pesquisa Google.

3 de outubro de 2024

Atualizações de modelos:

Lançamos o gemini-1.5-flash-8b-001, uma versão estável do nosso modelo de API Gemini mais compacto.

24 de setembro de 2024

Atualizações de modelos:

Lançamento do gemini-1.5-pro-002 e gemini-1.5-flash-002, duas novas versões estáveis do Gemini 1.5 Pro e 1.5 Flash, para disponibilidade geral.
Atualizamos o código do modelo gemini-1.5-pro-latest para usar gemini-1.5-pro-002 e o código do modelo gemini-1.5-flash-latest para usar gemini-1.5-flash-002.
gemini-1.5-flash-8b-exp-0924 foi lançado para substituir gemini-1.5-flash-8b-exp-0827.
Lançamos o filtro de segurança de integridade cívica para a API Gemini e o AI Studio.
Suporte lançado para dois novos parâmetros do Gemini 1.5 Pro e 1.5 Flash no Python e NodeJS: frequencyPenalty e presencePenalty.

19 de setembro de 2024

Atualizações do AI Studio:

Foram adicionados botões "Gostei" e "Não gostei" às respostas do modelo para que os usuários possam dar feedback sobre a qualidade de uma resposta.

Atualizações da API:

Adição de suporte a créditos do Google Cloud, que agora podem ser usados para uso da API Gemini.

17 de setembro de 2024

Atualizações do AI Studio:

Adicionamos um botão Open in Colab que exporta uma solicitação e o código para executá-la em um notebook do Colab. O recurso ainda não oferece suporte a comandos com ferramentas (modo JSON, chamada de função ou execução de código).

13 de setembro de 2024

Atualizações do AI Studio:

Adição de suporte ao modo de comparação, que permite comparar respostas entre modelos e comandos para encontrar o melhor ajuste para seu caso de uso.

30 de agosto de 2024

Atualizações de modelos:

O Gemini 1.5 Flash oferece suporte para fornecer o esquema JSON pela configuração do modelo.

27 de agosto de 2024

Atualizações de modelos:

Lançamos os seguintes modelos experimentais:
- gemini-1.5-pro-exp-0827
- gemini-1.5-flash-exp-0827
- gemini-1.5-flash-8b-exp-0827

9 de agosto de 2024

Atualizações da API:

Inclusão de suporte para processamento de PDF.

5 de agosto de 2024

Atualizações de modelos:

O suporte a ajustes finos foi lançado para o Gemini 1.5 Flash.

1º de agosto de 2024

Atualizações de modelos:

Lançamos o gemini-1.5-pro-exp-0801, uma nova versão experimental do Gemini 1.5 Pro.

12 de julho de 2024

Atualizações de modelos:

O suporte ao Gemini 1.0 Pro Vision foi removido dos serviços e ferramentas de IA do Google.

27 de junho de 2024

Atualizações de modelos:

Versão de disponibilidade geral para a janela de contexto de 2 milhões do Gemini 1.5 Pro.

Atualizações da API:

Foi adicionada a compatibilidade com a execução de código.

18 de junho de 2024

Atualizações da API:

Adição de suporte para armazenamento em cache de contexto.

12 de junho de 2024

Atualizações de modelos:

O Gemini 1.0 Pro Vision foi descontinuado.

23 de maio de 2024

Atualizações de modelos:

O Gemini 1.5 Pro (gemini-1.5-pro-001) está disponível em geral (GA).
O Gemini 1.5 Flash (gemini-1.5-flash-001) está disponível em geral (GA).

14 de maio de 2024

Atualizações da API:

Introdução de uma janela de contexto de 2 milhões para o Gemini 1.5 Pro (lista de espera).
Introdução do faturamento de pagamento por uso para o Gemini 1.0 Pro, com o faturamento do Gemini 1.5 Pro e do Gemini 1.5 Flash em breve.
Aumento dos limites de taxa para o próximo nível pago do Gemini 1.5 Pro.
Adicionamos suporte a vídeo integrado à API File.
Foi adicionado suporte a texto simples à API File.
Adição de suporte à chamada de função paralela, que retorna mais de uma chamada por vez.

10 de maio de 2024

Atualizações de modelos:

Lançamos o Gemini 1.5 Flash (gemini-1.5-flash-latest) em pré-lançamento.

9 de abril de 2024

Atualizações de modelos:

Lançamos o Gemini 1.5 Pro (gemini-1.5-pro-latest) em pré-lançamento.
Lançamos um novo modelo de embedding de texto, text-embeddings-004, que oferece suporte a tamanhos de embedding elástica menores que 768.

Atualizações da API:

Lançamos a API File para armazenar temporariamente arquivos de mídia para uso em solicitações.
Foi adicionado suporte a comandos com dados de texto, imagem e áudio, também conhecidos como comandos multimodais. Para saber mais, consulte Como usar mídia para dar instruções.
Lançamos a versão Beta das Instruções do sistema.
Foi adicionado o modo de chamada de função, que define o comportamento de execução da chamada de função.
Adição de suporte à opção de configuração response_mime_type, que permite solicitar respostas no formato JSON.

19 de março de 2024

Atualizações de modelos:

Foi adicionado suporte para ajustar o Gemini 1.0 Pro no Google AI Studio ou com a API Gemini.

13 de dezembro de 2023

Atualizações de modelos:

gemini-pro: novo modelo de texto para uma ampla variedade de tarefas. Equilibra capacidade e eficiência.
gemini-pro-vision: novo modelo multimodal para uma ampla variedade de tarefas. Equilibra capacidade e eficiência.
embedding-001: novo modelo de embeddings.
AQA: um novo modelo ajustado especialmente que é treinado para responder a perguntas usando passagens de texto para fundamentar as respostas geradas.

Consulte Modelos do Gemini para mais detalhes.

Atualizações da versão da API:

v1: o canal de API estável.
v1beta: canal Beta. Este canal tem recursos que podem estar em desenvolvimento.

Consulte o tópico sobre versões da API para mais detalhes.

Atualizações da API:

GenerateContent é um único endpoint unificado para chat e texto.
Streaming disponível pelo método StreamGenerateContent.
Recurso multimodal: a imagem é um novo modo compatível
Novos recursos Beta:
- Chamadas de função
- Semantic Retriever (link em inglês)
- Respostas a perguntas atribuídas (AQA)
Atualização da contagem de candidatos: os modelos Gemini só retornam um candidato.
Diferentes categorias de SafetyRating e Configurações de segurança. Consulte Configurações de segurança para mais detalhes.
Ajustar modelos ainda não é possível para modelos do Gemini (em desenvolvimento).