Especificações técnicas do Gemini 3.1 Flash Image Preview
| Item | Gemini 3.1 Flash Image Preview |
|---|---|
| Provedor | |
| Família do modelo | Gemini 3.1 (camada Flash) |
| Foco principal | Geração multimodal rápida com pré-visualização de imagem |
| Tipos de entrada | Texto, Imagem |
| Tipos de saída | Texto, Imagem (geração de pré-visualização) |
| Janela de contexto | Até 1M tokens (padrão da camada Gemini 3.x Flash) |
| Nível de latência | Baixa latência, alto throughput |
| Suporte a streaming | Sim |
| Chamada de ferramentas | Sim (framework de ferramentas da API Gemini) |
| Versão | 3.1 |
O que é Nano Banana 2
Nano Banana 2 é o apelido popular usado pela imprensa e pela comunidade de desenvolvedores para o modelo recém-lançado Gemini-3.1-Flash-Image. O Google o posiciona como o mecanismo de imagem da camada “Flash”, que traz fidelidade visual próxima à Pro para uma camada de latência e custo muito mais baixos — adequada para geração em alto volume, edição iterativa rápida e fluxos de trabalho integrados de produto em todos os serviços do Google. Ele herda o raciocínio multimodal do Gemini 3.1 e adiciona capacidades centradas em imagem (texto legível em imagens, composição de múltiplas imagens, suporte a ampla proporção de aspecto, 4K nativo).
Principais recursos
- Geração em alta velocidade e múltiplas resoluções: velocidade da camada Flash com opções de saída em 0.5K / 1K / 2K / 4K e novas proporções de aspecto extremas (1:4, 4:1, 1:8, 8:1).
- Grounding web em tempo real: integra resultados de pesquisa de texto e imagem para fundamentar o conteúdo gerado em informações atuais da web quando “Thinking” ou o grounding de pesquisa está ativado. Útil para referências atualizadas e infográficos factuais.
- Renderização de texto aprimorada: melhor renderização de textos curtos e texto gráfico (fontes, tamanhos) do que os modelos Flash anteriores; ainda imperfeita em parágrafos longos/texto pequeno.
- Edição com múltiplas entradas e fluxos de trabalho em múltiplos turnos: forte suporte para combinar várias imagens como entrada e para edições iterativas ao longo dos turnos.
📊 Desempenho em benchmark — Geração e edição de imagem (pontuações Elo)
| Capacidade | Gemini 3.1 Flash Image (Nano Banana 2) | Gemini 2.5 Flash Image (Nano Banana) | Gemini 3 Pro Image (Nano Banana Pro) | GPT-Image 1.5 | Seedream 5.0 Lite | Grok Imagine Image Pro |
|---|---|---|---|---|---|---|
| Texto para imagem — Preferência geral | 1079.0 ± 7.0 | 1073.0 ± 5.0 | 942.0 ± 6.0 | 1021.0 ± 5.0 | 1047.0 ± 5.0 | 928.0 ± 8.0 |
| Texto para imagem — Qualidade visual | 1140.0 ± 6.0 | 1129.0 ± 6.0 | 929.0 ± 6.0 | 1043.0 ± 5.0 | 975.0 ± 5.0 | 759.0 ± 10.0 |
| Texto para imagem — Infográficos (factualidade) | 1114.0 ± 14.0 | 1074.0 ± 12.0 | 881.0 ± 13.0 | 1102.0 ± 13.0 | 985.0 ± 12.0 | 890.0 ± 22.0 |
| Edição — Geral | 1065.0 ± 9.0 | 1047.0 ± 9.0 | 913.0 ± 9.0 | 1051.0 ± 10.0 | 995.0 ± 8.0 | 937.0 ± 9.0 |
| Edição — Personagem | 1056.0 ± 7.0 | 1049.0 ± 7.0 | 952.0 ± 7.0 | 1050.0 ± 8.0 | 1025.0 ± 7.0 | 894.0 ± 8.0 |
| Edição — Criativa | 1023.0 ± 7.0 | 1031.0 ± 7.0 | 976.0 ± 7.0 | 1004.0 ± 7.0 | 1017.0 ± 7.0 | 938.0 ± 7.0 |
| Edição — Objeto/Ambiente | 1029.0 ± 8.0 | 1018.0 ± 8.0 | 945.0 ± 8.0 | 1042.0 ± 10.0 | 976.0 ± 8.0 | 946.0 ± 9.0 |
| Edição — Multientrada | 1037.0 ± 8.0 | 1016.0 ± 8.0 | 919.0 ± 9.0 | 1056.0 ± 12.0 | 1014.0 ± 9.0 | N/A |
| Edição — Estilização | 1045.0 ± 7.0 | 1031.0 ± 7.0 | 862.0 ± 8.0 | 1045.0 ± 9.0 | 996.0 ± 7.0 | 984.0 ± 7.0 |
Principais conclusões desta tabela de benchmark:
- Nas categorias de geração de texto para imagem e edição de imagem, o Gemini 3.1 Flash Image lidera consistentemente ou iguala as pontuações mais altas entre os modelos de imagem da camada Flash e muitos modelos concorrentes.
- O modelo mostra resultados especialmente fortes nos benchmarks de Qualidade visual e Infográficos (factualidade) — sinalizando que ele se destaca não apenas na qualidade estética, mas também na renderização de conteúdo estruturalmente preciso.
- Em edição multientrada, o Nano Banana 2 também mostra generalização robusta, com pontuações mais altas do que sua geração Flash anterior.
Essas avaliações são realizadas por meio de comparações Elo lado a lado feitas por humanos em um conjunto diversificado de benchmarks, refletindo tanto preferência quanto fidelidade em tarefas de geração/edição de imagem comumente usadas.
Nano Banana 2 vs Nano Banana vs Nano Banana Pro
| Modelo | Posicionamento | Benchmark/notas representativos |
|---|---|---|
| Gemini 3.1 Flash Image (Nano Banana 2) | Camada Flash: velocidade + alta qualidade visual (2K–4K) | Preferência geral 1079.0 ± 7.0; qualidade visual 1140 ± 6.0 (GenAI-Bench interno). |
| Gemini 2.5 Flash Image (Nano Banana) | Versão Flash anterior (menor fidelidade) | Pontuações de preferência/qualidade visual ligeiramente inferiores em relação ao 3.1. |
| Gemini 3 Pro Image (Nano Banana Pro) | Camada Pro: maior fidelidade percebida para tarefas complexas, maior custo/latência | Trade-offs diferentes; algumas métricas mostram classificações relativas diferentes em tarefas especializadas. |
| GPT-Image 1.5 / outros modelos comerciais | Concorrentes (abertos/fechados) | Nos benchmarks internos do Google, GPT-Image e outros ficaram abaixo do Gemini 3.1 em qualidade visual e preferência geral na avaliação reportada. Comparações independentes de terceiros variam. |
Quando escolher Flash Image Preview:
- Pré-visualização de imagem em tempo real em aplicativos
- Geração de imagens em larga escala com sensibilidade a custo
- Assistentes de design interativos
Como acessar e integrar o Nano Banana 2
Etapa 1: Cadastre-se para obter uma chave de API
Faça login em cometapi.com. Se você ainda não é nosso usuário, registre-se primeiro. Entre no seu console do CometAPI. Obtenha a credencial de acesso, a chave de API da interface. Clique em “Add Token” na seção de token de API na central pessoal, obtenha a chave do token: sk-xxxxx e envie.
Etapa 2: Envie solicitações para a API Nano Banana 2
Selecione o endpoint “gemini-3.1-flash-image-preview8” para enviar a solicitação de API e configure o corpo da solicitação. O método da solicitação e o corpo da solicitação podem ser obtidos na documentação da API em nosso site. Nosso site também fornece teste com Apifox para sua conveniência. Substitua <YOUR_API_KEY> pela sua chave CometAPI real da sua conta. Onde chamar:Gemini generates image
O Nano Banana 2 oferece suporte a edição de imagem, geração de imagem e fluxos de trabalho com múltiplas imagens. Para edição de imagem, você precisa fazer upload do URL da imagem. Para mais parâmetros, consulte a documentação.
Etapa 3: Recupere e verifique os resultados
Processe a resposta da API para obter a resposta gerada. Após o processamento, a API retorna o status da tarefa e os dados de saída. Você pode baixar diretamente a imagem para sua máquina local no playground (geralmente em formato PNG). Um URL de imagem é gerado durante o processo da API; faça o download prontamente.