Gemini 2.0 Flash

Speed-focused Gemini tier for high-traffic workloads with strong multimodal coverage.

Context window

1M tokens (streaming) / 128k cached context

Peak context for this model.

Availability

Google AI Studio, Vertex AI

Where you can run it.

Modalities

Text · Vision · Audio · Code

Input/output coverage.

Pricing

$0.10 / 1M input tokens, $0.40 / 1M output tokens

Latency: Very low; designed for real-time experiences

Strengths

Best for

Summary

Other models

Gemini 2.0 Pro

balanced · 2024