Veo 3 jest już dostępny w interfejsie Gemini API. Więcej informacji

Ta strona została przetłumaczona przez Cloud Translation API.

Modele Gemini

2.5 Pro

Nasz najbardziej zaawansowany model myślenia o maksymalnej dokładności odpowiedzi i najnowocześniejszej wydajności

Wprowadzanie dźwięku, obrazów, filmów i tekstu oraz otrzymywanie odpowiedzi tekstowych
Rozwiązywanie trudnych problemów, analizowanie dużych baz danych i inne działania
Najlepszy do złożonego kodowania, wyciągania wniosków i rozumienia multimodalnego

2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości.

przesyłać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe;
Model myśli w razie potrzeby lub możesz skonfigurować budżet na myślenie.
Najlepszy do zadań o niskim opóźnieniu i dużej liczbie, które wymagają zastanowienia

2.5 Flash-Lite

Model Gemini 2.5 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.

przesyłać dźwięk, obrazy, filmy i tekst oraz otrzymywać odpowiedzi tekstowe;
Najbardziej ekonomiczny model obsługujący wysoką przepustowość
Najlepszy w przypadku zastosowań wymagających krótkiego czasu oczekiwania i przetwarzania w czasie rzeczywistym

Warianty modelu

Gemini API oferuje różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótki przegląd dostępnych wersji Gemini:

Wariant modelu	Dane wejściowe	Wyniki	Zoptymalizowany dla
Gemini 2.5 Pro `gemini-2.5-pro`	dźwięk, obrazy, filmy, tekst i pliki PDF;	Tekst	Ulepszone myślenie i rozumowanie, multimodalne rozumienie, zaawansowane kodowanie i inne funkcje
Gemini 2.5 Flash `gemini-2.5-flash`	dźwięk, obrazy, filmy i tekst;	Tekst	Myślenie adaptacyjne, opłacalność
Gemini 2.5 Flash-Lite `gemini-2.5-flash-lite`	Tekst, obraz, film oraz plik dźwiękowy	Tekst	Najbardziej ekonomiczny model obsługujący wysoką przepustowość
Gemini 2.5 Flash Live `gemini-live-2.5-flash-preview`	dźwięk, obraz i tekst;	Tekst, dźwięk	Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami
Gemini 2.5 Flash Native Audio `gemini-2.5-flash-preview-native-audio-dialog` & `gemini-2.5-flash-exp-native-audio-thinking-dialog`	Audio, filmy i tekst	Tekst i dźwięk, przeplatane	Wysokiej jakości, naturalne wyjścia audio rozmowy z myśleniem lub bez niego
Gemini 2.5 Flash Preview TTS `gemini-2.5-flash-preview-tts`	Tekst	Dźwięk	Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników.
Gemini 2.5 Pro Preview TTS `gemini-2.5-pro-preview-tts`	Tekst	Dźwięk	Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników.
Gemini 2.0 Flash `gemini-2.0-flash`	dźwięk, obrazy, filmy i tekst;	Tekst	Funkcje nowej generacji, szybkość i transmisja strumieniowa w czasie rzeczywistym.
Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash `gemini-2.0-flash-preview-image-generation`	dźwięk, obrazy, filmy i tekst;	Tekst, obrazy	Generowanie i edytowanie obrazów w trybie konwersacyjnym
Gemini 2.0 Flash-Lite `gemini-2.0-flash-lite`	dźwięk, obrazy, filmy i tekst;	Tekst	Opłacalność i krótkie czasy oczekiwania
Gemini 2.0 Flash Live `gemini-2.0-flash-live-001`	dźwięk, obraz i tekst;	Tekst, dźwięk	Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami
Gemini 1.5 Flash `gemini-1.5-flash`	dźwięk, obrazy, filmy i tekst;	Tekst	Szybkie i wszechstronne działanie w różnych zadaniach. Wycofane
Gemini 1.5 Flash-8B `gemini-1.5-flash-8b`	dźwięk, obrazy, filmy i tekst;	Tekst	Zadania o dużej liczbie zapytań i mniejszym stopniu złożoności Wycofane
Gemini 1.5 Pro `gemini-1.5-pro`	dźwięk, obrazy, filmy i tekst;	Tekst	Złożone zadania wymagające większej inteligencji Wycofane

Limity szybkości dla poszczególnych modeli znajdziesz na tej stronie.

Gemini 2.5 Pro

Gemini 2.5 Pro to nasz najnowocześniejszy model myślący, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty przy użyciu długiego kontekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`gemini-2.5-pro`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy, tekst i pliki PDF; Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj groundingu Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślenie Obsługiwane Tryb wsadowy Obsługiwane Kontekst adresu URL Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. `Stable: gemini-2.5-pro`
Ostatnia aktualizacja	Czerwiec 2025 r.
Granica wiedzy	Styczeń 2025 r.

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości. 2.5 Flash najlepiej sprawdza się w przypadku przetwarzania na dużą skalę, zadań o niskim czasie oczekiwania i dużej objętości, które wymagają myślenia, oraz zastosowań związanych z agentami.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash`
Obsługiwane typy danych	Dane wejściowe Tekst, obrazy, filmy, dźwięk Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
Uprawnienia	Generowanie dźwięku Nieobsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Wykonanie kodu Obsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Obsługiwane Myślenie Obsługiwane Tryb wsadowy Obsługiwane Kontekst adresu URL Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Stabilny: `gemini-2.5-flash` Podgląd: `gemini-2.5-flash-preview-05-20`
Ostatnia aktualizacja	Czerwiec 2025 r.
Granica wiedzy	Styczeń 2025 r.

Gemini 2.5 Flash-Lite

Model Gemini 2.5 Flash zoptymalizowany pod kątem niskich kosztów i wysokiej przepustowości.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash-lite`
Obsługiwane typy danych	Dane wejściowe Tekst, obraz, film, dźwięk, PDF Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 65 536
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Kontekst adresu URL Obsługiwane Szukaj groundingu Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślenie Obsługiwane Tryb wsadowy Obsługiwane Kontekst adresu URL Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Stabilny: `gemini-2.5-flash-lite` Podgląd: `gemini-2.5-flash-lite-06-17`
Ostatnia aktualizacja	Lipiec 2025 r.
Granica wiedzy	Styczeń 2025 r.

Gemini 2.5 Flash Live

Model Gemini 2.5 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-live-2.5-flash-preview`
Obsługiwane typy danych	Dane wejściowe dźwięk, obraz i tekst; Dane wyjściowe tekst i dźwięk,
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślenie Nieobsługiwane Kontekst adresu URL Obsługiwane
wersji	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Podgląd: `gemini-live-2.5-flash-preview`
Ostatnia aktualizacja	Czerwiec 2025 r.
Granica wiedzy	Styczeń 2025 r.

Gemini 2.5 Flash Native Audio

Nasze natywne modele dialogów audio z myśleniem i bez niego, dostępne w ramach interfejsu Live API. Te modele zapewniają interaktywne i nieustrukturyzowane rozmowy z użyciem promptów dotyczących stylu i kontroli.

Wypróbuj natywny dźwięk w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash-preview-native-audio-dialog` & `models/gemini-2.5-flash-exp-native-audio-thinking-dialog`
Obsługiwane typy danych	Dane wejściowe Audio, wideo, tekst Dane wyjściowe Dźwięk i tekst
Limity tokenów^[*]	Limit tokenów wejściowych 128 000 Limit tokenów wyjściowych 8000
Uprawnienia	Generowanie dźwięku Obsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Wykonanie kodu Nieobsługiwane Wywoływanie funkcji Obsługiwane Generowanie obrazów Nieobsługiwane Szukaj groundingu Obsługiwane Ustrukturyzowane dane wyjściowe Nieobsługiwane Myślenie Obsługiwane Dostrajanie Nieobsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Podgląd: `gemini-2.5-flash-preview-05-20` Eksperymentalne: `gemini-2.5-flash-exp-native-audio-thinking-dialog`
Ostatnia aktualizacja	Maj 2025 r.
Granica wiedzy	Styczeń 2025 r.

Przesłuchiwanie tekstu w Gemini 2.5 Flash

Gemini 2.5 Flash Preview TTS to nasz model zamiany tekstu na mowę o korzystnym stosunku ceny do wydajności. Zapewnia on dużą kontrolę i przejrzystość w przypadku ustrukturyzowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji przedpremierowej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-flash-preview-tts`
Obsługiwane typy danych	Dane wejściowe Tekst Dane wyjściowe Dźwięk
Limity tokenów^[*]	Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000
Uprawnienia	Ustrukturyzowane dane wyjściowe Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślenie Nieobsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. `gemini-2.5-flash-preview-tts`
Ostatnia aktualizacja	Maj 2025 r.

Przesłuchiwanie tekstu w Gemini 2.5 Pro

Gemini 2.5 Pro Preview TTS to nasz najpotężniejszy model zamiany tekstu na mowę, który zapewnia dużą kontrolę i przejrzystość w przypadku uporządkowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji testowej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.5-pro-preview-tts`
Obsługiwane typy danych	Dane wejściowe Tekst Dane wyjściowe Dźwięk
Limity tokenów^[*]	Limit tokenów wejściowych 8000 Limit tokenów wyjściowych 16 000
Uprawnienia	Ustrukturyzowane dane wyjściowe Nieobsługiwane Zapisywanie w pamięci podręcznej Nieobsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie dźwięku Obsługiwane Live API Nieobsługiwane Myślenie Nieobsługiwane
wersji	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. `gemini-2.5-pro-preview-tts`
Ostatnia aktualizacja	Maj 2025 r.

Gemini 2.0 Flash

Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, natywne korzystanie z narzędzi i okno kontekstu z milionem tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Obsługiwane Myślenie Eksperymentalne Tryb wsadowy Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Najnowsze: `gemini-2.0-flash` Stabilny: `gemini-2.0-flash-001` Eksperymentalne: `gemini-2.0-flash-exp`
Ostatnia aktualizacja	Luty 2025 r.
Granica wiedzy	Sierpień 2024 r.

Generowanie obrazów w Gemini 2.0 Flash

Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash zapewnia ulepszone funkcje generowania obrazów, w tym generowanie i edytowanie obrazów w formie konwersacji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-preview-image-generation`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst i obrazy
Limity tokenów^[*]	Limit tokenów wejściowych 32 000 Limit tokenów wyjściowych 8192
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Nieobsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie obrazów Obsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Myślenie Nieobsługiwane
wersji	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Podgląd: `gemini-2.0-flash-preview-image-generation` Funkcja gemini-2.0-flash-preview-image-generation nie jest obecnie obsługiwana w kilku krajach w Europie, na Bliskim Wschodzie i w Afryce
Ostatnia aktualizacja	Maj 2025 r.
Granica wiedzy	Sierpień 2024 r.

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-lite`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Nieobsługiwane Szukaj Nieobsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Nieobsługiwane Live API Nieobsługiwane Batch API Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Najnowsze: `gemini-2.0-flash-lite` Stabilny: `gemini-2.0-flash-lite-001`
Ostatnia aktualizacja	Luty 2025 r.
Granica wiedzy	Sierpień 2024 r.

Gemini 2.0 Flash Live

Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-2.0-flash-live-001`
Obsługiwane typy danych	Dane wejściowe dźwięk, obraz i tekst; Dane wyjściowe tekst i dźwięk,
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Uprawnienia	Ustrukturyzowane dane wyjściowe Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Szukaj Obsługiwane Generowanie obrazów Nieobsługiwane Generowanie dźwięku Obsługiwane Myślenie Nieobsługiwane Kontekst adresu URL Obsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Podgląd: `gemini-2.0-flash-live-001`
Ostatnia aktualizacja	Kwiecień 2025 r.
Granica wiedzy	Sierpień 2024 r.

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania wykorzystywany w różnorodnych zadaniach.

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacje audiowizualne	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
Uprawnienia	Instrukcje systemowe Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa z możliwością dostosowania Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Najnowsze: `gemini-1.5-flash-latest` Najnowsza stabilna wersja: `gemini-1.5-flash` Stabilna: `gemini-1.5-flash-001` `gemini-1.5-flash-002`
Data wycofania	Wrzesień 2025 r.
Ostatnia aktualizacja	Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do mniej wymagających zadań.

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-flash-8b`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 1 048 576 Limit tokenów wyjściowych 8192
Specyfikacje audiowizualne	Maksymalna liczba obrazów na prompt 3,600 Maksymalna długość filmu 1 godzina Maksymalna długość dźwięku Około 9,5 godziny
Uprawnienia	Instrukcje systemowe Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa z możliwością dostosowania Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Obsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane
wersji	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Najnowsze: `gemini-1.5-flash-8b-latest` Najnowsza stabilna wersja: `gemini-1.5-flash-8b` Stabilna: `gemini-1.5-flash-8b-001`
Data wycofania	Wrzesień 2025 r.
Ostatnia aktualizacja	Październik 2024 r.

Gemini 1.5 Pro

Wypróbuj Gemini 2.5 Pro w wersji podglądowej, nasz najbardziej zaawansowany model Gemini.

Gemini 1.5 Pro to średniej wielkości model multimodalny zoptymalizowany pod kątem szerokiego zakresu zadań wymagających wnioskowania. Wersja 1.5 Pro może przetwarzać duże ilości danych naraz, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. linii kodu lub 2000 stron tekstu.

Szczegóły modelu

Właściwość	Opis
Kod modelu	`models/gemini-1.5-pro`
Obsługiwane typy danych	Dane wejściowe dźwięk, obrazy, filmy i tekst; Dane wyjściowe Tekst
Limity tokenów^[*]	Limit tokenów wejściowych 2 097 152 Limit tokenów wyjściowych 8192
Specyfikacje audiowizualne	Maksymalna liczba obrazów na prompt 7200 Maksymalna długość filmu 2 godziny Maksymalna długość dźwięku Około 19 godzin
Uprawnienia	Instrukcje systemowe Obsługiwane Tryb JSON Obsługiwane Schemat JSON Obsługiwane Ustawienia bezpieczeństwa z możliwością dostosowania Obsługiwane Zapisywanie w pamięci podręcznej Obsługiwane Dostrajanie Nieobsługiwane Wywoływanie funkcji Obsługiwane Wykonanie kodu Obsługiwane Live API Nieobsługiwane
Wersje	Więcej informacji znajdziesz w artykule Wzorce wersji modelu. Najnowsze: `gemini-1.5-pro-latest` Najnowsza stabilna wersja: `gemini-1.5-pro` Stabilna: `gemini-1.5-pro-001` `gemini-1.5-pro-002`
Data wycofania	Wrzesień 2025 r.
Ostatnia aktualizacja	Wrzesień 2024 r.

Zapoznaj się z przykładami, aby poznać możliwości tych wersji modeli.

[*] W przypadku modeli Gemini token odpowiada około 4 znakom. 100 tokenów to około 60–80 słów w języku angielskim.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnej, testowej lub eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i wersji chcesz użyć.

Najnowsza stabilna

Wskazuje najnowszą stabilną wersję wydaną dla określonego modelu, generacji i wariantu.

Aby określić najnowszą stabilną wersję, użyj tego wzorca:<model>-<generation>-<variation>. Na przykład: gemini-2.0-flash.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle nie ulegają zmianom. Większość aplikacji produkcyjnych powinna korzystać z określonego stabilnego modelu.

Aby określić wersję stabilną, użyj tego wzorca:<model>-<generation>-<variation>-<version> Na przykład:gemini-2.0-flash-001.

Podgląd

Wskazuje model w wersji przedpremierowej, który może nie być odpowiedni do użytku produkcyjnego, ma bardziej restrykcyjne limity szybkości, ale może mieć włączone rozliczenia.

Aby określić wersję podglądową, użyj tego wzorca:<model>-<generation>-<variation>-<version> Na przykład:gemini-2.5-pro-preview-06-05.

Modele w wersji podglądowej nie są stabilne, a dostępność punktów końcowych modeli może ulec zmianie.

Eksperymentalna

Wskazuje model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i ma bardziej restrykcyjne limity szybkości. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko przekazywać deweloperom najnowsze aktualizacje.

Aby określić wersję eksperymentalną, użyj tego wzorca:<model>-<generation>-<variation>-<version>. Na przykład:gemini-2.0-pro-exp-02-05.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modeli może się zmienić.

Modele eksperymentalne

Oprócz stabilnych modeli Gemini API oferuje modele eksperymentalne, które mogą nie być odpowiednie do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity szybkości.

Udostępniamy modele eksperymentalne, aby zbierać opinie, szybko udostępniać deweloperom najnowsze aktualizacje i pokazywać tempo innowacji w Google. Dzięki temu, czego dowiadujemy się z eksperymentalnych wersji, możemy lepiej przygotować się na szersze wdrożenie modeli. Model eksperymentalny można zastąpić innym bez wcześniejszego powiadomienia. Nie gwarantujemy, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Poprzednie modele eksperymentalne

Gdy pojawią się nowe wersje lub stabilne wydania, usuwamy modele eksperymentalne i zastępujemy je nowymi. Poprzednie modele eksperymentalne, które udostępniliśmy, znajdziesz w sekcji poniżej wraz z wersją zastępczą:

Kod modelu	Model podstawowy	Wersja zastępcza
`gemini-embedding-exp-03-07`	Osadzanie Gemini	`gemini-embedding-001`
`gemini-2.5-flash-preview-04-17`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-05-20`
`gemini-2.0-flash-exp-image-generation`	Gemini 2.0 Flash	`gemini-2.0-flash-preview-image-generation`
`gemini-2.5-pro-preview-06-05`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.5-pro-preview-05-06`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.5-pro-preview-03-25`	Gemini 2.5 Pro	`gemini-2.5-pro`
`gemini-2.0-flash-thinking-exp-01-21`	Gemini 2.5 Flash	`gemini-2.5-flash-preview-04-17`
`gemini-2.0-pro-exp-02-05`	Gemini 2.0 Pro Experimental	`gemini-2.5-pro-preview-03-25`
`gemini-2.0-flash-exp`	Gemini 2.0 Flash	`gemini-2.0-flash`
`gemini-exp-1206`	Gemini 2.0 Pro	`gemini-2.0-pro-exp-02-05`
`gemini-2.0-flash-thinking-exp-1219`	Gemini 2.0 Flash Thinking	`gemini-2.0-flash-thinking-exp-01-21`
`gemini-exp-1121`	Gemini	`gemini-exp-1206`
`gemini-exp-1114`	Gemini	`gemini-exp-1206`
`gemini-1.5-pro-exp-0827`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-pro-exp-0801`	Gemini 1.5 Pro	`gemini-exp-1206`
`gemini-1.5-flash-8b-exp-0924`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`
`gemini-1.5-flash-8b-exp-0827`	Gemini 1.5 Flash-8B	`gemini-1.5-flash-8b`

Obsługiwane języki

Modele Gemini są trenowane do pracy w tych językach:

arabski (ar),
bengalski (bn)
bułgarski (bg),
chiński uproszczony i tradycyjny (zh),
chorwacki (hr),
czeski (cs)
duński (da),
Niderlandzki (nl)
angielski (en),
estoński (et),
fiński (fi),
francuski (fr),
Niemiecki (de)
grecki (el),
hebrajski (iw)
hindi (hi),
węgierski (hu),
Indonezyjski (id)
Włoski (it)
japoński (ja),
koreański (ko),
łotewski (lv)
litewski (lt),
norweski (no),
polski (pl),
portugalski (pt),
rumuński (ro),
rosyjski (ru),
serbski (sr)
słowacki (sk)
słoweński (sl),
hiszpański (es),
suahili (sw),
szwedzki (sv),
tajski (th),
turecki (tr),
ukraiński (uk),
wietnamski (vi),