Modele Gemini

Warianty modelu

Gemini API oferuje różne modele zoptymalizowane pod kątem konkretnych zastosowań. Oto krótki przegląd dostępnych wersji Gemini:

Wariant modelu Dane wejściowe Wyniki Zoptymalizowany dla
Gemini 2.5 Pro
gemini-2.5-pro
dźwięk, obrazy, filmy, tekst i pliki PDF; Tekst Ulepszone myślenie i rozumowanie, multimodalne rozumienie, zaawansowane kodowanie i inne funkcje
Gemini 2.5 Flash
gemini-2.5-flash
dźwięk, obrazy, filmy i tekst; Tekst Myślenie adaptacyjne, opłacalność
Gemini 2.5 Flash-Lite
gemini-2.5-flash-lite
Tekst, obraz, film oraz plik dźwiękowy Tekst Najbardziej ekonomiczny model obsługujący wysoką przepustowość
Gemini 2.5 Flash Live
gemini-live-2.5-flash-preview
dźwięk, obraz i tekst; Tekst, dźwięk Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami
Gemini 2.5 Flash Native Audio
gemini-2.5-flash-preview-native-audio-dialog &
gemini-2.5-flash-exp-native-audio-thinking-dialog
Audio, filmy i tekst Tekst i dźwięk, przeplatane Wysokiej jakości, naturalne wyjścia audio rozmowy z myśleniem lub bez niego
Gemini 2.5 Flash Preview TTS
gemini-2.5-flash-preview-tts
Tekst Dźwięk Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników.
Gemini 2.5 Pro Preview TTS
gemini-2.5-pro-preview-tts
Tekst Dźwięk Generowanie dźwięku z zamiany tekstu na mowę z niskim opóźnieniem, możliwością sterowania oraz obsługą jednego i wielu głośników.
Gemini 2.0 Flash
gemini-2.0-flash
dźwięk, obrazy, filmy i tekst; Tekst Funkcje nowej generacji, szybkość i transmisja strumieniowa w czasie rzeczywistym.
Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash
gemini-2.0-flash-preview-image-generation
dźwięk, obrazy, filmy i tekst; Tekst, obrazy Generowanie i edytowanie obrazów w trybie konwersacyjnym
Gemini 2.0 Flash-Lite
gemini-2.0-flash-lite
dźwięk, obrazy, filmy i tekst; Tekst Opłacalność i krótkie czasy oczekiwania
Gemini 2.0 Flash Live
gemini-2.0-flash-live-001
dźwięk, obraz i tekst; Tekst, dźwięk Dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami
Gemini 1.5 Flash
gemini-1.5-flash
dźwięk, obrazy, filmy i tekst; Tekst Szybkie i wszechstronne działanie w różnych zadaniach.
Wycofane
Gemini 1.5 Flash-8B
gemini-1.5-flash-8b
dźwięk, obrazy, filmy i tekst; Tekst Zadania o dużej liczbie zapytań i mniejszym stopniu złożoności
Wycofane
Gemini 1.5 Pro
gemini-1.5-pro
dźwięk, obrazy, filmy i tekst; Tekst Złożone zadania wymagające większej inteligencji
Wycofane

Limity szybkości dla poszczególnych modeli znajdziesz na tej stronie.

Gemini 2.5 Pro

Gemini 2.5 Pro to nasz najnowocześniejszy model myślący, który potrafi rozwiązywać złożone problemy związane z kodem, matematyką i naukami ścisłymi, a także analizować duże zbiory danych, bazy kodu i dokumenty przy użyciu długiego kontekstu.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu gemini-2.5-pro
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy, tekst i pliki PDF;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj groundingu

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślenie

Obsługiwane

Tryb wsadowy

Obsługiwane

Kontekst adresu URL

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Stable: gemini-2.5-pro
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Flash

Nasz najlepszy model pod względem stosunku ceny do wydajności, oferujący wszechstronne możliwości. 2.5 Flash najlepiej sprawdza się w przypadku przetwarzania na dużą skalę, zadań o niskim czasie oczekiwania i dużej objętości, które wymagają myślenia, oraz zastosowań związanych z agentami.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash
Obsługiwane typy danych

Dane wejściowe

Tekst, obrazy, filmy, dźwięk

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Uprawnienia

Generowanie dźwięku

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Wykonanie kodu

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Obsługiwane

Myślenie

Obsługiwane

Tryb wsadowy

Obsługiwane

Kontekst adresu URL

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Stabilny: gemini-2.5-flash
  • Podgląd: gemini-2.5-flash-preview-05-20
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Flash-Lite

Model Gemini 2.5 Flash zoptymalizowany pod kątem niskich kosztów i wysokiej przepustowości.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-lite
Obsługiwane typy danych

Dane wejściowe

Tekst, obraz, film, dźwięk, PDF

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

65 536

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Kontekst adresu URL

Obsługiwane

Szukaj groundingu

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślenie

Obsługiwane

Tryb wsadowy

Obsługiwane

Kontekst adresu URL

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Stabilny: gemini-2.5-flash-lite
  • Podgląd: gemini-2.5-flash-lite-06-17
Ostatnia aktualizacja Lipiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Flash Live

Model Gemini 2.5 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-live-2.5-flash-preview
Obsługiwane typy danych

Dane wejściowe

dźwięk, obraz i tekst;

Dane wyjściowe

tekst i dźwięk,

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Myślenie

Nieobsługiwane

Kontekst adresu URL

Obsługiwane

 wersji
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-live-2.5-flash-preview
Ostatnia aktualizacja Czerwiec 2025 r.
Granica wiedzy Styczeń 2025 r.

Gemini 2.5 Flash Native Audio

Nasze natywne modele dialogów audio z myśleniem i bez niego, dostępne w ramach interfejsu Live API. Te modele zapewniają interaktywne i nieustrukturyzowane rozmowy z użyciem promptów dotyczących stylu i kontroli.

Wypróbuj natywny dźwięk w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-preview-native-audio-dialog &
models/gemini-2.5-flash-exp-native-audio-thinking-dialog
Obsługiwane typy danych

Dane wejściowe

Audio, wideo, tekst

Dane wyjściowe

Dźwięk i tekst

Limity tokenów[*]

Limit tokenów wejściowych

128 000

Limit tokenów wyjściowych

8000

Uprawnienia

Generowanie dźwięku

Obsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Szukaj groundingu

Obsługiwane

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Myślenie

Obsługiwane

Dostrajanie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.5-flash-preview-05-20
  • Eksperymentalne: gemini-2.5-flash-exp-native-audio-thinking-dialog
Ostatnia aktualizacja Maj 2025 r.
Granica wiedzy Styczeń 2025 r.

Przesłuchiwanie tekstu w Gemini 2.5 Flash

Gemini 2.5 Flash Preview TTS to nasz model zamiany tekstu na mowę o korzystnym stosunku ceny do wydajności. Zapewnia on dużą kontrolę i przejrzystość w przypadku ustrukturyzowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Flash są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji przedpremierowej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-flash-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Dźwięk

Limity tokenów[*]

Limit tokenów wejściowych

8000

Limit tokenów wyjściowych

16 000

Uprawnienia

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Live API

Nieobsługiwane

Myślenie

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • gemini-2.5-flash-preview-tts
Ostatnia aktualizacja Maj 2025 r.

Przesłuchiwanie tekstu w Gemini 2.5 Pro

Gemini 2.5 Pro Preview TTS to nasz najpotężniejszy model zamiany tekstu na mowę, który zapewnia dużą kontrolę i przejrzystość w przypadku uporządkowanych przepływów pracy, takich jak generowanie podcastów, audiobooków, obsługa klienta i inne. Limity szybkości Gemini 2.5 Pro są bardziej restrykcyjne, ponieważ jest to model eksperymentalny / w wersji testowej.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.5-pro-preview-tts
Obsługiwane typy danych

Dane wejściowe

Tekst

Dane wyjściowe

Dźwięk

Limity tokenów[*]

Limit tokenów wejściowych

8000

Limit tokenów wyjściowych

16 000

Uprawnienia

Ustrukturyzowane dane wyjściowe

Nieobsługiwane

Zapisywanie w pamięci podręcznej

Nieobsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Live API

Nieobsługiwane

Myślenie

Nieobsługiwane

 wersji
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • gemini-2.5-pro-preview-tts
Ostatnia aktualizacja Maj 2025 r.

Gemini 2.0 Flash

Gemini 2.0 Flash oferuje funkcje nowej generacji i ulepszone możliwości, w tym większą szybkość, natywne korzystanie z narzędzi i okno kontekstu z milionem tokenów.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Obsługiwane

Myślenie

Eksperymentalne

Tryb wsadowy

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-2.0-flash
  • Stabilny: gemini-2.0-flash-001
  • Eksperymentalne: gemini-2.0-flash-exp
Ostatnia aktualizacja Luty 2025 r.
Granica wiedzy Sierpień 2024 r.

Generowanie obrazów w Gemini 2.0 Flash

Generowanie obrazów w wersji podglądowej Gemini 2.0 Flash zapewnia ulepszone funkcje generowania obrazów, w tym generowanie i edytowanie obrazów w formie konwersacji.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-preview-image-generation
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst i obrazy

Limity tokenów[*]

Limit tokenów wejściowych

32 000

Limit tokenów wyjściowych

8192

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Nieobsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie obrazów

Obsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Myślenie

Nieobsługiwane

 wersji
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.0-flash-preview-image-generation
  • Funkcja gemini-2.0-flash-preview-image-generation nie jest obecnie obsługiwana w kilku krajach w Europie, na Bliskim Wschodzie i w Afryce

Ostatnia aktualizacja Maj 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 2.0 Flash-Lite

Model Gemini 2.0 Flash zoptymalizowany pod kątem niskich kosztów i małych opóźnień.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-lite
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Nieobsługiwane

Szukaj

Nieobsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Nieobsługiwane

Live API

Nieobsługiwane

Batch API

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-2.0-flash-lite
  • Stabilny: gemini-2.0-flash-lite-001
Ostatnia aktualizacja Luty 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 2.0 Flash Live

Model Gemini 2.0 Flash Live współpracuje z interfejsem Live API, aby umożliwić dwukierunkowe interakcje z użyciem głosu i wideo z niewielkimi opóźnieniami dzięki Gemini. Model może przetwarzać tekst, dźwięk i wideo, a także generować tekst i dźwięk.

Wypróbuj w Google AI Studio

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-2.0-flash-live-001
Obsługiwane typy danych

Dane wejściowe

dźwięk, obraz i tekst;

Dane wyjściowe

tekst i dźwięk,

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Uprawnienia

Ustrukturyzowane dane wyjściowe

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Szukaj

Obsługiwane

Generowanie obrazów

Nieobsługiwane

Generowanie dźwięku

Obsługiwane

Myślenie

Nieobsługiwane

Kontekst adresu URL

Obsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Podgląd: gemini-2.0-flash-live-001
Ostatnia aktualizacja Kwiecień 2025 r.
Granica wiedzy Sierpień 2024 r.

Gemini 1.5 Flash

Gemini 1.5 Flash to szybki i wszechstronny model multimodalny do skalowania wykorzystywany w różnorodnych zadaniach.

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-flash
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Specyfikacje audiowizualne

Maksymalna liczba obrazów na prompt

3,600

Maksymalna długość filmu

1 godzina

Maksymalna długość dźwięku

Około 9,5 godziny

Uprawnienia

Instrukcje systemowe

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Ustawienia bezpieczeństwa z możliwością dostosowania

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-1.5-flash-latest
  • Najnowsza stabilna wersja: gemini-1.5-flash
  • Stabilna:
    • gemini-1.5-flash-001
    • gemini-1.5-flash-002
Data wycofania Wrzesień 2025 r.
Ostatnia aktualizacja Wrzesień 2024 r.

Gemini 1.5 Flash-8B

Gemini 1.5 Flash-8B to mały model przeznaczony do mniej wymagających zadań.

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-flash-8b
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

1 048 576

Limit tokenów wyjściowych

8192

Specyfikacje audiowizualne

Maksymalna liczba obrazów na prompt

3,600

Maksymalna długość filmu

1 godzina

Maksymalna długość dźwięku

Około 9,5 godziny

Uprawnienia

Instrukcje systemowe

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Ustawienia bezpieczeństwa z możliwością dostosowania

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Obsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Live API

Nieobsługiwane

 wersji
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-1.5-flash-8b-latest
  • Najnowsza stabilna wersja: gemini-1.5-flash-8b
  • Stabilna:
    • gemini-1.5-flash-8b-001
Data wycofania Wrzesień 2025 r.
Ostatnia aktualizacja Październik 2024 r.

Gemini 1.5 Pro

Wypróbuj Gemini 2.5 Pro w wersji podglądowej, nasz najbardziej zaawansowany model Gemini.

Gemini 1.5 Pro to średniej wielkości model multimodalny zoptymalizowany pod kątem szerokiego zakresu zadań wymagających wnioskowania. Wersja 1.5 Pro może przetwarzać duże ilości danych naraz, w tym 2 godziny filmu, 19 godzin dźwięku, bazy kodów zawierające 60 tys. linii kodu lub 2000 stron tekstu.

Szczegóły modelu

Właściwość Opis
Kod modelu models/gemini-1.5-pro
Obsługiwane typy danych

Dane wejściowe

dźwięk, obrazy, filmy i tekst;

Dane wyjściowe

Tekst

Limity tokenów[*]

Limit tokenów wejściowych

2 097 152

Limit tokenów wyjściowych

8192

Specyfikacje audiowizualne

Maksymalna liczba obrazów na prompt

7200

Maksymalna długość filmu

2 godziny

Maksymalna długość dźwięku

Około 19 godzin

Uprawnienia

Instrukcje systemowe

Obsługiwane

Tryb JSON

Obsługiwane

Schemat JSON

Obsługiwane

Ustawienia bezpieczeństwa z możliwością dostosowania

Obsługiwane

Zapisywanie w pamięci podręcznej

Obsługiwane

Dostrajanie

Nieobsługiwane

Wywoływanie funkcji

Obsługiwane

Wykonanie kodu

Obsługiwane

Live API

Nieobsługiwane

Wersje
Więcej informacji znajdziesz w artykule Wzorce wersji modelu.
  • Najnowsze: gemini-1.5-pro-latest
  • Najnowsza stabilna wersja: gemini-1.5-pro
  • Stabilna:
    • gemini-1.5-pro-001
    • gemini-1.5-pro-002
Data wycofania Wrzesień 2025 r.
Ostatnia aktualizacja Wrzesień 2024 r.

Zapoznaj się z przykładami, aby poznać możliwości tych wersji modeli.

[*] W przypadku modeli Gemini token odpowiada około 4 znakom. 100 tokenów to około 60–80 słów w języku angielskim.

Wzorce nazw wersji modelu

Modele Gemini są dostępne w wersjach stabilnej, testowej lub eksperymentalnej. W kodzie możesz użyć jednego z tych formatów nazwy modelu, aby określić, którego modelu i wersji chcesz użyć.

Najnowsza stabilna

Wskazuje najnowszą stabilną wersję wydaną dla określonego modelu, generacji i wariantu.

Aby określić najnowszą stabilną wersję, użyj tego wzorca:<model>-<generation>-<variation>. Na przykład: gemini-2.0-flash.

Stabilny

Wskazuje konkretny stabilny model. Modele stabilne zwykle nie ulegają zmianom. Większość aplikacji produkcyjnych powinna korzystać z określonego stabilnego modelu.

Aby określić wersję stabilną, użyj tego wzorca:<model>-<generation>-<variation>-<version> Na przykład:gemini-2.0-flash-001.

Podgląd

Wskazuje model w wersji przedpremierowej, który może nie być odpowiedni do użytku produkcyjnego, ma bardziej restrykcyjne limity szybkości, ale może mieć włączone rozliczenia.

Aby określić wersję podglądową, użyj tego wzorca:<model>-<generation>-<variation>-<version> Na przykład:gemini-2.5-pro-preview-06-05.

Modele w wersji podglądowej nie są stabilne, a dostępność punktów końcowych modeli może ulec zmianie.

Eksperymentalna

Wskazuje model eksperymentalny, który może nie być odpowiedni do użytku produkcyjnego i ma bardziej restrykcyjne limity szybkości. Modele eksperymentalne udostępniamy, aby zbierać opinie i szybko przekazywać deweloperom najnowsze aktualizacje.

Aby określić wersję eksperymentalną, użyj tego wzorca:<model>-<generation>-<variation>-<version>. Na przykład:gemini-2.0-pro-exp-02-05.

Modele eksperymentalne nie są stabilne, a dostępność punktów końcowych modeli może się zmienić.

Modele eksperymentalne

Oprócz stabilnych modeli Gemini API oferuje modele eksperymentalne, które mogą nie być odpowiednie do użytku w środowisku produkcyjnym i mają bardziej restrykcyjne limity szybkości.

Udostępniamy modele eksperymentalne, aby zbierać opinie, szybko udostępniać deweloperom najnowsze aktualizacje i pokazywać tempo innowacji w Google. Dzięki temu, czego dowiadujemy się z eksperymentalnych wersji, możemy lepiej przygotować się na szersze wdrożenie modeli. Model eksperymentalny można zastąpić innym bez wcześniejszego powiadomienia. Nie gwarantujemy, że model eksperymentalny stanie się w przyszłości modelem stabilnym.

Poprzednie modele eksperymentalne

Gdy pojawią się nowe wersje lub stabilne wydania, usuwamy modele eksperymentalne i zastępujemy je nowymi. Poprzednie modele eksperymentalne, które udostępniliśmy, znajdziesz w sekcji poniżej wraz z wersją zastępczą:

Kod modelu Model podstawowy Wersja zastępcza
gemini-embedding-exp-03-07 Osadzanie Gemini gemini-embedding-001
gemini-2.5-flash-preview-04-17 Gemini 2.5 Flash gemini-2.5-flash-preview-05-20
gemini-2.0-flash-exp-image-generation Gemini 2.0 Flash gemini-2.0-flash-preview-image-generation
gemini-2.5-pro-preview-06-05 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-05-06 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.5-pro-preview-03-25 Gemini 2.5 Pro gemini-2.5-pro
gemini-2.0-flash-thinking-exp-01-21 Gemini 2.5 Flash gemini-2.5-flash-preview-04-17
gemini-2.0-pro-exp-02-05 Gemini 2.0 Pro Experimental gemini-2.5-pro-preview-03-25
gemini-2.0-flash-exp Gemini 2.0 Flash gemini-2.0-flash
gemini-exp-1206 Gemini 2.0 Pro gemini-2.0-pro-exp-02-05
gemini-2.0-flash-thinking-exp-1219 Gemini 2.0 Flash Thinking gemini-2.0-flash-thinking-exp-01-21
gemini-exp-1121 Gemini gemini-exp-1206
gemini-exp-1114 Gemini gemini-exp-1206
gemini-1.5-pro-exp-0827 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-pro-exp-0801 Gemini 1.5 Pro gemini-exp-1206
gemini-1.5-flash-8b-exp-0924 Gemini 1.5 Flash-8B gemini-1.5-flash-8b
gemini-1.5-flash-8b-exp-0827 Gemini 1.5 Flash-8B gemini-1.5-flash-8b

Obsługiwane języki

Modele Gemini są trenowane do pracy w tych językach:

  • arabski (ar),
  • bengalski (bn)
  • bułgarski (bg),
  • chiński uproszczony i tradycyjny (zh),
  • chorwacki (hr),
  • czeski (cs)
  • duński (da),
  • Niderlandzki (nl)
  • angielski (en),
  • estoński (et),
  • fiński (fi),
  • francuski (fr),
  • Niemiecki (de)
  • grecki (el),
  • hebrajski (iw)
  • hindi (hi),
  • węgierski (hu),
  • Indonezyjski (id)
  • Włoski (it)
  • japoński (ja),
  • koreański (ko),
  • łotewski (lv)
  • litewski (lt),
  • norweski (no),
  • polski (pl),
  • portugalski (pt),
  • rumuński (ro),
  • rosyjski (ru),
  • serbski (sr)
  • słowacki (sk)
  • słoweński (sl),
  • hiszpański (es),
  • suahili (sw),
  • szwedzki (sv),
  • tajski (th),
  • turecki (tr),
  • ukraiński (uk),
  • wietnamski (vi),