Vertex AI Model Optimizer adalah endpoint dinamis yang dirancang untuk menyederhanakan pemilihan model dengan otomatis menerapkan model Gemini yang paling sesuai dengan kebutuhan Anda. Hal ini memungkinkan Anda mengarahkan perintah ke satu meta-endpoint dan layanan akan secara cerdas memilih model Gemini yang paling sesuai untuk kueri Anda (Pro, Flash, dll.) berdasarkan preferensi biaya dan kualitas Anda.
Untuk mengetahui informasi selengkapnya tentang harga Model Optimizer, lihat Harga.
Manfaat
Pengoptimal Model memungkinkan Anda:
- Menyederhanakan pemilihan model, bukan memilih model untuk setiap aplikasi
- Mengoptimalkan biaya, kualitas, atau keduanya, sehingga Anda dapat menyeimbangkan performa dan anggaran
- Berintegrasi secara lancar dengan Gemini API dan SDK yang ada
- Melacak penggunaan dan mengidentifikasi potensi penghematan biaya
- Menangani tugas berbasis teks secara efisien tanpa perlu memilih endpoint secara manual
Model yang didukung
- Gemini 2.0 Flash (GA)
- Gemini 2.5 Pro (pratinjau, 25-03)
Dukungan bahasa
Pengoptimal Model mendukung semua bahasa yang juga didukung oleh model Gemini. (Lihat Dukungan bahasa Gemini)
Pengandaian
Pengoptimal Model mendukung kasus penggunaan teks, termasuk:
- Coding, termasuk panggilan fungsi dan eksekusi kode
- Ringkasan
- Percakapan satu dan multi-giliran
- Tanya jawab
Untuk mengetahui batasan dan cara menanganinya, lihat Menangani fitur yang tidak didukung.
Memulai
Untuk mulai menggunakan Model Optimizer, lihat notebook Colab panduan memulai kami.
Menggunakan Pengoptimal Model Vertex AI
Python
Instal
pip install --upgrade google-genai
Untuk mempelajari lebih lanjut, lihat dokumentasi referensi SDK.
Tetapkan variabel lingkungan untuk menggunakan Gen AI SDK dengan Vertex AI:
# Replace the `GOOGLE_CLOUD_PROJECT` and `GOOGLE_CLOUD_LOCATION` values # with appropriate values for your project. export GOOGLE_CLOUD_PROJECT=GOOGLE_CLOUD_PROJECT export GOOGLE_CLOUD_LOCATION=global export GOOGLE_GENAI_USE_VERTEXAI=True
Menangani fitur yang tidak didukung
Pengoptimal Model hanya mendukung input dan output teks. Namun, permintaan dapat mencakup modalitas atau alat yang berbeda yang tidak didukung. Bagian berikut membahas cara Model Optimizer menangani fitur yang tidak didukung ini.
Permintaan multimodal
Permintaan yang menyertakan perintah dengan data multimodal, seperti video, gambar, atau audio, akan memunculkan error INVALID_ARGUMENT
.
Alat yang tidak didukung
Pengoptimal Model hanya mendukung deklarasi fungsi untuk permintaan. Jika permintaan berisi jenis alat lain termasuk google_maps
, google_search
, enterprise_web_search
, retrieval
, atau browse
, error INVALID_ARGUMENT
akan ditampilkan.
Kirim masukan
Untuk mengirim masukan tentang pengalaman Anda menggunakan Model Optimizer, isi survei masukan kami.
Jika ada pertanyaan, masalah teknis, atau masukan tentang Model Optimizer, hubungi [email protected].
Grup diskusi pelanggan
Untuk terhubung langsung dengan tim pengembangan, Anda dapat bergabung dengan Grup Diskusi Pengoptimal Model Vertex AI, tempat Anda dapat mempelajari produk dan membantu kami memahami cara membuat fitur berfungsi lebih baik untuk Anda. Aktivitas grup ini meliputi:
- Workshop virtual untuk mempelajari fitur lebih lanjut
- Survei masukan untuk menyampaikan kebutuhan dan prioritas Anda
- Sesi 1:1 dengan Google Cloud karyawan saat kami mempelajari fitur baru
Aktivitas ditawarkan sekitar sekali setiap 6-8 minggu. Anda dapat berpartisipasi sebanyak yang Anda inginkan, atau Anda dapat memilih untuk tidak berpartisipasi sama sekali kapan saja. Untuk bergabung dengan grup, lengkapi formulir pendaftaran grup diskusi Vertex AI Model Optimizer.