Membuat embedding teks

Ekstensi google_ml_integration mencakup fungsi penyematan dalam dua namespace yang berbeda; public dan google_ml. Halaman ini menjelaskan cara membuat sematan teks menggunakan fungsi dari namespace ini.

Fungsi embedding() dalam skema public dapat digunakan dengan model embedding Vertex AI apa pun tanpa mendaftarkan endpoint. Jika Anda ingin meneruskan informasi kustom seperti jenis tugas, daftarkan endpoint, lalu gunakan fungsi google_ml.embedding() dalam skema google_ml. Untuk mengetahui informasi selengkapnya tentang cara mendaftarkan endpoint, lihat Mendaftarkan model.

Cara kerja penyematan

Bayangkan database yang berjalan di AlloyDB dengan karakteristik berikut:

  • Database berisi tabel, items. Setiap baris dalam tabel ini menjelaskan item yang dijual bisnis Anda.

  • Tabel items berisi kolom, complaints. Kolom TEXT ini menyimpan keluhan pembeli yang dicatat tentang setiap item.

  • Database ini terintegrasi dengan Vertex AI Model Garden, sehingga memberikan akses ke model berbahasa Inggris gemini-embedding-001.

Meskipun database ini menyimpan keluhan tentang item, keluhan ini disimpan sebagai teks biasa, sehingga sulit untuk dikueri. Misalnya, untuk melihat item mana yang paling banyak dikeluhkan oleh pelanggan yang menerima warna barang yang salah, Anda dapat menjalankan kueri SQL biasa pada tabel, yang mencari berbagai kecocokan kata kunci. Namun, pendekatan ini hanya mencocokkan baris yang berisi kata kunci persis tersebut.

Misalnya, kueri SQL dasar seperti SELECT * FROM item WHERE complaints LIKE "%wrong color%" tidak menampilkan baris yang kolom complaints-nya hanya berisi The picture shows a blue one, but the one I received was red.

Kueri SQL yang menggunakan embedding yang didukung LLM dapat membantu menampilkan respons yang mirip secara semantik untuk kueri tersebut. Dengan menerapkan embedding, Anda dapat membuat kueri tabel dalam contoh ini untuk item yang keluhannya memiliki kemiripan semantik dengan perintah teks tertentu, seperti It was the wrong color.

Untuk membuat embedding, pilih salah satu skema berikut.

Langkah berikutnya