本指南將介紹生成式 AI 的核心概念,以及在 Vertex AI 上建構應用程式的工作流程,涵蓋下列主題: 這份入門指南將介紹生成式 AI 的核心技術,並說明這些技術如何相互配合,為聊天機器人和應用程式提供支援。生成式 AI (也稱為 genAI 或 gen AI) 是機器學習 (ML) 領域,主要開發及使用 ML 模型來生成新內容。 生成式 AI 模型通常稱為大型語言模型 (LLM),因為這類模型規模龐大,且能理解及生成自然語言。不過,視模型訓練所用的資料而定,這些模型可以解讀及生成多種模態的內容,包括文字、圖片、影片和音訊。可處理多種資料模態的模型稱為多模態模型。 Google 提供 Gemini 系列生成式 AI 模型,專為多模態用途而設計,可處理圖片、影片和文字等多種形式的資訊。 如要讓生成式 AI 模型產生實用內容,用於實際應用,模型必須具備下列功能: 下圖概略說明整體工作流程: 生成式 AI 工作流程通常從提示開始。提示是傳送給生成式 AI 模型的自然語言要求,用來引導模型提供回覆。視模型而定,提示可以包含文字、圖片、影片、音訊、文件或多種模態 (多模態)。 舉例來說,簡單的文字提示可以是: 建立提示,讓模型提供所需回覆,這個過程稱為提示設計。雖然提示設計是反覆試驗的過程,但您可以運用提示設計原則和策略,引導模型做出符合預期的行為。Vertex AI Studio 提供提示管理工具,可協助您管理提示。 系統會將提示傳送給生成式 AI 模型,要求生成回覆。Vertex AI 提供各種生成式 AI 基礎模型,可透過代管 API 存取。 這些模型的大小、模態和費用各不相同。下表提供概要總覽: 您可以在 Model Garden 中探索 Google 模型、開放式模型和 Google 合作夥伴的模型。 您可以自訂 Google 基礎模型的預設行為,使模型不需要複雜的提示,便能生成一致、符合預期的結果。這項自訂程序稱為「模型微調」。調整模型有助於簡化提示,減少要求的成本和延遲時間。 Vertex AI 也提供模型評估工具,協助您評估微調模型的成效。微調模型準備好投入生產後,您就可以將模型部署至端點,並像標準 MLOps 工作流程一樣監控效能。 Vertex AI 提供多種方式,讓模型存取外部 API 和即時資訊。 生成回覆後,Vertex AI 會檢查是否需要在回覆中加入引文。如果回應中的大部分文字出自同一來源,該來源就會加入回應的引文中繼資料。 提示和回覆在傳回前,會經過最後一層檢查,也就是安全篩選機制。Vertex AI 會檢查提示和回覆,判斷提示或回覆屬於安全類別的程度。如果一或多個類別超過門檻,系統會封鎖回應,且 Vertex AI 會傳回備用回應。 如果提示和回覆通過安全篩選器檢查,系統就會傳回回覆。通常系統會一次傳回所有回應。不過,啟用串流後,您也可以在 Vertex AI 生成回覆的同時逐步接收回覆。 如要開始在 Vertex AI 上使用生成式 AI,請試試下列任一快速入門導覽。 使用 SDK 將要求傳送至 Vertex AI Gemini API。 測試提示,無須進行任何設定。 使用 Vertex AI 的 Imagen 建立浮水印圖片。
概念
生成內容
提示
"Summarize the following article in three bullet points: [article text]"
基礎模型
型號系列 主要用途 Gemini API 進階推理、多輪對話、程式碼生成,以及多模態提示 (文字、圖像、影片、音訊)。 Imagen API 生成、編輯高品質圖片,以及生成圖像說明。 MedLM (已淘汰) 解答醫療問題和生成摘要。 自訂模型
存取外部資訊
選項 說明 用途 建立基準 將模型回覆連結至真實來源,例如您自己的資料或網路搜尋。 將回覆內容與特定資料連結,減少幻覺並提高事實準確度。 檢索增強生成 (RAG) 將模型連結至外部知識來源,例如文件和資料庫。 從大型知識庫擷取相關資訊,生成更準確且實用的回覆。 函式呼叫 讓模型與外部 API 互動。 取得即時資訊 (例如天氣、股價) 或執行現實生活中的工作 (例如預訂航班、傳送電子郵件)。 引文檢查
負責任的 AI 技術與安全
回應
開始使用
生成式 AI 新手指南
除非另有註明,否則本頁面中的內容是採用創用 CC 姓名標示 4.0 授權,程式碼範例則為阿帕契 2.0 授權。詳情請參閱《Google Developers 網站政策》。Java 是 Oracle 和/或其關聯企業的註冊商標。
上次更新時間:2025-08-19 (世界標準時間)。