本指南将介绍生成式 AI 的核心概念以及在 Vertex AI 上构建应用的工作流,涵盖以下主题: 本新手指南将向您介绍生成式 AI 的核心技术,并说明这些技术如何协同工作来为聊天机器人和应用提供支持。 生成式 AI(也称为 genAI)是机器学习 (ML) 的一个领域,用于开发和使用机器学习模型来生成新内容。 生成式 AI 模型通常称为大语言模型 (LLM),因为它们规模庞大,并且能够理解和生成自然语言。不过,根据模型接受的训练数据,这些模型可以理解和生成来自多种模态(包括文本、图片、视频和音频)的内容。处理多种数据模态的模型称为多模态模型。 Google 提供了专为多模态应用场景设计的 Gemini 系列生成式 AI 模型;能够处理来自多种模态(包括图片、视频和文本)的信息。 为了让生成式 AI 模型生成在实际应用中实用的内容,模型需要具备以下能力: 下图总结了整个工作流程: 生成式 AI 工作流通常从提示开始。提示是发送给生成式 AI 模型以引发回答的自然语言请求。根据模型的不同,提示可以包含文本、图片、视频、音频、文档或多种模态(多模态提示)。 例如,一个简单的文本提示可以是: 创建提示以从模型获取所需回答的做法称为提示设计。虽然提示设计是一个试验和试错过程,但您可以利用提示设计原则和策略来智能调整模型,使其行为符合预期。Vertex AI Studio 提供提示管理工具,可帮助您管理提示。 提示会发送到生成式 AI 模型以生成回答。Vertex AI 具有可通过托管 API 访问的各种生成式 AI 基础模型。 这些模型的大小、模态和费用各有不同。下表简要介绍了这些服务: 您可以在 Model Garden 中探索 Google 模型,以及 Google 合作伙伴提供的开放模型和其他模型。 您可以自定义 Google 基础模型的默认行为,以便在不使用复杂提示的情况下始终生成所需的结果。此自定义过程称为模型调优。模型调优可让您简化提示,从而帮助您降低请求的费用并缩短延迟时间。 Vertex AI 还提供模型评估工具,可帮助您评估经过调优的模型的性能。在经过调优的模型可用于生产后,您可以像在标准 MLOps 工作流中一样将其部署到端点并监控性能。 Vertex AI 提供多种方法,可让模型访问外部 API 和实时信息。 生成回答后,Vertex AI 会检查回答中是否需要包含引用。如果回答中有大量文本来自特定来源,则该来源会添加到回答中的引用元数据。 在返回提示和回答之前要经过的最后一层检查是安全过滤器。Vertex AI 会检查提示和回答,以了解提示或回答属于安全类别的程度。如果一个或多个类别超过阈值,则响应会被阻止,Vertex AI 将返回后备响应。 如果提示和回答通过了安全过滤条件检查,则系统会返回回答。通常,系统会一次性返回所有回答。不过,您还可以使用 Vertex AI 通过启用流式传输来逐步接收生成的响应。 请尝试使用以下快速入门之一开始使用 Vertex AI 上的生成式 AI。 使用 SDK 向 Vertex AI Gemini API 发送请求。 测试无需设置的提示。 使用 Imagen on Vertex AI 创建带水印的图片。
概念
内容生成
提示
"Summarize the following article in three bullet points: [article text]"
基础模型
模型系列 主要使用场景 Gemini API 高级推理、多轮聊天、代码生成和多模态提示(文本、图片、视频、音频)。 Imagen API 高质量的图片生成、编辑和视觉标注。 MedLM(已弃用) 医学问题回答和摘要。 模型自定义
访问外部信息
选项 说明 使用场景 标准答案关联 将模型回答连接到真实来源(例如您自己的数据或网页搜索)。 通过将回答与特定数据相关联,减少幻觉并提高事实准确性。 检索增强生成 (RAG) 将模型连接到外部知识源(例如文档和数据库)。 通过从大型知识库中检索相关信息,生成更准确、信息更丰富的回答。 函数调用 让模型与外部 API 交互。 获取实时信息(例如天气、股价)或执行现实世界中的任务(例如预订航班、发送电子邮件)。 引用检查
Responsible AI 和安全
响应
开始使用
生成式 AI 新手指南
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-08-19。