Model Garden 簡介

Model Garden 是 AI/ML 模型庫,可協助您探索、測試、自訂及部署 Google 和 Google 合作夥伴的模型和資產。

Model Garden 的優點

使用 AI 模型時,Model Garden 提供下列優點:

  • 所有可用模型都會歸類在單一位置
  • Model Garden 為不同類型的模型提供一致的部署模式
  • Model Garden 內建與 Vertex AI 其他部分的整合功能,例如模型微調、評估和服務
  • 提供生成式 AI 模型服務可能很困難,但 Vertex AI 會為您處理模型部署和服務

探索模型

如要查看可用的 Vertex AI 及開放原始碼模型清單,包括基礎模型、可調整的模型,以及適用特定工作的模型,請前往Google Cloud 控制台的 Model Garden 頁面。

前往 Model Garden

Model Garden 中的模型類別如下:

類別 說明
基礎模型 預先訓練的大型多工模型,可透過 Vertex AI Studio、Vertex AI API 和 Vertex AI SDK for Python,針對特定工作進一步調整或自訂。
可微調的模型 可使用自訂筆記本或 pipeline 微調的模型。
特定工作的解決方案 這些預先建構的模型大多立即可用,您能運用自己資料來自訂其中許多模型。

如要在篩選器窗格中篩選模型,請指定下列項目:

  • 工作:按一下要模型執行的工作。
  • 模型集合:按一下即可選擇由 Google、合作夥伴或您管理的模型。
  • 供應商:按一下模型供應商。
  • 特徵:點選模型中所需的特徵。

如要進一步瞭解各模型,請按一下模型資訊卡。

如需 Model Garden 中可用的模型清單,請參閱「Model Garden 中可用的模型」。

模型安全性掃描

Google 會對提供的服務和調整容器進行徹底測試和基準化。主動式安全漏洞掃描也適用於容器構件。

精選合作夥伴提供的第三方模型會經過模型檢查點掃描,確保真實性。HuggingFace Hub 的第三方模型會直接由 HuggingFace 和第三方掃描器掃描,檢查是否含有惡意軟體、pickle 檔案、Keras Lambda 層和密碼。Hugging Face 會標記掃描後判定為不安全的模型,並禁止在 Model Garden 中部署這類模型。Model Garden 會標示出可疑模型或可能執行遠端程式碼的模型,但您仍可部署這些模型。建議您在 Model Garden 中部署任何可疑模型前,先進行全面審查。

定價

使用 Model Garden 中的開放原始碼模型時,您需要支付下列 Vertex AI 服務的費用:

  • 模型微調:系統會根據您使用的運算資源,以與自訂訓練相同的費率計費。請參閱自訂訓練定價
  • 模型部署作業:將模型部署至端點時,系統會收取所用運算資源的相關費用。請參閱預測定價
  • Colab Enterprise:請參閱 Colab Enterprise 定價

控管特定模型的存取權

您可以在機構、資料夾或專案層級設定 Model Garden 機構政策,控管 Model Garden 中特定模型的存取權。舉例來說,您可以允許存取您審查過的特定模型,並拒絕存取所有其他模型。

進一步瞭解 Model Garden

如要進一步瞭解部署選項,以及您可以在 Model Garden 中對模型進行的自訂作業,請參閱下列各節中的資源,包括教學課程、參考資料、筆記本和 YouTube 影片的連結。

部署及提供服務

進一步瞭解如何自訂部署作業和進階放送功能。

容器規範

Model Garden 提供下列符合 FedRAMP 高等風險規範的容器,用於模型服務。

容器名稱 支援的工作 容器映像檔版本 筆記本範例
PyTorch 推論 v0.1 audio2text
text2image
zero-shot-image-classification
zero-shot-object-detection
csm_text2speech
dia_text2speech
image-to-text
visual-question-answering
instant-id
janus_text2image
janus_text_generation
mask-generation
nllb_translation
paligemma_v2
pix2pix
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/pytorch-inference.cu125.0-1.ubuntu2204.py310:model-garden.pytorch-inference-0-1-gpu-release_20250727.00_p0

注意:偵測到的 CVE-2024-12797 安全漏洞在容器中視為誤報。
Whisper Large V3 (部署)
PyTorch Inference v0.4 audio2text
text2image
zero-shot-image-classification
zero-shot-object-detection
csm_text2speech
dia_text2speech
image-to-text
visual-question-answering
instant-id
janus_text2image
janus_text_generation
mask-generation
nllb_translation
paligemma_v2
pix2pix
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/pytorch-inference.cu125.0-4.ubuntu2204.py310:model-garden.pytorch-inference-0-4-gpu-release_20250725.00_p0

注意:偵測到的 CVE-2024-12797 安全漏洞在容器中視為誤判。
HiDream-I1
SGLang 文字轉文字生成 us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/sglang-serve.cu124.0-4.ubuntu2204.py310:model-garden.sglang-0-4-release_20250718.00_p0

注意:偵測到的 CVE-2024-12797 安全漏洞在容器中視為誤報。
Qwen3 (部署)
HuggingFace Inference Toolkit 文字轉圖像生成
一般文字生成
文字分類
翻譯
零樣本物件偵測
遮罩生成
句子嵌入
特徵擷取
填滿遮罩

完整工作清單:https://huggingface.co/docs/inference-endpoints/en/supported_tasks
us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/hf-inference-toolkit.cu125.0-1.ubuntu2204.py311:model-garden.hf-inference-toolkit-0-1-release_20250726.00_p0 Hugging Face PyTorch 推論部署
HuggingFace Text Embeddings Inference (TEI) text2embeddings us-docker.pkg.dev/deeplearning-platform-release/vertex-model-garden/hf-tei.cu125.0-1.ubuntu2204.py310:model-garden.hf-tei-0-1-release_20250727.00_p0

注意:偵測到的 CVE-2024-12797 安全漏洞在容器中視為誤報。
Hugging Face Text Embeddings Inference 部署作業

調整

進一步瞭解如何調整模型,針對特定用途量身打造回應。

評估

進一步瞭解如何使用 Vertex AI 評估模型回應

其他資源