Introduzione a Vertex AI Workbench
Le istanze Vertex AI Workbench sono ambienti di sviluppo basati su blocchi note Jupyter per l'intero flusso di lavoro di data science. Puoi interagire con Vertex AI e altri servizi Google Cloud dall'interno del notebook Jupyter di un'istanza Vertex AI Workbench.
Le integrazioni e le funzionalità di Vertex AI Workbench possono semplificare l'accesso ai dati, l'elaborazione più rapida dei dati, la pianificazione delle esecuzioni dei blocchi note e altro ancora.
Le istanze di Vertex AI Workbench sono preconfigurate con JupyterLab e hanno una suite preinstallata di pacchetti di deep learning, incluso il supporto per i framework TensorFlow e PyTorch. Puoi configurare istanze solo CPU o abilitate alla GPU.
Le istanze di Vertex AI Workbench supportano la sincronizzazione con un repository GitHub.
Le istanze Vertex AI Workbench sono protette dall'autenticazione e dall'autorizzazione Google Cloud .
Accesso ai dati
Puoi accedere ai tuoi dati senza uscire dall'interfaccia utente di JupyterLab.
Nel menu di navigazione di JupyterLab in un'istanza di Vertex AI Workbench, puoi utilizzare l'integrazione di Cloud Storage per sfogliare i dati e altri file a cui hai accesso. Consulta Accedere ai bucket e ai file Cloud Storage da JupyterLab.
Puoi anche utilizzare l'integrazione di BigQuery per sfogliare le tabelle a cui hai accesso, scrivere query, visualizzare l'anteprima dei risultati e caricare i dati nel notebook. Consulta Esegui query sui dati nelle tabelle BigQuery da JupyterLab.
Esegui le esecuzioni del notebook
Utilizza l'executor per eseguire un file notebook una sola volta o in base a una pianificazione. Scegli l'ambiente e l'hardware specifici su cui vuoi eseguire l'esecuzione. Il codice del notebook verrà eseguito nell'addestramento personalizzato di Vertex AI, il che può semplificare l'addestramento distribuito, l'ottimizzazione degli iperparametri o la pianificazione di job di addestramento continuo.
Puoi utilizzare i parametri nell'esecuzione per apportare modifiche specifiche a ogni esecuzione. Ad esempio, potresti specificare un set di dati diverso da utilizzare, modificare il tasso di apprendimento del modello o cambiare la versione del modello.
Puoi anche impostare l'esecuzione di un blocco note in base a una pianificazione ricorrente. Anche se l'istanza è arrestata, Vertex AI Workbench eseguirà il file del notebook e salverà i risultati in modo che tu possa visualizzarli e condividerli con altri. Vedi Pianificare l'esecuzione di un notebook.
Condividere approfondimenti
Le esecuzioni dei notebook vengono archiviate in un bucket Cloud Storage, in modo da poter condividere i tuoi approfondimenti con altri concedendo l'accesso ai risultati. Consulta la sezione precedente sull'esecuzione delle esecuzioni dei notebook.
Proteggere l'istanza
Le sezioni seguenti descrivono le funzionalità supportate che possono aiutarti a proteggere l'istanza Vertex AI Workbench.
VPC
Puoi eseguire il deployment dell'istanza Vertex AI Workbench con la rete predefinita gestita da Google, che utilizza una rete VPC e una subnet predefinite. Anziché la rete predefinita, puoi specificare una rete VPC da utilizzare con l'istanza.
Per utilizzare Vertex AI Workbench all'interno di un perimetro di servizio, consulta Utilizzare un'istanza di Vertex AI Workbench all'interno di un perimetro di servizio.
Chiavi di crittografia gestite dal cliente (CMEK)
Per impostazione predefinita, Google Cloud cripta automaticamente i dati quando sono in stato inattivo utilizzando chiavi di crittografia gestite da Google. Se hai requisiti normativi o di conformità specifici relativi alle chiavi che proteggono i tuoi dati, puoi utilizzare le chiavi di crittografia gestite dal cliente (CMEK) con le tue istanze Vertex AI Workbench. Per saperne di più, vedi Chiavi di crittografia gestite dal cliente.
Confidential Computing
Puoi criptare i dati in uso utilizzando Confidential Computing. Per utilizzare Confidential Computing, devi abilitare il servizio Confidential VM quando crei un'istanza di Vertex AI Workbench. Per iniziare, consulta Crea un'istanza con Confidential Computing.
Arresto automatico per le istanze inattive
Per contribuire a gestire i costi, le istanze di Vertex AI Workbench vengono arrestate dopo un periodo di inattività specifico per impostazione predefinita. Puoi modificare la durata o disattivare questa funzionalità. Per ulteriori informazioni, vedi Arresto inattivo.
Aggiungere ambienti conda
Le istanze Vertex AI Workbench utilizzano kernel basati su ambienti conda. Puoi aggiungere un ambiente conda alla tua istanza Vertex AI Workbench e l'ambiente viene visualizzato come kernel nell'interfaccia JupyterLab dell'istanza.
L'aggiunta di ambienti conda consente di utilizzare kernel non disponibili nell'istanza Vertex AI Workbench predefinita. Ad esempio, puoi aggiungere ambienti conda per R e Apache Beam. In alternativa, puoi aggiungere ambienti conda per versioni precedenti specifiche dei framework disponibili, come TensorFlow, PyTorch o Python.
Per maggiori informazioni, vedi Aggiungere un ambiente conda.
Container personalizzati
Puoi creare un'istanza di Vertex AI Workbench basata su un contenitore personalizzato. Inizia con un'immagine container di base fornita da Google e modificala in base alle tue esigenze. Poi crea un'istanza basata sul container personalizzato.
Per saperne di più, consulta Crea un'istanza utilizzando un container personalizzato.
Integrazione di Dataproc
Puoi elaborare i dati rapidamente eseguendo un notebook su un cluster Dataproc. Una volta configurato il cluster, puoi eseguire un file di notebook senza uscire dall'interfaccia utente di JupyterLab. Per saperne di più, consulta Creare un'istanza abilitata per Dataproc.
Prenota le risorse VM
Utilizza le prenotazioni di Compute Engine per avere la certezza che le tue istanze Vertex AI Workbench dispongano di risorse di macchine virtuali (VM) sufficienti per l'esecuzione.
Le prenotazioni sono una funzionalità di Compute Engine. Ti aiutano ad avere sempre a disposizione le risorse necessarie per creare VM con lo stesso hardware (memoria e vCPU) e le risorse facoltative (GPU e dischi SSD locali) ogni volta che ne hai bisogno.
Per saperne di più, vedi Utilizzare le prenotazioni.
Crea istanze con credenziali di terze parti
Puoi creare e gestire istanze Vertex AI Workbench con credenziali di terze parti fornite da Workforce Identity Federation. La federazione delle identità per la forza lavoro utilizza il tuo provider di identità (IdP) esterno per concedere a un gruppo di utenti l'accesso alle istanze di Vertex AI Workbench tramite un proxy.
L'accesso a un'istanza di Vertex AI Workbench viene concesso assegnando un'entità del pool di forza lavoro� all'account di servizio dell'istanza di Vertex AI Workbench.
Per saperne di più, vedi Creare un'istanza con credenziali di terze parti.
Tag per le istanze Vertex AI Workbench
La VM sottostante di un'istanza Vertex AI Workbench è una VM Compute Engine. Puoi aggiungere e gestire i tag delle risorse alla tua istanza Vertex AI Workbench tramite la relativa VM Compute Engine.
Quando crei un'istanza di Vertex AI Workbench, Vertex AI Workbench associa il tag risorsa Compute Engine vertex-workbench-instances:prod=READ_ONLY
. Questo tag risorsa viene utilizzato solo per scopi interni.
Per saperne di più sulla gestione dei tag per le istanze Compute Engine, consulta Gestisci i tag per le risorse.
Limitazioni
Quando pianifichi il tuo progetto, tieni presente le seguenti limitazioni delle istanze di Vertex AI Workbench:
Le estensioni JupyterLab di terze parti non sono supportate.
Quando utilizzi Access Context Manager e Chrome Enterprise Premium per proteggere le istanze Vertex AI Workbench con controlli di accesso sensibili al contesto, l'accesso viene valutato ogni volta che l'utente si autentica all'istanza. Ad esempio, l'accesso viene valutato la prima volta che l'utente accede a JupyterLab e ogni volta che vi accede successivamente se il cookie del browser web è scaduto.
L'utilizzo di un container personalizzato non derivato dal container di base fornito da Google (
gcr.io/deeplearning-platform-release/workbench-container:latest
) aumenta i rischi di problemi di compatibilità con i nostri servizi e non è supportato. Modifica invece il container di base per creare un container personalizzato che soddisfi le tue esigenze, quindi crea un'istanza utilizzando il container personalizzato.Le istanze Vertex AI Workbench prevedono immagini del progetto
cloud-notebooks-managed
. L'elenco dei nomi delle immagini è disponibile nella pagina di creazione della console Google Cloud . Sebbene sia possibile utilizzare immagini di macchine virtuali (VM) personalizzate o immagini di Deep Learning VM con istanze di Vertex AI Workbench, Vertex AI Workbench non fornisce assistenza per comportamenti o malfunzionamenti imprevisti durante l'utilizzo di queste immagini.L'utilizzo di un'immagine di notebook gestiti dall'utente o di un'immagine di notebook gestiti per creare un'istanza di Vertex AI Workbench non è supportato.
Non puoi modificare la VM sottostante di un'istanza Vertex AI Workbench utilizzando la console Google Cloud o l'API Compute Engine. Per modificare la VM sottostante di un'istanza di Vertex AI Workbench, utilizza il metodo
projects.locations.instances.patch
nell'API Notebooks o il comandogcloud workbench instances update
in Google Cloud SDK.Nelle istanze che utilizzano i Controlli di servizio VPC, l'utilizzo di executor non è supportato.
Per utilizzare gli acceleratori con le istanze Vertex AI Workbench, il tipo di acceleratore che vuoi deve essere disponibile nella zona dell'istanza. Per informazioni sulla disponibilità degli acceleratori per zona, consulta la sezione Disponibilità delle GPU per regioni e zone.