Connor Treacy d03fda145d Add files via upload		hace 7 meses
..
README.md	d03fda145d Add files via upload	hace 7 meses
main.tf	d03fda145d Add files via upload	hace 7 meses
outputs.tf	d03fda145d Add files via upload	hace 7 meses
terraform.tfvars.example	d03fda145d Add files via upload	hace 7 meses
variables.tf	d03fda145d Add files via upload	hace 7 meses

GCP Vertex AI deployment

Deploy Llama 4 Scout models using Google Cloud Vertex AI managed service.

Overview

This Terraform configuration sets up a basic example deployment, demonstrating how to deploy/serve foundation models using GCP Vertex. Vertex AI provides fully managed ML services with Model-as-a-Service (MaaS) endpoints.

This example shows how to use basic services such as:

IAM roles for permissions management
Service accounts for fine-grained access control
Creating Vertex endpoints for model serving

In our architecture patterns for private cloud guide we outline advanced patterns for cloud deployment that you may choose to implement in a more complete deployment. This includes:

Deployment into multiple regions or clouds
Managed keys/secrets services
Comprehensive logging systems for auditing and compliance
Backup and recovery systems

Getting started

Prerequisites

GCP project with billing account enabled (required for API activation)
Terraform installed
Gcloud CLI configured
Application Default Credentials: gcloud auth application-default login

Deploy

Configure GCP authentication:

gcloud auth login
gcloud config set project YOUR_PROJECT_ID

Edit terraform.tfvars with your project ID.

Create configuration:

cd terraform/gcp-vertex-ai-default
cp terraform.tfvars.example terraform.tfvars

Deploy:

terraform init
terraform plan
terraform apply

Usage

Accept Llama Community License in Vertex AI Model Garden
Use Llama 4 Scout via MaaS API:

from google.cloud import aiplatform

aiplatform.init(
    project="your-project-id",
    location="us-central1"
)

# Model ID: meta/llama-4-scout-17b-16e-instruct-maas

README.md