Meta: Llama 3.2 90B Vision Instruct

Name: Meta: Llama 3.2 90B Vision Instruct
Brand: Meta
SKU: meta-llama-llama-3.2-90b-vision-instruct
Price: 0.35 USD
Availability: InStock

byMeta

The Llama 90B Vision model is a top-tier, 90-billion-parameter multimodal model designed for the most challenging visual reasoning and language tasks. It offers unparalleled accuracy in image captioning, visual question answering, and advanced image-text comprehension. Pre-trained on vast multimodal datasets and fine-tuned with human feedback, the Llama 90B Vision is engineered to handle the most demanding image-based AI tasks. This model is perfect for industries requiring cutting-edge multimodal AI capabilities, particularly those dealing with complex, real-time visual and textual analysis. Click here for the [original model card](https://github.com/meta-llama/llama-models/blob/main/models/llama3_2/MODEL_CARD_VISION.md). Usage of this model is subject to [Meta's Acceptable Use Policy](https://www.llama.com/llama3/use-policy/).

Pricing

Input

$0.35 / 1M tokens

Output

$0.40 / 1M tokens

Specifications

Context Window33K tokens

Max Output16K tokens

Modalitymultimodal

Input Typestext, image

Output Typestext

Strategic Analysis 🔒

Unlock vCAIO insights to make better model decisions:

Governance Risk Rating (Low / Medium / High)
Quality Tier Classification
Best Use Cases & Tags
Strategic Verdict from vCAIO
AI-Verified Fit Scoring

Start Free Trial Sign In

Not sure if this model fits your use case?

Describe your task and get AI-verified recommendations in seconds.

Try Model Advisor

Popular model profiles

Pricing last updated: Invalid Date

Meta: Llama 3.2 90B Vision Instruct

Pricing

Specifications

Strategic Analysis 🔒

Not sure if this model fits your use case?

Popular model profiles

Other Meta Models

Meta: Llama 3 70B Instruct

Meta: Llama 3.1 70B Instruct

Meta: Llama 3.3 70B Instruct

Meta: Llama 3.1 405B (base)