Qwen3 VL 32B Instruct

🧠 AIモデルqwen

32Bパラメータのマルチモーダル視覚言語モデル、テキストと画像を高精度に理解。

Qwen3-VL-32B-Instructは、Qwenシリーズの最先端マルチモーダルモデルであり、指示追従に最適化されています。32Bパラメータにより、深い視覚認識と高度なテキスト推論を組み合わせ、画像キャプション、視覚的質問応答、ドキュメント理解などのタスクを実現します。262,144トークンの巨大なコンテキストウィンドウをサポートし、長文書や複数画像を単一リクエストで処理可能です。max_tokens、presence_penalty、response_format、seed、temperature、tool_choice、tools、top_pなどの設定可能なパラメータを提供します。価格は入力100万トークンあたり0.10ドル、出力100万トークンあたり0.42ドルです。入力モダリティはテキストと画像、出力はテキストです。OpenRouterや各種プロバイダから利用可能です。

💡ハイライト

├─32Bパラメータでバランスの取れた性能
├─262,144トークンのコンテキスト長
└─テキストと画像の入力、テキスト出力

🎯対象

├─AI研究者
├─マルチモーダルアプリケーション開発者
└─コンテンツ制作者

🔗リンク

└─OpenRouterモデルページ