Qwen3 VL 32B Instruct
🧠 AIモデルqwen
32Bパラメータのマルチモーダル視覚言語モデル、テキストと画像を高精度に理解。
Qwen3-VL-32B-Instructは、Qwenシリーズの最先端マルチモーダルモデルであり、指示追従に最適化されています。32Bパラメータにより、深い視覚認識と高度なテキスト推論を組み合わせ、画像キャプション、視覚的質問応答、ドキュメント理解などのタスクを実現します。262,144トークンの巨大なコンテキストウィンドウをサポートし、長文書や複数画像を単一リクエストで処理可能です。max_tokens、presence_penalty、response_format、seed、temperature、tool_choice、tools、top_pなどの設定可能なパラメータを提供します。価格は入力100万トークンあたり0.10ドル、出力100万トークンあたり0.42ドルです。入力モダリティはテキストと画像、出力はテキストです。OpenRouterや各種プロバイダから利用可能です。
💡ハイライト
- ├─32Bパラメータでバランスの取れた性能
- ├─262,144トークンのコンテキスト長
- └─テキストと画像の入力、テキスト出力
🎯対象
- ├─AI研究者
- ├─マルチモーダルアプリケーション開発者
- └─コンテンツ制作者