google/gemma-4-12B-it

🧠 AIモデルgoogle

Googleの高性能な12Bマルチモーダルモデル。テキストと画像を自在に扱うany-to-any処理を実現。

google/gemma-4-12B-itは、Gemmaシリーズの大きな進化形であり、統一されたGemma 4アーキテクチャを活用して多様な入力モダリティを処理します。120億のパラメータにより、計算効率と推論能力の最適なバランスを実現しました。本モデルは指示追従のために特別にファインチューニングされており、テキストや画像入力に対して高い精度でユーザーのプロンプトに応答します。安全で効率的なロードが可能なsafetensors形式を採用し、Hugging Faceのtransformersエコシステムと完全に互換性があります。「any-to-any」機能により、視覚的質問応答（VQA）、画像キャプション生成、複雑な文書解釈など、クロスモーダル分析を必要とするパイプラインへのシームレスな統合が可能です。Apache 2.0ライセンスで公開されており、企業や研究用途での幅広い採用とカスタマイズが推奨されています。

💡ハイライト

├─120億パラメータのマルチモーダル構造
├─ネイティブなany-to-any入力サポート
└─指示追従タスクに最適化された設計

🎯対象

├─AI研究者
├─ソフトウェア開発者
└─機械学習エンジニア

🔗リンク

└─Hugging Faceリポジトリ