meta-llama/Meta-Llama-3-8B-Instruct
🧠 AIモデルmeta-llama
Metaの80億パラメータ・インストラクションチューニングLLMが、チャット・推論・コード生成を大規模に実現。
Meta-Llama-3-8B-Instructは、MetaのLlama 3 8Bベースモデルの微調整版で、指示に従う対話型・アシスタント型アプリケーション向けに設計されています。Llama 2よりも大幅に大規模で高品質なデータセットで学習されたtransformerアーキテクチャを採用し、128Kトークンに拡張された語彙と8Kコンテキストウィンドウを備えています。インストラクションチューニングには教師あり微調整(SFT)と人間フィードバックからの強化学習(RLHF)を用い、出力をユーザーの意図に合わせています。主に英語を中心とした多言語対話に対応し、コード生成、推論、複雑なプロンプトの遵守に優れています。Llama 3コミュニティライセンスに基づくゲート制のオープンソースとして配布され、アクセスにはMetaのライセンス規約への同意が必要です。safetensors形式で配布され、Hugging Face Transformers、vLLM、llama.cppなど主要な推論スタックと互換性があります。
💡ハイライト
- ├─8Bパラメータ、128K語彙、8Kコンテキストウィンドウ
- ├─SFT + RLHFによるインストラクションチューニング
- └─Hugging Faceで100万件以上のダウンロード
🎯対象
- ├─AI研究者
- ├─LLMアプリケーション開発者
- └─オープンソース貢献者