meta-llama/Meta-Llama-3-8B-Instruct

🧠 AIモデルmeta-llama

Metaの80億パラメータ・インストラクションチューニングLLMが、チャット・推論・コード生成を大規模に実現。

Meta-Llama-3-8B-Instructは、MetaのLlama 3 8Bベースモデルの微調整版で、指示に従う対話型・アシスタント型アプリケーション向けに設計されています。Llama 2よりも大幅に大規模で高品質なデータセットで学習されたtransformerアーキテクチャを採用し、128Kトークンに拡張された語彙と8Kコンテキストウィンドウを備えています。インストラクションチューニングには教師あり微調整（SFT）と人間フィードバックからの強化学習（RLHF）を用い、出力をユーザーの意図に合わせています。主に英語を中心とした多言語対話に対応し、コード生成、推論、複雑なプロンプトの遵守に優れています。Llama 3コミュニティライセンスに基づくゲート制のオープンソースとして配布され、アクセスにはMetaのライセンス規約への同意が必要です。safetensors形式で配布され、Hugging Face Transformers、vLLM、llama.cppなど主要な推論スタックと互換性があります。

💡ハイライト

├─8Bパラメータ、128K語彙、8Kコンテキストウィンドウ
├─SFT + RLHFによるインストラクションチューニング
└─Hugging Faceで100万件以上のダウンロード

🎯対象

├─AI研究者
├─LLMアプリケーション開発者
└─オープンソース貢献者

🔗リンク

└─Hugging Faceモデルカード