meta-llama/Meta-Llama-3-8B-Instruct

🧠 ИИ Модельmeta-llama

Дообученная на инструкциях LLM от Meta на 8 млрд параметров для чата, рассуждений и генерации кода.

Meta-Llama-3-8B-Instruct — это дообученная вариация базовой модели Llama 3 8B от Meta, ориентированная на следование инструкциям и предназначенная для диалоговых и ассистентных приложений. Она использует архитектуру трансформера, обученную на значительно большем и качественном наборе данных по сравнению с Llama 2, с расширенным словарём на 128 тыс. токенов и контекстным окном 8K. Процесс дообучения на инструкциях включает контролируемое тонкое обучение (SFT) и обучение с подкреплением на основе обратной связи от человека (RLHF) для согласования выходных данных с намерениями пользователя. Модель поддерживает многоязычный диалог (преимущественно английский) и отлично справляется с генерацией кода, рассуждениями и следованием сложным запросам. Распространяется как закрытый (gated) релиз с открытым исходным кодом под лицензией Llama 3 Community License, требующей принятия лицензионных условий Meta перед получением доступа. Доступна в формате safetensors для эффективного и безопасного инференса и совместима с популярными стеками, включая Hugging Face Transformers, vLLM и llama.cpp.

💡Основное

├─8 млрд параметров, словарь 128K, контекст 8K
├─Конвейер SFT + RLHF
└─1M+ загрузок на Hugging Face

🎯Для

├─Исследователи ИИ
├─Разработчики приложений на LLM
└─Контрибьюторы open-source

🔗Ссылки

└─Карточка модели на Hugging Face