meta-llama/Meta-Llama-3-8B-Instruct
🧠 ИИ Модельmeta-llama
Дообученная на инструкциях LLM от Meta на 8 млрд параметров для чата, рассуждений и генерации кода.
Meta-Llama-3-8B-Instruct — это дообученная вариация базовой модели Llama 3 8B от Meta, ориентированная на следование инструкциям и предназначенная для диалоговых и ассистентных приложений. Она использует архитектуру трансформера, обученную на значительно большем и качественном наборе данных по сравнению с Llama 2, с расширенным словарём на 128 тыс. токенов и контекстным окном 8K. Процесс дообучения на инструкциях включает контролируемое тонкое обучение (SFT) и обучение с подкреплением на основе обратной связи от человека (RLHF) для согласования выходных данных с намерениями пользователя. Модель поддерживает многоязычный диалог (преимущественно английский) и отлично справляется с генерацией кода, рассуждениями и следованием сложным запросам. Распространяется как закрытый (gated) релиз с открытым исходным кодом под лицензией Llama 3 Community License, требующей принятия лицензионных условий Meta перед получением доступа. Доступна в формате safetensors для эффективного и безопасного инференса и совместима с популярными стеками, включая Hugging Face Transformers, vLLM и llama.cpp.
💡Основное
- ├─8 млрд параметров, словарь 128K, контекст 8K
- ├─Конвейер SFT + RLHF
- └─1M+ загрузок на Hugging Face
🎯Для
- ├─Исследователи ИИ
- ├─Разработчики приложений на LLM
- └─Контрибьюторы open-source