DeepSeek: R1 Distill Llama 70B
🧠 AI 모델deepseek
DeepSeek R1 출력물을 증류한 70B 모델로, 경쟁력 있는 가격에 고급 추론 제공.
DeepSeek R1 Distill Llama 70B는 더 큰 DeepSeek R1 모델의 증류를 Llama-3.3-70B-Instruct 아키텍처에 적용합니다. 그 결과 강력한 추론 능력을 유지하는 더 효율적인 모델이 탄생했습니다. 주요 기능으로는 빈도 및 존재 페널티 지원, 추론 모드, 최대 토큰, 시드 제어, 중지 토큰이 있습니다. 이 모델은 수학, 논리, 코드 생성과 같은 복잡한 추론이 필요한 텍스트 생성 작업에 최적화되어 있습니다. 128,000 토큰의 컨텍스트 길이로 긴 문서와 확장된 대화를 처리할 수 있습니다. OpenRouter에서 사용 가능하며, 전체 모델을 실행하는 오버헤드 없이 고품질 추론을 원하는 개발자와 연구자에게 비용 효율적인 솔루션을 제공합니다.