unsloth/gemma-4-12b-it-GGUF

🧠 AI 모델unsloth

Unsloth가 빠른 로컬 추론을 위해 최적화한 GGUF 양자화 Google Gemma 4 12B 멀티모달 모델

이 저장소는 Unsloth가 효율적인 로컬 추론을 위해 준비하고 최적화한 Google Gemma 4 12B 명령어 튜닝(IT) 모델의 GGUF 양자화 버전을 제공합니다. 원본 모델은 이미지-텍스트-투-텍스트 파이프라인을 지원하는 멀티모달 아키텍처이며, GGUF 포맷은 llama.cpp, Ollama, LM Studio, text-generation-webui 같은 추론 엔진을 통해 소비자용 하드웨어에서 실행될 수 있도록 합니다. Unsloth는 모델 품질을 유지하면서 VRAM 요구 사항을 크게 줄이는 고도로 최적화된 동적 양자화 모델 파일을 제작하는 것으로 잘 알려져 있습니다. Gemma 4 12B 베이스는 성능과 효율성 사이의 훌륭한 균형을 제공하며, 이 배포판은 고가의 클라우드 GPU 없이도 강력한 멀티모달 모델을 실행하고 싶은 사용자들이 쉽게 접근할 수 있도록 만듭니다. 이 모델은 원래 Gemma 4 출시의 통합 텍스트-비전 기능을 그대로 유지하며, Apache 2.0 라이선스로 배포되어 상업적 및 연구 목적으로 폭넓게 사용할 수 있습니다.

💡하이라이트

├─이미지-텍스트-투-텍스트 멀티모달 파이프라인
├─로컬 CPU/GPU 추론용 GGUF 포맷
├─Google Gemma 4 12B IT 기반
├─Unsloth의 동적 양자화 최적화 적용
└─Apache 2.0 오픈소스 라이선스

🎯대상

├─AI 개발자
├─로컬 LLM 사용자
└─멀티모달 AI 연구자

🔗링크

├─HuggingFace 모델 페이지
└─베이스 모델: google/gemma-4-12B-it