lmstudio-community/gemma-4-E4B-it-MLX-8bit

🧠 AI 모델lmstudio-community

Apple Silicon에서 효율적으로 실행되는 Google Gemma 4-E4B 모델의 8비트 MLX 양자화 버전입니다.

이 모델은 Google Gemma 4-E4B-it 아키텍처를 8비트 가중치 양자화를 적용한 MLX 형식으로 변환한 결과물입니다. MLX는 Apple Silicon(M 시리즈 칩)에서 효율적인 실행을 위해 설계된 Apple의 머신러닝 프레임워크입니다. 8비트 양자화를 통해 연산 효율성과 출력 품질 사이의 균형을 맞추어, 전체 정밀도 모델보다 적은 VRAM으로 복잡한 이미지-텍스트 간 변환 작업을 수행할 수 있습니다. 'any-to-any' 파이프라인을 지원하여 다재다능한 멀티모달 상호작용이 가능하며, safetensors 형식을 사용하여 안전하고 빠른 로딩을 보장합니다. 이 릴리스는 클라우드 API 의존 없이 로컬 애플리케이션에 최첨단 멀티모달 기능을 통합하려는 연구자와 개발자에게 매우 중요합니다.

💡하이라이트

├─8비트 MLX 최적화 양자화 적용
├─Any-to-any 멀티모달 작업 지원
└─Apple Silicon 네이티브 가속

🎯대상

├─AI 개발자
└─Apple Silicon 사용자

🔗링크

└─Hugging Face 저장소