40개 발견
aishwaryanr/awesome-generative-ai-guide는 생성형 AI와 관련된 모든 정보를 한곳에서 확인할 수 있는 커뮤니티 기반의 종합 저장소입니다. Aishwarya Naresh Reganti가 구축한 이 프로젝트는 고품질 연구 논문, 실습용 노트북, 학습 로드맵 및 인터뷰 자료를 집대성했습니다. LLM, 확산 모델 등 급변하는 AI 기술 환경을 탐색하려는 개발자와 연구자들에게 필수적인 학습 가이드입니다.
koala73이 개발한 WorldMonitor는 AI를 활용해 전 세계 뉴스, 지정학적 변화, 인프라 상태를 수집하고 분석하는 정교한 상황 인식 플랫폼입니다. TypeScript로 구축된 이 프로젝트는 복잡한 사건을 실시간으로 추적할 수 있는 통합 대시보드를 제공합니다. 방대한 데이터를 실행 가능한 인텔리전스로 변환함으로써, 자동화된 AI 기반 관점을 통해 글로벌 동향을 파악해야 하는 분석가, 연구원 및 조직을 위한 강력한 도구로 활용됩니다.
Palmier Pro는 palmier-io가 Swift로 개발한 오픈 소스 macOS 영상 편집기입니다. 전통적인 비선형 편집과 최신 AI 워크플로우를 결합하여, macOS 네이티브 프레임워크를 활용해 영상 제작 파이프라인에 AI 기능을 직접 도입함으로써 복잡한 편집 작업을 더욱 효율적으로 수행할 수 있게 합니다.
LibreTranslate는 상용 번역 서비스를 대체할 수 있는 강력한 개인정보 보호 중심의 오픈소스 기계 번역 엔진입니다. LibreTranslate 커뮤니티에서 개발한 이 도구는 사용자가 직접 번역 인프라를 구축할 수 있게 해줍니다. Argos Translate 라이브러리를 기반으로 하며, Docker나 Python을 통해 쉽게 배포할 수 있는 강력한 API를 제공합니다. 로컬에서 실행되므로 데이터 프라이버시를 보장하며 인터넷 연결 없이도 작동하여, 신뢰할 수 있는 번역 기능이 필요한 개발자와 조직에 이상적입니다.
MyAppleIntelligence는 DaemonLoki가 개발한 오픈 소스 프로젝트로, Apple Intelligence와 유사한 기능을 커스텀으로 구현합니다. 주로 Swift로 작성되었으며, CoreML, MLX-Swift, Llama 3를 활용하여 Apple 하드웨어에서 고급 온디바이스 AI 기능을 제공합니다. 이 프로젝트는 개발자가 독점적인 클라우드 솔루션에 의존하지 않고 로컬 거대 언어 모델과 생성형 AI를 Apple 생태계에 직접 통합하는 방법을 탐구합니다.
Developed by nealmick, this open-source repository provides a suite of machine learning tools designed for NBA sports betting analysis. It leverages Python, Keras, and TensorFlow to process historical data and generate predictive insights. The project includes infrastructure for data management and model training, enabling users to build custom betting strategies based on statistical probabilities and market odds.
zmre/awesome-security-for-ai는 AI 보안을 위한 필수 리소스를 모아놓은 큐레이션 저장소입니다. 머신러닝 모델과 생성형 AI 파이프라인을 보호하기 위해 설계된 오픈소스 및 상용 제품들을 체계적으로 정리했습니다. 사이버 보안 전문가와 AI 엔지니어가 취약점 스캔, 위협 탐지, 리스크 관리 도구를 쉽게 찾을 수 있는 중앙 허브 역할을 하며, AI 보안 환경을 시각화한 유용한 인포그래픽도 제공합니다.
TradeSight is an open-source, self-hosted AI trading laboratory developed by rmbell09-lang. It provides a comprehensive environment for quantitative finance enthusiasts to design, backtest, and execute trading strategies. The platform features integrated paper trading capabilities, automated overnight strategy tournaments, and support for over 15 technical indicators, allowing users to leverage machine learning to optimize their financial market performance in a controlled, risk-free environment.
Aitino는 startino에서 개발한 오픈소스 플랫폼으로, AI 에이전트 팀을 구성하고 관리할 수 있게 해줍니다. 복잡한 문제 해결과 작업 자동화를 위해 설계된 이 프레임워크는 다중 에이전트 시스템을 구축하는 환경을 제공합니다. LLM을 활용하여 특정 역할을 수행하는 에이전트들을 정의하고, 이들이 협력하여 정교한 워크플로우를 실행하도록 지원함으로써 에이전트 기반 자동화를 프로젝트에 통합하려는 개발자들에게 강력한 도구가 됩니다.
SAP-samples/ai-core-samples는 SAP에서 제공하는 공식 저장소로, 필수적인 워크플로우 템플릿과 Jupyter 노트북을 포함하고 있습니다. 개발자가 SAP AI Core 생태계 내에서 머신러닝 모델을 통합, 배포 및 관리하는 방법을 익힐 수 있는 실용적인 가이드 역할을 합니다. SAP AI Core SDK를 활용하여 실험적인 코드를 프로덕션 수준의 AI 서비스로 전환하는 방법을 배우고, SAP의 엔터프라이즈급 인프라와 원활하게 통합할 수 있도록 돕습니다.
homemade-gpt-js는 trekhleb이 개발한 교육용 프로젝트로, Andrej Karpathy의 minGPT를 TensorFlow.js로 간결하게 재구현했습니다. 생성형 사전 학습 트랜스포머(GPT)의 내부 작동 원리를 이해하고자 하는 개발자를 위해 설계되었으며, 전체 모델 아키텍처가 300줄 미만의 TypeScript 코드로 구성되어 있습니다. 브라우저 환경에서 트랜스포머 블록, 셀프 어텐션 메커니즘, 언어 모델링이 어떻게 작동하는지 학습할 수 있는 실습형 리소스입니다.
Forust는 jinlow가 개발한 머신러닝 라이브러리로, 그래디언트 부스팅 결정 트리(GBDT)를 구현합니다. Rust로 구축되어 최고의 성능을 제공하며, PyO3를 통해 Python과 원활하게 통합됩니다. XGBoost와 같은 기존 프레임워크의 가볍고 효율적인 대안으로서, 정형 데이터 작업에서 속도와 메모리 효율성에 중점을 둡니다.
IBM의 'Data Science Best Practices'는 연구 단계의 모델을 실무 환경으로 성공적으로 전환하기 위해 설계된 저장소입니다. 데이터 과학자와 ML 엔지니어가 버전 관리, 확장성, 모니터링을 체계적으로 구현할 수 있도록 필수 지침을 제공합니다. 이 프로젝트는 공학적 엄격함을 강조하여 팀이 워크플로우를 표준화하고, 실제 기업 환경에서 유지보수가 가능하며 신뢰할 수 있는 머신러닝 모델을 구축하도록 돕습니다.
bzier/gym-mupen64plus는 Mupen64Plus N64 에뮬레이터를 강화학습 프레임워크와 통합하는 오픈소스 OpenAI Gym 환경 래퍼입니다. bzier가 개발한 이 도구는 상태 관찰 및 액션 제어를 위한 표준화된 인터페이스를 제공하여, 연구자와 개발자가 닌텐도 64 고전 게임을 통해 AI 에이전트를 학습시킬 수 있도록 돕습니다. 복잡한 에뮬레이터 환경과 현대적인 머신러닝 라이브러리 사이의 가교 역할을 하며 게임 기반 AI 연구를 촉진합니다.
eren23/one_layer_image_gen은 'One Layer Is Enough: Adapting Pretrained Visual Encoders for Image Generation' 논문의 FAE(Feature Auto-Encoder) 로직을 재현한 PyTorch 저장소입니다. 기존의 사전 학습된 비전 인코더에 경량화된 단일 레이어만 추가하여 생성 작업에 활용하는 방법을 제시하며, 대규모 생성 모델을 처음부터 학습시키는 데 필요한 막대한 컴퓨팅 자원을 획기적으로 줄여줍니다.
FoodVisionAI는 Rishabh1925가 개발한 지능형 웹 애플리케이션으로, 최첨단 Vision Transformer(ViT) 모델을 사용하여 음식 이미지를 분류합니다. React 프론트엔드와 Flask 백엔드를 통합하여 사용자가 이미지를 업로드하고 즉각적이고 정확한 예측 결과를 얻을 수 있는 원활한 인터페이스를 제공합니다. 이 프로젝트는 Hugging Face 모델 호스팅과 현대적인 웹 개발 스택 간의 효과적인 시너지를 보여주는 실용적인 딥러닝 구현 사례입니다.
Analog Devices에서 제공하는 MAX78xxx-RefDes 저장소는 MAX78000 및 MAX78002 마이크로컨트롤러를 위한 다양한 레퍼런스 디자인을 제공합니다. 이 칩들은 하드웨어 기반 CNN 가속기를 탑재하여 엣지 AI에 최적화되어 있습니다. 본 저장소는 C 언어 기반의 구현 예제를 통해 개발자가 전력 제약이 있는 임베디드 시스템에 딥러닝 기능을 통합하고, 고수준 머신러닝 모델과 저전력 하드웨어 실행 간의 간극을 좁힐 수 있도록 지원합니다.
LaMI(Late Multi-Image Fusion)는 ACL 2026에서 발표된 혁신적인 프레임워크로, 거대 언어 모델(LLM)에 고급 시각적 기능을 부여합니다. Guy Yariv가 개발한 이 접근 방식은 모델이 여러 이미지를 효과적으로 처리하고 추론할 수 있게 합니다. 후기 융합 아키텍처를 활용하는 LaMI는 텍스트 이해와 시각적 상식 사이의 간극을 메워, 더욱 정교한 멀티모달 상호작용을 가능하게 합니다. 공식 구현체는 연구자들이 기존 LLM 파이프라인에 다중 이미지 컨텍스트를 통합할 수 있는 도구를 제공합니다.
MjdMahasneh/Simple-PyTorch-Semantic-Segmentation-CNNs는 업계 표준 의미론적 분할 모델들을 깔끔하고 모듈화된 PyTorch 코드로 제공하는 오픈소스 저장소입니다. MjdMahasneh이 개발한 이 프로젝트는 UNet, DeepLabv3+, SegNet, FCN, PSPNet 등의 아키텍처를 포함합니다. 복잡한 프레임워크의 오버헤드 없이 픽셀 단위 분류 작업을 구현하려는 개발자와 연구자들에게 실용적인 교육 자료이자 시작점이 되어줍니다.
Low-Rank Decay는 Chunjiang-Intelligence에서 개발한 혁신적인 정규화 기법으로, 모델의 일반화 성능을 향상하고 과적합을 방지합니다. 학습 과정에서 가중치 행렬에 저차원(low-rank) 제약을 적용하여 신경망의 수렴 특성을 개선합니다. 이 저장소는 연구자와 개발자가 자신의 딥러닝 파이프라인에 쉽게 통합할 수 있도록 공식 Python 구현 코드를 제공합니다.
bellerb/chess는 터미널에서 직접 체스를 즐길 수 있도록 설계된 오픈소스 파이썬 프로그램입니다. bellerb가 개발한 이 프로젝트는 인간 대 인간, 인간 대 AI 대국을 모두 지원합니다. 딥러닝과 몬테카를로 트리 탐색(MCTS)을 결합하여 지능적인 컴퓨터 상대를 구현했으며, 강화 학습과 게임 이론의 결합에 관심 있는 개발자들에게 훌륭한 학습 자원을 제공합니다.
AutismX는 Mahmoudagha01이 Flutter와 Dart로 개발한 오픈소스 모바일 애플리케이션입니다. 비언어적 아동을 위한 대화형 활동을 제공하며, AI 기반 행동 분석을 통해 자폐 지표를 식별합니다. 부모와 보호자가 전문가와 공유할 수 있는 상세한 보고서를 생성하여 조기 개입을 돕습니다.
UGR-SAIL 연구 그룹이 개발한 이 리포지토리는 'HVAC 제어를 위한 심층 강화 학습 알고리즘의 실험적 평가' 논문에 대한 보조 자료, 코드 및 실험 프레임워크를 제공합니다. 지능형 에이전트 기반 전략을 통해 건물 에너지 소비와 냉난방 효율을 최적화하려는 연구자와 엔지니어를 위한 귀중한 자원입니다.
SeeABLE은 딥페이크 콘텐츠를 식별하기 위해 설계된 오픈소스 딥러닝 프레임워크입니다. 기존 이진 분류 방식의 한계를 극복하기 위해 소프트 불일치(soft discrepancies)와 경계 대조 학습(bounded contrastive learning)을 사용하여 실제 미디어와 조작된 미디어를 효과적으로 구분합니다. 표준 모델이 놓치기 쉬운 미세한 불일치에 집중함으로써, 정교해지는 생성형 AI 시대에 더욱 강력한 포렌식 분석 도구를 제공합니다.
csinva가 개발한 이 프로젝트는 AI 공정성과 이미지 조작의 핵심 과제를 해결하기 위해 GAN 잠재 공간 매칭을 활용합니다. 잠재 벡터를 식별하고 매칭함으로써 연구자들은 얼굴 인식 시스템의 편향성을 엄격하게 벤치마킹하고 생성된 이미지에 대해 세밀한 의미론적 편집을 수행할 수 있습니다. 이 프레임워크는 특징 분리(disentanglement)를 위한 방법론적 접근을 제공하며, 딥 생성 모델의 인과 추론 및 공정성을 연구하는 이들에게 유용한 자원입니다.
ApricotM은 iheallab에서 개발한 중환자실(ICU) 환자 모니터링을 위한 오픈소스 프레임워크입니다. Nature Communications에 게재된 이 프로젝트는 상태 공간 모델(Mamba)과 트랜스포머 아키텍처를 결합하여 전자의무기록(EHR)을 처리합니다. 복잡한 시계열 임상 데이터를 효율적으로 분석하여 의료진에게 환자의 상태와 치료 요구 사항에 대한 예측 정보를 제공함으로써, 긴박한 의료 환경에서 선제적인 대응을 가능하게 합니다.
Manifold-linearization은 '매니폴드 평탄화 및 재구성을 통한 표현 학습(Representation Learning via Manifold Flattening and Reconstruction)' 논문의 공식 보조 저장소입니다. Michael Psenka가 작성한 이 프로젝트는 딥러닝 모델이 복잡한 데이터 매니폴드를 평탄화하여 표현을 학습하는 과정을 탐구할 수 있는 구현 코드와 Jupyter 노트북을 제공합니다. 기하학, 비지도 학습, 오토인코더 아키텍처에 관심 있는 연구자와 실무자를 위한 실용적인 리소스입니다.
bharatc9530이 개발한 이 프로젝트는 이미지와 비디오 스트림에서 무기와 화재를 탐지하기 위한 전체 파이프라인을 제공합니다. YOLOv4-tiny 아키텍처를 기반으로 하며, 학습 코드, 데이터셋, 사전 학습된 가중치 파일을 포함합니다. CCTV 및 보안 감시 시스템에 통합하여 딥러닝 기반의 자동화된 위협 탐지 기능을 구현하도록 설계되었습니다.
HectorPulido가 개발한 이 프레임워크는 Unity와 Python을 매끄럽게 통합하여 고급 VTuber 애플리케이션을 구현합니다. 딥러닝 모델을 활용해 실시간 신체 추적 및 표정 분석을 수행하며, AI 컴퓨터 비전 기술로 3D 아바타를 제어할 수 있게 합니다. Python의 강력한 머신러닝 생태계와 Unity의 실시간 렌더링 기능을 결합하여 인터랙티브 모션 캡처 캐릭터를 위한 기반을 제공합니다.
Delta는 GitGud-f에서 개발한 효율적인 단안 깊이 추정용 경량 딥러닝 모델입니다. 지식 증류(Knowledge Distillation) 기술을 활용하여 강력한 DepthAnythingV2 모델의 성능을 더 작고 빠른 모델로 압축했습니다. 이 접근 방식은 리소스가 제한된 엣지 하드웨어에서도 고품질의 깊이 인식을 가능하게 하여, 낮은 지연 시간과 최소한의 연산 비용이 필요한 실시간 컴퓨터 비전 애플리케이션에 최적화된 솔루션을 제공합니다.
MyProctorAI는 hemantkarekar가 Flask와 Python으로 개발한 오픈소스 시험 포털입니다. AI 기반 감독 기능을 통합하여 온라인 평가 중 학문적 정직성을 유지합니다. 이미지 처리 및 인식 기술을 활용해 응시자의 의심스러운 행동을 모니터링하며, 원격 감독을 위한 확장 가능한 솔루션을 제공합니다. 보안이 강화된 자동화 시험 환경을 구축하려는 개발자들에게 훌륭한 기초 프레임워크가 됩니다.
Genet은 Goosang-Yu가 개발한 유전체 편집 워크플로우 최적화용 파이썬 라이브러리입니다. 딥러닝 모델을 활용하여 CRISPR 가이드 RNA(gRNA)의 설계 및 효율성을 예측합니다. 생물정보학과 최신 AI 기술을 결합하여 연구자들이 유전자 편집 실험을 최적화하고 표적 특이성을 개선하며 CRISPR-Cas 시스템의 효율을 예측할 수 있도록 돕는 유전체 연구 및 합성 생물학 분야의 핵심 도구입니다.
ClearML Server for Kubernetes는 ClearML에서 제공하는 오픈 소스 배포 솔루션으로, 팀이 자체 K8s 인프라에서 전체 ClearML MLOps 플랫폼을 호스팅할 수 있게 합니다. 표준화된 Helm 차트를 통해 실험 추적, 데이터 버전 관리 및 모델 오케스트레이션 관리를 간소화하며, 기존 Kubernetes 기반 워크플로우 및 프라이빗 클라우드 환경과의 원활한 통합을 보장합니다.
SM-ViT(Salient Mask-Guided Vision Transformer)는 demidovd98이 개발하고 VISIGRAPP '23에서 발표한 오픈 소스 프로젝트입니다. 이 모델은 표준 비전 트랜스포머에 중요도 기반 마스킹 메커니즘을 통합하여 이미지의 가장 식별력 있는 영역에 집중합니다. 이를 통해 미세한 특징 구분이 중요한 세밀한 이미지 분류 작업에서 성능을 크게 향상시킵니다.
Wildfire-Smoke-Detection은 paulinamoskwa가 개발한 오픈소스 프로젝트로, 딥러닝을 활용한 환경 모니터링 솔루션입니다. PyTorch 기반의 Faster R-CNN 아키텍처를 사용하여 시각 데이터에서 연기 기둥을 식별합니다. 이 도구는 컴퓨터 비전을 통해 산불 조기 경보 시스템을 구축하려는 연구자와 개발자에게 중요한 기반 프레임워크를 제공하며, 산불 취약 지역의 상황 인식 및 대응 속도를 높이는 데 기여합니다.
capstone-insper 팀이 개발한 이 저장소는 드론 군집 탐색 환경(DSSE)을 해결하기 위한 다양한 알고리즘을 제공합니다. 심층 강화학습과 다중 에이전트 시스템을 활용하여 자율 드론 군집이 목표물을 탐색하고 이동하는 방식을 최적화합니다. 탐욕 알고리즘부터 PyTorch 기반의 정교한 딥러닝 모델까지 다양한 전략을 구현하여, 자율 비행 조정 및 긴급 구조 분야를 연구하는 개발자들에게 실용적인 프레임워크를 제공합니다.
Connectit.chatit은 loayabdalslam이 개발한 혁신적인 오픈소스 프로젝트로, LLM 배포 방식을 재정의합니다. 토렌트와 유사한 P2P 프로토콜을 활용하여 대규모 언어 모델을 분산된 노드 간에 효율적으로 공유하고 배포할 수 있습니다. 중앙 집중식 클라우드 인프라에 대한 의존도를 낮추고, 파이썬 기반의 분산 네트워크를 통해 딥러닝 모델의 접근성과 복원력을 높이는 데 중점을 둡니다.
Risk Distribution Matching은 nktoan이 개발하고 WACV 2024에서 발표한 오픈소스 연구 프로젝트입니다. 이 프레임워크는 학습 환경 간의 위험 분포를 정렬하여 도메인 일반화 문제를 해결합니다. 인과 추론과 딥러닝을 결합하여 학습 데이터와 테스트 데이터가 크게 다른 실세계 환경에서도 모델이 안정적으로 작동하도록 돕습니다.
Nevin Baiju가 개발한 이 오픈소스 안드로이드 앱은 Google ML Kit를 활용하여 실시간 자세 추정 및 감지를 수행합니다. 카메라 입력을 통해 신체 랜드마크를 식별하고 사용자의 특정 자세를 인식합니다. Java로 작성된 이 프로젝트는 모바일 개발자가 자신의 앱에 컴퓨터 비전 기능을 통합하는 방법을 보여주는 실용적인 예제입니다.
이 저장소는 앤드류 응과 DeepLearning.AI가 주최한 데이터 중심 AI 경진대회에서 상위 5%를 달성한 Kenneth Leung의 소스 코드와 방법론을 담고 있습니다. 모델 중심의 전통적 접근 방식과 달리, 데이터 정제, 증강, 라벨링 개선을 통해 모델 성능을 극적으로 향상시키는 방법을 보여줍니다. 데이터 중심 AI 원칙을 실무에 적용하려는 엔지니어들을 위한 실용적인 가이드라인을 제공합니다.