40 открытий
aishwaryanr/awesome-generative-ai-guide — это всеобъемлющий репозиторий, ставший центральным хабом для всего, что связано с генеративным ИИ. Проект, созданный Айшварией Нареш Реганти, объединяет высококачественные научные статьи, практические блокноты, дорожные карты обучения и материалы для подготовки к интервью. Он помогает разработчикам, исследователям и энтузиастам ориентироваться в быстро меняющемся мире LLM и диффузионных моделей, являясь обязательной закладкой для каждого, кто хочет освоить или быть в курсе последних достижений в этой области.
WorldMonitor, разработанный koala73, — это продвинутая платформа ситуационной осведомленности, использующая ИИ для агрегации и анализа мировых новостей, геополитических сдвигов и состояния инфраструктуры. Проект, написанный на TypeScript, предоставляет единый интерфейс для отслеживания сложных событий в реальном времени. Преобразуя огромные потоки данных в аналитическую информацию, он становится мощным инструментом для аналитиков и организаций, которым необходимо следить за глобальными изменениями с помощью автоматизированных ИИ-решений.
Palmier Pro — это видеоредактор с открытым исходным кодом для macOS от palmier-io, написанный на Swift. Он объединяет традиционный нелинейный монтаж с современными ИИ-инструментами. Используя нативные фреймворки macOS, приложение обеспечивает высокую производительность и позволяет авторам внедрять функции на базе ИИ непосредственно в процесс видеопроизводства, делая сложные задачи монтажа доступнее и эффективнее.
LibreTranslate — это мощный движок машинного перевода, предлагающий ориентированную на конфиденциальность альтернативу коммерческим сервисам. Разработанный сообществом, он позволяет пользователям развертывать собственную инфраструктуру перевода. Система построена на базе библиотеки Argos Translate и предоставляет надежный API, который легко развертывается через Docker или Python. Поскольку LibreTranslate работает локально, он гарантирует конфиденциальность данных и функционирует без подключения к интернету, что делает его идеальным решением для разработчиков и организаций, которым необходимы суверенные инструменты перевода.
MyAppleIntelligence — это open-source проект от DaemonLoki, предлагающий собственную реализацию функций, аналогичных Apple Intelligence. Проект написан на Swift и использует CoreML, MLX-Swift и Llama 3 для внедрения продвинутых возможностей локального ИИ на устройствах Apple. Это практическое руководство для разработчиков по интеграции больших языковых моделей и генеративного ИИ непосредственно в экосистему Apple без зависимости от облачных решений.
Developed by nealmick, this open-source repository provides a suite of machine learning tools designed for NBA sports betting analysis. It leverages Python, Keras, and TensorFlow to process historical data and generate predictive insights. The project includes infrastructure for data management and model training, enabling users to build custom betting strategies based on statistical probabilities and market odds.
zmre/awesome-security-for-ai is a curated repository maintained by zmre that aggregates essential resources for AI security. It provides a structured list of both open-source and commercial products designed to protect machine learning models and GenAI pipelines. The project serves as a central hub for cybersecurity professionals and AI engineers to discover tools for vulnerability scanning, threat detection, and risk management in AI-driven environments, complete with a helpful infographic for visualizing the AI security landscape.
TradeSight is an open-source, self-hosted AI trading laboratory developed by rmbell09-lang. It provides a comprehensive environment for quantitative finance enthusiasts to design, backtest, and execute trading strategies. The platform features integrated paper trading capabilities, automated overnight strategy tournaments, and support for over 15 technical indicators, allowing users to leverage machine learning to optimize their financial market performance in a controlled, risk-free environment.
Aitino — это open-source платформа от startino, предназначенная для оркестрации команд ИИ-агентов. Она предоставляет фреймворк для создания многоагентных систем, способных решать сложные задачи. Используя возможности LLM, Aitino позволяет разработчикам настраивать специализированных агентов, которые взаимодействуют друг с другом для выполнения многоэтапных процессов, что делает проект мощным инструментом для внедрения агентной автоматизации.
SAP-samples/ai-core-samples — это официальный репозиторий от SAP, содержащий шаблоны рабочих процессов и Jupyter-ноутбуки. Он служит практическим руководством для разработчиков по интеграции, развертыванию и управлению моделями машинного обучения в экосистеме SAP AI Core. Используя SDK SAP AI Core, пользователи могут научиться переходить от экспериментального кода к готовым промышленным AI-сервисам, обеспечивая бесшовную интеграцию с корпоративной инфраструктурой SAP.
homemade-gpt-js — это образовательный проект от trekhleb, представляющий собой чистую и лаконичную реализацию minGPT Андрея Карпатого на базе TensorFlow.js. Проект создан для разработчиков, желающих понять внутреннее устройство трансформеров: вся архитектура модели умещается в 300 строк кода на TypeScript. Это практический инструмент для изучения работы блоков трансформера, механизмов self-attention и языкового моделирования в среде браузера.
Forust — это библиотека машинного обучения от jinlow, реализующая алгоритмы градиентного бустинга на решающих деревьях. Написанная на Rust для достижения максимальной производительности, она предлагает бесшовную интеграцию с Python через PyO3. Forust является легкой и эффективной альтернативой таким фреймворкам, как XGBoost, фокусируясь на скорости и экономном потреблении памяти при работе с табличными данными.
IBM Data Science Best Practices — это курируемый репозиторий, созданный для преодоления разрыва между исследованиями и продакшеном. Он предоставляет рекомендации для специалистов по Data Science и ML-инженеров по внедрению версионирования, масштабируемости и мониторинга. Сосредоточившись на инженерной строгости, проект помогает командам стандартизировать рабочие процессы, гарантируя, что модели машинного обучения будут не только точными, но и надежными, масштабируемыми и удобными в обслуживании в реальных корпоративных средах.
bzier/gym-mupen64plus — это open-source проект, интегрирующий эмулятор Mupen64Plus с фреймворками обучения с подкреплением. Разработанный bzier, этот инструмент предоставляет исследователям стандартизированный интерфейс для наблюдения за состоянием игры и управления действиями агента. Он упрощает процесс обучения ИИ в сложных 3D-средах классических игр, делая их доступными для современных библиотек машинного обучения.
eren23/one_layer_image_gen — это репозиторий на PyTorch, воспроизводящий логику Feature Auto-Encoder (FAE) из научной статьи «One Layer Is Enough: Adapting Pretrained Visual Encoders for Image Generation». Проект демонстрирует, как использовать существующие предобученные визуальные энкодеры для генеративных задач путем добавления легковесного однослойного адаптера, что значительно снижает вычислительные затраты по сравнению с обучением моделей с нуля.
FoodVisionAI — это интеллектуальное веб-приложение от Rishabh1925, использующее современные модели Vision Transformer (ViT) для классификации изображений еды. Благодаря интеграции фронтенда на React и бэкенда на Flask, проект предоставляет пользователям удобный интерфейс для загрузки фото и получения мгновенных прогнозов. Это практическая реализация глубокого обучения для задач компьютерного зрения, демонстрирующая эффективное сочетание инструментов Hugging Face и современных веб-технологий.
Репозиторий MAX78xxx-RefDes от Analog Devices содержит коллекцию эталонных проектов для микроконтроллеров MAX78000 и MAX78002. Эти чипы разработаны специально для Edge AI и оснащены аппаратным ускорителем нейронных сетей (CNN). Репозиторий включает реализации на языке C и примеры, помогающие разработчикам внедрять возможности глубокого обучения в энергоэффективные встраиваемые системы, сокращая разрыв между высокоуровневыми моделями машинного обучения и аппаратным выполнением с низким энергопотреблением.
LaMI (Late Multi-Image Fusion) — это инновационный фреймворк, представленный на ACL 2026, который расширяет возможности больших языковых моделей (LLM) в области визуального восприятия. Разработанный Гаем Яривом, этот подход позволяет моделям эффективно обрабатывать и анализировать несколько изображений одновременно. Используя архитектуру позднего слияния, LaMI устраняет разрыв между текстовым пониманием и визуальным здравым смыслом, обеспечивая более точное мультимодальное взаимодействие. Официальная реализация предоставляет исследователям инструменты для интеграции контекста нескольких изображений в существующие конвейеры LLM.
MjdMahasneh/Simple-PyTorch-Semantic-Segmentation-CNNs — это open-source репозиторий, предоставляющий чистые и модульные реализации стандартных моделей семантической сегментации на PyTorch. Проект включает в себя такие архитектуры, как UNet, DeepLabv3+, SegNet, FCN и PSPNet. Он служит практическим образовательным ресурсом и отправной точкой для разработчиков и исследователей, желающих внедрить задачи попиксельной классификации в компьютерном зрении без использования сложных и перегруженных фреймворков.
Low-Rank Decay — это инновационный метод регуляризации от Chunjiang-Intelligence, направленный на улучшение обобщающей способности моделей и борьбу с переобучением. Внедряя низкоранговые ограничения в процесс обучения, этот подход помогает нейронным сетям достигать лучших свойств сходимости. Репозиторий содержит официальную реализацию на Python, позволяющую исследователям и разработчикам интегрировать этот метод в свои пайплайны для повышения производительности и стабильности моделей.
bellerb/chess — это проект с открытым исходным кодом для игры в шахматы прямо в терминале. Разработанный bellerb, он поддерживает как режим игры между людьми, так и против ИИ. Проект использует глубокое обучение и поиск по дереву Монте-Карло (MCTS) для создания интеллектуального компьютерного противника, что делает его отличным ресурсом для изучения пересечения обучения с подкреплением и теории игр.
AutismX — это мобильное приложение с открытым исходным кодом, разработанное на Flutter и Dart. Оно выполняет две важные функции: предлагает интерактивные занятия для улучшения коммуникации у невербальных детей и использует ИИ для анализа поведения с целью выявления признаков аутизма. Приложение формирует подробные отчеты, которыми родители могут поделиться со специалистами для облегчения диагностики и раннего вмешательства.
Разработанный исследовательской группой UGR-SAIL, этот репозиторий содержит дополнительные материалы, код и экспериментальную базу для научной работы «Экспериментальная оценка алгоритмов глубокого обучения с подкреплением для управления HVAC». Это ценный ресурс для исследователей и инженеров, стремящихся применять методы DRL для оптимизации энергопотребления зданий и повышения эффективности климат-контроля с помощью интеллектуальных агентов.
SeeABLE — это open-source фреймворк глубокого обучения для выявления дипфейков. В отличие от стандартной бинарной классификации, он использует метод мягких расхождений (soft discrepancies) и ограниченное контрастивное обучение для более точного различения реального и поддельного контента. Сосредоточившись на тонких несоответствиях, которые часто пропускают обычные модели, SeeABLE предлагает надежный подход к криминалистическому анализу медиа в эпоху развития генеративного ИИ.
Проект от csinva исследует возможности сопоставления в латентном пространстве GAN для решения проблем справедливости ИИ и манипуляции изображениями. Находя и сопоставляя латентные векторы, фреймворк позволяет проводить строгий бенчмаркинг предвзятости в системах распознавания лиц и выполнять точечное семантическое редактирование. Это ценный ресурс для исследователей причинно-следственных связей и этики в глубоких генеративных моделях.
ApricotM — это open-source фреймворк от iheallab для мониторинга пациентов в отделениях интенсивной терапии. Проект, опубликованный в Nature Communications, использует архитектуры state-space (Mamba) и трансформеры для обработки электронных медицинских карт (EHR). Система предоставляет врачам предиктивную аналитику по состоянию пациентов и необходимым методам лечения, обеспечивая проактивный подход к уходу за счет эффективной обработки сложных временных рядов клинических данных.
Manifold-linearization — это официальный репозиторий к научной статье «Representation Learning via Manifold Flattening and Reconstruction». Проект, созданный Майклом Псенкой, содержит реализацию и Jupyter-ноутбуки, необходимые для изучения того, как модели глубокого обучения могут формировать представления путем выпрямления сложных многообразий данных. Это практический ресурс для исследователей и специалистов, интересующихся геометрией, обучением без учителя и архитектурами автокодировщиков.
Проект от bharatc9530 представляет собой комплексное решение для обнаружения оружия и очагов возгорания на изображениях и в видеопотоках. Используя архитектуру YOLOv4-tiny, репозиторий включает код для обучения, готовый набор данных и веса модели. Система предназначена для интеграции в системы видеонаблюдения и CCTV, повышая уровень безопасности за счет автоматизированного обнаружения угроз с помощью глубокого обучения.
Разработанный HectorPulido, этот фреймворк обеспечивает интеграцию Unity и Python для создания продвинутых VTuber-приложений. Используя модели глубокого обучения, он выполняет отслеживание тела и анализ выражений лица в реальном времени, позволяя управлять 3D-аватарами через компьютерное зрение. Объединяя мощную экосистему машинного обучения Python и возможности рендеринга Unity, проект создает основу для интерактивных виртуальных персонажей с захватом движений.
Delta — это компактная модель глубокого обучения от GitGud-f, предназначенная для эффективной монокулярной оценки глубины. Используя технологию дистилляции знаний, проект переносит возможности архитектуры DepthAnythingV2 в более легкую и быструю модель. Это позволяет добиться качественного восприятия глубины на устройствах с ограниченными ресурсами, что делает решение идеальным для задач компьютерного зрения, требующих низкой задержки и минимальных вычислительных затрат.
MyProctorAI — это open-source портал для экзаменов, разработанный hemantkarekar на базе Flask и Python. Система интегрирует ИИ-инструменты для обеспечения академической честности во время онлайн-тестирования. Используя технологии обработки изображений и распознавания, система отслеживает подозрительное поведение экзаменуемых, предлагая масштабируемое решение для удаленного наблюдения. Это отличная база для разработчиков, создающих защищенные автоматизированные среды для проведения экзаменов.
Genet — это специализированная Python-библиотека от Goosang-Yu, предназначенная для оптимизации процессов редактирования генома. Она использует модели глубокого обучения, чтобы помочь исследователям в проектировании и прогнозировании направляющих РНК (gRNA) для CRISPR. Объединяя биоинформатику с современными методами ИИ, инструмент помогает ученым оптимизировать эксперименты по редактированию генов, повышать специфичность таргетинга и предсказывать эффективность систем CRISPR-Cas, что делает его ценным ресурсом для геномных исследований и синтетической биологии.
ClearML Server for Kubernetes — это решение с открытым исходным кодом, позволяющее командам развертывать платформу ClearML MLOps на собственной инфраструктуре K8s. Оно упрощает управление отслеживанием экспериментов, версионированием данных и оркестрацией моделей с помощью стандартизированных Helm-чартов, обеспечивая бесшовную интеграцию с существующими рабочими процессами на базе Kubernetes и частными облаками.
SM-ViT (Salient Mask-Guided Vision Transformer) — это проект с открытым исходным кодом от demidovd98, представленный на конференции VISIGRAPP '23. Он улучшает стандартные модели Vision Transformer, интегрируя механизм маскирования на основе значимости. Этот подход фокусирует внимание модели на наиболее информативных областях изображения, что значительно повышает эффективность в задачах тонкой классификации, где критически важны мелкие детали.
Wildfire-Smoke-Detection — это проект с открытым исходным кодом от paulinamoskwa, использующий глубокое обучение для мониторинга окружающей среды. Применяя архитектуру Faster R-CNN, реализованную на PyTorch, модель распознает шлейфы дыма на визуальных данных. Этот инструмент служит базовой платформой для исследователей и разработчиков, создающих автоматизированные системы раннего предупреждения о лесных пожарах, помогая повысить осведомленность и ускорить реагирование в пожароопасных регионах.
Этот репозиторий от команды capstone-insper содержит набор алгоритмов для решения задач в среде Drone Swarm Search Environment (DSSE). Проект использует глубокое обучение с подкреплением и многоагентные системы для оптимизации навигации и поиска целей автономными роями дронов. Реализуя различные стратегии — от жадных алгоритмов до сложных моделей на PyTorch, — проект служит практическим фреймворком для исследователей и разработчиков, работающих над координацией беспилотников и поисково-спасательными операциями.
Connectit.chatit — это инновационный open-source проект от loayabdalslam, переосмысливающий развертывание LLM. Используя P2P-протокол, подобный торрентам, он обеспечивает децентрализованное распространение больших языковых моделей. Этот подход снижает зависимость от централизованной облачной инфраструктуры, позволяя пользователям эффективно обмениваться моделями и развертывать их на распределенных узлах. Проект написан на Python и фокусируется на использовании одноранговых сетей для повышения доступности и отказоустойчивости моделей глубокого обучения.
Risk Distribution Matching — это open-source проект от nktoan, представленный на конференции WACV 2024. Он решает проблему доменной обобщаемости (domain generalization) путем выравнивания распределений риска между различными средами обучения. Используя методы причинно-следственного вывода и глубокого обучения, фреймворк позволяет моделям надежно работать с данными вне распределения (OOD), обеспечивая стабильность в реальных сценариях, где тестовые данные значительно отличаются от обучающих.
Это open-source Android-приложение, созданное Nevin Baiju, использует Google ML Kit для оценки и детекции поз в реальном времени. Оно анализирует видеопоток, определяет ключевые точки тела и распознает позы пользователя. Проект, написанный на Java, служит практическим руководством для разработчиков, желающих внедрить функции компьютерного зрения в свои мобильные приложения с использованием локального машинного обучения.
Этот репозиторий содержит исходный код и методологию, которые позволили Кеннету Люнгу войти в топ-5% конкурса Data-Centric AI, организованного Эндрю Ыном и DeepLearning.AI. В отличие от традиционных подходов, ориентированных на модели, проект демонстрирует, как систематическая очистка данных, аугментация и улучшение разметки могут значительно повысить производительность нейросетей. Это практическое руководство для специалистов, стремящихся применять принципы data-centric AI в реальных задачах машинного обучения.