Open Source

40 открытий

aishwaryanr/awesome-generative-ai-guide

aishwaryanr/awesome-generative-ai-guide — это всеобъемлющий репозиторий, ставший центральным хабом для всего, что связано с генеративным ИИ. Проект, созданный Айшварией Нареш Реганти, объединяет высококачественные научные статьи, практические блокноты, дорожные карты обучения и материалы для подготовки к интервью. Он помогает разработчикам, исследователям и энтузиастам ориентироваться в быстро меняющемся мире LLM и диффузионных моделей, являясь обязательной закладкой для каждого, кто хочет освоить или быть в курсе последних достижений в этой области.

generative-aillmmachine-learningeducation

koala73/worldmonitor

WorldMonitor, разработанный koala73, — это продвинутая платформа ситуационной осведомленности, использующая ИИ для агрегации и анализа мировых новостей, геополитических сдвигов и состояния инфраструктуры. Проект, написанный на TypeScript, предоставляет единый интерфейс для отслеживания сложных событий в реальном времени. Преобразуя огромные потоки данных в аналитическую информацию, он становится мощным инструментом для аналитиков и организаций, которым необходимо следить за глобальными изменениями с помощью автоматизированных ИИ-решений.

osintgeopoliticstypescriptintelligence

palmier-io/palmier-pro

Palmier Pro — это видеоредактор с открытым исходным кодом для macOS от palmier-io, написанный на Swift. Он объединяет традиционный нелинейный монтаж с современными ИИ-инструментами. Используя нативные фреймворки macOS, приложение обеспечивает высокую производительность и позволяет авторам внедрять функции на базе ИИ непосредственно в процесс видеопроизводства, делая сложные задачи монтажа доступнее и эффективнее.

video-editingmacosswiftai-tools

LibreTranslate/LibreTranslate

LibreTranslate — это мощный движок машинного перевода, предлагающий ориентированную на конфиденциальность альтернативу коммерческим сервисам. Разработанный сообществом, он позволяет пользователям развертывать собственную инфраструктуру перевода. Система построена на базе библиотеки Argos Translate и предоставляет надежный API, который легко развертывается через Docker или Python. Поскольку LibreTranslate работает локально, он гарантирует конфиденциальность данных и функционирует без подключения к интернету, что делает его идеальным решением для разработчиков и организаций, которым необходимы суверенные инструменты перевода.

translationprivacyapiself-hosted

DaemonLoki/MyAppleIntelligence

MyAppleIntelligence — это open-source проект от DaemonLoki, предлагающий собственную реализацию функций, аналогичных Apple Intelligence. Проект написан на Swift и использует CoreML, MLX-Swift и Llama 3 для внедрения продвинутых возможностей локального ИИ на устройствах Apple. Это практическое руководство для разработчиков по интеграции больших языковых моделей и генеративного ИИ непосредственно в экосистему Apple без зависимости от облачных решений.

apple-intelligencecoremlmlxswift

nealmick/Sports-Betting-ML-Tools-NBA

Developed by nealmick, this open-source repository provides a suite of machine learning tools designed for NBA sports betting analysis. It leverages Python, Keras, and TensorFlow to process historical data and generate predictive insights. The project includes infrastructure for data management and model training, enabling users to build custom betting strategies based on statistical probabilities and market odds.

nbamachine-learningsports-bettingtensorflow

zmre/awesome-security-for-ai

zmre/awesome-security-for-ai is a curated repository maintained by zmre that aggregates essential resources for AI security. It provides a structured list of both open-source and commercial products designed to protect machine learning models and GenAI pipelines. The project serves as a central hub for cybersecurity professionals and AI engineers to discover tools for vulnerability scanning, threat detection, and risk management in AI-driven environments, complete with a helpful infographic for visualizing the AI security landscape.

cybersecurityai-securityllmappsec

rmbell09-lang/tradesight

TradeSight is an open-source, self-hosted AI trading laboratory developed by rmbell09-lang. It provides a comprehensive environment for quantitative finance enthusiasts to design, backtest, and execute trading strategies. The platform features integrated paper trading capabilities, automated overnight strategy tournaments, and support for over 15 technical indicators, allowing users to leverage machine learning to optimize their financial market performance in a controlled, risk-free environment.

aialgo-tradingfintechbacktesting

startino/aitino

Aitino — это open-source платформа от startino, предназначенная для оркестрации команд ИИ-агентов. Она предоставляет фреймворк для создания многоагентных систем, способных решать сложные задачи. Используя возможности LLM, Aitino позволяет разработчикам настраивать специализированных агентов, которые взаимодействуют друг с другом для выполнения многоэтапных процессов, что делает проект мощным инструментом для внедрения агентной автоматизации.

aiautomationmulti-agentllm

SAP-samples/ai-core-samples

SAP-samples/ai-core-samples — это официальный репозиторий от SAP, содержащий шаблоны рабочих процессов и Jupyter-ноутбуки. Он служит практическим руководством для разработчиков по интеграции, развертыванию и управлению моделями машинного обучения в экосистеме SAP AI Core. Используя SDK SAP AI Core, пользователи могут научиться переходить от экспериментального кода к готовым промышленным AI-сервисам, обеспечивая бесшовную интеграцию с корпоративной инфраструктурой SAP.

sapmlopsenterprise-aiworkflow-automation

trekhleb/homemade-gpt-js

homemade-gpt-js — это образовательный проект от trekhleb, представляющий собой чистую и лаконичную реализацию minGPT Андрея Карпатого на базе TensorFlow.js. Проект создан для разработчиков, желающих понять внутреннее устройство трансформеров: вся архитектура модели умещается в 300 строк кода на TypeScript. Это практический инструмент для изучения работы блоков трансформера, механизмов self-attention и языкового моделирования в среде браузера.

aigpttensorflowjstypescript

jinlow/forust

Forust — это библиотека машинного обучения от jinlow, реализующая алгоритмы градиентного бустинга на решающих деревьях. Написанная на Rust для достижения максимальной производительности, она предлагает бесшовную интеграцию с Python через PyO3. Forust является легкой и эффективной альтернативой таким фреймворкам, как XGBoost, фокусируясь на скорости и экономном потреблении памяти при работе с табличными данными.

rustmachine-learninggradient-boostingpyo3

IBM/data-science-best-practices

IBM Data Science Best Practices — это курируемый репозиторий, созданный для преодоления разрыва между исследованиями и продакшеном. Он предоставляет рекомендации для специалистов по Data Science и ML-инженеров по внедрению версионирования, масштабируемости и мониторинга. Сосредоточившись на инженерной строгости, проект помогает командам стандартизировать рабочие процессы, гарантируя, что модели машинного обучения будут не только точными, но и надежными, масштабируемыми и удобными в обслуживании в реальных корпоративных средах.

mlopsdata-sciencedevopsbest-practices

bzier/gym-mupen64plus

bzier/gym-mupen64plus — это open-source проект, интегрирующий эмулятор Mupen64Plus с фреймворками обучения с подкреплением. Разработанный bzier, этот инструмент предоставляет исследователям стандартизированный интерфейс для наблюдения за состоянием игры и управления действиями агента. Он упрощает процесс обучения ИИ в сложных 3D-средах классических игр, делая их доступными для современных библиотек машинного обучения.

reinforcement-learningnintendo-64gymemulator

eren23/one_layer_image_gen

eren23/one_layer_image_gen — это репозиторий на PyTorch, воспроизводящий логику Feature Auto-Encoder (FAE) из научной статьи «One Layer Is Enough: Adapting Pretrained Visual Encoders for Image Generation». Проект демонстрирует, как использовать существующие предобученные визуальные энкодеры для генеративных задач путем добавления легковесного однослойного адаптера, что значительно снижает вычислительные затраты по сравнению с обучением моделей с нуля.

pytorchautoencoderdiffusiongenerative-ai

Rishabh1925/foodvisionai

FoodVisionAI — это интеллектуальное веб-приложение от Rishabh1925, использующее современные модели Vision Transformer (ViT) для классификации изображений еды. Благодаря интеграции фронтенда на React и бэкенда на Flask, проект предоставляет пользователям удобный интерфейс для загрузки фото и получения мгновенных прогнозов. Это практическая реализация глубокого обучения для задач компьютерного зрения, демонстрирующая эффективное сочетание инструментов Hugging Face и современных веб-технологий.

computer-visiontransformersreactflask

analogdevicesinc/MAX78xxx-RefDes

Репозиторий MAX78xxx-RefDes от Analog Devices содержит коллекцию эталонных проектов для микроконтроллеров MAX78000 и MAX78002. Эти чипы разработаны специально для Edge AI и оснащены аппаратным ускорителем нейронных сетей (CNN). Репозиторий включает реализации на языке C и примеры, помогающие разработчикам внедрять возможности глубокого обучения в энергоэффективные встраиваемые системы, сокращая разрыв между высокоуровневыми моделями машинного обучения и аппаратным выполнением с низким энергопотреблением.

edge-aiembeddedmicrocontrollercnn

guyyariv/LaMI

LaMI (Late Multi-Image Fusion) — это инновационный фреймворк, представленный на ACL 2026, который расширяет возможности больших языковых моделей (LLM) в области визуального восприятия. Разработанный Гаем Яривом, этот подход позволяет моделям эффективно обрабатывать и анализировать несколько изображений одновременно. Используя архитектуру позднего слияния, LaMI устраняет разрыв между текстовым пониманием и визуальным здравым смыслом, обеспечивая более точное мультимодальное взаимодействие. Официальная реализация предоставляет исследователям инструменты для интеграции контекста нескольких изображений в существующие конвейеры LLM.

multimodalllmcomputer-visiondeep-learning

MjdMahasneh/Simple-PyTorch-Semantic-Segmentation-CNNs

MjdMahasneh/Simple-PyTorch-Semantic-Segmentation-CNNs — это open-source репозиторий, предоставляющий чистые и модульные реализации стандартных моделей семантической сегментации на PyTorch. Проект включает в себя такие архитектуры, как UNet, DeepLabv3+, SegNet, FCN и PSPNet. Он служит практическим образовательным ресурсом и отправной точкой для разработчиков и исследователей, желающих внедрить задачи попиксельной классификации в компьютерном зрении без использования сложных и перегруженных фреймворков.

pytorchsegmentationcomputer-visioncnn

Chunjiang-Intelligence/low-rank-decay

Low-Rank Decay — это инновационный метод регуляризации от Chunjiang-Intelligence, направленный на улучшение обобщающей способности моделей и борьбу с переобучением. Внедряя низкоранговые ограничения в процесс обучения, этот подход помогает нейронным сетям достигать лучших свойств сходимости. Репозиторий содержит официальную реализацию на Python, позволяющую исследователям и разработчикам интегрировать этот метод в свои пайплайны для повышения производительности и стабильности моделей.

deep-learningregularizationlow-rankoptimization

bellerb/chess

bellerb/chess — это проект с открытым исходным кодом для игры в шахматы прямо в терминале. Разработанный bellerb, он поддерживает как режим игры между людьми, так и против ИИ. Проект использует глубокое обучение и поиск по дереву Монте-Карло (MCTS) для создания интеллектуального компьютерного противника, что делает его отличным ресурсом для изучения пересечения обучения с подкреплением и теории игр.

chessreinforcement-learningmctspytorch

Mahmoudagha01/AutismX

AutismX — это мобильное приложение с открытым исходным кодом, разработанное на Flutter и Dart. Оно выполняет две важные функции: предлагает интерактивные занятия для улучшения коммуникации у невербальных детей и использует ИИ для анализа поведения с целью выявления признаков аутизма. Приложение формирует подробные отчеты, которыми родители могут поделиться со специалистами для облегчения диагностики и раннего вмешательства.

autismflutterhealthcaredeep-learning

ugr-sail/paper-drl_building

Разработанный исследовательской группой UGR-SAIL, этот репозиторий содержит дополнительные материалы, код и экспериментальную базу для научной работы «Экспериментальная оценка алгоритмов глубокого обучения с подкреплением для управления HVAC». Это ценный ресурс для исследователей и инженеров, стремящихся применять методы DRL для оптимизации энергопотребления зданий и повышения эффективности климат-контроля с помощью интеллектуальных агентов.

reinforcement-learninghvacenergy-optimizationcontrol-systems

anonymous-author-sub/seeable

SeeABLE — это open-source фреймворк глубокого обучения для выявления дипфейков. В отличие от стандартной бинарной классификации, он использует метод мягких расхождений (soft discrepancies) и ограниченное контрастивное обучение для более точного различения реального и поддельного контента. Сосредоточившись на тонких несоответствиях, которые часто пропускают обычные модели, SeeABLE предлагает надежный подход к криминалистическому анализу медиа в эпоху развития генеративного ИИ.

deepfakeforensicscontrastive-learningsecurity

csinva/matching-with-gans

Проект от csinva исследует возможности сопоставления в латентном пространстве GAN для решения проблем справедливости ИИ и манипуляции изображениями. Находя и сопоставляя латентные векторы, фреймворк позволяет проводить строгий бенчмаркинг предвзятости в системах распознавания лиц и выполнять точечное семантическое редактирование. Это ценный ресурс для исследователей причинно-следственных связей и этики в глубоких генеративных моделях.

biasfairnessgancomputer-vision

iheallab/apricotM

ApricotM — это open-source фреймворк от iheallab для мониторинга пациентов в отделениях интенсивной терапии. Проект, опубликованный в Nature Communications, использует архитектуры state-space (Mamba) и трансформеры для обработки электронных медицинских карт (EHR). Система предоставляет врачам предиктивную аналитику по состоянию пациентов и необходимым методам лечения, обеспечивая проактивный подход к уходу за счет эффективной обработки сложных временных рядов клинических данных.

icuehrmambahealthcare

michael-psenka/manifold-linearization

Manifold-linearization — это официальный репозиторий к научной статье «Representation Learning via Manifold Flattening and Reconstruction». Проект, созданный Майклом Псенкой, содержит реализацию и Jupyter-ноутбуки, необходимые для изучения того, как модели глубокого обучения могут формировать представления путем выпрямления сложных многообразий данных. Это практический ресурс для исследователей и специалистов, интересующихся геометрией, обучением без учителя и архитектурами автокодировщиков.

manifold-learningautoencoderdeep-learninggeometry

bharatc9530/weapon-detection

Проект от bharatc9530 представляет собой комплексное решение для обнаружения оружия и очагов возгорания на изображениях и в видеопотоках. Используя архитектуру YOLOv4-tiny, репозиторий включает код для обучения, готовый набор данных и веса модели. Система предназначена для интеграции в системы видеонаблюдения и CCTV, повышая уровень безопасности за счет автоматизированного обнаружения угроз с помощью глубокого обучения.

yolosurveillancecomputer-visiondeep-learning

HectorPulido/Vtuber-Framework-Unity-and-Python

Разработанный HectorPulido, этот фреймворк обеспечивает интеграцию Unity и Python для создания продвинутых VTuber-приложений. Используя модели глубокого обучения, он выполняет отслеживание тела и анализ выражений лица в реальном времени, позволяя управлять 3D-аватарами через компьютерное зрение. Объединяя мощную экосистему машинного обучения Python и возможности рендеринга Unity, проект создает основу для интерактивных виртуальных персонажей с захватом движений.

aibody-trackingunitypython

GitGud-f/Delta

Delta — это компактная модель глубокого обучения от GitGud-f, предназначенная для эффективной монокулярной оценки глубины. Используя технологию дистилляции знаний, проект переносит возможности архитектуры DepthAnythingV2 в более легкую и быструю модель. Это позволяет добиться качественного восприятия глубины на устройствах с ограниченными ресурсами, что делает решение идеальным для задач компьютерного зрения, требующих низкой задержки и минимальных вычислительных затрат.

depth-estimationedge-aiknowledge-distillationcomputer-vision

hemantkarekar/MyProctorAI

MyProctorAI — это open-source портал для экзаменов, разработанный hemantkarekar на базе Flask и Python. Система интегрирует ИИ-инструменты для обеспечения академической честности во время онлайн-тестирования. Используя технологии обработки изображений и распознавания, система отслеживает подозрительное поведение экзаменуемых, предлагая масштабируемое решение для удаленного наблюдения. Это отличная база для разработчиков, создающих защищенные автоматизированные среды для проведения экзаменов.

proctoringflaskcomputer-visionedtech

Goosang-Yu/genet

Genet — это специализированная Python-библиотека от Goosang-Yu, предназначенная для оптимизации процессов редактирования генома. Она использует модели глубокого обучения, чтобы помочь исследователям в проектировании и прогнозировании направляющих РНК (gRNA) для CRISPR. Объединяя биоинформатику с современными методами ИИ, инструмент помогает ученым оптимизировать эксперименты по редактированию генов, повышать специфичность таргетинга и предсказывать эффективность систем CRISPR-Cas, что делает его ценным ресурсом для геномных исследований и синтетической биологии.

bioinformaticscrisprgenomicsdeep-learning

clearml/clearml-server-k8s

ClearML Server for Kubernetes — это решение с открытым исходным кодом, позволяющее командам развертывать платформу ClearML MLOps на собственной инфраструктуре K8s. Оно упрощает управление отслеживанием экспериментов, версионированием данных и оркестрацией моделей с помощью стандартизированных Helm-чартов, обеспечивая бесшовную интеграцию с существующими рабочими процессами на базе Kubernetes и частными облаками.

kubernetesmlopshelmexperiment-tracking

demidovd98/sm-vit

SM-ViT (Salient Mask-Guided Vision Transformer) — это проект с открытым исходным кодом от demidovd98, представленный на конференции VISIGRAPP '23. Он улучшает стандартные модели Vision Transformer, интегрируя механизм маскирования на основе значимости. Этот подход фокусирует внимание модели на наиболее информативных областях изображения, что значительно повышает эффективность в задачах тонкой классификации, где критически важны мелкие детали.

computer-visionvision-transformerdeep-learningimage-classification

paulinamoskwa/Wildfire-Smoke-Detection

Wildfire-Smoke-Detection — это проект с открытым исходным кодом от paulinamoskwa, использующий глубокое обучение для мониторинга окружающей среды. Применяя архитектуру Faster R-CNN, реализованную на PyTorch, модель распознает шлейфы дыма на визуальных данных. Этот инструмент служит базовой платформой для исследователей и разработчиков, создающих автоматизированные системы раннего предупреждения о лесных пожарах, помогая повысить осведомленность и ускорить реагирование в пожароопасных регионах.

computer-visionpytorchwildfireobject-detection

capstone-insper/drone-swarm-search-algorithms

Этот репозиторий от команды capstone-insper содержит набор алгоритмов для решения задач в среде Drone Swarm Search Environment (DSSE). Проект использует глубокое обучение с подкреплением и многоагентные системы для оптимизации навигации и поиска целей автономными роями дронов. Реализуя различные стратегии — от жадных алгоритмов до сложных моделей на PyTorch, — проект служит практическим фреймворком для исследователей и разработчиков, работающих над координацией беспилотников и поисково-спасательными операциями.

reinforcement-learningdrone-swarmmulti-agentrobotics

loayabdalslam/connectit.chatit

Connectit.chatit — это инновационный open-source проект от loayabdalslam, переосмысливающий развертывание LLM. Используя P2P-протокол, подобный торрентам, он обеспечивает децентрализованное распространение больших языковых моделей. Этот подход снижает зависимость от централизованной облачной инфраструктуры, позволяя пользователям эффективно обмениваться моделями и развертывать их на распределенных узлах. Проект написан на Python и фокусируется на использовании одноранговых сетей для повышения доступности и отказоустойчивости моделей глубокого обучения.

p2pdecentralizedllmnetworking

nktoan/risk-distribution-matching

Risk Distribution Matching — это open-source проект от nktoan, представленный на конференции WACV 2024. Он решает проблему доменной обобщаемости (domain generalization) путем выравнивания распределений риска между различными средами обучения. Используя методы причинно-следственного вывода и глубокого обучения, фреймворк позволяет моделям надежно работать с данными вне распределения (OOD), обеспечивая стабильность в реальных сценариях, где тестовые данные значительно отличаются от обучающих.

causal-inferencedomain-generalizationdeep-learningood-detection

nevinbaiju/pose_estimation_android_app

Это open-source Android-приложение, созданное Nevin Baiju, использует Google ML Kit для оценки и детекции поз в реальном времени. Оно анализирует видеопоток, определяет ключевые точки тела и распознает позы пользователя. Проект, написанный на Java, служит практическим руководством для разработчиков, желающих внедрить функции компьютерного зрения в свои мобильные приложения с использованием локального машинного обучения.

androidmlkitpose-estimationcomputer-vision

kennethleungty/Data-Centric-AI-Competition

Этот репозиторий содержит исходный код и методологию, которые позволили Кеннету Люнгу войти в топ-5% конкурса Data-Centric AI, организованного Эндрю Ыном и DeepLearning.AI. В отличие от традиционных подходов, ориентированных на модели, проект демонстрирует, как систематическая очистка данных, аугментация и улучшение разметки могут значительно повысить производительность нейросетей. Это практическое руководство для специалистов, стремящихся применять принципы data-centric AI в реальных задачах машинного обучения.

data-centricdeep-learningmachine-learningandrew-ng