40件
aishwaryanr/awesome-generative-ai-guideは、生成AIに関するあらゆる情報を集約した包括的なコミュニティ主導型リポジトリです。Aishwarya Naresh Reganti氏によって作成され、高品質な研究論文、実践的なノートブック、学習ロードマップ、面接対策資料を網羅しています。LLMや拡散モデルなど、急速に進化するAI分野を学びたい開発者や研究者にとって、最新情報を追うための必須のブックマークです。
koala73が開発したWorldMonitorは、AIを活用して世界中のニュース、地政学的変動、インフラ状況を収集・分析する高度な状況認識プラットフォームです。TypeScriptで構築されており、複雑な事象をリアルタイムで追跡するための統合ダッシュボードを提供します。膨大なデータストリームを実用的なインテリジェンスへと統合することで、AI駆動型の自動化された視点から世界情勢を把握したいアナリストや研究者にとって強力なツールとなります。
Palmier Proは、palmier-ioがSwiftで開発したオープンソースのmacOS用ビデオエディタです。従来のノンリニア編集と最新のAIワークフローを融合させ、macOSのネイティブフレームワークを活用することで、クリエイターがAI駆動の機能を制作パイプラインに直接組み込める、高速かつ効率的な編集環境を提供します。
LibreTranslateは、商用翻訳サービスの代替となるプライバシー重視の強力なオープンソース機械翻訳エンジンです。LibreTranslateコミュニティによって開発され、独自の翻訳インフラを構築可能です。Argos Translateライブラリを基盤とし、DockerやPythonで簡単にデプロイできる堅牢なAPIを提供します。ローカル環境で動作するためデータプライバシーが確保され、インターネット接続なしでも利用できるため、信頼性の高い翻訳機能を求める開発者や組織に最適です。
MyAppleIntelligenceは、DaemonLoki氏によるオープンソースプロジェクトで、Apple Intelligenceのような機能を独自に実装するものです。主にSwiftで構築されており、CoreML、MLX-Swift、Llama 3を活用して、Appleハードウェア上で高度なオンデバイスAIを実現します。開発者が独自のクラウド依存型ソリューションに頼らず、ローカルLLMや生成AIをAppleエコシステムに直接統合するための実践的なリファレンスを提供します。
Developed by nealmick, this open-source repository provides a suite of machine learning tools designed for NBA sports betting analysis. It leverages Python, Keras, and TensorFlow to process historical data and generate predictive insights. The project includes infrastructure for data management and model training, enabling users to build custom betting strategies based on statistical probabilities and market odds.
zmre/awesome-security-for-ai is a curated repository maintained by zmre that aggregates essential resources for AI security. It provides a structured list of both open-source and commercial products designed to protect machine learning models and GenAI pipelines. The project serves as a central hub for cybersecurity professionals and AI engineers to discover tools for vulnerability scanning, threat detection, and risk management in AI-driven environments, complete with a helpful infographic for visualizing the AI security landscape.
TradeSight is an open-source, self-hosted AI trading laboratory developed by rmbell09-lang. It provides a comprehensive environment for quantitative finance enthusiasts to design, backtest, and execute trading strategies. The platform features integrated paper trading capabilities, automated overnight strategy tournaments, and support for over 15 technical indicators, allowing users to leverage machine learning to optimize their financial market performance in a controlled, risk-free environment.
Aitino is an open-source platform developed by startino that enables users to orchestrate crews of AI agents. Designed to tackle complex problem-solving and task automation, it provides a framework for multi-agent systems. By leveraging LLMs, Aitino allows developers to define specialized agents that work together to execute intricate workflows, making it a powerful tool for those looking to integrate agentic automation into their projects.
SAP-samples/ai-core-samplesは、SAP AI Coreを活用するための公式ワークフローテンプレートとJupyterノートブックのコレクションです。開発者がSAP AI Core SDKを使用して、機械学習モデルの統合、デプロイ、管理を行うための実践的なガイドを提供します。実験的なコードを本番環境対応のAIサービスへ移行し、SAPのエンタープライズインフラとシームレスに連携させる方法を習得できます。
homemade-gpt-jsは、Andrej Karpathy氏のminGPTをTensorFlow.jsで再実装した教育用プロジェクトです。GPTモデルの核心部分を300行未満のTypeScriptで記述しており、トランスフォーマーブロックや自己注意機構(セルフアテンション)の仕組みをブラウザ環境で学習したい開発者に最適です。
Forustは、jinlow氏によって開発された勾配ブースティング決定木(GBDT)ライブラリです。Rustのパフォーマンスを最大限に活かすよう設計されており、PyO3を通じてPythonからシームレスに利用可能です。XGBoostなどの従来のフレームワークに代わる、軽量でメモリ効率に優れた選択肢として、テーブルデータ分析に最適です。
IBMの「Data Science Best Practices」は、研究段階から本番運用への橋渡しを目的としたリポジトリです。データサイエンティストやMLエンジニアが、堅牢なバージョン管理、スケーラビリティ、監視体制を構築するための指針を提供します。エンジニアリングの厳密さに焦点を当てることで、チームはワークフローを標準化し、機械学習モデルを実世界のエンタープライズ環境で信頼性の高いものへと進化させることができます。
bzier/gym-mupen64plusは、Mupen64Plus N64エミュレータを強化学習フレームワークと統合するオープンソースのOpenAI Gym環境ラッパーです。bzier氏によって開発されたこのツールは、N64ゲームの画面状態や操作入力を標準化されたインターフェースとして提供し、AIエージェントの学習を容易にします。複雑なエミュレータ環境と最新の機械学習ライブラリの橋渡しを行い、ゲームベースのAI研究を強力に支援します。
eren23/one_layer_image_genは、論文「One Layer Is Enough: Adapting Pretrained Visual Encoders for Image Generation」で提案されたFeature Auto-Encoder (FAE)のロジックを再現したPyTorchリポジトリです。既存の事前学習済み視覚エンコーダーに軽量な単層アダプターを追加することで、大規模な生成モデルをゼロから学習させることなく、効率的に画像生成を行う手法を実証しています。
FoodVisionAIは、Rishabh1925氏によって開発された、最先端のVision Transformer (ViT) モデルを活用した食品画像認識Webアプリケーションです。ReactフロントエンドとFlaskバックエンドを統合し、ユーザーがアップロードした画像を即座に高精度で分類します。Hugging FaceのモデルホスティングとモダンなWeb開発スタックを組み合わせ、ディープラーニングを実用的なコンピュータビジョンタスクへ応用する優れた事例です。
Analog Devicesが提供するMAX78xxx-RefDesは、エッジAI向けマイコンMAX78000およびMAX78002を活用するためのリファレンスデザイン集です。ハードウェアCNNアクセラレータを搭載したこれらのチップ上で、ディープラーニングモデルを効率的に動作させるためのC言語実装例を提供し、電力制約の厳しい組み込みシステムへのAI導入を支援します。
LaMI(Late Multi-Image Fusion)は、ACL 2026で発表された、大規模言語モデル(LLM)に高度な視覚的推論能力を付加する革新的なフレームワークです。Guy Yariv氏によって開発されたこの手法は、複数の画像を効率的に処理・推論することを可能にします。レイトフュージョン(後期融合)アーキテクチャを採用することで、テキスト理解と視覚的常識の橋渡しを行い、より洗練されたマルチモーダルな対話を実現します。公式実装には、既存のLLMパイプラインにマルチイメージのコンテキストを統合するためのツールが含まれています。
MjdMahasneh/Simple-PyTorch-Semantic-Segmentation-CNNsは、業界標準のセマンティックセグメンテーションモデルをPyTorchで簡潔かつモジュール化して実装したオープンソースプロジェクトです。UNet、DeepLabv3+、SegNet、FCN、PSPNetなどの主要アーキテクチャを網羅しており、複雑なフレームワークを介さずにピクセル単位の分類タスクを実装したい開発者や研究者にとって、実用的な学習リソースおよび開発の出発点となります。
Low-Rank Decayは、Chunjiang-Intelligenceが開発した、モデルの汎化性能向上と過学習抑制を目的とした革新的な正則化手法です。学習プロセスにおいて低ランク制約を課すことで、ニューラルネットワークの収束特性を改善します。本リポジトリでは公式のPython実装が提供されており、研究者や開発者は自身のディープラーニングパイプラインにこの手法を統合し、モデルの性能と安定性を高めることが可能です。
bellerb/chessは、ターミナル上で直接チェスをプレイできるオープンソースのPythonプログラムです。bellerb氏によって開発され、人間対人間、および人間対AIの対局をサポートしています。ディープラーニングとモンテカルロ木探索(MCTS)を組み合わせたAIを搭載しており、強化学習とゲーム理論の交差領域を学ぶ開発者にとって最適なリソースです。
AutismXは、FlutterとDartで開発されたオープンソースのモバイルアプリです。非言語の子供たちのコミュニケーションを促進するアクティビティ機能と、AIによる行動分析を用いた自閉症の兆候検知機能を備えています。保護者はアプリで作成した詳細なレポートを専門家と共有でき、早期介入をサポートします。
UGR-SAIL研究グループが開発した本リポジトリは、論文「An experimental evaluation of Deep Reinforcement Learning algorithms for HVAC control」の補足資料、コード、および実験フレームワークを提供します。建物エネルギー消費の最適化と、インテリジェントなエージェントベースの戦略による空調効率向上を目指す研究者やエンジニア向けの貴重なリソースです。
SeeABLEは、ディープフェイクコンテンツを特定するために設計されたオープンソースの深層学習フレームワークです。従来の二値分類の限界を克服するため、ソフト不一致(soft discrepancies)と境界付き対照学習を活用し、本物と加工されたメディアをより正確に識別します。標準的なモデルでは見逃されがちな微細な不整合に焦点を当てることで、高度化する生成AI時代のフォレンジック分析に強力なアプローチを提供します。
csinvaによって開発された本プロジェクトは、GANの潜在空間マッチングを用いて、AIの公平性と画像操作における課題に取り組みます。潜在ベクトルの特定とマッチングを行うことで、顔認識システムの厳密なバイアス評価や、生成画像に対するきめ細やかなセマンティック編集を可能にします。特徴量の分離(ディスエンタングルメント)に対する手法を提供し、深層生成モデルにおける因果推論や公平性を研究する方にとって貴重なリソースです。
ApricotMは、iheallabが開発したICU患者のリアルタイム監視用オープンソースフレームワークです。Nature Communicationsに掲載された本プロジェクトは、状態空間モデル(Mamba)とTransformerアーキテクチャを活用し、電子カルテ(EHR)データを処理します。複雑な時系列臨床データを効率的に解析することで、患者の重症度や治療ニーズを予測し、医療現場での先制的なケアを支援します。
Manifold-linearizationは、論文「Representation Learning via Manifold Flattening and Reconstruction」の公式コンパニオンリポジトリです。Michael Psenka氏によって作成された本プロジェクトは、深層学習モデルが複雑なデータ多様体をフラット化することで表現を学習する仕組みを、Jupyter Notebookを通じて解説しています。幾何学、教師なし学習、オートエンコーダーの交差点を探求する研究者や実務家にとって貴重なリソースです。
bharatc9530によって開発されたこのプロジェクトは、画像や動画ストリーム内の武器や火災を検知するための完全なパイプラインを提供します。YOLOv4-tinyアーキテクチャを採用し、トレーニングコード、データセット、学習済みウェイトファイルが含まれています。監視カメラやCCTVシステムに統合し、ディープラーニングによる自動脅威検知でセキュリティを強化するために設計されています。
HectorPulido氏によって開発されたこのフレームワークは、UnityとPythonをシームレスに統合し、高度なVTuberアプリケーションを構築するための基盤です。ディープラーニングモデルを活用してリアルタイムの全身トラッキングと表情解析を行い、AIベースのコンピュータビジョンで3Dアバターを制御します。Pythonの強力な機械学習エコシステムとUnityのリアルタイムレンダリング能力を橋渡しすることで、インタラクティブなモーションキャプチャ環境を提供します。
Deltaは、GitGud-fによって開発された効率的な単眼深度推定モデルです。知識蒸留技術を活用し、高性能なDepthAnythingV2の能力を軽量なモデルに圧縮しました。リソースが限られたエッジハードウェア上でも高品質な深度認識を可能にし、低遅延が求められるリアルタイムコンピュータビジョンアプリケーションに最適です。
MyProctorAIは、hemantkarekar氏がFlaskとPythonで開発したオープンソースの試験ポータルです。AIによる試験監督機能を統合し、オンライン試験中の学術的誠実性を維持します。画像処理と認識技術を活用して受験者の不審な行動を監視し、リモート試験監督のためのスケーラブルなソリューションを提供します。不正防止対策を組み込んだ安全な自動試験環境を構築したい開発者にとって、基盤となるフレームワークです。
Genetは、Goosang-Yu氏によって開発されたゲノム編集ワークフローを効率化するための専門的なPythonライブラリです。深層学習モデルを活用し、研究者によるCRISPRガイドRNA(gRNA)の設計と予測を支援します。バイオインフォマティクスと最新のAI技術を統合することで、遺伝子編集実験の最適化、標的特異性の向上、CRISPR-Casシステムの効率予測を実現し、ゲノム研究や合成生物学において強力なツールとなります。
ClearML Server for Kubernetesは、ClearMLが提供するオープンソースのデプロイメントソリューションです。チームはこれを利用して、独自のKubernetesインフラ上にClearML MLOpsプラットフォーム全体をホストできます。標準化されたHelmチャートを提供することで、実験管理、データバージョン管理、モデルオーケストレーションの管理を簡素化し、既存のKubernetesワークフローやプライベートクラウド環境とのシームレスな統合を実現します。
SM-ViT (Salient Mask-Guided Vision Transformer) は、VISIGRAPP '23で発表されたdemidovd98氏によるオープンソースプロジェクトです。標準的なVision Transformerに顕著性に基づくマスキング機構を統合し、画像の識別性の高い領域にモデルの注意を集中させることで、微細な特徴が重要な分類タスクにおいて高い性能を発揮します。
Wildfire-Smoke-Detectionは、paulinamoskwa氏によって開発された、環境モニタリングのためのディープラーニングプロジェクトです。PyTorchで実装されたFaster R-CNNアーキテクチャを使用し、画像データから煙の plume(煙柱)を識別します。このツールは、コンピュータビジョンを活用して山火事の早期警戒システムを構築しようとする研究者や開発者にとって、状況認識と対応速度を向上させるための基盤となるフレームワークを提供します。
capstone-insperチームによって開発された本リポジトリは、ドローン群探索環境(DSSE)を解決するためのアルゴリズム集です。深層強化学習とマルチエージェントシステムを活用し、自律型ドローン群のターゲット探索とナビゲーションを最適化します。貪欲法からPyTorchを用いた高度な深層学習モデルまで、自律的な航空協調や捜索救助アプリケーションの研究開発に最適なフレームワークを提供します。
Connectit.chatitは、loayabdalslam氏によるLLMデプロイメントを再定義する革新的なオープンソースプロジェクトです。トレントのようなP2Pプロトコルを活用することで、大規模言語モデルの分散配布を実現します。中央集権的なクラウドインフラへの依存を減らし、ユーザー間でモデルを効率的に共有・デプロイ可能です。Pythonで構築されており、分散環境において深層学習モデルをよりアクセスしやすく、強固なものにすることを目指しています。
Risk Distribution Matchingは、nktoanによるWACV 2024採択の研究プロジェクトです。異なる学習環境間でのリスク分布を整合させることで、ドメイン汎化の課題に対処します。因果推論と深層学習を活用し、学習データとテストデータが大きく異なる実環境においても、モデルが信頼性の高いOOD(分布外)汎化性能を発揮できるよう支援します。
Nevin Baiju氏によって開発されたこのオープンソースのAndroidアプリは、GoogleのML Kitを利用してリアルタイムで姿勢推定と検出を行います。カメラ映像から人体ランドマークを特定し、ユーザーのポーズを認識します。Javaで構築されており、モバイルアプリにコンピュータビジョン機能を統合したい開発者にとって、オンデバイス機械学習の実装例として役立ちます。
本リポジトリは、Kenneth Leung氏がAndrew Ng氏とDeepLearning.AI主催の「Data-Centric AI Competition」で上位5%に入賞した際のソースコードと手法を公開しています。モデルの構造を変えるのではなく、データのクリーニングや拡張、ラベル付けの改善を通じてモデル性能を向上させる「データ中心型AI」の極意を学べる実践的なリソースです。