7件
nktoan氏によって開発された本プロジェクトは、因果推論とスタイル転送技術を統合し、分布外(OOD)汎化性能を向上させる革新的な手法を提案しています。KDD 2023で発表されたこのフレームワークは、ニューラルネットワークが因果関係のある特徴と偽の相関を識別できるように設計されています。データスタイルを操作することで、モデルは多様なドメイン間で安定した堅牢な表現を学習し、未知のデータ分布に対する標準的な深層学習モデルの弱点を克服します。
AIOZ-AIが開発しICCV 2019で発表されたVQA-CTIは、視覚的質問応答における「コンパクト三線形相互作用」手法を導入したモデルです。高次マルチモーダル融合における計算量の課題に対し、三線形相互作用メカニズムを用いることで解決を図っています。画像と質問間の複雑な関係を、パラメータ数を抑えつつ効果的に捉えることが可能であり、マルチモーダル深層学習研究における重要な貢献となっています。
SpaceFusionは、NAACL '19で発表されたニューラル応答生成における多様性と関連性のトレードオフを解決するオープンソースの研究実装です。Microsoft Researchによって開発されたこの手法は、共同最適化アプローチを導入することで、初期のSeq2Seqモデルにありがちな単調で反復的な出力を避け、文脈的に正確かつ言語的に多様な応答を生成するチャットボットを実現します。
h-Editは、CVPR 2025で発表された拡散モデルベースの革新的な画像編集フレームワークです。nktoan氏によって開発された本プロジェクトは、Doobのh変換を用いることで、画像操作に対して数学的根拠に基づいたアプローチを提供します。拡散プロセスに特定の制約を課すことで、大規模なファインチューニングや膨大な計算コストをかけずに、高品質で柔軟な画像編集を可能にします。
OWASP Top 10 for Large Language Model Applicationsは、Open Worldwide Application Security Project (OWASP) が開発した包括的なセキュリティフレームワークです。プロンプトインジェクション、不適切な出力処理、学習データの汚染など、LLMシステム特有の重大なリスクを特定します。開発者やセキュリティ専門家が生成AIの脅威を理解・優先順位付けし、LLM統合ソフトウェアを安全にデプロイするための不可欠なリソースです。
SISINFLABチームがまとめた、レコメンデーションシステム(RS)における敵対的機械学習(AML)に関する網羅的な調査リポジトリです。74本の主要論文を対象に、RSのセキュリティ対策(攻撃と防御)と、データ生成におけるGANの活用という2つの側面から解説。堅牢なレコメンデーションモデルの構築を目指す研究者やエンジニアにとって、不可欠なリファレンスとなっています。
DAIR.AIが毎週、最も影響力のある機械学習論文を厳選して紹介するGitHubリポジトリ。最先端の研究をキャッチアップするためのダイジェスト。