
vespa-engine/vespa
🔧 ツールvespa-engine
AIによる大規模リアルタイムベクトル・テキスト検索プラットフォーム
Vespaは、検索およびレコメンデーションシステム向けの高度にスケーラブルなリアルタイムサービングエンジンです。Javaで構築され、近似最近傍(ANN)インデックスによるテキスト検索とベクトル検索の両方をサポートし、語彙的マッチングとセマンティックマッチングをブレンドしたハイブリッドクエリを可能にします。Vespaはクエリ時に機械学習モデル(ONNX、TensorFlowなど)を評価でき、パーソナライズされたランキングや検索拡張生成(RAG)を実現します。分散アーキテクチャにより、自動データ分割、レプリケーション、フェイルオーバーを備え、テンソルによる多次元データ、グループ評価、REST APIによるSREフレンドリーな運用などの高度な機能を提供します。VespaはYahooなどの企業で本番運用され、数十億のドキュメントをサブ秒レイテンシで処理しています。
💡ハイライト
- ├─テキストとベクトルの統合検索
- ├─リアルタイムMLモデル評価
- └─数十億文書へのスケーラビリティ
🎯対象
- ├─検索エンジニア
- ├─AI/MLエンジニア
- └─データプラットフォームチーム