kibae/onnxruntime-server

🔧 Инструментkibae

Высокопроизводительный сервер для запуска ONNX-моделей через TCP и REST API.

ONNX Runtime Server — это надежное решение для разработчиков, стремящихся развернуть модели машинного обучения с минимальными накладными расходами. Сервер написан на C++ и оптимизирован для высокой производительности, что делает его идеальным для задач с большой нагрузкой. Он выступает связующим звеном между обученными моделями и клиентскими приложениями, скрывая сложность выполнения моделей за доступными сетевыми интерфейсами. Основные возможности включают поддержку TCP и RESTful HTTP/HTTPS, что обеспечивает гибкость интеграции в микросервисы или распределенные системы. Благодаря использованию ONNX Runtime, сервер поддерживает аппаратное ускорение, включая CUDA для GPU. Это отличный выбор для команд, использующих PyTorch, TensorFlow или другие фреймворки с экспортом в ONNX, так как позволяет избежать установки тяжелых зависимостей в рабочей среде. Модульный дизайн упрощает жизненный цикл развертывания от локального тестирования до облачных контейнеров.

💡Основное

├─Поддержка TCP и HTTP/HTTPS REST
├─Высокопроизводительный движок на C++
└─Нативная поддержка ускорения CUDA

🎯Для

├─ML-инженеры
├─Бэкенд-разработчики
└─DevOps-инженеры

🔗Ссылки

└─Репозиторий GitHub