ByteDance: UI-TARS 7B
🧠 Модель ИИbytedance
Мультимодальный визуально-языковой агент для автоматизации GUI, оптимизирован для десктопа, веба, мобильных устройств и игр.
UI-TARS-1.5 (7B параметров) — передовая мультимодальная визуально-языковая модель от ByteDance. Отлично работает в GUI-средах: десктопные приложения, веб-браузинг, мобильные интерфейсы и игры. Модель принимает как изображения, так и текст, что позволяет понимать и взаимодействовать с графическими интерфейсами. Контекст до 128 000 токенов позволяет обрабатывать длинные истории диалогов или подробные инструкции. Цена: $0.10 за миллион входных токенов и $0.20 за миллион выходных. Поддерживает продвинутые параметры: frequency_penalty, logit_bias, max_tokens, presence_penalty, repetition_penalty, seed, stop, temperature. Построена на фреймворке UI-TARS с обучением с подкреплением, достигает высокой производительности в автоматизации задач GUI.
💡Основное
- ├─7B параметров
- ├─Контекст 128K токенов
- └─Ввод: изображение + текст, вывод: текст
🎯Для
- ├─Исследователи ИИ
- ├─Разработчики GUI-автоматизации
- └─Создатели продуктов