Французский стартап Ши Мистраль представил свою первую аудиомодель открытого кода под названием Voxtral. Новый продукт проблем с закрытыми системами от гигантов, таких как Openai, ElevenLabs и Google, предлагая бизнесу доступную альтернативу, которая стоит менее половины цены конкурентов. Об этом пишет TechCrunch.
► Подпишитесь на Министерство финансов Telegram: основные финансовые новости
Вокстральные версии и версии
Новая модель ориентирована на бизнес -пользователей. Он может транскрибировать (преобразовать аудио в текст) в 30 минут записи и понять контекст до 40 минут звука. Это позволяет вам не только расшифровать, но и задавать вопросы аудиофайлу, создавать его резюме (резюме) или выполнять реальные действия. В настоящее время Voxtral поддерживает восемь языков, включая английский, испанский, французский, немецкий и итальянский.
Мистраль предлагает несколько версий модели:
- Voxtral Small: большая модель для 24 миллиардов параметров для большого использования.
- Voxtral Mini: компактная модель для 3 миллиардов параметров для локального развертывания на устройствах.
- Voxtral Mini Transcribe: Быстрый и дешевый API для транскрипции, который, по мнению компании, превышает производительность и стоимость хорошо известной Spearai Whisper Service.
Модель уже доступна для бесплатного тестирования через платформу обнимающего лица и чат LE Chat Compant, а стоимость интеграции API начинается с 0,001 доллара в минуту.
Стратегия Мистрала
Французский стартап, стоимость венчурных инвесторов, оценивалась в 6,2 миллиарда долларов, стремится стать независимым европейским лидером в области ИИ и конкурировать с разработчиками из США и Китая. Президент Франции Эммануэль Макрон поддерживает открытый код для части своих моделей, в отличие от полностью закрытых систем Openai или Google.
«Открытые» и «закрытые» модели SHI: в чем разница
Современные крупные языковые модели (LLM) делятся на два основных типа в зависимости от их доступности:
- Закрытые модели: это принадлежащие системы, разработанные крупными корпорациями (например, GPT-4 от Openai или Claude 3 от Anpropic). Их исходный код, архитектура и данные обучения являются коммерческим секретом. Пользователи могут взаимодействовать с ними только через платные программные интерфейсы (API). Они предлагают высокую производительность и надежную поддержку, но ограничивают возможности управления и настройки.
- Открытые модели: такие модели, как Voxtral из Mistral или Llama из Meta, опубликованы с открытым исходным кодом и «весами» (математическое представление «Знания» модели). Это позволяет любому разработчику или компании загружать их бесплатно, работать на собственном оборудовании, модифицировать и глубоко приспосабливаться к их конкретным потребностям. Это обеспечивает большую гибкость, управление данными и более низкую стоимость, но требует большей технической проверки.
Стратегия Mistral заключается в том, чтобы предложить как передовые закрытые модели для корпоративных клиентов, так и мощные открытые модели для сообщества разработчиков.