Яндекс представил новую нейросеть Alice AI LLM Flash – это быстрая языковая модель, которая оптимизирована под наиболее популярные задачи бизнеса. Она хорошо работает с текстами и документами – а это почти 60% от всех b2b-запросов к моделям Яндекса. С помощью новой модели компании смогут решать эти задачи быстрее и почти в 5 раз дешевле, чем ранее. Новая модель уже доступна бизнесу в Yandex AI Studio.
Alice AI LLM Flash эффективна в задачах, которые требуют качественного ответа при высокой скорости отклика – например, в диалогах или при обработке большого количества данных. Она подойдет для модерации контента на сайте, классификации обращений в техподдержку или диалога с клиентом. Новая модель позволит малому бизнесу использовать нейросети с минимальными финансовыми затратами, в то же время она поможет крупным компаниям сэкономить на обработке массовых запросов, сохранив хорошее качество и высокую скорость ответов. Она будет востребована у банков, ритейлеров, телеком-операторов и других компаний с большим объемом однотипных задач, в которых критически важна скорость ответа.
Alice AI LLM Flash в 56% случаев превосходит нейросеть GPT-5.4 mini по качеству решения бизнес‑задач. При этом она сохраняет все преимущества флагманской модели Alice AI LLM: она превосходит западную модель в диалоговых сценариях (лучше в 73% случаев), обобщении и структуризации текста (66%) и в поиске данных по файлам и базам знаний (61%).
«Яндекс выходит на новый для себя рынок моделей, созданных специально под запросы бизнеса. Alice AI LLM Flash поможет российским компаниям перейти на российские нейросети для автоматизации работы с огромными объемами данных. Новая модель – это собственная разработка, прошедшая полный цикл обучения на данных Яндекса. Она сопоставима по стоимости с ближайшим западным аналогом GPT-5.4 mini, при этом мы также обеспечиваем безопасность обрабатываемых данных и стабильную работу в России», – рассказал руководитель платформы Yandex AI Studio Артур Самигуллин.
Также на платформе открыли доступ к опенсорсной модели DeepSeek V4 Flash. Это первая в России доступная в облаке модель с контекстным окном в 1 млн токенов. Ее можно использовать для разработки корпоративных ИИ-агентов, анализа больших документов и решения сложных многоэтапных задач. При этом она в полтора раза дешевле предыдущей версии DeepSeek V3.2.

Комментарии закрыты, но трэкбэки и Pingbacks открыты.