08.03.2025

Qwen представила новую языковую модель QwQ-32B с критическим мышлением и возможностями для интеграции

Команда Qwen, подразделение Alibaba, анонсировала запуск новой языковой модели QwQ-32B, которая демонстрирует выдающуюся производительность, сопоставимую с DeepSeek-R1, несмотря на наличие у последней в 20 раз больше параметров. В процессе создания QwQ-32B использовалась инновационная методика двухэтапного обучения с подкреплением. На первом этапе модель обучалась решению математических задач и генерации кода. На втором акцент был сделан на совершенствовании навыков в области текстовой генерации и обработки изображений.

QwQ-32B обладает уникальными возможностями AI-агента, включая способность критически анализировать информацию, использовать внешние инструменты (например, интерпретаторы кода или генераторы изображений) и адаптировать свои выводы на основе обратной связи. Эти качества позволяют нейросети значительно улучшить эффективность решения сложных задач в реальных условиях.

Модель уже доступна для разработчиков под лицензией Apache 2.0, что открывает возможности для интеграции QwQ-32B в различные приложения и сервисы. В команде Qwen рассматривают этот проект как важный шаг к созданию систем обучения с подкреплением и активно работают над развитием следующего поколения моделей, которые приблизят нас к созданию общего искусственного интеллекта (AGI).

В дополнение к этому, Alibaba объявила о намерении инвестировать в облачные технологии и искусственный интеллект не менее 380 млрд юаней (примерно 52,44 млрд долларов) в ближайшие три года — значительно увеличив свои вложения в ИТ-сферу за последние десятилетия.

Оцените статью
ODELAX.RU
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x

Проверить франшизу

Спасибо
Ваша заявка отправлена
Скоро мы свяжемся с Вами