08.04.2025

A-Vibe от «Авито» обошла международные LLM в российском бенчмарке MERA

Собственная языковая модель A-Vibe, разработанная «Авито», заняла первое место среди легковесных генеративных моделей (до 10 млрд параметров) по версии независимого российского бенчмарка MERA. Она продемонстрировала более высокие результаты по сравнению с международными аналогами от OpenAI (GPT-4o mini), Google (Gemma), Anthropic (Claude Haiku) и Mistral.

Согласно результатам тестирования, A-Vibe значительно опережает конкурентов по ключевым задачам:

  • генерация кода — на 25% точнее, чем Gemini 1.5 (8B),
  • ведение диалога — на 32% лучше, чем Llama 3.1 (405B),
  • смысловой анализ текста — на 23% эффективнее, чем Claude 3.5 Haiku.

MERA оценивает A-Vibe как наиболее сбалансированную модель в своей категории по способности к точной интерпретации пользовательских запросов, логическому ведению диалога и выполнению сложных лингвистических задач. Эти возможности уже применяются в продуктах «Авито» — от генерации продающих описаний до интеллектуального автокомплита в мессенджерах.

От прототипа к продукту: инвестиции, сценарии и стратегия

A-Vibe активно интегрируется в бизнес-процессы «Авито». До конца года компания планирует внедрить более 20 новых сценариев использования модели, а в долгосрочной перспективе — рассмотреть возможность открытого релиза кода. По оценке старшего директора по данным и аналитике Андрея Рыбинцева, к 2028 году вложения в направление GenAI составят около 12 млрд рублей, при ожидаемой выручке более 21 млрд рублей.

Локализация как преимущество: глубинная адаптация под русский язык

Первоначально модель была построена на открытом архитектурном решении с мультиязычным датасетом, где доля русского языка не превышала 1%. Команда «Авито» провела глубокую модификацию: разработала собственный токенизатор, оптимизированный под особенности русской морфологии и синтаксиса. Этот шаг обеспечил два критически важных результата:

  • ускорение обработки русскоязычного текста в 1.5–2 раза,
  • существенный прирост точности генерации и понимания запросов на русском языке.

Модель также обладает высокой вычислительной гибкостью — она способна работать с входами до 32 тысяч токенов, что делает её пригодной для анализа длинных текстов, документов и диалогов с большим количеством контекста.

A-Vision — следующий шаг

В параллель с A-Vibe команда «Авито» развивает визуальную модель A-Vision, ориентированную на обработку изображений. Это направление дополняет текущую NLP-инфраструктуру и позволяет выстраивать комплексные мультимодальные решения для маркетплейса.

Оцените статью
ODELAX.RU
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x

Проверить франшизу

Спасибо
Ваша заявка отправлена
Скоро мы свяжемся с Вами