Собственная языковая модель A-Vibe, разработанная «Авито», заняла первое место среди легковесных генеративных моделей (до 10 млрд параметров) по версии независимого российского бенчмарка MERA. Она продемонстрировала более высокие результаты по сравнению с международными аналогами от OpenAI (GPT-4o mini), Google (Gemma), Anthropic (Claude Haiku) и Mistral.
Согласно результатам тестирования, A-Vibe значительно опережает конкурентов по ключевым задачам:
- генерация кода — на 25% точнее, чем Gemini 1.5 (8B),
- ведение диалога — на 32% лучше, чем Llama 3.1 (405B),
- смысловой анализ текста — на 23% эффективнее, чем Claude 3.5 Haiku.
MERA оценивает A-Vibe как наиболее сбалансированную модель в своей категории по способности к точной интерпретации пользовательских запросов, логическому ведению диалога и выполнению сложных лингвистических задач. Эти возможности уже применяются в продуктах «Авито» — от генерации продающих описаний до интеллектуального автокомплита в мессенджерах.
От прототипа к продукту: инвестиции, сценарии и стратегия
A-Vibe активно интегрируется в бизнес-процессы «Авито». До конца года компания планирует внедрить более 20 новых сценариев использования модели, а в долгосрочной перспективе — рассмотреть возможность открытого релиза кода. По оценке старшего директора по данным и аналитике Андрея Рыбинцева, к 2028 году вложения в направление GenAI составят около 12 млрд рублей, при ожидаемой выручке более 21 млрд рублей.
Локализация как преимущество: глубинная адаптация под русский язык
Первоначально модель была построена на открытом архитектурном решении с мультиязычным датасетом, где доля русского языка не превышала 1%. Команда «Авито» провела глубокую модификацию: разработала собственный токенизатор, оптимизированный под особенности русской морфологии и синтаксиса. Этот шаг обеспечил два критически важных результата:
- ускорение обработки русскоязычного текста в 1.5–2 раза,
- существенный прирост точности генерации и понимания запросов на русском языке.
Модель также обладает высокой вычислительной гибкостью — она способна работать с входами до 32 тысяч токенов, что делает её пригодной для анализа длинных текстов, документов и диалогов с большим количеством контекста.
A-Vision — следующий шаг
В параллель с A-Vibe команда «Авито» развивает визуальную модель A-Vision, ориентированную на обработку изображений. Это направление дополняет текущую NLP-инфраструктуру и позволяет выстраивать комплексные мультимодальные решения для маркетплейса.