21.03.2024

Deepgram разработал новый инструмент под названием Aura, который способен воспроизводить текст с помощью живого человеческого голоса в реальном времени

Deepgram зарекомендовал себя как один из ведущих стартапов в области распознавания речи. Компания представила свой новый продукт под названием Aura — программный интерфейс, способный преобразовывать текст в речь в реальном времени. Aura объединяет реалистичные голосовые модели искусственного интеллекта с минимальной задержкой, что позволяет разработчикам создавать диалоговых ботов в реальном времени, которые могут эффективно заменять операторов колл-центров.

Соучредитель и генеральный директор Deepgram, Скотт Стивенсон, отметил, что хотя хорошие голосовые модели существуют уже давно, они дороги и требуют много времени на обработку. Он подчеркнул, что модели с низкой задержкой часто звучат как роботы. Aura от Deepgram же сочетает в себе человеческое звучание, высокую скорость обработки и доступность по цене.

Стремление создать голосовых ботов с искусственным интеллектом, способных оперативно воспринимать, понимать и генерировать ответы, стало актуальным. Стивенсон подчеркнул, что для успешного внедрения такого продукта в бизнесе требуется сочетание точности, минимальной задержки и приемлемых затрат, особенно учитывая высокую стоимость доступа к большим языковым моделям.

Deepgram заявляет, что цены на Aura на данный момент превосходят конкурентов и составляют $0,015 за 1000 символов, что немного дешевле, чем аналогичные продукты от Google и Amazon. Несмотря на возможные недочеты в произношении, скорость работы Aura является ее ключевым преимуществом. Deepgram акцентирует внимание на скорости генерации ответов и отмечает, что обычно время начала генерации составляет менее 0,3 секунды, а время завершения ответа — менее секунды.

Ранее промпт-инженерия казалась многообещающей областью в технологическом мире на фоне развития генеративного искусственного интеллекта. Однако исследователи из компании VMware, специализирующейся на облачных вычислениях, обнаружили, что большие языковые модели способны писать и оптимизировать свои запросы самостоятельно.

Оцените статью
ODELAX.RU
Подписаться
Уведомить о
guest
0 комментариев
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x
()
x

Проверить франшизу

Спасибо
Ваша заявка отправлена
Скоро мы свяжемся с Вами