08.08.2024

Блогер подал коллективный иск против OpenAI: компания анализирует транскрипции контента создателей

Один из YouTube-блогеров планирует подать коллективный иск против OpenAI, утверждая, что компания использовала миллионы транскриптов видео с YouTube для обучения своих моделей искусственного интеллекта без уведомления и компенсации владельцам роликов, сообщает TechCrunch.

В жалобе, поданной в окружной суд США по Северному округу Калифорнии, адвокаты Дэвида Миллетта заявляют, что OpenAI тайно расшифровывала видео Миллетта и других авторов для обучения своих моделей, на которых основаны ChatGPT и другие инструменты компании. Они утверждают, что OpenAI извлекала значительную прибыль из работы создателей, нарушая авторское право и условия использования YouTube, запрещающие использование видео для сторонних приложений.

В жалобе также отмечается, что продукты ИИ от OpenAI становятся всё более ценными для пользователей благодаря обучающим данным, однако значительная часть этих данных была взята без согласия авторов. Миллетт, представляющийся фирмой Bursor & Fisher, требует суда присяжных и компенсации свыше 5 миллионов долларов для всех пользователей и создателей YouTube, чьи данные могли использоваться для обучения OpenAI.

Генеративные модели ИИ, как у OpenAI, обучаются на огромном количестве примеров, включая фильмы и тексты, для выявления закономерностей. Компании утверждают, что это является добросовестным использованием, однако правообладатели не согласны и подают иски для прекращения такой практики.

По данным Originality.AI, более 35% крупнейших веб-сайтов мира блокируют веб-краулер OpenAI, а исследование MIT’s Data Provenance Initiative показало, что около 25% данных из высококачественных источников были исключены из обучающих наборов данных. Epoch AI прогнозирует, что к 2026-2032 годам у разработчиков могут закончиться данные для обучения ИИ, если тенденция блокировки сохранится.

В апреле The New York Times сообщила, что OpenAI использовала свою модель распознавания речи Whisper для расшифровки аудио из видео на YouTube, собрав более миллиона часов видео для обучения модели GPT-4. Это вызвало обсуждение среди сотрудников OpenAI о возможном нарушении правил YouTube. В июле Proof News сообщила, что компании, такие как Anthropic и Nvidia, использовали набор данных The Pile, содержащий субтитры видео с YouTube, для обучения своих моделей. Многие авторы видео не знали об этом и не давали согласия.

Apple заявила, что не планирует использовать эти модели в своих продуктах. Google, владеющая YouTube, также пыталась использовать транскрипты для обучения своих моделей и расширила условия обслуживания, чтобы использовать больше пользовательских данных для ИИ.

Ранее Илон Маск подал иск против OpenAI и Сэма Альтмана, обвинив компанию в отходе от некоммерческой миссии и использовании технологий для коммерческих клиентов. Маск также утверждает, что OpenAI занимается рэкетом.

Оцените статью
ODELAX.RU
Подписаться
Уведомить о
guest
0 комментариев
Старые
Новые Популярные
Межтекстовые Отзывы
Посмотреть все комментарии
0
Оставьте комментарий! Напишите, что думаете по поводу статьи.x

Проверить франшизу

Спасибо
Ваша заявка отправлена
Скоро мы свяжемся с Вами