ГлавнаяЛайфстайлИнтернетРасследование показывает, что технологические компании обучали ИИ работе с транскриптами YouTube

Расследование показывает, что технологические компании обучали ИИ работе с транскриптами YouTube

Искусственный интеллект не является волшебным — это указано в названии: «искусственный». Мы знаем, что контент откуда-то берется. Расследование показало, что некоторые крупные технологические компании, в том числе Apple, обучали свои технологии искусственного интеллекта на расшифровках видеороликов на YouTube — и все это без разрешения.

Расследование показывает, что использовались стенограммы YouTube

Proof News провела расследование, в ходе которого был использован инструмент поиска YouTube в наборе данных. Следствие установило что субтитры почти к 175 000 видеороликов YouTube с более чем 48 000 каналов использовались технологическими компаниями.

В качестве видео использовались ночные телепередачи из Позднего шоу со Стивеном Колбертоми Jimmy Kimmel Live. В ходе расследования также фигурировали видеоролики MrBeast, PewDiePie и Маркеса Браунли.

Обученные искусственным интеллектом видеоролики на YouTube Как работает Llm

Набор данных взят из «The Pile». В 2020 году стопка описывалась как смесь из 22 наборов данных от некоммерческой организации EleutherAI.

Представитель Google заявил в электронном письме CNET, что компания придерживается того, что говорила ранее, возвращаясь к апрельскому комментарию. Генеральный директор Нил Мохан тогда заявил, что не знает, использует ли OpenAI видео с YouTube. Но если бы это произошло, он признал, что это было бы нарушением Условий использования YouTube.

Откуда еще берётся AI-контент?

Почти каждая технологическая компания недавно объявила о разработке или разработке системы искусственного интеллекта. Как было сказано изначально, мы знаем, что это не волшебство и что контент откуда-то берется. Просто не ожидалось, что ИИ будет исходить из стенограмм YouTube.

OpenAI, создатели ЧатGPT , ранее упоминали, что становится все труднее находить наборы данных для обучения ИИ, и это привело к заключению сделок с Reddit и News Corp. на их контент. Google заявила, что у нее есть соглашение с создателями контента, которое позволяет ей использовать контент YouTube в обучении искусственному интеллекту. Обзор AI недавно был добавлен в поиск Google. Узнайте, как отключить обзор ИИ , если это не для вас.

Обученные искусственным интеллектом видео на YouTube Chatgpt

Тем не менее, представитель Anthropic признал Proof News, что они использовали Pile для обучения Клода, своего искусственного помощника. Представитель также подтвердил, что в куче есть несколько субтитров YouTube.

Используете ли вы Клод, ChatGPT или другую технологию искусственного интеллекта, она была обучена на наборе данных. Вопрос в том, было ли оно обучено на добровольных поставщиках контента, таких как Реддит , или же поиск поставщиков расширился до контента, который использовался без ведома создателей. Вам определенно следует об этом подумать, когда в следующий раз будете использовать чат-бота с искусственным интеллектом.

ПОХОЖИЕ СТАТЬИ

Популярные записи