Искусственный интеллект не является волшебным — это указано в названии: «искусственный». Мы знаем, что контент откуда-то берется. Расследование показало, что некоторые крупные технологические компании, в том числе Apple, обучали свои технологии искусственного интеллекта на расшифровках видеороликов на YouTube — и все это без разрешения.
Расследование показывает, что использовались стенограммы YouTube
Proof News провела расследование, в ходе которого был использован инструмент поиска YouTube в наборе данных. Следствие установило что субтитры почти к 175 000 видеороликов YouTube с более чем 48 000 каналов использовались технологическими компаниями.
В качестве видео использовались ночные телепередачи из Позднего шоу со Стивеном Колбертоми Jimmy Kimmel Live. В ходе расследования также фигурировали видеоролики MrBeast, PewDiePie и Маркеса Браунли.
Набор данных взят из «The Pile». В 2020 году стопка описывалась как смесь из 22 наборов данных от некоммерческой организации EleutherAI.
Представитель Google заявил в электронном письме CNET, что компания придерживается того, что говорила ранее, возвращаясь к апрельскому комментарию. Генеральный директор Нил Мохан тогда заявил, что не знает, использует ли OpenAI видео с YouTube. Но если бы это произошло, он признал, что это было бы нарушением Условий использования YouTube.
Откуда еще берётся AI-контент?
Почти каждая технологическая компания недавно объявила о разработке или разработке системы искусственного интеллекта. Как было сказано изначально, мы знаем, что это не волшебство и что контент откуда-то берется. Просто не ожидалось, что ИИ будет исходить из стенограмм YouTube.
OpenAI, создатели ЧатGPT , ранее упоминали, что становится все труднее находить наборы данных для обучения ИИ, и это привело к заключению сделок с Reddit и News Corp. на их контент. Google заявила, что у нее есть соглашение с создателями контента, которое позволяет ей использовать контент YouTube в обучении искусственному интеллекту. Обзор AI недавно был добавлен в поиск Google. Узнайте, как отключить обзор ИИ , если это не для вас.
Тем не менее, представитель Anthropic признал Proof News, что они использовали Pile для обучения Клода, своего искусственного помощника. Представитель также подтвердил, что в куче есть несколько субтитров YouTube.
Используете ли вы Клод, ChatGPT или другую технологию искусственного интеллекта, она была обучена на наборе данных. Вопрос в том, было ли оно обучено на добровольных поставщиках контента, таких как Реддит , или же поиск поставщиков расширился до контента, который использовался без ведома создателей. Вам определенно следует об этом подумать, когда в следующий раз будете использовать чат-бота с искусственным интеллектом.