Искусственный интеллект не является волшебством. Когда вы просите его написать электронное письмо, письмо редактору или полную статью, он откуда-то получает контент. Некоторые крупные сайты, такие как New York Times, говорят «нет» Apple Intelligence, не желая, чтобы они использовали веб-скрейпинг своего контента для обучения ИИ.
Apple Intelligence
Об Apple Intelligence говорилось много, но она еще даже не была официально выпущена, поскольку в следующем месяце выйдет iOS 18. Даже тогда он не будет полностью готов. Лишь некоторые функции были выпущены в бета-версии для разработчиков iOS 18.1. Кроме того, его могут использовать только новейшие iPad Pro и новейшие iPhone Pro. Однако, когда в следующем месяце выйдет iPhone 17, ожидается, что вся серия будет работать с Apple Intelligence.
Apple Intelligence — это собственный искусственный интеллект технологической компании из Купертино. Чтобы иметь возможность предоставлять многочисленные услуги, его по-прежнему необходимо обучать парсингу данных с помощью искусственного интеллекта.
Парсинг веб-страниц с помощью ИИ – это автоматизированный процесс сбора данных с веб-сайтов с использованием технологий искусственного интеллекта. Он предполагает использование алгоритмов ИИ для извлечения, анализа и структурирования информации с веб-страниц для различных целей, например для обучения моделей ИИ, таких как Apple Intelligence, или сбора больших наборов данных.
Сайты не разрешают парсинг веб-страниц с помощью искусственного интеллекта Apple
Несмотря на то, что все чат-боты с искусственным интеллектом должны обучаться таким образом, а Apple Intelligence даже не готова к полноценному выпуску бета-версии, несколько веб-сайтов уже блокируют Apple. Если вы беспокоитесь о своем веб-сайте, мы можем показать вам, как это сделать защитите свой сайт от парсинга ИИ .
Это может нанести ущерб Apple Intelligence, поскольку сайты, которые его закрывают являются важными поставщиками контента: Facebook, Instagram, Craigslist, Tumblr, The New York Times, The Financial Times, The Atlantic, Vox Media, USA Today сети и Condé Nast.
Важная часть уравнения заключается в том, что Apple Intelligence не занимается тайным анализом веб-сайтов. Фактически, это дает веб-сайтам возможность отказаться. Тем не менее, они, возможно, не ожидали, что так много людей откажутся от подписки еще до ее выхода.
Парсинг веб-страниц не является чем-то новым – он существует уже некоторое время. Однако привязанность к искусственному интеллекту — это нечто новое, и, возможно, именно это приводит к беспокойству на веб-сайтах.
Специальный веб-сканер Apple с искусственным интеллектом — «Applebot-Extended». Первый Applebot был представлен в 2015 году и использовался для предоставления данных Siri и Spotlight. Однако для Apple Intelligence требовался другой веб-сканер. Applebot-Extended не останавливает бота Apple. Вместо этого он не позволяет использовать данные для обучения LLM (больших языковых моделей) Apple.
Apple здесь не обязательно выделяется. Боты ИИ от OpenAI, Anthropic и других тяжеловесов ИИ-контента также были заблокированы. Хотя Apple блокировали гораздо реже, она все еще новая и даже не дебютировала официально. Маловероятно, что веб-сайты просто больше доверяют Apple.
Если вы хотите собирать собственные данные, ознакомьтесь с этими замечательными Инструменты веб-скрапинга с использованием искусственного интеллекта , которые может использовать каждый. Также ознакомьтесь с наш обзор Octoparse , чтобы узнать, как легко парсить данные из Интернета.