1.Поисковые системы учитывают слова:
- чем больше частота фразы запроса в тексте – тем лучше;
- чем больше частота слова из фразы запроса в одном предложении – тем лучше;
- чем больше относительная частота упоминания слова в тексте – тем лучше.
Основа базовых алгоритмов поисковых систем.
2. Поисковые системы при анализе текста – стремятся к учету того, что стоит за словами, вместо учета слов; к учету связей между словами; к автоматизированному выявлению и учету тематики.
Что можно выбелить из текста, кроме слов? Можно выделить смысл, стоящий за словами. В системе “пользователь – поисковая система” возникает цепочка, в которой на каждом звене происходит искажение смысла: информационная потребность пользователя – слова, в которые он облек свой запрос – слова документов в базе – объекты и понятия, стоящие за словами документа. Один из алгоритмов выявления связей основан на том, что часто встречающиеся рядом слова имеют связь между собой и могут относиться к одной тематике.
Анализ “тем” и “связей” по базе документов.
Проводимые в Яндексе работы по выявлению связей между “словами” и “темами” наглядно иллюстрируются с помощью общедоступного инструмента автоматической генерации тематических рефератов referats.yandex.ru. Очевидно, что почти каждое слово, использованное в автоматически созданном тексте – узкотематическое. И ничего лишнего. Как правило, если что-либо делается общедоступным в сервисах поисковых систем, значит, ружье не зря висит на стене – в третьем акте будет выстрел.
Обратная процедура – автоматическое выявление “темы” документа или запроса – не за горами.
Направления развития поисковых алгоритмов Яндекс:
1. переход от поиска по словам к поиску по объектам. В выдаче – информация об объектах, о которых идет речь в вопросе.
2. Учет связей между объектами. Формирование базы знаний.
3. Автоматическое определение тематики.
Как писать тексты под такой алгоритм:
- определяемся с тематикой и основными запросами документа;
- анализируем тематические документы, связанные с темой, под которую оптимизируем документ;
- составляем “словарь темы” и при написании текста используем слова только из него;
- стараемся действительно осветить в тексте данную тему через ее основные понятия.
Анализ “тем” и “связей” в запросах.
Яндекс энергично банит за наличие на странице примитивного списка запросов через запятую. Потому что, такой список запросов “мешает корректной работе ранжирующего алгоритма Яндекс”. Точно так же банит за список запросов на странице Рамблер.
Как писать текст под конкретный запрос:
- определяемся с основным запросом, под который оптимизируем документ;
- расширяем запрос, анализируя списки прямых (т.е. исходный запрос + дополнительные слова) и ассоциативных запросов;
- из запросов составляем “словарь темы” и при написании текста используем слова только из него;
- стараемся употребить каждый запрос хотя бы раз;
- при этом пишем нормальный человеческий текст, раскрывающий для посетителя тему со всех ее сторон, отраженных в запросах.
3. Написание оптимизированных текстов.
Логика процесса проста:
- есть некоторый исходный тематический текст (в зависимости от подхода это может быть совокупность документов базы или совокупность запросов посетителей поисковой системы);
- для него можно выявить наиболее “контрастные”, “смыслоразличительные” термины и составить “словарь темы”, будь то тема “Индустриализация” или “Азиатский орнамент”;
- используя слова почти исключительно из словаря темы, пишем текст;
- такой текст будет обладать высокой релевантностью к теме;
- и, кроме того, если словарь составлен на основе анализа запросов – текст перекроет многочисленные низкочастотные вариации запросов.
