Опыты без взрывов. Как угадать алгоритм?


С помощью экспериментов вполне реально определить алгоритм поисковика или хотя бы его часть.

Метод деления пополам

Метод предполагает сужение интервала значений исследуемого параметра для определения некоторого эффективного его значения. Предположим необходимо выяснить поведение некоторого показателя влияющего на релевантность, и вполне резонно можно предположить, что у этого параметра есть некоторое значение, ниже которого релевантность страницы уменьшается, а выше поисковик может посчитать страницу спамом. Допустим для определённости, что таким параметром является процент ключевых слов на странице.
Логично начать исследование с некоторого достаточно большого интервала значений процента ключевых слов на странице, где начало интервала определяется как процент ключевых слов близкий к нулю, другой конец интервала значений определят процент ключевых слов, который гарантировано, оценивается поисковиком как спам. После проведения ряда индексаций можно сужая интервал значений определить эффективное значение показателя. Следуя этой логике, создаются три страницы, на которых процент ключевых слов соответствуют началу, концу и середины выбранного интервала значений показателя, и все три страницы регистрируются. Через некоторое время становится известной более релевантная страница, и в зависимости от того какая страница оказалась более релевантной (первая или вторая), интервал делится пополам и вся процедура повторяется, пока не будет найдено оптимальное значения параметра.

Примечание:
1. Поскольку поисковики выдают сайты, а не страницы, то следует поместить страницы на разных доменах
2. Запрос должен быть достаточно популярным иначе страницы могут оказаться рядом в поисковой выдаче
3. Многие поисковики проверяют текст на «естественность», то есть соотношение глаголов, прилагательных и прочее в тексте. Поэтому берётся отрывок текста, в котором нужные части речи заменяют синонимами.
У метода есть два очень существенных недостатка. Во-первых, зависимость практически никогда не бывает линейной, и, во-вторых, метод требует многократной индексации, что занимает слишком много времени, а алгоритм поисковика может за это время измениться. Необходимо придумать способ для того чтобы избежать этих недостатков.





Продвижение сайтов, создание, администрирование.

Контакты:

г.Королев
Телефон: +7 (965) 432-69-91
E-mail: alalemih@gmail.com

skype alex27791



Яндекс.Метрика