Просування сайтів

Хто більше каламутить інформацією у світлі автоматизації

21.04.2020

483

Я тут спостерігаю за ринком і гравцями зі своєї пісочниці і причини участі в цьому ринку дивлюся, хто що і про кого говорить). І в той час, як одні (один) каже, що у нас все схвачено і перекрито, інші (їх кілька) кажуть, що все працює і нічого не палітся.

Щоб не бути гучним: ось чергова заява яндекса (оформлене у вигляді доповіді) і відповідь movebo (природно, з прямим посиланням, яка вже не працює).

Давайте проаналізуємо основні моменти, ху із ху, хто більше бреше і, особливо, навіщо :).

Yandex про 1ю щабель

Перша ступінь – це капча, так звана роботоловилка. Вона призначена для того, щоб захистити Яндекс від напливу великої кількості ботів, абсолютно простих і примітивних. Якщо не було цієї першої перешкоди, то на сервіси Яндекса дуже сильно зросла б навантаження, і йому було б дуже складно відповідати на запити користувачів.

Роботоловилка складається з двох частин – класифікатора робота і людини, і тіста, покликаного відрізнити одного від іншого.

Movebo про 1ю щабель

І якщо перша щабель — російськомовна капча описана докладно, барвисто і зрозуміло не зовсім правда зрозуміло, як пов’язана капча і поведінкові чинники=), то про другий і третій сходинках «чистки» сказано зовсім небагато і як-то побіжно.

Yandex про 2ю щабель

Друга щабель – швидка і легка очистка від роботів, яка в основному використовується в спеціальних сервісах:

Персоналізація
Пошукові підказки
…

Для обмеження reverse engineering’а

Movebo про 2ю щабель

Друга ступінь – легка чистка від накруток (роботів) в персоналізації та пошукових підказках. З того що ми бачимо, накручується це дійсно дуже просто і багато компаній користуються цим. Тобто очищення на цьому етапі або практично відсутній або дійсно враховує тільки якісь зовсім явні показники.

Yandex про 3ю щабель

Третя ступінь – глибоке очищення. Це великий, дуже добре розвинутий алгоритм, що використовує величезну кількість даних, що враховує велику кількість користувальницьких розподілів.

Алгоритм глибокої очистки це:
Близько 2000 факторів (розподілів)
Близько 200 функцій очищення
В основному використовується 34 фактора

Movebo про 3ю щабель

Найбільше, звичайно, інтерес представляє третя частина доповіді, в якій йдеться про «великому, добре розвиненому алгоритм, що використовує величезну кількість даних, що враховує велику кількість користувальницьких розподілів».
Наведені далі цифри викликають, при першому погляді, звичайно повага:
• 2000 факторів (розподілів); (Більше ніж у мартикснете? Яндекс, ви серйозно? Звучить дуже забавно)
• 200 функцій очищення;
• Правда тут же пишуть, що використовують в основному 34 фактора.
Якщо ж абстрагуватися від великих і нібито страшних цифр, що можна побачити? Докладний опис алгоритму дії капчі, а все інше — обтічні слова про якесь великій кількості якихось факторів, завдяки яким Яндекс може розпізнавати роботів. І в кінці — попередження про те, що просування поведінковими факторами, буде каратися «терміном від…».

Цікавий фінал

Тут мені хочеться стати на бік Movebo при всій моїй повазі до команди Яндекса. Є цікаві інсайди, коли Яндекс сильно цікавився внутрішньою кухнею сервісів по роботі з поведінковими.

Інше питання — як відрізнити живу людину від іншого живого людини, коли обидва займаються по сайту в пошуку потрібної інформації, яка представлена наочним чином. А ще, скажіть мені, де є тут накрутка?

А вона є, просто ви її не бачите. Або її немає насправді? Здалося?

Movebo молодці, що реагують на заяви «протилежної сторони» (грамотно тролять). Ще нюанс, якби сервіс не заробляв, він би не існував вже декілька років. Значить працює, значить яндекс прибріхує, що все палить. Поки працює, ще мінімум півроку-рік все буде як і раніше. А там подивимося).

Терехов.