Занимаюсь реализацией пинга для MaxSite CMS и как-то возник «философский вопрос»: «А нафига?». Дабы понять о чем речь, кратенько расскажу об этих технологиях. Я уже когда-то их описывал и теперь немного технической информации.
Дело в том, что пинги работают по такому алгоритму: мой сайт получив запрос от чужого сайта, должен отправиться на чужой сайт и проверить а) наличие указания на пинг-сервер (XMLRPC), б) найти в тексте ссылку на мой сайт. Если условия выполнены, то на моем сайте появляется комментарий.
Трекбак работает чуть по другому. Вместо того, чтобы отправляться на чужой сайт, мой сайт просто ставит трекбак на премодерацию. Но трекбак с чужого сайта передает и текст для комментария. А в нем может быть всё, что угодно.
Обе технологии уже скомпроментированы, поскольку давно взяты на вооружение спамерами.
Пинг. Спецификация такова, что отправить запрос (пинг) может кто угодно. То есть злоумышленник может подделать пинг и указать в качестве ответной ссылки страницу жертвы. Такой пинг можно отправить сразу на десятки-сотни-тысячи блогов. А поскольку у многих используется WordPress с настройкой принимать пинги и трекбаки, то все эти блоги «полезут» на сайт жертвы проверять установленные на них ссылки. И главное здесь не в том, что ссылки как таковой нет, а в том, что создается значительная нагрузка на сервер жертвы. В общем получается DDOS-атака.
Иной раз спамер может отправить и нормальный пинг на вашу запись. Вы даже можете это вручную проверить и убедитесь в том, что ссылка стоит. Вы, естественно, разрешаете публикацию этого пинга и ссылка спамера оказывается на вашем сайте. Но, поскольку вы не собираетесь вручную проверять ссылки каждый день, то спамер преспокойно удаляет вашу ссылку через несколько дней. (Таким образом спамер уменьшает количество внешних ссылок на своем сайте. Считается, что это благотворно сказывается на поисковой выдаче. Очень спорно, ИМХО.)
Трекбак. С ним ситуация еще хуже, поскольку можно отправить свой спамерский текст сразу на множество блогов. И хотя в этом случае блог не будет проверять ответную ссылку, а лишь отправит короткий ответ (вроде «ОК»), всё равно количество трекбаков может оказаться значительным. Проблема здесь в том, что автор блога вынужден вручную проверять каждый трекбак. Ну или с помощью спам-фильтров.
Поскольку трекбак позволяет отправлять произвольный текст, то спамеры расчитывают на то, что на некоторых блогах трекбаки не нуждаются в премодерации. Например для WordPress будет достаточно указать только одну ссылку в тексте трекбака, чтобы миновать «подозрительность». И если блог настроен публиковать все комментарии, то спам будет опубликован автоматически.
Из-за того, что в трекбаках доля спама значительно превышает нормальные, то многие блогеры давно уже отключили возможность их получения. Таким образом они сразу отсекли львинную долю спама.
С пингами несколько сложнее. С одной стороны спам через них не пройдет, поскольку нет ответной ссылки, но, подумайте сами, не только блог жертвы подвергается атаке через ваш, но и ваш также, поскольку процесс обоюдный: именно ваш блог запрашивает указанную страницу. При большом количестве пингов через ваш сайт, создается нагрузка уже вашего сервера. То есть вы видите, что посещаемость на обычном уровне, а сервер выдает перегрузку, поскольку сам генерирует множество запросов.
Возможно в 2001 году, когда придумали pingback, Интернет был не таким массовым и спамеры в основном использовали электронную почту. С появлением блоговых «движков», где этот механизм уже встроен, спамеры и прочие вредители просто получили в подарок еще один инструмент.
Вот такая невеселая картина получается.
Существует еще один псевдоплюс во всей этой технологии: пинг на ping-сервисы или как их называют - сервисы обновлений. То есть при публикации новой записи отправляется пинг на такой сервис. Вроде как вы уведомляете, что появилась новая запись в вашем блоге.
В последнее время я всё больше сомневаюсь в полезности этих сервисов. Теоретически, после отправки вами пинга, ваша новая запись (например заголовок и ссылка) должны появиться на пинг-сервисе. Я просмотрел список из нескольких десятков и только на единицах есть некое подобие такого списка. То есть никакого трафика или обратной ссылки с них вы не получите.
Я допускаю, что пинг-сервис нужен для поисковика, но даже всеми нами горячо любимый Яндекс хоть и принимает пинг, всё, что готов сделать, так это направить (?) своего робота на новую запись.
Вроде бы всё замечательно, но точно с таким же успехом поисковик проверит сайт и через RSS-ленту. А нормальные поисковики, помимо всего, еще учитывают и meta «revisit-after» и robots.txt, что делает этот процесс более управляемым.
Даже если взять Google, то с помощью своего feedburner.com он отслеживает огромное количество обновлений блогов через RSS. Думаю, что в этом каждый убеждался, когда читает записи через Google Reader и видит с какой задержкой они там появляются - всего несколько десятков минут.
Таким образом смысл в пинг-сервисах стремительно падает до нуля.
Главный же вопрос: каким образом организовать нормальное автоматическое уведомление от других блогов, остается открытым. Может кто-то что-то и придумает...
Комментариев: 15 RSS
1Абсурдный Людишко :)19-06-2008 00:18
Ручные комменты :)
2Fasgen20-06-2008 13:11
я вообще не понимаю для чего эти всякие пингбэки и трекбеки...
3vladdis20-06-2008 20:45
аналогично Fasgen.
поскольку есть сомнения, значит не нужно.
4Александр@WP-web21-06-2008 11:48
Максим, тебя услышали :)
5Paki21-06-2008 12:28
Хорошо описано, раньше ещё думал использовать/нет
6Санчо24-06-2008 21:43
Да, к сожалению уже это спамерские технологии. Очень жаль. Я бы не советовал использовать.
7Иванна25-06-2008 20:21
Эти навороты придумываются для того, чтобы раскрутить сервисы, с которых эти пинбаки и такбаки скачиваются.
8Жук26-06-2008 12:20
А ты не переборщил с заявлением о DDOS атаке через ping? Это же как нужно все подгадать, чтобы на сервер жертвы все полезли одновременно, да еще чтобы "повисели" на нем...
9kartex26-06-2008 12:37
Иванна, верно говорите. Встречал подобное просто уже и на одном форуме комментили именно в этом ключе: для раскрутки сервисов.
10Максим26-06-2008 12:47
2Жук: А чего подгадывать-то? Отправил пинги - сервера сразу в ответ полезут на сайт.
11веб мозг28-06-2008 13:09
Если открываешь новый блог, то пинг - это один из самых эфективных способов направить на него поисковых роботов, а значит и проиендксировать, так что, имхо, пингу - быть :)
12Охотник на зелёных29-06-2008 21:56
Вот тут у меня спорные мысли. Потому как (я не знаю почему, но это факт), вот делаю я 10 блогов. В 5 из них забиваю кучу сервисов для пинга, в 5 других этого не делаю и пинг не разрешаю. Все 10 добавляю в аддурилку яндекса и гугла. Проверяю через неделю. 5 первых (все страницы проиндексированы), 5 вторых (половина страниц или вообще ещё нет в индесе). Проверял пачками по 10 штук (5+5) несколько раз и результат всегда приблизительно, как я описал. Как это объяснить не знаю, но факт есть факт.
13Максим29-06-2008 23:19
Я вообще в гугл ничего не добавляю, однако же сайта в его базе оказываются буквально через несколько дней. А вот с Яшей всё не так просто. У меня был сайт, которому три года и, как оказалось его Яша не проиндексировал. Платон ответил, что все ОК, скоро всё случится... В итоге только через пару месяцев он попал в его индекс. Так что Яша совсем не критерий - у его слишком много случайных факторов. Ну там: солнечные бури, взрывы Новых и Сверхновых, да и просто плохое настроение одного из Щукиных. ;)
14Олег10-07-2008 04:58
Здравствуйте. Извините, что не в тему :oops: Но, может быть подскажите как прикрутить к коментам такие же смайлы как у Вас?
Спасибо.
15Олег04-08-2008 06:55
Удачно попал на этот пост :idea: как раз сижу "ковыряюсь" в коде своей темы и думаю оставлять или нет этот Трекбак. Прочитал статью, не совсем понял как Трекбак работает, но понял, что потенциально опасная штука, так, что сейчас уберу ее нафиг :lol: