Антиобнаружитель ссылок Сапы

Среда, 3 сентября 2008 г.
Рубрика: Мысли вслух
Метки:
Просмотров: 7846
Подписаться на комментарии по RSS

Как известно для того, чтобы обнаружить ссылку sape.ru достаточно в адрес подставить дополнительный параметр, что-то вроде такого «/?test». Если ссылка исчезла, а текст остался тем же, значит на сайте есть продажные ссылки. Насколько я в курсе, разработчики сапы в курсе этой проблемы, но пока готового решения нет.

Я же решил в своем плагине реализовать немного другую схему. Поскольку MaxSite CMS не должна (но умееет) работать с GET-параметрами (то что после «?»), то в принципе можно просто отлавливать все такие ссылки, отсекать GET-часть и редиректиться на нормальный адрес.

С этим проблем нет и я уже её реализовал. Возник вопрос по самому редиректу. Тут есть два варианта. Перед редиректом можно послать заголовок (header).

Вначале я сделал «301 Moved Permanently», то есть страница постояно перемещена. Но вот у меня возникли сомнения - а понимает ли тот же Яша такой заголовок? Почему-то мне кажется что нет и поэтому я прописал «404 Not Found».

Может кто-нибудь в курсе как поисковики реагируют на эти 301 и 404? И стоит ли после этого заголовка редиректиться на нормальную страницу? Может просто рубить соединение?

ps Кстати новую лекцию выложил.

twitter.com facebook.com mail.ru friendfeed.com livejournal.ru memori.ru google.com yandex.ru

Комментариев: 24

  1. Мне кажется, 404 вполне достаточно.

  2. Максим, а для WP такой скриптик очень сложно написать?

  3. Мдя... Не знал про такой простой способ... Придется в своих проектах тоже о нем подумать =(

  4. Дима, я вот думаю, что наверное тоже правильней 404. Ну как минимум у проверющего выскочит 404 страница, что по идее и должно быть - адрес-то другой.

    Максим, в принципе можно, но WordPress активно кушает такие get-ссылки, из-за этого нужно вводить массу условий и дополнительных проверок, чтобы не рубануть нормальные запросы.

  5. А если взять обычный сайт например Яндекс и добавить параметр GET - разве вы получите 404 ошибку?

    То есть имеем что проверщик проверяет различия страниц с параметром и без параметра, разность и будет - продажные ссылки.

  6. правильный вариант - 301, и яндекс и гугл прекрасно его понимают, плюс такой вариант лояльней к посетителям - если мы точно знаем какую именно страницу они хотели загрузить, то нужно переадресовать на нее, а не выводить 404

  7. Есть такие варианты:

    1. Отсекать get-часть и делать редирект на страницу. В этом случае по идее нужно 301 редирект делать.

    2. Ничего не отсекать, а поскольку ничего все равно не найдено, то переходить на 404-страницу с 404-хидером.

    В общем пока не понятно, как все таки верно. На данный момент у меня стоит 2-й вариант.

  8. Поисковики прекрасно понимают 301 заголовок

    Согласен с corset,com насчет того, что лучше редиректить если знаем что желает получить пользователь

  9. пришла идея - а что если просто уничтожать переменную?

    unset($_GET[test])

  10. Прячь, не прячь, бесполезно. Ссылки вычисляются по возрасту. Чем старее ссылка, тем большее к ней доверия у ПС. Не делать откровенного Г, не ставить ссылки на сомнительные ресурсы - ОК.

  11. Интересная идея. Правильный вариант - использовать 301 редирект.

    Еще для решения проблемы можно использовать следующий вызов кода sape:

    <?php
    	global $sape;
    	if (!defined('_SAPE_USER')){
    		define('_SAPE_USER', '...');
    	}
    	require_once($_SERVER['DOCUMENT_ROOT'].'/'._SAPE_USER.'/sape.php');
    	$tm = explode("?", $_SERVER['REQUEST_URI']);
    	$o['request_uri'] = $tm[0];
    	$o['charset'] = 'UTF-8';
    	$sape = new SAPE_client($o);
    	unset($o);
    ?>
  12. Иван, спасибо за код. smile Как-то не сообразил, что можно попробовать использовать такую возможность самой сапы. Я пожалуй еще уточню у самих саповцев, может действительно это выход.

  13. Так, всё верно. Если на сайте не используется GET, значит можно смело использовать этот код.

  14. 2008-09-05 в 17:35:26 | Аноним

    вот ещё вариантик решения этой проблемы

    http:// venality.name/safe.htm

  15. Неплохой сервис. smile Сейчас на сайте стоит первый вариант (301-редирект) и этот сервис продажных ссылок не нашел. В принципе нормально. smile

    Может у кого-нибудть есть еще ссылки на аналогичные «детекторы»?

  16. Иван, спасибо за код.

    Всегда, пожалуйста. grin

    Может у кого-нибудть есть еще ссылки на аналогичные «детекторы»?

    http://pr-cy.ru/sale_links

  17. Я когда ставлю код Ивана так ссылки на страницах перестают отображатся

  18. Anton, это вызов кода для подключения к системе. Еще же нужно вызов ссылок прописать:

    <? echo $sape->return_links($n); ?>

    или:

    <? echo $sape->return_links(1); ?>
    <? echo $sape->return_links(2); ?>
    <? echo $sape->return_links(); ?>

    если вывод в нескольких местах.

  19. У меня вопрос, правда чуть чуть не по теме.

    У меня страницы вызываются site.ru/1.php?id=23, где id-число и я делаю в коде проверку, чтобы вводилось именно число is_numeric($id), если id не число, то выводится сообщение об ошибке. А как на это реагируют поисковики? Саповские ссылки при этом соответственно не выводятся

  20. Беда с кодом, предложенным 2008-09-05 в 16:02:01 | уважаемым Иваном.

    Суть проблемы:

    Имеем сайт на WordPress 2,5,1 и с плагином NextGEN Gallery 0.98. Есть пост с галерейкой из нескольких изображений. NextGEN Gallery делает два поста из одного. В первом вар-те статическое изображение картинок вставленой галерейки, в другом - слайдшоу из этих картинок. Так вот на страничке со слайдшоу ссылки сапы некоректно отображаются при использовании

    $tm = explode("?", $_SERVER['REQUEST_URI']);
    	$o['request_uri'] = $tm[0];

    Некоректно - показываются ссылки со страницы со статическими изображениями.

    Что можно сделать? т.к. удалять страницы из сапы со слайдшоу не хочется, и продажностью светить тоже.

    Помогите пожалуйста решить проблему.

    Версия WordPress 2.5.1

    NextGEN Gallery 0.98

  21. Дизайн почетен =) FreeBSD =)) постил сюда немного бред про сапу toИван угу это основная идея для скрытия ссылок, просто если немножко по другому сделать, то все переменные могут вылететь и страница отображаться не корректно ...

  22. http://talk.pr-cy.ru/topic9554s0.html?p=122071&#entry122071

    Вот ещё так сказать пища для размышлений.

  23. Плыз помогите поставил код Ивана и ссылки пояаились на всех страницах которые были на главной а других как и небыло. что делать ???

  24. идея прикольная, но яша не собирается определять ссылки таким образом. потому что это слишком легко. они идут другим путем - анализ контента, анализ донора, реципиента, вес ссылок и прочее. Потому что если они похерят сапу таким простым методом - завтра сешнеги перейдут на дугие методы генерации ссылок. В конце концов - даже руками, по старинке. яша это понимает и не идет путем "неперспективного фикса" сорри что пишу уже в 2010 (токо пост увидел), но думаю что тема еще актуальна

Оставьте свой комментарий!

grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake excaim question

Комментарий будет опубликован после проверки

(войти без комментирования)

Имя и сайт используются только при регистрации

Авторизация: Loginza.

(обязательно)