Антиобнаружитель ссылок Сапы

Рубрика: Мысли вслух -> MaxSite CMS
Метки:
Среда, 3 сентября 2008 г.
Просмотров: 4730
Подписаться на комментарии по RSS
]]>
]]>

Как известно для того, чтобы обнаружить ссылку sape.ru достаточно в адрес подставить дополнительный параметр, что-то вроде такого «/?test». Если ссылка исчезла, а текст остался тем же, значит на сайте есть продажные ссылки. Насколько я в курсе, разработчики сапы в курсе этой проблемы, но пока готового решения нет.

Я же решил в своем плагине реализовать немного другую схему. Поскольку MaxSite CMS не должна работать с GET-параметрами (то что после «?»), то в принципе можно просто отлавливать все такие ссылки, отсекать GET-часть и редиректиться на нормальный адрес.

С этим проблем нет и я уже её реализовал. Возник вопрос по самому редиректу. Тут есть два варианта. Перед редиректом можно послать заголовок (header).

Вначале я сделал «301 Moved Permanently», то есть страница постояно перемещена. Но вот у меня возникли сомнения - а понимает ли тот же Яша такой заголовок? Почему-то мне кажется что нет и поэтому я прописал «404 Not Found».

Может кто-нибудь в курсе как поисковики реагируют на эти 301 и 404? И стоит ли после этого заголовка редиректиться на нормальную страницу? Может просто рубить соединение?

ps Кстати новую лекцию выложил.

]]>twitter.com Google Buzz google.com bobrdobr.ru del.icio.us technorati.com linkstore.ru news2.ru rumarkz.ru memori.ru moemesto.ru]]>

Комментариев: 24

  1. 2008-09-04 в 00:27:57 | Dimox

    Мне кажется, 404 вполне достаточно.

  2. 2008-09-04 в 00:56:09 | MaxBloger
    ]]>]]>

    Максим, а для WP такой скриптик очень сложно написать?

  3. 2008-09-04 в 02:07:14 | aktuba

    Мдя... Не знал про такой простой способ... Придется в своих проектах тоже о нем подумать =(

  4. 2008-09-04 в 09:44:22 | Максим
    ]]>]]>

    Дима, я вот думаю, что наверное тоже правильней 404. Ну как минимум у проверющего выскочит 404 страница, что по идее и должно быть - адрес-то другой.

    Максим, в принципе можно, но WordPress активно кушает такие get-ссылки, из-за этого нужно вводить массу условий и дополнительных проверок, чтобы не рубануть нормальные запросы.

  5. 2008-09-04 в 14:31:05 | Poster

    А если взять обычный сайт например Яндекс и добавить параметр GET - разве вы получите 404 ошибку?

    То есть имеем что проверщик проверяет различия страниц с параметром и без параметра, разность и будет - продажные ссылки.

  6. 2008-09-04 в 15:08:57 | corset,com

    правильный вариант - 301, и яндекс и гугл прекрасно его понимают, плюс такой вариант лояльней к посетителям - если мы точно знаем какую именно страницу они хотели загрузить, то нужно переадресовать на нее, а не выводить 404

  7. 2008-09-04 в 23:26:51 | Максим
    ]]>]]>

    Есть такие варианты:

    1. Отсекать get-часть и делать редирект на страницу. В этом случае по идее нужно 301 редирект делать.

    2. Ничего не отсекать, а поскольку ничего все равно не найдено, то переходить на 404-страницу с 404-хидером.

    В общем пока не понятно, как все таки верно. На данный момент у меня стоит 2-й вариант.

  8. 2008-09-05 в 00:05:43 | Vovochka

    Поисковики прекрасно понимают 301 заголовок

    Согласен с corset,com насчет того, что лучше редиректить если знаем что желает получить пользователь

  9. 2008-09-05 в 00:28:54 | Poster

    пришла идея - а что если просто уничтожать переменную?

    unset($_GET[test])

  10. 2008-09-05 в 08:02:14 | VolAnd

    Прячь, не прячь, бесполезно. Ссылки вычисляются по возрасту. Чем старее ссылка, тем большее к ней доверия у ПС. Не делать откровенного Г, не ставить ссылки на сомнительные ресурсы - ОК.

  11. 2008-09-05 в 16:02:01 | Иван

    Интересная идея. Правильный вариант - использовать 301 редирект.

    Еще для решения проблемы можно использовать следующий вызов кода sape:

    <?php
    	global $sape;
    	if (!defined('_SAPE_USER')){
    		define('_SAPE_USER', '...');
    	}
    	require_once($_SERVER['DOCUMENT_ROOT'].'/'._SAPE_USER.'/sape.php');
    	$tm = explode("?", $_SERVER['REQUEST_URI']);
    	$o['request_uri'] = $tm[0];
    	$o['charset'] = 'UTF-8';
    	$sape = new SAPE_client($o);
    	unset($o);
    ?>
    
  12. 2008-09-05 в 16:55:17 | Максим
    ]]>]]>

    Иван, спасибо за код. smile Как-то не сообразил, что можно попробовать использовать такую возможность самой сапы. Я пожалуй еще уточню у самих саповцев, может действительно это выход.

  13. 2008-09-05 в 16:59:12 | Максим
    ]]>]]>

    Так, всё верно. Если на сайте не используется GET, значит можно смело использовать этот код.

  14. 2008-09-05 в 17:35:26 | Аноним

    вот ещё вариантик решения этой проблемы

    http:// venality.name/safe.htm

  15. 2008-09-05 в 17:49:52 | Максим
    ]]>]]>

    Неплохой сервис. smile Сейчас на сайте стоит первый вариант (301-редирект) и этот сервис продажных ссылок не нашел. В принципе нормально. smile

    Может у кого-нибудть есть еще ссылки на аналогичные «детекторы»?

  16. 2008-09-05 в 18:16:16 | Иван
    Иван, спасибо за код.

    Всегда, пожалуйста. grin

    Может у кого-нибудть есть еще ссылки на аналогичные «детекторы»?

    http://pr-cy.ru/sale_links

  17. 2008-09-12 в 23:06:54 | Anton

    Я когда ставлю код Ивана так ссылки на страницах перестают отображатся

  18. 2008-09-13 в 11:21:58 | Иван

    Anton, это вызов кода для подключения к системе. Еще же нужно вызов ссылок прописать:

    <? echo $sape->return_links($n); ?>
    

    или:

    <? echo $sape->return_links(1); ?>
    <? echo $sape->return_links(2); ?>
    <? echo $sape->return_links(); ?>
    

    если вывод в нескольких местах.

  19. 2008-09-18 в 09:27:10 | Рафис

    У меня вопрос, правда чуть чуть не по теме.

    У меня страницы вызываются site.ru/1.php?id=23, где id-число и я делаю в коде проверку, чтобы вводилось именно число is_numeric($id), если id не число, то выводится сообщение об ошибке. А как на это реагируют поисковики? Саповские ссылки при этом соответственно не выводятся

  20. 2008-09-19 в 23:26:17 | Doxi

    Беда с кодом, предложенным 2008-09-05 в 16:02:01 | уважаемым Иваном.

    Суть проблемы:

    Имеем сайт на WordPress 2,5,1 и с плагином NextGEN Gallery 0.98. Есть пост с галерейкой из нескольких изображений. NextGEN Gallery делает два поста из одного. В первом вар-те статическое изображение картинок вставленой галерейки, в другом - слайдшоу из этих картинок. Так вот на страничке со слайдшоу ссылки сапы некоректно отображаются при использовании

    $tm = explode("?", $_SERVER['REQUEST_URI']);
    	$o['request_uri'] = $tm[0];
    

    Некоректно - показываются ссылки со страницы со статическими изображениями.

    Что можно сделать? т.к. удалять страницы из сапы со слайдшоу не хочется, и продажностью светить тоже.

    Помогите пожалуйста решить проблему.

    Версия WordPress 2.5.1

    NextGEN Gallery 0.98

  21. 2008-09-30 в 04:22:08 | adre

    Дизайн почетен =) FreeBSD =)) постил сюда немного бред про сапу toИван угу это основная идея для скрытия ссылок, просто если немножко по другому сделать, то все переменные могут вылететь и страница отображаться не корректно ...

  22. 2008-10-18 в 22:01:00 | Serg
    http://talk.pr-cy.ru/topic9554s0.html?p=122071&#entry122071
    

    Вот ещё так сказать пища для размышлений.

  23. 2008-10-23 в 01:37:31 | Hidden

    Плыз помогите поставил код Ивана и ссылки пояаились на всех страницах которые были на главной а других как и небыло. что делать ???

  24. 2010-05-27 в 16:42:54 | sha

    идея прикольная, но яша не собирается определять ссылки таким образом. потому что это слишком легко. они идут другим путем - анализ контента, анализ донора, реципиента, вес ссылок и прочее. Потому что если они похерят сапу таким простым методом - завтра сешнеги перейдут на дугие методы генерации ссылок. В конце концов - даже руками, по старинке. яша это понимает и не идет путем "неперспективного фикса" сорри что пишу уже в 2010 (токо пост увидел), но думаю что тема еще актуальна

Оставьте комментарий!

Не регистрировать/аноним

Используйте нормальные имена. Ваш комментарий будет опубликован после проверки.

Если вы уже зарегистрированы как комментатор или хотите зарегистрироваться, укажите пароль и свой действующий email.
(При регистрации на указанный адрес придет письмо с кодом активации и ссылкой на ваш персональный аккаунт, где вы сможете изменить свои данные, включая адрес сайта, ник, описание, контакты и т.д.)



grin LOL cheese smile wink smirk rolleyes confused surprised big surprise tongue laugh tongue rolleye tongue wink raspberry blank stare long face ohh grrr gulp oh oh downer red face sick shut eye hmmm mad angry zipper kiss shock cool smile cool smirk cool grin cool hmm cool mad cool cheese vampire snake excaim question

(обязательно)