苏苏网赚论坛

 找回密码
 立即注册
查看: 1751|回复: 0

防止不利于蜘蛛抓取网页的9大圈套

[复制链接]
跳转到指定楼层
楼主
发表于 2018-11-25 14:34:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  1、登陆后方可看内容
  这部分需要填入登陆信息才能看到的内容,搜索引擎是看不到的。
  解决方法:
  可以适当将一部分内容公开化,方便搜索引擎抓取。其余内容使用登陆后方能查阅这种做法。
  2、网站使用FLASH
  虽然搜索引擎近些年来已经不断努力提高FLASH这方面的内容读取,但其抓取能力还有待于考究。
  解决方法:
  建议将网站做成普通的HTML版本。如果实在到了非要FLASH不可的地步,不妨使用SWFObject和sIFR等便于搜索引擎抓取的技术。
  3、网站URL含有动态元素
  这些动态元素包括问号,参数以及等号等,一般由数据库驱动的网站自动生成。
  比如典型的论坛URL:
  百度等搜索引擎蜘蛛在发展初期一般不太喜欢爬行和抓取此类URL,原因在于极有可能陷入无限循环或收录大量重复内容,造成资源的极大浪费。
  解决方法:
  将URL静态化,严格说来应该是“伪静态化”。最常用的方法是使用服务器的URL重写模块,在LAMP(Linux+Apache+MySQL+PHP)服务器上一般使用mod_rewrite模块,Windows服务器也有功能类似的ISAPI Rewrite等模块。
  4、强制使用Cookies !
  有些网页为了跟踪用户访问行为,启用了强制用户使用COOKIE的功能。如果用户的浏览器停掉COOKIE,页面的内容便会无法显示或者不能正常显示。这也会造成搜索引擎没有办**常访问抓取。
  5搜索引擎所敏感的各种跳转
  搜索引擎对一些类似于302跳转,Javascript跳转,Flash跳转,Meta Refresh跳转相对来讲比较敏感。如果必须要使用,推荐301跳转。
  6、URL里含有Session ID,即(会话ID)
  每个用户在访问网站时会有一个唯一的Session ID 存在于URL中。这会导致同个页面出现不同的URL的状况,导致搜索引擎认为网站有大量重复内容,这对网站来讲是极端不利的。
  7、、弹出的聊天窗口
  显示在聊天窗口的内容,搜索引擎是也是无法读取的。
  8、Javascript 链接的使用
  据了解,对于权重不高的网站,搜索引擎会认为没有必要浪费精力去执行脚本,跟踪链接的。所以做导航时,应该避免使用Javascript
  9、网站的框架结构
  虽然搜索引擎蜘蛛可以根据跟踪框架里所调用的HTML文件,然而通常情况下这些文件是不完整的,这导致搜索引擎无法判断框架中的内容到底是属于主框架还是框架调用的文件。
  解决方法:
  避免在建站时使用框架
  归唐山现代男科医院http://www.2331999.com/所有,若要转载请标上文章源自,感谢您的合作!
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-5-16 05:45 , Processed in 0.124800 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表