苏苏网赚论坛

 找回密码
 立即注册
查看: 209|回复: 0

网站日志分析对优化有什么帮助

[复制链接]
跳转到指定楼层
楼主
发表于 2017-12-30 16:19:31 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  一、了解搜索引擎蜘蛛爬行次数
  蜘蛛是搜索引擎派来抓取内容的机器人,了解蜘蛛爬行次数才知道我们的网站是否搜索引擎喜欢的,反之这个网站没什么继续抓取了,能够对比的来的次数的,对比的以前的四周的操作对比能够知道蜘蛛来的多少是哪些东西引起的是网站外链还是网站的更新,从而调整的网页,蜘蛛喜欢原创内容,要是都是一些直接复制粘贴过来的转载内容,下次也许蜘蛛就不会再来了,感觉这个网站就是某个网站的镜像站。
  对于有害的蜘蛛我们要是的屏蔽的(屏蔽的蜘蛛的ip)蜘蛛也是很多种,要是哪天发现多次出现某个不明的蜘蛛IP网站却被降权或被K,那我们就得必须禁止这个蜘蛛的IP访问。
  蜘蛛的大量访问能够增加服务器的资源,蜘蛛的频繁访问还是对网站有帮助的,但资源消耗也是很大,所以要找个好的空间商来放,不然一下子服务器垮了,那可能就不在通知你的情况下删除你的网站掉了。
  百度俱乐部:看假冒蜘蛛的识别(为了偷取别的数据),最重要的是百度蜘蛛都是显示北京那边的IP,如果是其它的地方就不是真正的蜘蛛了,也有降权和被K的蜘蛛,小心谨慎查看哦。
  二、网站页面抓取程度
  如果是喜欢抓取首页的话,那快照都是隔天的了,内页频繁的话也是秒收情况,如果某部分的页面没被抓取,那就查看是否禁止了蜘蛛的爬行,做外链的时候不能大部分做首页的,也要适当的做内页,不然收录就很低,还能知道我们网站出现了什么的问题,蜘蛛主要爬去的是哪些页面或哪些页面爬去是比较频繁的还有哪些页面是没有爬去的,我们要结合起来分析,那个目录收录比较多那个少进行对比(找空间商提供IIS日志)还要查看的变化,搜索引擎在不同的时期的爬去的情况是不一样的,是因为的转载,还是因为外链。
  三、http状态码的分析
  蜘蛛抓取完毕后一般都留下了http状态码,返回的是200不代表会直接放出,有的是一个星期更新就放出,有的是一个月才放的,只要返回了这个代码,一般这个页面都会被放出的。
  两个问题:
  1.我们的做的错误页面应该返回404还是200?
  应该返回404四正确的,因为这样的搜索引擎才知道的网页不能访问,如果是200的话,那就可能造成降权或是被K的情况了,代表这个网页还是可以抓取的,一旦发现大量的都是访问不了的,那就会给予惩罚,所以要做好404页面的。
  2.如果我们的网站要备案,我们正在建设当中,我们因该返回那个状态码是500、还是400、还是404、还是500、还是503?
  要返回503(503是告诉搜索引擎暂时不能访问,马上会恢复,如果返回其他的状态码可能搜索引擎就不会访问了,404页面是代表这个页面已经不存在了,那搜索引擎就会认为你的网站已经不存在了,就直接删除了,暂时的话下次会继续来抓取的。)
  网站做了301永久重定向返回的代码却没有,那就得查询下是否设置的正确,不然权重就不会转移到新的域名去了,什么事情都要做好万无一失的。
  四、专业的日志分析工具
  能够让我们知道的pv访问值和攻击性的访问值
  pv是留住用户的体现,如果跳出率太高了,那这个网站就是打不开或是内容没可读性,网站就逃不了排名被端的命运,也查看到什么页面是访问最高的,这样就能摸索出用户的需求来改善。网站长期打不开或是打开很慢,就得看下日志里是否有不明的IP的大量访问,那可能就是被攻击了,这样我们只能妥协或是报案,不然就换别的服务器,但换汤不换药,还是不能解决问题的,最好还是采取法律的手段来保护自己的利益。
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-4-25 20:58 , Processed in 0.920402 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表