SEO服务的对象就是搜索引擎,必须对它的运行规律、工作原理、习性、优缺点等都铭记于心,多多实践操作,平时时间的越多,经验也就越丰富。
搜索引擎是人创造出来的,所以也是有理可寻的。搜索引擎工作过程主要有三段工作流程,爬行抓取、预处理及服务输出。
爬行抓取
爬行抓取是搜索引擎工作最重要的一步,把所有需要抓取的地方抓取回来处理分析,因此如果在抓取这部分出了错,后面完全就瘫痪了。
搜索引擎都是事先已经处理好了所抓取的网页。搜集工作也是要按照一定的规律来进行的,基本上有如下两种特征。
批量收集:对互联网上只要是存在连接的网页都收集一遍,耗时在几周左右。缺点在于增加了额外的带宽消耗,时效性也不高。
增量收集:是批量收集的一个技术升级,完美的弥补了批量收集的缺点。在原有的基础上收集重复和不存在的网页。
还有一种比较简单的方法让搜索引擎来爬行,自己主动向搜索引擎提交网站,等到一定时间就回来爬取。不过现在主动提交后再来爬行的速度越来越慢了,最理想的办法还是顺着自然链接来收集比较好。这就需要我们在前期做好蜘蛛爬行的入口 |