苏苏网赚论坛

 找回密码
 立即注册
查看: 2968|回复: 0

**页对SEO优化的影响

[复制链接]
跳转到指定楼层
楼主
发表于 2018-12-8 11:08:08 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
**页对seo优化的影响。在SEO优化中跟网络管理员沟通时经常会出现这种情形,一些广为传播的理念可能在过去是正确的,但是可能已不再切合目前的情况了。当我们最近在跟几个朋友谈及关于网址的结构时就碰到这种情况。其中一个朋友很担心**址的使用,甚至认为搜索引擎无法处理**址。另外一个朋友觉得**址对搜索引擎来说完全不是问题,那些都是过去的事了。还有一个甚至说他从来都搞不懂**址和静态网址相比有什么区别。对于我们来说,这一刻使我们决定要好好研究一下**址和静态网址这个话题。首先,让我们来界定一下我们要谈论的主题:

举例来说,众所周知的搜索引擎的检索结果页面就是**页。搜索引擎收到用户提交的查询请求后,会搜索它的数据库,查找相关的地址,并生成一个结果页面。这个页面会整合查询结果及其他信息,如搜索引擎标识和广告。它生成的网页是一个真实的网页,有惟一的URL(对大多数搜索引擎来说),但是,如果爬虫访问搜索引擎站点,它不会发现该网页,因为该网页是响应查询请求生成的,响应结束后,立即被清除。

**页对seo优化的影响。从该例可以看出,在网络上有很多有用信息。但不是以静态网页形式呈现的。这些网页必须向数据库发出一个请求才能访问,包括一些图书馆目录、商业产品数据库以及数字图书馆。这些通常只是被称作不可见的网络或者深度网络的一部分,前一个概念已经由ShermanPrice普及(2001)。爬虫数据的使用者必须接受这一不可避免的局限性,即网络爬虫无法找到大量不同类型的**页。

有趣的是,一些运营网络数据库的信息提供商也拥有大量静态网页,甚至是数据库的关键部分,因此,搜索引擎能完全地索引这些页面。

对链接分析而言,未将爬虫数据建库已不是问题,但有一个相关问题值得注意,即有些网站以**页为核心,而不是以数据库为核心。有一些网络技术可用于自动生成动态/网页,包括PHP技术(PHPHypertext Pre-processor-arecursive acronym)ASP(Active Server Pages)技术。

**页曾经是爬虫的一大难题。设计爬虫时,通常都回避**页(CharkabartiJoshiPunera&Pennock2002)。识别**页时,只需要看URL中是否出现问号,含问号的就是**页。忽略**页是因为它们容易造成蜘蛛陷阱。蜘蛛陷阱理论上是一个无限的网页集合,而蜘蛛永远不能完整地遍历这个集合。在线日历就是一个容易被忽略的蜘蛛陷阱,它生成的**页中可以标上任何日期,并包含指向后一天网页的链接。一个爬虫从这个日历中找到一个网页后,便会无止境地请求后一天的网页。

商业搜索引擎的爬虫通常回避这些带问号的URL,因为这些URL可能会导致蜘蛛陷阱。Google已经放宽了对这些站点的限制。Google爬虫似乎有另一种避免蜘蛛陷阱的方法。举例来说,它可能沿着指向带问号URL的链接爬行,但不会爬取带问号的URL,这样便可以跳出蜘蛛陷阱的递归循环。

链接分析研究者应当注意,研究型的网络爬虫不能遍历含**页的站点,或者只能遍历深度较浅的站点。商业搜索引擎的爬虫也是如此。在使用爬虫的时候,应当公开所使用的参数,以便其他研究者能判断这些参数对结果的影响。遍历参数集合列举如下:

·拒绝访问带有如下子串的URL?cgi-bin,&

·拒绝访问超过最大斜线数的URL

·拒绝访问超过最大字符数的URL

影响搜索引擎收录就会间接影响到SEO项目,尽管现在各大搜索引擎算法对**页的索引都有了很大的改善。但是与其等搜索引擎来改变这个事情,为什么不自己就做的很好?站点静态化仍旧是SEO中非常必要的一个事情。
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-5-5 22:32 , Processed in 0.109200 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表