苏苏网赚论坛

 找回密码
 立即注册
查看: 4934|回复: 0

浅谈搜索引擎是怎么判定原创与抄袭虾缕梨

[复制链接]
跳转到指定楼层
楼主
发表于 2018-12-13 16:56:19 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
  我们知道,网站原创内容在搜索引擎排名中占有重要地位,但做原创内容不容易,伪原创又怕不被当成原创,白做。那么我们先从搜索引擎角度去如何判定内容是原创还是抄袭。
  很多站长都想利用原创内容来提高自己网站的收录与排名,但是做原创内容并不是一件容易的事,偶尔一两篇应该还行,要是一天一两篇,很多多人也是受不了,因为大多数站长都不是作家那样行如流水。比如要写一篇SEO的原创文章,若是自己本身都还不太了解SEO,那肯定是半天都都憋不出一个字来。所以,如何利用别人的文章来改成伪原创,让搜索引擎以为是原创内容,这是很多站长都追求的效果。
  之前有人认为搜索引擎是利用“分词”与“索引”技术,没看过的可以看下这篇《网站建设中利用搜索引擎“分词”和“索引库”技术来做网站排名》地址是:http://www.kz27.com/seo-paiming/fenci-suoyin/ ,大家都很认同。我们来看看2010-02-21在百度搜索“网站建设中常见的DIV+CSS问题解决方法”时得出的结果:
  


  从上图可以看出,搜索引擎确实是利用了分词技术:它把“网站建设中常见的DIV+CSS问题解决方法”分为“网站”、”建设”、”常见”、”div”、”CSS”、”问题”、”解决”、”方法“ 还有“网站的”,“div+css的”,“网站设计”。值得一提的是跟“网站建设”相关的“网站设计”也以红字出现。同时,在上面的搜索关键词中,有“的”也没有“的”搜索结果都是213篇文章,但排名有一点点小的改动。如下图:
  


  注:以下纯属猜测,如有与搜索引擎算法相似,不胜荣幸,欢迎指正。
  第一、首先,我们来分析索引擎是如何分析哪些是原创,哪些不是原创的
  是原创还是复制别人的文章,要进行判断,那肯定需要进行“比较”。那怎么比较?我们先从搜索引擎地角度去想想看:
  1.先是标题
  如果是一样的,那很有可能是复制,但要是改了一下标题呢,如把《如何做伪原创文章》改成《教你怎么写伪原创内容》,意思没变,文字变了。所以,不能仅靠标题来判断是不是原创。但可以做以下分析:
  因为搜索引擎的数据量实在太大,不可能对所有的内容进行遂一的结比,而是同样是使用“分词“技术:
  (1)如果搜索引擎蛛蛛访问的页面是一个新的页面,那么,它将先把这个页面内容收集起来,放入一个数据库(或是其它),等其它程序如专门对比内容是不是原创、是不是有价值的程序进行处理。这时候,这个内容将不会被搜索出来。
  (2)分析内容。也是利用了分词技术,对标题、内容等进行分析。得出了这个页面的主要内容。如《周杰伦2010年专辑》这样的篇文章时,它将与包括”周杰伦“、”2010“、”专辑“这样的关键词的文章进行比较,而不用与所有的网页进行比较。如果结果是原创、比较有价值,则进行收录,给比较高的权重。如果被认为是复制或抄袭,则不进行收录,或是给的权重很低。顺便要说的是,对于这个页面的权重,不仅仅是跟其本身的内容、本身的内容有关,能不能有好的排名,还要跟整个站点的权重有关。打个比方,如果这个页面的权重是3,网站的权重是3,那加起来是6。要是别的网站转载了这个文章,文章的权重是1,但他的网站的权重是7,那加起来就是8。6
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-4-19 14:01 , Processed in 0.202801 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表