首先,搜索引擎为有机过滤器,两篇文章作为比较对象,如何知道它比这篇文章是关于什么?是,当然,关键字,关键字决定根据这篇文章,这就是为什么这篇文章想建立一定比例的关键原因,至少如何区分这篇文章关键字,搜索引擎有自己的算法来解决,而不是太多。
这两篇文章拿出来,计算机进行分析:
1、设置一个比率,定义为M,例如,马克是系数为0.5。
2、一篇文章,根据单词、段落分成三个部分。段B文章分为三个部分,然后编译算法,也可以理解成为加密等等,也就是说这个词变成一个符号。例如一段汇编成aaacbdfbcdfsdafefasdfasd后这个字符串。这样的人物,当然不一定使用ABCD这么做是因为电脑的好处,方便比较和处理。
3、然后把A、B两篇文章通过第二步的处理,是通过算法之间的相似性,两篇文章,有多少(估计这比较算法是复杂的,我只能猜。)将获取一个值,它是类似于上面提到的在1 M的系数,根据标准,如高于0.5是表示是相同的,下面是说的是不一样的,如果同样的搜索引擎抓取其他参数用于决定谁是原始的,或者是原始的。 |