苏苏网赚论坛

 找回密码
 立即注册
查看: 5122|回复: 0

淘宝客网站相关性算法的探讨

[复制链接]
跳转到指定楼层
楼主
发表于 2019-1-2 01:24:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
现在很多主流的相关算法都是根据Simhash来操作的,谷歌总是走在所有搜索引擎的前面。simhash方法是在大文本重复识别常用的一个方法,该方法主要是通过将对象的原始特征集合映射为一个固定长度的签名,将对象之间的相似度的度量转化为签名的汉明距离,通过这样的方式,极大限度地进行了降低了计算和存储的消耗。
我们要判定文本与文本相关性算法,是两个文本的对比,算法的效率直接决定了他的实用性。

接下来我们讲,百度相关性算法最终的实现和对我们网站产生的效果有哪些
1、主流相关性算法的探讨。
相关性算法的应用非常广泛,比如外链,就像旅**业找的友链都是同行旅游业的。但不是说我们找所有相关性的友链排名就好。
如果我们是做內链,该推荐神马内容呢,很多人做内页列表都是随机推荐的,但是在所有相关推荐中,随机推荐的效果是最差的,随机推荐的列表也多,垃圾内容也就越多,哪些网站随机推荐列表醉的的呢,医疗类站点就是非常典型的。
站内内容是投票的重要因素,但是内页列表我们如何去推荐呢?最新列表,最新热点这些推荐也是垃圾的,随机生成的推荐是最差的。

二.关于相关性的应用
a.外链的相关性应用
谷歌原始算法和百度算法是如何识别网站的权威性识别,之所以要识别,是因为权威的指导,能给信息带来信用度的。百度作为以信息检索平台,他要保证信息的真实性 ,所有肯定要建立信用度和公正性,才会让用户在百度上,减少信息的欺骗。
百度必须做到,权威性的识别和枢纽,他们是如何计算权威性的呢,权威是由枢纽组成的,百度上权威站点是根据ICO标签来识别的,ICO标签是最好的识别
1.权威他是指整个互联网的权威还是某个行业的权威??
2.权威可不可以跨行业??
答:高权威只针对行业,不针对跨行业的。给同行业的投票,才可以获得权重。
枢纽是如何保证不同行业的识别,枢纽链接,是根据不同网站来进行指向的,枢纽导出的页面是针对不同行业指向的。枢纽就是一个中心,向大量,不同行业进行指向。
神马叫权威网站,权威性是指被大量的枢纽指向的网站,就叫做权威**,如果想做权威**,就不能全部是同行的链接,比如不能全部是同行的友链。这样的话,我们就成为不了权威**。
如果只是指向一个链接,就不是枢纽,论坛个性签名属于典型的枢纽,友情链接的首页也是枢纽
a、如果我们友情链接全部是同行,就不是枢纽,也成不了权威**,
b、友情链接不一定全部要同行的,不相干的友链也适合
c、论坛个性签名不属于垃圾链接
跨行业是不可以传递权威的,行业权威的指向最为重要

三、內链的相关性如何去做呢
随机生成是典型垃圾链接,这样的网页会被慢慢淘汰,中小型的要针对性的去推荐,比如关怀性的推荐。引导性需求相关性,绝对相关性,我们把需求分为显性需求和隐形需求两种,只要用户需求的都是显性需求,直接需求的就是显示的,连带需要的就是隐性需求。案例1.京东商城提示,浏览了该用户的最终购买了什么,这是显示需求的挖掘。购买了该页面产品还购买了什么什么产品,这个就是隐性需求的挖掘。
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-4-30 14:54 , Processed in 0.124800 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表