苏苏网赚论坛

 找回密码
 立即注册
查看: 10168|回复: 0

搜索引擎对页面的分词取决于词库的规模

[复制链接]
跳转到指定楼层
楼主
发表于 2018-12-17 12:39:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
搜索引擎对页面的分词取决于词库的规模、准确性和分词算法的好坏,而不是取决于页面本身如何,所以SEO人员对于分词所能做的很少。唯一能做的是在页面上用某种形式提示搜索赢取,某几个字应该被当作一个词处理,尤其是可能产生歧义的时候,比如在页面标题、H1标签及黑体中出现关键词。如果页面是“重庆SEO优化”,而我们的关键词是SEO优化,那么就可以把“SEO优化”这几个字特意标为黑体。如果我们的关键词是重庆SEO那么我们就应该把“重庆SEO”这两个词标为黑体。这样搜索引擎对页面进行分析时就知道为黑体的应该是一个词。
无论是英文还是中文,页面内容都会出现一些频率很高,却对内容没有任何影响的词,如“的”“地”“得”之类的助词,“啊”“哈”“呀”之类的感叹词,“从而”“以”“却”之类的副词或介词。这些词被称为停顿词,因为他们对页面的主要意思没什么影响。英文中的常见停顿词有zhe,a,an,to,of等。搜索引擎在搜索页面之前会去掉这类词语,使索引数据主题更为突出,减少无谓的计算量。
下一篇:亚交
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-5-2 09:18 , Processed in 0.312001 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表