苏苏网赚论坛

 找回密码
 立即注册
查看: 5616|回复: 0

  做个关键词替换

[复制链接]
跳转到指定楼层
楼主
发表于 2018-12-10 13:05:05 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
做伪原创工具首先要分词,分词要词库的支持,在网上找了一些工具,比较好的是哈工大分词,和ictclas.org这个分词,哈工大分词的借口有java和c++的,后一种分词有高手已经做出来了,但词库只是共享了了一部分,没法用,这个伪原创工具是属于自然语言识别中的范畴,把找到的资源和大家共享一下:

  哈工大的一网站

  这个是分词演示,测试了一下很牛,估计百度等一些需要这个功能的机构或个人都应该参考或者应用这个东西

  这个是他们的论坛 东西不多 好多都是06 07年的 看来这个研究很早就有了

  哈工大分词提供源文件下载,他里面还有个同义词字,大概有7万多个同义词,论坛里面有介绍,想用的朋友可以详细的看看,有了这两个功能相信做伪原创工具就不难了。

  还有个是ictclas.org 专门研究分词的机构,但东西都是共享版的。里面有好多sample可以直接用,但是效果一般,专业版的要收费。
热帖推荐
回复

使用道具 举报

广告合作|最大的网赚客中文交流社区!十年老站!

GMT+8, 2024-4-25 14:39 , Processed in 0.795602 second(s), 23 queries , Gzip On.

Powered by Discuz! X3.1 VIP版

© 2012-2022 苏苏网赚论坛 版权所有 | 10年老品牌

快速回复 返回顶部 返回列表