PHPAnalysis中文分词2.0版本,支持链式调用,丰富词性,增加TF-IDF计算权重

阅读601评论1

php分词一直在用PHPAnalysis,随着业务需求的不断增加,原版的PHPAnalysis已不满足需求了,并且原版也很长时间没更新了。

这个分词是在原版基础上修改的,加入了一些新特征:

  1. 在analysis基础上修改分词算法

  2. 重构文件结构,支持composer

  3. 优化分词步骤(粗分、切分、优化三步完全独立)

  4. 优化词性标注,新增更多类别的词性

  5. 新增基于TF-IDF的权重排序

  6. 支持类成员链式调用,即是 xx()->xx()->xx() 模式

同时,也优化的结果的获取,可以根据需要获取不同类型的分词结果,支持:

  1. 获取粗分分词

  2. 获取深度分词

  3. 获取优化后的分词

  4. 获取排序后的分词

  5. 获取新词

测试截图:

网页捕获_28-4-2023_134844_aassdd.jpg

效果体验:

请移步:Analysis2中文无组件分词

文件名称:PHPAnalysis2.0中文分词

文件大小:

更新日期:2023-08-07 18:41:32

作者信息:网络游客

授权类型:免费

1 位网友评论:

访客 1年前(2023-05-05 12:41:14)

感谢分享,分词分的很好

欢迎来评论

暂不支持评论