PHPAnalysis中文分词2.0版本,支持链式调用,丰富词性,增加TF-IDF计算权重
php分词一直在用PHPAnalysis,随着业务需求的不断增加,原版的PHPAnalysis已不满足需求了,并且原版也很长时间没更新了。
这个分词是在原版基础上修改的,加入了一些新特征:
在analysis基础上修改分词算法
重构文件结构,支持composer
优化分词步骤(粗分、切分、优化三步完全独立)
优化词性标注,新增更多类别的词性
新增基于TF-IDF的权重排序
支持类成员链式调用,即是 xx()->xx()->xx() 模式
同时,也优化的结果的获取,可以根据需要获取不同类型的分词结果,支持:
获取粗分分词
获取深度分词
获取优化后的分词
获取排序后的分词
获取新词
测试截图:
效果体验:
请移步:Analysis2中文无组件分词
有 1 位网友评论:
访客 1年前(2023-05-05 12:41:14)
感谢分享,分词分的很好