NLPchina

ansj_seg

NLPchina

ansj分词.ict的真正java实现.分词效果速度都超过开源版的ict. 中文分词,人名识别,词性标注,用户自定义词典

AI 简介

Ansj_seg是一个基于n-Gram+CRF+HMM的中文分词Java实现。该项目提供了包括中文分词、人名识别、词性标注及用户自定义词典等核心功能,其分词速度可达每秒约200万字,准确率超过96%。此外,还支持关键字提取与自动摘要等功能。适用于对文本处理精度和效率有较高要求的应用场景,如搜索引擎优化、内容分析系统开发以及自然语言处理相关的研究项目中。采用Apache License 2.0开源许可协议,便于集成到各种Java项目中。

Java
Apache License 2.0
6.5k
Stars
2.3k
Forks
649
Watchers
47
Issues

Star 增长

今日0
近 7 天0
近 30 天0
综合评分66
默认分支master