
Chinese-Word-Vectors
Embedding
100+ Chinese Word Vectors 上百种预训练中文词向量
AI 简介
该项目提供了上百种预训练的中文词向量,涵盖了不同的表示方法(稠密和稀疏)、上下文特征(如词、n-gram、字符等)以及语料库。核心功能包括易于获取具有不同属性的预训练向量,并支持用户通过提供的中文类比推理数据集CA8及评估工具包来评测词向量的质量。技术上,这些向量使用了多种训练方法,如SGNS生成稠密向量、PPMI生成稀疏向量。适用于自然语言处理中的下游任务,比如文本分类、情感分析、机器翻译等场景,能够有效提升模型性能。
Python
Apache License 2.012.2k
Stars
2.3k
Forks
279
Watchers
60
Issues
Star 增长
今日0
近 7 天0
近 30 天+6
综合评分70.6
默认分支master