makcedward

nlpaug

makcedward

Data augmentation for NLP

AI 简介

nlpaug 是一个用于自然语言处理的数据增强库。它支持文本和音频数据的合成生成,以提高机器学习模型性能而无需手动创建额外数据。该库具有简单易用、轻量级的特点,仅需三行代码即可完成数据增强,并且可以无缝集成到各种机器学习或神经网络框架中(如scikit-learn, PyTorch, TensorFlow)。此外,nlpaug 提供了多种增强方法,允许用户通过“Augmenter”组件单独使用或者通过“Flow”组件组合多个增强器来构建复杂的数据处理流程。适用于需要增加训练数据多样性以改善模型泛化能力的各种NLP应用场景,包括但不限于文本分类、情感分析以及语音识别等任务。

Jupyter Notebook
MIT License
4.7k
Stars
477
Forks
37
Watchers
71
Issues

Star 增长

今日0
近 7 天0
近 30 天+4
综合评分60.44
默认分支master