
datasets
huggingface
🤗 The largest hub of ready-to-use datasets for AI models with fast, easy-to-use and efficient data manipulation tools
AI 简介
🤗 Datasets 是一个轻量级库,旨在为AI模型提供大量可直接使用的数据集,并配备快速、易用且高效的数据处理工具。其核心功能包括通过一行代码加载众多公开数据集(如图像、音频及467种语言和方言的文本数据),以及对这些公开或本地CSV、JSON、PNG等多种格式的数据进行简单、快速且可复现的预处理。该库支持Numpy、Pandas、PyTorch、TensorFlow等主流框架,非常适合需要快速获取并准备训练/评估机器学习模型所需数据的研究人员与开发者使用。
Python
Apache License 2.021.6k
Stars
3.2k
Forks
280
Watchers
892
Issues
Star 增长
今日+4
近 7 天+35
近 30 天+100
综合评分105.5
默认分支main