
arnio
im-anishraj
C++ accelerated data quality toolkit for Python: CSV parsing, cleaning, schema validation, profiling, and pandas integration.
AI 简介
Arnio 是一个用于 Python 的 C++ 加速数据质量工具包,主要功能包括 CSV 解析、数据清洗、模式验证、数据剖析以及与 pandas 的集成。它通过预编译的 C++ 引擎实现了高效的数据处理,能够快速解析、推断类型、去除空白字符、去重、验证和分析数据,然后将干净的数据返回给用户熟悉的工具如 pandas、NumPy 等。适用于需要对大量 CSV 数据进行快速预处理并确保其质量的场景,例如数据科学项目中的数据准备阶段。
Python
MIT License90
Stars
403
Forks
3
Watchers
248
Issues
Star 增长
今日0
近 7 天+1
近 30 天+7
综合评分49.02
默认分支main