[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-11647":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":10,"language":11,"languages":10,"totalLinesOfCode":10,"stars":12,"forks":13,"watchers":14,"openIssues":15,"contributorsCount":16,"subscribersCount":16,"size":16,"stars1d":17,"stars7d":18,"stars30d":19,"stars90d":16,"forks30d":16,"starsTrendScore":20,"compositeScore":21,"rankGlobal":10,"rankLanguage":10,"license":22,"archived":23,"fork":23,"defaultBranch":24,"hasWiki":23,"hasPages":23,"topics":25,"createdAt":10,"pushedAt":10,"updatedAt":32,"readmeContent":33,"aiSummary":34,"trendingCount":16,"starSnapshotCount":16,"syncStatus":15,"lastSyncTime":35,"discoverSource":36},11647,"Data-Analysis-Agent","Zafer-Liu\u002FData-Analysis-Agent","Zafer-Liu","面向商业分析师的智能数据分析体。Intelligent Data Analysis Agent for Business Analysts.","https:\u002F\u002Fdata-analysis-agent-eight.vercel.app\u002F",null,"Python",1466,171,49,2,0,129,221,381,387,19.71,"Apache License 2.0",false,"main",[26,27,28,29,30,31],"agent","ai","ai-tools","analysis","charts","datavisualization","2026-06-12 02:02:33","# 智能商业分析 Agent\n\n\u003Cp align=\"center\">\n  \u003Cimg src=\".\u002FImages\u002FBanner.png\" alt=\"智能商业分析 Agent Banner\" width=\"100%\" \u002F>\n\u003C\u002Fp>\n\n\u003Cp align=\"right\">\u003Ca href=\".\u002FREADME_EN.md\">English\u003C\u002Fa>\u003C\u002Fp>\n\n![Python](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FPython-3.8%2B-blue.svg)\n![Flask](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FBackend-Flask-black.svg)\n![Plotly](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FVisualization-Plotly-3F4F75.svg)\n![LLM](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLLM-OpenAI%20Compatible-green.svg)\n![Charts](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FCharts-43_Types-orange.svg)\n![License](https:\u002F\u002Fimg.shields.io\u002Fbadge\u002FLicense-Apache%202.0-yellow.svg)\n\n> 一个面向商业分析场景的 AI Agent。  \n> 连接数据源后，用户只需使用自然语言提问，系统即可自动完成：\n>\n> - 数据结构识别\n> - SQL 生成与执行\n> - 图表生成\n> - 业务洞察分析\n\n---\n# 目录\n\n- [✨ 项目亮点](#-项目亮点)\n- [🧠 核心能力](#-核心能力)\n- [⚙️ 安装方式](#⚙️安装方式)\n- [🛠 斜杠命令](#-斜杠命令)\n- [📈 使用示例](#-使用示例)\n- [⚙️ 配置说明](#⚙️-配置说明)\n- [🗺️ 项目里程碑](#️-项目里程碑)\n- [❓ FAQ](#-faq)\n- [🚀 寻找一起改变世界的 Contributor](#-寻找一起改变世界的-contributor)\n- [📄 License](#-license)\n- [⭐ 项目目标](#-项目目标)\n---\n# ✨ 项目亮点\n\nBusiness Analyst Agent 是一个对话式商业数据分析系统，目标是让非技术用户也能像“聊天”一样完成数据分析。\n\n上传 Excel \u002F CSV，或连接数据库后，用户可以直接提问：\n\n```text\n最近三个月销售额趋势如何？\n哪个地区利润最高？\n帮我生成用户增长图\n```\n\n系统会自动：\n\n1. 理解问题意图\n2. 分析数据结构（Schema）\n3. 自动生成 SQL\n4. 执行查询\n5. 自动推荐图表\n6. 输出业务洞察\n\n并通过 **SSE（Server-Sent Events）流式输出**，实时展示分析过程。\n\n---\n\n\n# 🧠 核心能力\n\n## 1️⃣ 自然语言数据分析\n\n无需编写 SQL。\n\n用户只需输入自然语言：\n\n```text\n今年每个月的订单量趋势\n```\n\n系统自动完成：\n\n- SQL 生成\n- 数据查询\n- 图表推荐\n- 分析总结\n\n![Data Query](Images\u002FData_query.png)\n\n---\n\n## 2️⃣ 多数据源支持\n\n支持上传和连接多种数据源：\n\n- 文件：Excel \u002F CSV\n- 数据库：SQLite、MySQL、PostgreSQL、SQL Server\n- 未来计划：DuckDB、Spark\n\n![Data Preview](Images\u002FData_preview.png)\n\n---\n\n## 3️⃣ 智能图表系统\n\n| 分类 | 图表类型 |\n|---|---|\n| **对比类** COMPARING | Marimekko_ABS（马里美科-绝对值）、Marimekko_PCT（马里美科-百分比）、Bar_Chart（柱状图）、Grouped_Bar_Chart（分组柱状图）、Stacked_Bar_Chart（堆叠柱状图）、Diverging_Bar_Chart（对比条形图）、Dot_Plot（点图）、Waffle（华夫格）、Bullet_Chart（靶心图）、Sankey_Chart（桑基图）、Heatmap（热力图）、Waterfall（瀑布图） |\n| **时间趋势类** TIME | Line_Chart（折线图）、Circular_Line_Chart（圆形折线图）、Slope_Chart（斜率图）、Sparkline（迷你图）、Bump_Chart（凹凸图）、Cycle_Chart（周期图）、Area_Chart（面积图）、Stacked_Area_Chart（堆叠面积图）、Horizon_Chart（地平线图）、Connected_Scatter（连线散点图） |\n| **分布类** DISTRIBUTION | Histogram_Pareto_chart（直方图与帕累托图）、Pyramid_Chart（金字塔图）、Error_Bar_Chart（误差条形图）、Box-and-Whisker_Plot（箱线图）、Violin_Chart（小提琴图）、Ridgeline_Plot（山脊线图）、Beeswarm_Plot（分簇散点图）、stem_leaf（茎叶图） |\n| **地理类** GEOSPATIAL | Flow_Map（动态流向图）、Dot_Density_Map（点密度地图）、Choropleth_Map（面量图） |\n| **关系类** RELATIONSHIP | Scatter_Plot（散点图）、Bubble_Plot（气泡图）、Radar_Charts（雷达图）、Chord_Diagram（弦图）、Arc_Chart（弧图）、Network_Diagram（网络图）、Parallel_Coordinates_Plot（平行坐标图） |\n| **占比类** PART-TO-WHOLE | Treemap（矩形树图）、Sunburst_Diagram（旭日图）、Nightingale_Chart（南丁格尔玫瑰图）、Pie_Chart（饼图） |\n\n系统会根据查询结果自动推荐最合适的图表。\n\n![Auto Generated](Images\u002FAuto_generated_image.png)\n\n---\n\n\n## 4️⃣ SSE 流式分析体验\n\n分析过程实时可见：\n\n```text\n[1\u002F4] 正在读取数据结构...\n[2\u002F4] 正在生成 SQL...\n[3\u002F4] 正在执行查询...\n[4\u002F4] 正在生成图表与洞察...\n```\n\n相比传统 BI 工具，更透明、更具交互感。\n\n---\n\n## 5️⃣ 多模型兼容\n\n支持：\n- DeepSeek\n- OpenAI\n- Claude\n- 任意 OpenAI SDK Compatible API\n\n支持自定义：\n\n- `base_url`\n- `model`\n- `api_key`\n\n默认配置：\n\n| Provider | Default Model |\n|---|---|\n| DeepSeek | `deepseek-chat` |\n| OpenAI | `gpt-4o-mini` |\n| Anthropic | `claude-3-5-haiku-20241022` |\n\n## 6️⃣ 数据分析\n目前支持的数据分析功能：\n- 异常值处理（截尾、缩尾处理）\n- 十分位分组分析\n- K-Means聚类分析\n- 决策树建模\n\n![Analyze](Images\u002FAnalyze.png)\n\n---\n\n## 7️⃣ 报告生成功能\n支持导出：\n- 整理后的Excel表格\n- docx格式报告\n- 内置风格PPT\n\n![Output](Images\u002FOutput.png)\n\n---\n\n## 8️⃣MCP拓展\n**支持连接本地或远程MCP，拓展Agent技能**\n![MCP](Images\u002FMCP1.png)\n\n- 教程：[MCP_tutorial](Information\u002FMCP_tutorial.md)\n\n---\n\n## 9️⃣知识库输入\n支持上传业务知识，让Agent更加了解你的数据\n![repository](Images\u002Frepository2.png)\n\n- 教程：[repository_tutorial](Information\u002Frepository_tutorial.md)\n---\n\n## ⚙️安装方式\n\n### 方式 1：安装包下载（推荐）\n\n#### 1) 下载压缩包 \n\n![Download installation package](Images\u002Fpackage.png)\n\n#### 2) 解压缩，在项目目录下双击直接运行：\n**Windows 用户**\n\n```bat\nstart.bat\n```\n\n> 注：首次启动 `start.bat` 会自动配置运行环境，时间可能较长，后续再次运行就无需等待。\n\n**Mac 用户**\n\n① 需要使用脚本 `start.command`\n\n② 在终端（按 Command + 空格，输入 Terminal回车）里赋予执行权限：\n   ```bash\n   chmod +x start.command\n   ```\n\n③ 双击 `start.command` 即可运行\n> 注：首次运行可能会被 macOS 安全策略阻止，解决方法： 右键点击 start.command → 选择“打开” → 再次确认“打开” 或在终端执行：xattr -d com.apple.quarantine start.command\n\n\n#### 2) 解压缩，命令行运行（备份方法）\n**① Windows：**\n\n进入项目目录（也可以直接在项目目录按住Shift右键打开Powershell）\n```bash\ncd ~\u002FData-Analysis-Agent（替换为你的真实路径）\n```\n\n安装依赖\n\n```bash\npip install -r requirements.txt\n```\n\n启动服务\n\n```bash\npython app.py\n```\n\n**② Mac**\n\n进入项目目录（按 Command + 空格，输入 Terminal回车）\n```bash\ncd ~\u002FData-Analysis-Agent（替换为你的真实路径）\n```\n\n安装依赖\n```bash\npip3 install -r requirements.txt\n```\n\n启动服务\n```bash\npython3 app.py\n```\n\n\n#### 3) 浏览器打开`http:\u002F\u002Flocalhost:5001`\n\n注：此地址为本机地址，不会泄露信息，请放心使用\n\n![Download installation package2](Images\u002Fpackage2.png)\n\n#### 4) 配置API key\n\n![Configure the API3](Images\u002FDeepseek3.png)\n\n#### 5) 后续更新\n\n![Update](Images\u002FUpdate.png)\n\n注：更新前请先重启\n\n---\n### 方式 2：一键安装 + 启动（还在测试，不稳定）\n\n#### 1) Windows（PowerShell）\n\n```powershell\niwr -useb https:\u002F\u002Fraw.githubusercontent.com\u002FZafer-Liu\u002FData-Analysis-Agent\u002Fmain\u002Finstall.ps1 | iex\n```\n\n安装完成后可用以下方式启动：\n\n- 双击运行（Windows）：\n  ```bat\n  %USERPROFILE%\\data-analysis-agent.bat\n  ```\n- 或进入目录手动启动：\n  ```powershell\n  cd $env:USERPROFILE\\.data-analysis-agent\\Data-Analysis-Agent\n  .\\.venv\\Scripts\\activate\n  python app.py\n  ```\n\n#### 1) macOS \u002F Linux（Shell）\n\n```bash\ncurl -fsSL https:\u002F\u002Fraw.githubusercontent.com\u002FZafer-Liu\u002FData-Analysis-Agent\u002Fmain\u002Finstall.sh | sh\n```\n\n安装完成后启动：\n\n```bash\ndata-analysis-agent\n```\n\n如果提示 `command not found`，请先把 `~\u002F.local\u002Fbin` 加入 PATH（写入 `~\u002F.bashrc` 或 `~\u002F.zshrc`）：\n\n```bash\nexport PATH=\"$HOME\u002F.local\u002Fbin:$PATH\"\n```\n\n#### 2) 浏览器打开（同方式 1）\n\n#### 3) 配置API key（同方式 1）\n\n#### 4) 后续更新（同方式 1）\n\n\n---\n### 方式 3：通过 GitHub 安装（命令行）\n\n#### 1) 克隆仓库\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002FZafer-Liu\u002FData-Analysis-Agent.git\n```\n\n#### 2) 进入项目目录\n\n```bash\ncd Data-Analysis-Agent\n```\n\n#### 3）安装依赖\n\n```bash\npip install -r requirements.txt\n```\n\n#### 4）启动服务\n\n```bash\npython app.py\n```\n\n#### 5) 浏览器打开（同方式 1）\n\n#### 6) 配置API key（同方式 1）\n\n#### 7) 后续更新（同方式 1）\n\n---\n\n# 🛠 斜杠命令 \n\n| Command | Status | Description |\n|---|---|---|\n| `\u002Fchart` | ✅ | 强制优先生成图表 |\n| `\u002Fsql` | ✅ | 直接执行 SQL |\n| `\u002Fanalyze` | ✅ | 深度统计分析 |\n| `\u002Ftree` | ✅ | 决策树分析 |\n| `\u002Fkmeans` | ✅ | K-Means 聚类分析 |\n| `\u002Fdata` | ✅ | 数据探查与预览 |\n| `\u002Finset` | ✅ | 缺失值插补处理 |\n| `\u002Fwinsorize` | ✅ | 缩尾处理（极值替换） |\n| `\u002Ftrimming` | ✅ | 截尾处理（极值剔除） |\n| `\u002Fexport` | ✅ | 导出数据文件 |\n| `\u002Freport` | ✅ | 导出 Word\u002FPDF 报告 |\n| `\u002Fppt` | ✅ | 导出 PPT 演示文稿 |\n| `\u002Fstatus` | ✅ | 查看任务状态 |\n\n---\n\n# 📈 使用示例\n\n## 示例 1：趋势分析\n\n用户输入：\n\n```text\n最近 12 个月销售趋势\n```\n\n系统输出：\n\n- SQL 查询\n- 趋势折线图\n- 销售增长分析\n\n---\n\n## 示例 2：区域分析\n\n用户输入：\n\n```text\n哪个地区利润最高？\n```\n\n系统输出：\n\n- 地区利润排行\n- 柱状图\n- 区域经营洞察\n\n---\n\n## 示例 3：图表优先模式\n\n用户输入：\n\n```text\n\u002Fchart 用户增长情况\n```\n\n系统会优先生成可视化图表。\n\n---\n\n# ⚙️ 配置说明\n\n## LLM 配置\n\n在侧边栏 ⚙ 中填写：\n\n```text\nAPI Key\nBase URL\nModel\n```\n\n即可切换模型。\n\n---\n\n# 🗺️ 项目里程碑\n\n## 版本更新日志\n**当前版本 v3.0**\n\n本次升级聚焦于 **外部生态集成与业务知识增强**，大幅拓展了 Agent 的数据接入能力和领域适应能力。\n\n### 1. MCP 工具调用能力\n- 新增 MCP（Model Context Protocol）协议支持，Agent 可动态调用外部 MCP 工具\n- 支持调用计算器、代码执行器、第三方 API 封装工具等，扩展分析能力边界\n- 通过标准化协议，可接入符合 MCP 规范的任意工具生态\n- 工具调用过程自动记录至日志，便于调试和审计\n\n### 2. 业务知识库集成\n- 新增业务数据库功能，支持导入企业内部的业务资料、产品文档、行业报告等\n- 自动对资料进行向量化处理，构建可检索的知识库\n- Agent 在执行分析时会自动检索相关知识，提升对特殊业务场景的理解和洞察能力\n- 支持多种格式：Word、Excel等，满足常见文档导入需求\n\n### 3. 数据源扩展：Google Sheets 与自定义 API\n- **Google Sheets API 集成**：支持直接读取 Google Sheets 中的数据作为分析源\n- **自定义数据库 API 接口**：提供通用 API 适配器\n- 所有外部数据源接入后均可使用数据清洗、预览、分析等全套功能\n\n## 详细更新日志\n- [Version_Update_Log](Information\u002FVersion_Update_Log.md)\n- [Version_Update_Log_EN](Information\u002FVersion_Update_Log_EN.md)\n\n---\n\n# ❓ FAQ\n\n## Q：提示未配置 LLM？\n\nA: 在侧栏 ⚙ 中填写 API Key 并保存。\n\n## Q：如何获取API Key？\nA: 这里以Deepseek为例，步骤如下：\n\n![Configure the API1](Images\u002FDeepseek1.png)\n\n![Configure the API2](Images\u002FDeepseek2.png)\n\n![Configure the API3](Images\u002FDeepseek3.png)\n\n## Q：图表链接重启后失效？\n\nA: 生成的图表储存在本地内容*\\outputs\\charts目录下\n\n\n## Q：如何连接SQL数据库？\n\nA: 请使用下面格式连接 `mysql+pymysql:\u002F\u002F用户名:密码@主机:端口\u002F数据库名`\n\n- 报错写法：mysql:\u002F\u002Fuser:pass@host:3306\u002Fdbname \n- 正确写法：mysql+pymysql:\u002F\u002Fuser:pass@host:3306\u002Fdbname\n---\n\n# 🚀 寻找一起改变世界的 Contributor\n\n一个好的开源项目，从来不是一个人的独角戏。  \n我们正在打造一个**能真正应对复杂业务场景**的数据工具——它需要在海量数据中极速穿梭，在多表逻辑间游刃有余，在可视化看板上洞察先机。  \n而现在，我们遇到了几个极富挑战、也极能体现技术价值的问题。如果你热爱解决“硬核”问题，这里正需要你：\n\n---\n\n### 急需你一起来攻克这些难题：\n- **海量数据输入下如何实现快速转换** —— 当数据洪流涌来，如何让转换毫秒级响应？\n- **多 Sheets 场景下的表间逻辑判断优化** —— 如何智能梳理几十张表之间的依赖与计算？\n- **可视化看板的交互与性能优化** —— 让数据故事讲得更流畅、更直观、更震撼。\n- **特殊业务场景下的模型能力提升** —— 那些通用工具搞不定的边缘业务，正是我们的战场。\n- **远程服务器调用** —— 搭建远程GPU调用框架。\n---\n\n### 为什么值得你加入？\n\n- 你将直面**真实、有深度、非玩具级**的技术挑战\n- 你的代码会直接影响**一线业务用户**的工作效率\n- 自由贡献，灵活协作——提 PR 或直接沟通，完全由你\n- 优秀 Contributor 将有机会成为项目 Committer\n\n---\n\n### 如何加入？\n\n- 直接 **Pull Request**，我们会在 24 小时内 review\n- 或联系邮箱：`rusboldtshanti34@gmail.com`（请备注“Contributor+擅长方向”）\n---\n\n# 📄 License\n\nApache License 2.0\n\n---\n\n# ⭐ 项目目标\n\n让商业分析像聊天一样简单。\n\n\n\n","Zafer-Liu\u002FData-Analysis-Agent 是一个面向商业分析师的智能数据分析工具，旨在通过自然语言处理技术简化数据分析流程。其核心功能包括数据结构识别、SQL自动生成与执行、图表生成及业务洞察分析等，并支持多种数据源（如Excel\u002FCSV文件和主流数据库）。项目采用Python 3.8+、Flask作为后端框架，利用Plotly进行可视化展示，并兼容OpenAI等大语言模型。它特别适合需要快速获取数据洞察但缺乏专业编程技能的企业用户或个人使用，在日常运营监控、市场趋势分析等领域展现出强大效能。","2026-06-11 03:32:13","CREATED_QUERY"]