[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-81492":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":8,"htmlUrl":8,"language":9,"languages":8,"totalLinesOfCode":8,"stars":10,"forks":11,"watchers":11,"openIssues":12,"contributorsCount":12,"subscribersCount":12,"size":12,"stars1d":12,"stars7d":12,"stars30d":13,"stars90d":12,"forks30d":12,"starsTrendScore":12,"compositeScore":14,"rankGlobal":8,"rankLanguage":8,"license":8,"archived":15,"fork":15,"defaultBranch":16,"hasWiki":17,"hasPages":15,"topics":18,"createdAt":8,"pushedAt":8,"updatedAt":19,"readmeContent":20,"aiSummary":21,"trendingCount":12,"starSnapshotCount":12,"syncStatus":11,"lastSyncTime":22,"discoverSource":23},81492,"spark-ai-copilot","r6z7ysn7yh-droid\u002Fspark-ai-copilot","r6z7ysn7yh-droid",null,"TypeScript",33,2,0,5,35.93,false,"main",true,[],"2026-06-12 04:01:34","# Spark AI Copilot\n\n一个面向数据工程师的 AI 智能助手，基于 Next.js 构建，专注于 Spark 作业诊断、数仓资产管理与 SQL 降本优化。\n\n## 功能\n\n### ✨ Spark 倾斜诊断\n- 自动解析 Spark Application ID，拉取 Stage 级物理指标（耗时、数据量、Task 分布）\n- 识别 7 大倾斜场景：JOIN 热点 Key、大小表 JOIN、NULL 值倾斜、GROUP BY 聚合倾斜、窗口函数 OOM、Count Distinct 长尾、小文件过载\n- 内置诊断引擎，结合日志\u002FSQL 输入与 mock 指标，自动推断最高优先级场景\n- 给出可落地的加盐改写 SQL、AQE 参数配置建议\n\n### 📚 数仓资产管家\n- 口径答疑：快速查找字段定义与业务口径\n- 数据链路探查：梳理上下游依赖关系\n- 基于知识图谱（Graph Refine）召回相关表，精准压缩上下文\n\n### 💰 智能 SQL 降本评审\n- 分析 SQL 计算资源消耗\n- 给出可执行的优化建议，降低集群成本\n\n## 技术栈\n\n- **框架**：Next.js 14 (App Router)\n- **语言**：TypeScript\n- **样式**：Tailwind CSS\n- **AI 接入**：Streaming Chat API（`\u002Fapi\u002Fchat`）\n- **知识库**：本地 JSON \u002F Markdown 文件（`public\u002Fknowledge\u002F`）\n\n## 快速开始\n\n```bash\n# 安装依赖\nnpm install\n\n# 启动开发服务器\nnpm run dev\n```\n\n访问 [http:\u002F\u002Flocalhost:3000](http:\u002F\u002Flocalhost:3000) 即可使用。\n\n## 项目结构\n\n```\n├── app\u002F\n│   ├── api\u002Fchat\u002F       # Streaming Chat API\n│   ├── page.tsx        # 主界面（技能选择 + 对话）\n│   └── layout.tsx\n├── components\u002F\n│   └── spark\u002F          # Spark 诊断面板组件\n├── hooks\u002F\n│   └── useChatHistory  # 会话历史管理\n├── lib\u002F\n│   ├── spark\u002F          # 诊断引擎、场景匹配、日志解析\n│   ├── mcp-engine.ts   # MCP 上下文引擎\n│   ├── security-shield.ts\n│   └── sql-sandbox.ts\n└── public\u002Fknowledge\u002F   # 本地知识库（SOP、参数预设、案例库）\n```\n","Spark AI Copilot 是一个专为数据工程师设计的智能助手，基于 Next.js 构建，主要功能包括 Spark 作业诊断、数仓资产管理以及 SQL 成本优化。该项目通过自动解析 Spark 应用程序 ID 来识别并解决如 JOIN 热点 Key 和 GROUP BY 聚合倾斜等常见问题，并提供相应的改写建议和参数配置；同时支持快速查找字段定义及业务口径，帮助理解复杂的数据链路；此外，它还能分析 SQL 的计算资源消耗情况，给出具体的成本节约方案。采用 TypeScript 编写，使用 Tailwind CSS 进行样式设计，并通过 Streaming Chat API 实现与 AI 的交互。适用于需要提高 Spark 任务效率、优化数据仓库管理和降低 SQL 执行成本的各种大数据处理场景。","2026-06-11 04:05:15","CREATED_QUERY"]