[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-80028":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":13,"openIssues":14,"contributorsCount":15,"subscribersCount":15,"size":15,"stars1d":14,"stars7d":16,"stars30d":17,"stars90d":15,"forks30d":15,"starsTrendScore":17,"compositeScore":18,"rankGlobal":9,"rankLanguage":9,"license":19,"archived":20,"fork":20,"defaultBranch":21,"hasWiki":22,"hasPages":20,"topics":23,"createdAt":9,"pushedAt":9,"updatedAt":24,"readmeContent":25,"aiSummary":26,"trendingCount":15,"starSnapshotCount":15,"syncStatus":16,"lastSyncTime":27,"discoverSource":28},80028,"paperwise","HJCheng0602\u002Fpaperwise","HJCheng0602","Deep-reading pipeline for research papers — LLM-powered reports, vector KB, and knowledge graph.",null,"Python",72,12,66,1,0,2,4,3.34,"MIT License",false,"main",true,[],"2026-06-12 02:03:57","# research-helper\n\n> 一个由 V4-Pro 级别模型驱动的论文阅读系统，产出结构化精读报告、领域综述与知识图谱。\n> \n> **不是把论文丢给 AI 问\"这篇讲了什么\"**——而是一套围绕长期知识积累设计的 pipeline：向量知识库消除幻觉，多路 LLM 调用保证深度，知识图谱追踪概念演进。\n\n---\n\n## 功能\n\n| 命令 | 功能 |\n|------|------|\n| `rh read --arxiv 2310.01234` | 精读单篇论文，生成 6 节结构化报告（中文） |\n| `rh read --pdf paper.pdf` | 同上，使用本地 PDF |\n| `rh survey --query \"KV Cache\"` | 检索 Arxiv，生成领域综述 |\n| `rh graph` | 从已读论文构建知识图谱（交互式 HTML + JSON） |\n| `rh kb search \"attention\"` | 在知识库中语义检索 |\n| `rh cost` | 查看 API 费用记录 |\n\n### 精读报告结构\n\n每篇报告由 **6 次独立 LLM 调用**生成，每节有最低字数要求：\n\n1. 研究问题与动机\n2. 核心方法（含公式、架构、设计动机）\n3. 实验设计与结果\n4. 与相关工作的比较（自动注入知识库上下文）\n5. 局限性与未来工作\n6. 个人评价与研究启发\n\n### 知识图谱\n\n`rh graph` 从所有已读报告中提取：\n\n- **概念节点**（方法、任务标签，如 *KV Cache*、*RoPE*）\n- **论文节点**\n- **边类型**：`uses`（论文→概念）、`similar_to`（向量相似度）、`builds_on \u002F compares_to \u002F contradicts`（从报告中提取）\n\n输出为可在浏览器中直接打开的交互式 HTML，以及可导入 Gephi 的 JSON。\n\n---\n\n## 快速开始\n\n从源码安装：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002F\u003Cyour-username>\u002Fresearch-helper\ncd research-helper\npip install -e .\n```\n\n复制配置文件并填入 API Key：\n\n```bash\ncp .env.example .env\n# 编辑 .env，填入 DEEPSEEK_API_KEY 等\n```\n\n读第一篇论文：\n\n```bash\nrh read --arxiv 1706.03762   # Attention Is All You Need\n```\n\n---\n\n## 配置\n\n所有配置通过 `.env` 文件或环境变量设置，参见 [`.env.example`](.env.example)。\n\n### LLM 提供商\n\n| 提供商 | `LLM_PROVIDER` | 推荐模型 | 获取 Key |\n|--------|---------------|----------|----------|\n| DeepSeek | `deepseek` | `deepseek-v4-flash` | [platform.deepseek.com](https:\u002F\u002Fplatform.deepseek.com) |\n| Qwen | `qwen` | `qwen-plus` | [dashscope.aliyuncs.com](https:\u002F\u002Fdashscope.aliyuncs.com) |\n| OpenAI | `openai` | `gpt-4o` | [platform.openai.com](https:\u002F\u002Fplatform.openai.com) |\n| Anthropic | `anthropic` | `claude-sonnet-4-6` | [console.anthropic.com](https:\u002F\u002Fconsole.anthropic.com) |\n\n### 向量嵌入（知识库）\n\n优先级：`EMBEDDING_PROVIDER` 环境变量 → 有 `QWEN_API_KEY` 则用 Qwen → 有 `OPENAI_API_KEY` 则用 OpenAI → 本地 `sentence-transformers`（无需 Key，首次运行自动下载模型）。\n\n---\n\n## 成本参考\n\n以 DeepSeek v4-flash 为例，精读一篇论文约 **$0.002–0.005**，综述约 **$0.001–0.003**。\n\n---\n\n## 项目结构\n\n```\nresearch_helper\u002F\n├── cli.py              # Click CLI 入口\n├── config.py           # 配置与定价表\n├── llm\u002Fclient.py       # 多提供商 LLM 客户端\n├── readers\u002F\n│   ├── arxiv_reader.py # Arxiv 元数据 + PDF 下载\n│   └── pdf_reader.py   # PDF 文本提取（pymupdf + pdfplumber）\n├── reports\u002F\n│   ├── single_paper.py # 精读报告生成（6 节 × 独立调用）\n│   └── survey.py       # 领域综述生成\n├── kb\u002F\n│   ├── store.py        # ChromaDB 向量知识库\n│   ├── embedder.py     # 多提供商 embedding\n│   └── graph.py        # 知识图谱构建与导出\n└── utils\u002F\n    ├── cache.py        # 中间结果缓存\n    └── cost_tracker.py # API 费用追踪\n```\n\n---\n\n## 致谢\n\n本项目由 **[Claude Sonnet 4.6](https:\u002F\u002Fanthropic.com)** 协助设计与实现。\n\nReports generated by this tool are authored with the assistance of large language models (DeepSeek \u002F Qwen \u002F Claude). The pipeline design, prompts, knowledge base architecture, and graph construction logic were developed in collaboration with Claude Code.\n\n---\n\n## License\n\nMIT\n","paperwise 是一个专为研究论文设计的深度阅读系统，能够生成结构化精读报告、领域综述和知识图谱。其核心功能包括通过多轮大语言模型调用生成详细的论文分析报告，构建基于向量的知识库以消除幻觉，并利用知识图谱追踪概念的发展。特别适用于需要深入理解和积累特定领域知识的研究人员或学生。项目支持多种LLM提供商（如DeepSeek、Qwen等），并提供灵活的成本控制选项，确保用户可以根据自身需求选择合适的配置。","2026-06-11 03:58:57","CREATED_QUERY"]