[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"project-80984":3},{"id":4,"name":5,"fullName":6,"owner":7,"repo":5,"description":8,"homepage":9,"htmlUrl":9,"language":10,"languages":9,"totalLinesOfCode":9,"stars":11,"forks":12,"watchers":11,"openIssues":12,"contributorsCount":12,"subscribersCount":12,"size":12,"stars1d":12,"stars7d":12,"stars30d":12,"stars90d":12,"forks30d":12,"starsTrendScore":12,"compositeScore":13,"rankGlobal":9,"rankLanguage":9,"license":14,"archived":15,"fork":15,"defaultBranch":16,"hasWiki":17,"hasPages":15,"topics":18,"createdAt":9,"pushedAt":9,"updatedAt":19,"readmeContent":20,"aiSummary":21,"trendingCount":12,"starSnapshotCount":12,"syncStatus":22,"lastSyncTime":23,"discoverSource":24},80984,"baidu-search-skill","valenovo\u002Fbaidu-search-skill","valenovo","面向 AI Agent 的百度 API 搜索 Skill，基于百度 AI Search \u002F 百度百科 API，需百度 API Key",null,"Python",30,0,40,"MIT License",false,"main",true,[],"2026-06-12 04:01:31","# Baidu API Search Skill\n\n简体中文 | [English](README.en.md)\n\n给 AI Agent 用的百度 API 搜索 Skill。它把百度 AI Search API 和百度百科 API 整理成一个“先拿来源、再让模型分析”的搜索流程，适合需要中文网页资料的 agent。\n\n这个项目不是爬虫，也不是生成答案接口。它的重点是保留原始搜索结果、去重、整理成 research pack，让 agent 在回答前有资料可看、有来源可引用。\n\n## 适合什么场景\n\n- 给 Codex、Claude Code、Cursor 等支持本地 Skills 的 agent 增加中文搜索能力\n- 查询中文网页、产品口碑、近期热点、项目资料、平台讨论\n- 简单实体问题先走百度百科，减少不必要的网页搜索\n- 需要保留原始搜索结果，方便后续 AI 分析和人工复查\n\n不适合的场景：\n\n- 大规模采集网页正文\n- 绕过搜索引擎限制\n- 把百度作为海外官方资料的唯一来源\n- 直接生成无来源的最终答案\n\n## 功能\n\n- 调用百度 AI Search `web_search`\n- 调用百度百科做轻量实体查询\n- 自动规划多个搜索词，覆盖产品、事件、项目、普通资料查询\n- 根据覆盖情况和重复率自适应停止，避免无意义消耗\n- URL 去重和近似重复结果合并\n- 输出适合 agent 阅读的 `research_pack.md`\n- 本地缓存重复查询\n- 支持多个 API Key 做失败切换和额度隔离\n\n## 环境要求\n\n- Python 3.10+\n- 百度 AI Search \u002F AppBuilder API Key\n- 能读取 `SKILL.md` 并运行本地 Python 脚本的 agent 环境\n\n脚本只使用 Python 标准库，不需要额外安装依赖。\n\n本项目需要百度 AI Search API Key 才能执行真实搜索。没有 Key 的用户请参考百度官方文档：\n\n- [百度搜索 API 文档](https:\u002F\u002Fcloud.baidu.com\u002Fdoc\u002Fqianfan-api\u002Fs\u002FWmbq4z7e5)\n- [API Key 创建与管理](https:\u002F\u002Fcloud.baidu.com\u002Fdoc\u002Fqianfan\u002Fs\u002Fwmh8l6tnf)\n- [API Key 认证鉴权](https:\u002F\u002Fcloud.baidu.com\u002Fdoc\u002Fqianfan-api\u002Fs\u002Fym9chdsy5)\n\n## 安装\n\n克隆仓库：\n\n```bash\ngit clone https:\u002F\u002Fgithub.com\u002Fvalenovo\u002Fbaidu-search-skill.git\ncd baidu-search-skill\n```\n\n把 Skill 复制到你的 agent skills 目录。\n\n项目级安装示例：\n\n```bash\nmkdir -p .codex\u002Fskills\ncp -r skills\u002Fbaidu-api-search .codex\u002Fskills\u002F\n```\n\nWindows PowerShell：\n\n```powershell\nNew-Item -ItemType Directory -Force .codex\\skills | Out-Null\nCopy-Item -Recurse skills\\baidu-api-search .codex\\skills\\\n```\n\n如果你的 agent 使用用户级 skills 目录，把 `skills\u002Fbaidu-api-search` 复制到对应目录即可。\n\n## 配置 API Key\n\n把百度 API Key 放到环境变量里：\n\n```bash\nexport BAIDU_AI_SEARCH_API_KEYS=\"your-key\"\n```\n\nWindows PowerShell：\n\n```powershell\n$env:BAIDU_AI_SEARCH_API_KEYS = \"your-key\"\n```\n\n多个 Key 用英文逗号分隔：\n\n```bash\nexport BAIDU_AI_SEARCH_API_KEYS=\"key1,key2,key3\"\n```\n\n多个 Key 只用于失败切换和额度隔离，不会把同一个关键词分页翻完，也不应该用来绕过官方限制。\n\n不要把真实 Key 写进配置文件、README、Prompt、日志或 Git 提交里。\n\n## 快速使用\n\n进入 Skill 目录：\n\n```bash\ncd skills\u002Fbaidu-api-search\n```\n\n普通中文网页搜索：\n\n```bash\npython scripts\u002Fsearch.py \"新能源汽车 口碑\" --mode normal\n```\n\n简单实体查询，优先走百度百科：\n\n```bash\npython scripts\u002Fsearch.py \"量子计算\" --mode lookup\n```\n\n查询最近或当前信息，建议关闭缓存：\n\n```bash\npython scripts\u002Fsearch.py \"新能源汽车 口碑\" --mode normal --freshness year --no-cache\n```\n\n只检查请求体，不真正调用 API：\n\n```bash\npython scripts\u002Fbaidu_web_search.py --query \"新能源汽车 口碑\" --top-k 50 --dry-run\n```\n\n## 模式说明\n\n| 模式 | 适合场景 | 消耗 |\n| --- | --- | --- |\n| `lookup` | “这是什么”“这个人是谁”等实体问题 | 通常 1-2 次 API 调用 |\n| `fast` | 快速找一批来源 | 1 个搜索词，低延迟 |\n| `normal` | 默认模式，适合普通问答和一轮资料检索 | 最多规划 12 个搜索词，覆盖够了会提前停 |\n| `deep` | 用户明确要求深度、全面、多角度 | 更高预算，会做结果驱动扩展 |\n\n建议默认用 `normal`。只有用户明确要求深度覆盖时再用 `deep`。\n\n## 输出文件\n\n每次运行会在 `runs\u002F` 下生成一个目录：\n\n```text\nruns\u002F\u003Ctimestamp>-\u003Cmode>-\u003Ctopic>\u002F\n├── query_plan.json\n├── raw_results.jsonl\n├── deduped_sources.json\n├── research_pack.md\n├── run_summary.json\n├── adaptive_trace.json\n└── errors.jsonl\n```\n\n一般让 agent 按这个顺序读：\n\n1. `run_summary.json`\n2. `research_pack.md`\n3. 需要核查细节时再读 `raw_results.jsonl`\n\n`research_pack.md` 会列出来源 ID、URL、域名、命中的搜索词、摘要、重复信息和覆盖缺口。\n\n## 推荐给 Agent 的指令\n\n如果你的 agent 同时有通用 `web_search` 工具，建议在 workspace 或系统指令里加一句：\n\n```text\n中文网页搜索、百度百科查询、最近\u002F最新\u002F热点类中文问题，以及用户说“查一下”“搜索”“联网查”时，优先使用 baidu-api-search skill，而不是 generic web_search。回答事实性结论时引用 research_pack.md 里的 source_id 或 URL。\n```\n\n这一步很重要。很多 agent 会优先调用框架自带的通用搜索工具，明确指令能提高自动触发率。\n\n## 限制\n\n- 当前流程里，百度 AI Search 单次查询 `top_k` 上限按 50 处理。\n- 脚本主要收集搜索结果、摘要和结构化引用，不抓取完整网页正文。\n- 百度更适合中文网页覆盖；海外官方资料建议配合其他搜索源。\n- 搜索结果里可能有低质量页面、重复页面、推广内容或二手信息。Skill 会做基础标记，但最终判断仍需要 agent 或用户完成。\n\n## 安全说明\n\n- API Key 只从环境变量读取。\n- Key 不会写入运行输出或缓存。\n- `runs\u002F`、`cache\u002F`、`.env` 等本地文件已加入 `.gitignore`。\n- 缓存命中时会标记为 `key_id: \"cache\"`。\n\n## 项目结构\n\n```text\nskills\u002Fbaidu-api-search\u002F\n├── SKILL.md\n├── agents\u002Fopenai.yaml\n├── scripts\u002F\n└── references\u002F\n```\n\n## License\n\nMIT\n","这个项目是一个面向AI Agent的百度API搜索Skill，基于百度AI Search和百度百科API，需要用户提供百度API Key。其核心功能包括调用百度AI Search进行网页搜索、使用百度百科进行轻量实体查询、自动规划多个搜索词以覆盖不同类型的查询需求，并对结果去重及整理成适合Agent阅读的研究资料包。该Skill适用于需要中文网页资料支持的场景，例如增强Codex、Claude Code等本地Skills的中文搜索能力，或用于查询产品口碑、近期热点信息等。此外，它还特别适合那些希望保留原始搜索结果以便后续分析或人工复查的应用场合。",2,"2026-06-11 04:03:04","CREATED_QUERY"]