skillopt-qa

joshhu

Minimal faithful re-implementation of Microsoft SkillOpt: a text-space optimizer that trains a deployable natural-language skill for a frozen LLM agent on HotpotQA.

AI 简介

skillopt-qa 是 Microsoft SkillOpt 方法的轻量级、忠实复现，用于在不修改模型权重的前提下，为冻结的大型语言模型（LLM）Agent 学习可部署的自然语言技能。其核心是文本空间优化器：以初始技能文本为起点，通过调用外部 LLM（作为 optimizer）生成小幅度、有界编辑，并仅在验证集指标提升时接受更新，最终输出单一 Markdown 技能文件（best_skill.md）。项目专为多跳推理问答任务（HotpotQA）设计，依赖 OpenAI 兼容 API，无需 GPU 支持，适合资源受限环境下的 LLM Agent 能力增强与技能迭代场景。

Python

在 GitHub 查看

Stars

Forks

Watchers

Issues

Star 增长

今日0

近 7 天0

近 30 天0

综合评分39.71

默认分支master

skillopt-qa

Star 增长

加入交流群