
agentic-harness-engineering
china-qijizhifeng
Official AHE code — Agentic Harness Engineering: observability-driven automatic evolution of coding-agent harnesses (concurrent w/ meta-harness). NexAU-AHE reaches 84.7% ± 2.1 pass@1 on Terminal-Bench 2 (GPT-5.5). Lifts GPT-5.4 69.7→77.0% over 10 iters, beats Codex/ACE/Training-Free GRPO; frozen harness transfers to SWE-bench-Verified.
AI 简介
Agentic Harness Engineering (AHE) 是一个用于自动进化编码代理周围框架的可观察性系统。该项目的核心功能包括通过三个可观察性层(组件、经验和决策)来优化固定基础模型的外围组件,如系统提示、工具描述和实现等。AHE 利用 NexAU 将框架分解为七个正交文件级组件,并通过 Git 进行版本控制,确保每次修改都是可审计和可回滚的。此外,它还提供了一个代理调试器,能够将大量原始追踪数据提炼成层次化的报告,帮助优化器更好地理解并改进模型性能。AHE 适用于需要对现有 AI 编码助手进行持续优化以提升其在特定任务上表现的场景,特别是在软件工程验证等领域。
Python
MIT License538
Stars
61
Forks
2
Watchers
1
Issues
Star 增长
今日0
近 7 天+35
近 30 天+361
综合评分76.88
默认分支main