Sim2Reason

Sim2Reason: Solving Physics Olympiad via Reinforcement Learning on Physics Simulators. We present a method for turning physics simulators into scalable generators of question–answer pairs for improving LLM physical reasoning.

AI 简介

Sim2Reason 是一个利用物理仿真器自动生成物理推理问答对以增强大语言模型（LLM）物理推理能力的研究框架。其核心是通过领域特定语言（DSL）控制仿真随机化过程，结合强化学习在仿真环境中生成结构化、可解释的物理问题与答案，并支持零样本迁移至真实物理竞赛题（如国际物理奥赛IPhO）。项目不依赖人工标注，显著缓解物理领域高质量QA数据稀缺问题，适用于物理教育、AI推理能力评测及科学AI训练数据构建等场景。