wadeKeith

autoresearch-qwen

wadeKeith

Autonomous Qwen3-VL training-code research on the official DocVQA benchmark. main: NVIDIA multi-GPU, mlx: Apple Silicon/MPS.

AI 简介

autoresearch-qwen 是一个用于在官方DocVQA基准上自主改进Qwen3-VL-4B-Instruct视觉语言模型的研究项目。该项目通过让代理迭代修改`train.py`文件、运行训练并基于完整的验证集测量结果,从而实现模型性能的持续提升。它支持NVIDIA多GPU(使用`torchrun`和DeepSpeed配置)以及Apple Silicon/MPS硬件环境,适合需要对特定视觉语言模型进行高效实验循环的研究者或开发者使用。MIT许可证下开源,已有209个星标和33次分叉,表明其在社区内具有一定的认可度与实用性。

Python
MIT License
211
Stars
33
Forks
24
Watchers
0
Issues

Star 增长

今日0
近 7 天+1
近 30 天+2
综合评分45.29
默认分支main