
qwen3.6-windows-server
devnen
One-click Qwen3.6-27B inference on Windows. 158 tok/s on RTX 5090, 72 tok/s on RTX 3090. Native, no WSL, no Docker, no telemetry.
AI 简介
该项目提供了一键式在Windows上运行Qwen3.6-27B模型的推理服务。其核心功能包括本地部署、无需额外软件(如WSL、Docker)即可运行,支持RTX 5090和RTX 3090显卡,并且完全离线无数据回传,确保用户隐私。通过简单的解压和双击操作,用户就能在本地启动一个兼容OpenAI API的服务端,适用于需要高性能文本生成但又重视数据安全性的场景,比如个人开发者、小型企业或对隐私有高要求的研究机构。
Python
201
Stars
22
Forks
3
Watchers
7
Issues
Star 增长
今日+1
近 7 天+7
近 30 天+64
综合评分52.99
默认分支main