
Qwen3.6-27B-AEON-Ultimate-Uncensored-DFlash
AEON-7
Lossless abliteration of Qwen3.6-27B with NVFP4 hardware quantization for DGX Spark / Blackwell. BF16 (51 GB) + NVFP4 (26 GB) deployment guide, docker-compose, and QuickStart.
AI 简介
该项目是对Qwen3.6-27B模型进行无损压缩和性能增强的版本,特别针对NVFP4硬件量化进行了优化,适用于DGX Spark/Blackwell平台。核心功能包括使用BF16(51GB)和NVFP4(26GB)格式部署模型,提供了详细的部署指南、docker-compose配置以及快速启动脚本。通过这些技术手段,项目实现了在单流解码速度上相比原始基线提升了约258%,显著提高了模型在编码、数学计算、推理等任务中的响应速度。适合需要高性能大语言模型处理能力且资源受限的企业级应用场景。
Python
Apache License 2.0274
Stars
28
Forks
5
Watchers
6
Issues
Star 增长
今日+10
近 7 天+17
近 30 天+110
综合评分82.89
默认分支main