xjdr-alt

entropix

xjdr-alt

Entropy Based Sampling and Parallel CoT Decoding

AI 简介

entropix 是一个基于熵的采样和并行思维链解码的研究项目。该项目利用熵来进行上下文感知采样,从而在推理时间计算中获得更优的结果,模拟类似o1的CoT或Anthropic的<antThinking>功能。其核心在于通过熵值指导的采样器以及未来的用户界面设计,支持单GPU(如4090)及苹果Metal环境下的本地研究与小模型测试,并计划扩展至多GPU(最高8xH100/TPU v4-16)部署以适应更大规模模型的需求。适合于需要提升生成质量同时控制计算成本的自然语言处理应用场景,尤其是那些对模型输出多样性和准确性有较高要求的任务。

Python
Apache License 2.0
3.4k
Stars
321
Forks
70
Watchers
33
Issues

Star 增长

今日0
近 7 天+1
近 30 天+5
综合评分40.52
默认分支main