SII-sc22mc

PA-BDM

SII-sc22mc

暂无描述

AI 简介

PA-BDM是一个基于Qwen2.5-VL和块扩散模型的文档识别模型,专注于文本、公式、表格和图表的识别。其核心功能包括因果块内去噪、基于置信度门控的结构损失(CSL)以及逐步前缀提交(PPC),这些技术旨在提高模型的结构一致性和推理速度。通过这些机制,PA-BDM解决了标准块扩散模型在解码过程中存在的两个主要瓶颈:全块完成前不生成令牌及双向块内去噪与从左到右块间生成之间的冲突。该模型适用于需要高效且准确地从文档中提取多种类型信息的应用场景,如学术论文解析、企业报告分析等。

Python
Apache License 2.0
41
Stars
0
Forks
38
Watchers
0
Issues

Star 增长

今日0
近 7 天0
近 30 天+3
综合评分37.3
默认分支main