microsoft

unilm

microsoft

Large-scale Self-supervised Pre-training Across Tasks, Languages, and Modalities

AI 简介

微软的unilm项目致力于大规模自监督预训练模型的研究,涵盖了多种任务、语言和模态。该项目的核心功能包括开发新的基础架构以增强模型的通用性、能力和训练稳定性,例如DeepNet可以扩展Transformer至1000层以上,BitNet则提出了一种1-bit Transformer用于大型语言模型。此外,它还推出了Kosmos系列等多模态大语言模型,能够处理文本、图像、音频等多种数据类型。这些技术特点使得unilm非常适合需要跨语言、跨模态处理的应用场景,如文档智能分析、多语言翻译以及综合性的AI助手开发。

Python
MIT License
22.1k
Stars
2.7k
Forks
297
Watchers
642
Issues

Star 增长

今日+2
近 7 天+12
近 30 天+32
综合评分73.2
默认分支master