
GLM-130B
zai-org
GLM-130B: An Open Bilingual Pre-Trained Model (ICLR 2023)
AI 简介
GLM-130B是一个开源的双语(英语和中文)预训练模型,拥有1300亿参数。该模型基于通用语言模型(GLM)算法进行训练,旨在支持在单台A100 (40G * 8)或V100 (32G * 8)服务器上的推理任务,并且通过INT4量化技术,可以在配置较低的硬件上运行而几乎不损失性能。GLM-130B具有出色的双语处理能力,在英文和中文的多项基准测试中表现优异,特别是在零样本学习场景下超越了多个现有大型模型。此外,它还支持快速推理以及跨平台部署,包括NVIDIA、Hygon DCU等。适合需要高性能双语自然语言处理的应用场景,如机器翻译、文本生成与理解等领域。
Python
Apache License 2.07.7k
Stars
603
Forks
91
Watchers
119
Issues
Star 增长
今日0
近 7 天0
近 30 天+2
综合评分34.54
默认分支main