jadore801120

attention-is-all-you-need-pytorch

jadore801120

A PyTorch implementation of the Transformer model in "Attention is All You Need".

AI 简介

该项目是一个基于PyTorch实现的Transformer模型,源自论文《Attention is All You Need》。它采用自注意力机制而非传统的卷积或循环结构来处理序列到序列的任务,并在WMT 2014英德翻译任务中取得了顶尖性能。项目支持训练与使用已训练模型进行翻译,特别适用于自然语言处理中的机器翻译场景。尽管BPE相关部分仍在测试中,但此实现为研究者和开发者提供了一个强大的工具来探索自注意力机制及其在深度学习中的应用潜力。

Python
MIT License
9.7k
Stars
2.1k
Forks
91
Watchers
66
Issues

Star 增长

今日+1
近 7 天+3
近 30 天+21
综合评分71.56
默认分支master