
深度学习初探之四:机器翻译、注意力机制与Seq2seq及Transformer模型
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
本篇文章介绍了深度学习在机器翻译领域的应用,包括注意力机制和Seq2seq模型,并深入探讨了Transformer模型的工作原理及其优势。
深度学习入门-4:机器翻译、注意力机制与Seq2seq模型及Transformer
一、机器翻译
1. 机器翻译的概念
2. 数据处理方法
3. 机器翻译的组成模块
(1)Encoder-Decoder框架(编码器-解码器)
(2)Sequence to Sequence模型
(3)集束搜索(Beam Search)
- 简单贪心搜索(greedy search)
- 维特比算法
二、注意力机制与Seq2seq模型
1. 注意力机制的引入
2. 注意力机制框架
3. 常用的两种注意力层
(1)点积注意力(The dot product )
(2)多层感知机注意力(Multilayer Perceptron Attention)
全部评论 (0)
还没有任何评论哟~


