
以下是关于seq2seq模型、Transformer以及机器翻译的一点小记。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
seq2seq模型,顾名思义,指的是一种模型架构,其核心特点在于它既接受一个序列作为输入,也产生一个序列作为输出。该模型的结构通常采用Encoder-Decoder的形式,如图所示。其中,Encoder和Decoder都依赖于循环神经网络(RNN)的实现。具体而言,Encoder的隐藏状态就代表了语义编码,囊括了Encoder提取的所有语义信息,并随后作为Decoder的输入,最终由Decoder生成所需的输出结果。在训练和预测过程中,这种方式通常被采用。以下是该结构的详细描述:实现方式采用encoder-decoder的架构如下:
全部评论 (0)
还没有任何评论哟~


