
Pointer Network与注意力机制
5星
- 浏览量: 0
- 大小:None
- 文件类型:PDF
简介:
Pointer Network是一种基于序列到序列模型的架构,利用注意力机制来执行需要生成精确数据位置的任务,如路径优化和机器翻译中的指针指向。
模型通过标签得知 (x1, y1) 对应的值是最大的,并学习到这样的概率分布。这里直接将注意力机制(attention)的权重视为输出的概率分布。
把 (x1, y1) 作为输入,生成新的 z1 ,进而产生新的注意力权重。
当结束时,注意力权重中对应 END 的值最大。
另一个应用示例:pointer network 可用于文本摘要。
没有使用 pointer network 的情况是解码器会独立地创建关键词,并重新构建编码信息。
全部评论 (0)
还没有任何评论哟~


