更深入透彻!清华发表最新综述,分析破解神经机器翻译三大难题

Evelyn Zhang

机器翻译(MT)是自然语言处理领域的一个重要分支,旨在利用计算机翻译自然语言。近年来,端到端神经机器翻译(NMT)取得了巨大的成功,已成为实际机器翻译系统中新的主流方法。

在他们的最新综述中,清华大学多位作者首先对深度学习的神经机器翻译技术(neural machine translation,简称 NMT)的方法进行了广泛的回顾,并重点介绍了与体系结构、解码和数据增强相关的方法。然后总结了可供研究者参考的资源和工具。最后,对未来可能的研究方向进行了讨论。

1

论文资料显示,清华大学计算机系教授、欧洲科学院外籍院士孙茂松与清华智能产业研究院副院长、国家杰青刘洋是该论文的两位教师作者。

作为一种数据驱动的机器翻译方法,NMT还包含了概率框架。从数学上讲,NMT的目标是在给定数据集的情况下估计一个未知的条件分布,其中和分别是表示源输入和目标输出的随机变量。他们在论文中回答了NMT遇到的三个基本问题:

建模(modeling)。如何设计神经网络来模拟条件分布?

推理(inference)。给定一个源输入,如何从NMT模型生成翻译句子?

学习(learning)。如何有效地从数据中学习NMT所需的参数?

在这篇综述中,他们首先描述了NMT解决上述三个问题的基本方法。然后,深入讨论NMT架构的细节。他们引入了非自回归NMTs和双向推断,并讨论了替代训练目标和使用单语数据。

译/前瞻经济学人APP资讯组

参考资料:https://www.sciencedirect.com/science/article/pii/S2666651020300024

可行性研究报告

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读

精彩推荐