#alternate * 慕课网 首页 * 免费 课程 * 实战 课程 * 就业 班 * 猿问 * 手记 * 猿聘 分享 赚 学费 下载 APP 慕课网 浏览器 - PC 客户端 Windows 版 Mac 版 开发 中 , 敬请 期待 … 慕课网 APP - 随时随地 学 编程 [ appload.png ] App Store 下载 Android 下载 扫描 下载 慕课网 APP 购物车 0 * 登录 / 注册 写 文章 动态圈 ____________________ 为了 账号 安全 , 请 及时 绑定 邮箱 和 手机 立即 绑定 ( BUTTON ) * ( BUTTON ) 推荐 评论 收藏 点击 这里 , 将 文章 分享 到 自己 的 动态 手记 / 人工 智能 让 翻译 人员 恐慌 的 机器 翻译 系统 ( 附 试用 地址 ) 2018.04.21 16:00 548 浏览 今天 , 微软 研究 团队 宣布 其 研发 的 机器 翻译 系统 在 通用 新闻 报道 测试 集 newstest2017 的 中 - 英 测试 集上 达到 了 人类 水平 。 这个 系统 模型 包含 了 由 微软 亚洲 研究院 研发 的 对偶 学习 、 推敲 网络 、 联合 训练 和 一致性 规范 技术 。 机器 翻译 是 自然 语言 处理 领域 最 具 挑战性 的 研究 任务 之一 , 我们 相信 新 技术 的 应用 会 让 机器 翻译 的 结果 日臻 完善 , 并且 催生 更多 人工 智能 技术 应用 的 突破 。 由 微软 亚洲 研究院 与雷德蒙 研究院 的 研究 人员 组成 的 团队 今天 宣布 , 其 研发 的 机器 翻译 系统 在 通用 新闻 报道 测试 集 newstest2017 的 中 - 英 测试 集上 , 达到 了 可 与 人工 翻译 媲美 的 水平 。 这 是 首 个 在 新闻 报道 的 翻译 质量 和 准确率 上 可以 比肩 人工 翻译 的 翻译 系统 。 https : //img.mukewang.com/5adaef490001526910800567.jpg newstest2017 新闻 报道 测试 集由 产业界 和 学术界 的 合作 伙伴 共同 开发 , 并 于 去年 秋天 在 WMT 17 大会 上 发布 。 为了 确保 翻译 结果 准确 且 达到 人类 的 翻译 水平 , 微软 研究 团队 邀请 了 双语 语言 顾问 将 微软 的 翻译 结果 与 两 个 独立 的 人工 翻译 结果 进行 了 比较 评估 。 微软 技术 院士 , 负责 微软 语音 、 自然 语言 和 机器 翻译 工作 的 黄学东 称 , 这 是 对 自然 语言 处理 领域 最 具 挑战性 任务 的 一 项 重大 突破 。 “ 在 机器 翻译 方面 达到 与 人类 相 同 的 水平 是 所有 人 的 梦想 , 我们 没有 想到 这么 快 就 能 实现 。 ” 他 表示 , “ 消除 语言 障碍 , 帮助 人们 更 好 地 沟通 , 这 非常 有 意义 , 值得 我们 多年来 为此 付出 的 努力 。 ” https : //img.mukewang.com/5adaef 69000165d910800608.jpg 微软 技术 院士 黄学东 回顾 黄学东 演讲 : 黄学东 揭秘 : 微软 是 怎样 在 对话 语音 识别 上 取得 媲美人 的 水平 的 ? ( 视频 + PPT ) 机器 翻译 是 科研 人员 攻坚 了 数十 年 的 研究 领域 , 曾经 很多 人 都 认为 机器 翻译 根本 不 可能 达到 人类 翻译 的 水平 。 虽然 此 次 突破 意义 非凡 , 但 研究 人员 也 提醒 大家 , 这 并不 代表 人类 已经 完全 解决 了 机器 翻译 的 问题 , 只 能 说明 我们 离 终极 目标 又 更 近 了 一 步 。 微软 亚洲 研究院 副院长 、 自然 语言 计算 组 负责人 周明 表示 , 在 WMT 17 测试 集上 的 翻译 结果 达到 人类 水平 很 鼓舞 人心 , 但 仍 有 很多 挑战 需要 我们 解决 , 比如 在 实时 的 新闻 报道 上 测试 系统 等 。 微软 机器 翻译 团队 研究 经理 Arul Menezes 表示 , 团队 想要 证明 的 是 : 当 一 种 语言 对 ( 比如 中 - 英 ) 拥有 较 多 的 训练 数据 , 且 测试 集中 包含 的 是 常见 的 大众 类 新闻 词汇 时 , 那么 在 人工 智能 技 术 的 加持 下 机器 翻译 系统 的 表现 可以 与 人类 媲美 。 640 ? wx_fmt = jpeg 微软 机器 翻译 团队 研究 经理 Arul Menezes 跨时区 跨 领域 合作 , 四 大 技术 为 创新 加持 虽然 学术界 和 产业界 的 科研 人员 致力于 机器 翻译 研究 很多 年 , 但 近 两 年 深度 神经 网络 的 使用 让 机器 翻译 的 表现 取得 了 很多 实质性 突破 , 翻译 结果 相较于 以往 的 统计 机器 翻译 结果 更加 自然 流畅 。 为了 能够 取得 中 - 英 翻译 的 里程碑式 突破 , 来自 微软 亚洲 研究院 和雷德蒙 研究院 的 三 个 研究组 , 进行 了 跨越 中 美 时区 、 跨越 研究 领域 的 联合 创新 。 其中 , 微软 亚洲 研究院 机器 学习 组 将 他们 的 最新 研究 成果 —— 对偶 学习 ( Dual Learning ) 和 推敲 网络 ( Deliberation Networks ) 应用 在 了 此 次 取得 突破 的 机器 翻译 系统 中 。 微软 亚洲 研究院 副院长 、 机器 学习 组 负责人 刘铁岩 介绍 道 , “ 这 两 个 技术 的 研究 灵感 其实 都 来自于 我们 人类 的 做事 方式 。 ” 对偶 学习 利用 的 是 人工 智能 任务 的 天然 对称性 。 当 我们 将 其 应用 在 机器 翻译 上 时 , 效果 就 好像 是 通过 自动 校对 来 进行 学习 —— 当 我们 把训 练 集中 的 一 个 中文 句子 翻译 成 英文 之后 , 系统 会 将 相应 的 英文 结果 再 翻译 回 中文 , 并 与 原始 的 中文 句子 进行 比对 , 进而 从 这个 比对 结果 中 学习 有用 的 反馈 信息 , 对 机器 翻译 模型 进行 修正 。 而 推敲 网络 则 类似于 人们 写 文章 时 不断 推敲 、 修改 的 过程 。 通过 多 轮 翻译 , 不断 地 检查 、 完善 翻译 的 结果 , 从而 使 翻译 的 质量 得到 大幅 提 升 。 对偶 学习 和 推敲 网络 的 工作 发表 在 NIPS 、 ICML 、 AAAI 、 IJCAI 等 人工 智能 的 全球 顶级 会议 上 , 并且 已 被 其他 学者 推广 到 机器 翻译 以外 的 研究 领域 。 640 ? wx_fmt = jpeg 微软 亚洲 研究院 副院长 、 机器 学习 组 负责人 刘铁岩 周明 带领 的 自然 语言 计算 组 多 年 来 一直 致力于 攻克 机器 翻译 , 这 一 自然 语言 处理 领域 最 具 挑战性 的 研究 任务 。 周明 表示 , “ 由于 翻译 没有 唯一 的 标准 答案 , 它 更 像 是 一 种 艺术 , 因此 需要 更加 复杂 的 算法 和 系统 去 应对 。 ” 自然 语言 计算 组 基于 之前 的 研究 积累 , 在 此 次 的 系统 模型 中 增加 了 另外 两 项 新 技术 : 联合 训练 ( Join t Training ) 和 一致性 规范 ( Agreement Regularization ) , 以 提高 翻译 的 准确性 。 联合 训练 可以 理解 为 用 迭代 的 方式 去 改进 翻译 系统 , 用 中英 翻译 的 句子 对 去 补充 反向 翻译 系统 的 训练 数 据集 , 同样 的 过程 也 可以 反向 进行 。 一致性 规范 则 让 翻译 可以 从左到右 进行 , 也 可以 从右到左 进行 , 最终 让 两 个 过程 生成 一致 的 翻译 结果 。 640 ? wx_fmt = jpeg 微软 亚洲 研究院 副院长 、 自然 语言 计算 组 负责人 周明 可以 说 , 两 个 研究组 分别 将 各自 所在 领域 的 积累 与 最新 发现 应用 在 了 此 次 的 机器 翻译 系统 中 , 从 不同 角度 切入 , 让 翻译 质量 大幅 提升 。 在 项目 合作 过程 中 , 他们 每 周 都 会 与 雷德蒙 总部 的 团队 开会 讨论 , 确保 技术 可以 无缝 融合 , 系统 可以 快速 迭代 。 没有 “ 正确 的 ” 翻译 结果 newstest2017 新闻 报道 测试 集 包括 约 2000 个 句子 , 由 专业 人员 从 在线 报纸 样本 翻译 而 来 。 微软 团队 对 测试 集 进行 了 多 轮 评估 , 每 次 评估会 随机 挑 选 数百 个 句子 翻译 。 为了 验证 微软 的 机器 翻译 是否 与 人类 的 翻译 同样 出色 , 微软 没有 停留 在 测试 集 本身 的 要求 , 而是 从 外部 聘请 了 一 群 双语 语言 顾问 , 将 微软 的 翻 译 结果 与 人工 翻译 进行 比较 。 验证 过程 之 复杂 也 从 另 一 个 侧面 体现 了 机器 翻译 要 做到 准确 所 面临 的 复杂性 。 对于 语音 识别 等 其它 人工 智能 任务 来说 , 判断 系统 的 表现 是否 可 与 人类 媲美 相当 简单 , 因为 理想 结果 对 人和 机器 来说 完全 相同 , 研究 人员 也 将 这 种 任务 称为 模式 识别 任务 。 然而 , 机器 翻译 却 是 另 一 种 类型 的 人工 智能 任务 , 即使 是 两 位 专业 的 翻译 人员 对于 完全 相同 的 句子 也 会 有 略微 不同 的 翻译 , 而且 两 个 人 的 翻译 都 不 是 错 的 。 那 是 因 为 表达 同 一 个 句子 的 “ 正确 的 ” 方法 不止 一 种 。 周明 表示 : “ 这 也 是 为什么 机器 翻译 比 纯粹 的 模式 识别 任务 复杂 得 多 , 人们 可能 用 不同 的 词语 来 表达 完全 相同 的 意思 , 但 未必 能 准确 判断 哪一 个 更 好 。 ” 复杂性 让 机器 翻译 成为 一 个 极有 挑战性 的 问题 , 但 也 是 一 个 极 有 意义 的 问题 。 刘铁 岩 认为 , 我们 不 知道 哪 一 天 机器 翻译 系统 才 能 在 翻译 任何 语言 、 任何 类型 的 文本 时 , 都 能 在 “ 信 、 达 、 雅 ” 等 多 个 维度 上 达到 专业 翻译 人员 的 水准 。 不过 , 他 对 技术 的 进展 表示 乐观 , 因为 每年 微软 的 研究 团队 以及 整个 学术界 都 会 发明 大量 的 新 技术 、 新 模型 和 新 算法 , “ 我们 可以 预测 的 是 , 新 技术 的 应用 一定 会 让 机器 翻译 的 结果 日臻 完善 。 ” 研究 团队 还 表示 , 此 次 技术 突破 将 被 应用 到 微软 的 商用 多语言 翻译 系统 产品 中 , 从而 帮助 其它 语言 或 词汇 更 复杂 、 更 专业 的 文本 实现 更 准确 、 更 地道 的 翻译 。 此外 , 这些 新 技术 还 可以 被 应用 在 机器 翻译 之外 的 其他 领域 , 催生 更多 人工 智能 技术 和 应用 的 突破 。 延伸 阅读 : 对偶 学习 ( Dual Learning ) : 对偶 学习 的 发现 是 由于 现实 中 有 意义 、 有 实用 价值 的 人工 智能 任务 往往 会 成对 出现 , 两 个 任务 可以 互相 反馈 , 从而 训练 出 更 好 的 深度 学习模 型 。 例如 , 在 翻译 领域 , 我们 关心 从 英文 翻译 到 中文 , 也 同样 关心 从 中文 翻译 回 英文 ; 在 语音 领域 , 我们 既 关心 语音 识别 的 问题 , 也 关心 语音 合成 的 问题 ; 在 图像 领域 , 图像 识别 与 图像 生成 也 是 成对 出现 。 此外 , 在 对话 引擎 、 搜索 引擎 等 场景 中 都 有 对偶 任务 。 一方面 , 由于 存在 特殊 的 对偶 结构 , 两 个 任务 可以 互相 提供 反馈 信息 , 而 这些 反馈 信息 可以 用来 训练 深度 学习 模型 。 也 就是说 , 即便 没有 人为 标注 的 数据 , 有 了 对 偶 结构 也 可以 做 深度 学习 。 另 一 方面 , 两 个 对偶 任务 可以 互相 充当 对方 的 环境 , 这样 就 不必 与 真实 的 环境 做 交互 , 两 个 对偶 任务 之间 的 交互 就 可以 产生 有效 的 反馈 信号 。 因此 , 充分 地 利用 对偶 结构 , 就 有望 解决 深度 学习 和 增强 学习 的 瓶颈 —— 训练 数据 从 哪里 来 、 与 环境 的 交互 怎么 持续 进行 等 问题 。 论文 地址 : https : //papers.nips.cc/paper/6469-dual-learning-for-machine-translation . pdf 640 ? wx_fmt = png 对偶 无 监督 学习 框架 推敲 网络 ( Deliberation Networks ) : “ 推敲 ” 二 字 可以 认为 是 来源于 人类 阅读 、 写 文章 以及 做 其他 任务 时候 的 一 种 行为 方式 , 即 任务 完成 之后 , 并不 当即 终止 , 而 是 会 反复 推敲 。 微软 亚洲 研究院 机器 学习 组 将 这个 过程 沿用 到 了 机器 学习 中 。 推敲 网络 具有 两 段 解码器 , 其中 第一 阶段 解码器 用于 解码 生成 原始 序列 , 第二 阶段 解码器 通过 推敲 的 过程 打磨 和 润色 原始 语句 。 后者 了解 全局 信息 , 在 机器 翻译 中看 , 它 可以 基于 第一 阶段 生成 的 语句 , 产生 更 好 的 翻译 结果 。 论文 地址 : https : //www.microsoft.com/en-us/research/publication/deliberation-netwo rks-sequence-generation-beyond-one-pass-decoding / 640 ? wx_fmt = png 推敲 网络 的 解码 过程 联合 训练 ( Joint Training ) : 这个 方法 可以 认为 是 从 源语言 到 目标 语言 翻译 ( Source to Target ) 的 学习 与 从 目标 语言 到 源语言 翻译 ( Target to Source ) 的 学习 的 结合 。 中英 翻译 和 英 中 翻译 都 使用 初始 并行 数据 来 训练 , 在 每 次 训练 的 迭代 过程 中 , 中 英 翻译 系统 将 中文 句子 翻译 成 英文 句子 , 从而 获得 新 的 句 对 , 而 该 句 对 又 可以 反过来 补充 到 英 中 翻译 系统 的 数据 集中 。 同理 , 这个 过程 也 可以 反向 进行 。 这样 双向 融合 不仅 使得 两 个 系统 的 训练 数据集 大大 增加 , 而 且 准确率 也 大幅 提高 。 论文 地址 : https : //arxiv.org/pdf/1803.00353.pdf 640 ? wx_fmt = png 联合 训练 : 从 源语言 到 目标 语言 翻译 ( Source to Target ) P ( y|x ) 与 从 目标 语言 到 源语言 翻译 ( Target to Source ) P ( x|y ) 一致性 规范 ( Agreement Regularization ) : 翻译 结果 可以 从左到右 按 顺序 产生 , 也可以 从右到左 进行 生成 。 该 规范 对 从左到右 和 从右到左 的 翻译 结果 进行 约束 。 如果 这 两 个 过程 生成 的 翻译 结果 一样 , 一般而言 比 结果 不 一样 的 翻译 更加 可信 。 这个 约束 , 应用于 神经 机器 翻译 训练 过程 中 , 以 鼓励 系统 基于 这 两 个 相反 的 过程 生成 一致的 翻译 结果 。 640 ? wx_fmt = jpeg 试用 系统 : https : //translator.microsoft.com/neural / 原文 出处 点击 查看 更多 内容 机器 学习 ( BUTTON ) 0 人 点 赞 若 觉得 本文 不错 , 就 分享 一下 吧 ! 评论 评论 共同 学习 , 写下 你 的 评论 评论 加载 中 . . . 展开 查看 更多 评论 相关 文章 推荐 正在 加载 中 [ 533e52b90001456f02000200-100 - 100.jpg ] 慕森卡 关注 篇 手记 贡献 字 作者 相关 文章 更多 * 每 个 Linux 新手 都 应该 知道 的 10 个 命令 * kafka 学习 非常 详细 的 经典 教程 * 与 C 语言 长 别离 * 与 TCP/IP 协议 的 一 次 邂逅 * CSS 网格 布局 ( Grid ) 完全 教程 慕课 专栏 更 多 * 两 小时 学会 Node.js stream 共 8 小节 723 人 已 购买 马上 订阅 ¥ 9.99 * 教 你 用 Python 进阶 量化 交易 共 24 小节 292 人 已 购买 马上 订阅 ¥ 19.90 29.90 * ( BUTTON ) 推荐 * 评论 * 收藏 * 共同 学习 , 写下 你 的 评论 * 意见 反馈 去 赚 学费 帮助 中心 APP 下载 官方 微信 返回 顶部 举报 ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ ____________________________________________________________ 0 / 150 提交 取消