让 翻译 人员 恐慌 的 机器 翻译 系统 ( 附 试用 地址 ) 今天 , 微软 研究 团队 宣布 其 研发 的 机器 翻译 系统 在 通用 新闻 报道 测试 集 newstest2017 的 中 - 英 测试 集上 达到 了 人类 水平 。 这个 系统 模型 包含 了 由 微软 亚洲 研究院 研发 的 对偶 学习 、 推敲 网络 、 联合 训练 和 一致性 规范 技术 。 机器 翻译 是 自然 语言 处理 领域 最 具 挑战性 的 研究 任务 之一 , 我们 相信 新 技术 的 应用 会 让 机器 翻译 的 结果 日臻 完善 , 并且 催生 更多 人工 智能 技术 应用 的 突破 。 由 微软 亚洲 研究院 与雷德蒙 研究院 的 研究 人员 组成 的 团队 今天 宣布 , 其 研发 的 机器 翻译 系统 在 通用 新闻 报道 测试 集 newstest2017 的 中 - 英 测试 集上 , 微软 技术 院士 , 负责 微软 语音 、 自然 语言 和 机器 翻译 工作 的 黄学东 称 , 这 是 对 自然 语言 处理 领域 最 具 挑战性 任务 的 一 项 重大 突破 。 “ 在 机器 翻译 方面 达到 与 人类 相 机器 翻译 是 科研 人员 攻坚 了 数十 年 的 研究 领域 , 曾经 很多 人 都 认为 机器 翻译 根本 不 可能 达到 人类 翻译 的 水平 。 虽然 此 次 突破 意义 非凡 , 但 研究 人员 也 提醒 大家 , 这 并不 代表 人类 已经 完全 解决 了 机器 翻译 的 问题 , 只 能 说明 我们 离 终极 目标 又 更 近 了 一 步 。 微软 亚洲 研究院 副院长 、 自然 语言 计算 组 负责人 周明 表示 , 在 WMT 17 微软 机器 翻译 团队 研究 经理 Arul 术 的 加持 下 机器 翻译 系统 的 表现 可以 与 人类 媲美 。 微软 机器 翻译 团队 研究 经理 Arul Menezes 虽然 学术界 和 产业界 的 科研 人员 致力于 机器 翻译 研究 很多 年 , 但 近 两 年 深度 神经 网络 的 使用 让 机器 翻译 的 表现 取得 了 很多 实质性 突破 , 翻译 结果 相较于 以往 的 统计 机器 翻译 结果 更加 自然 流畅 。 为了 能够 取得 中 - 英 翻译 的 里程碑式 突破 , 来自 微软 亚洲 研究院 和雷德蒙 研究院 的 三 个 研究组 , 进行 了 跨越 中 美 时区 、 跨越 研究 领域 其中 , 微软 亚洲 研究院 机器 学习 组 将 他们 的 最新 研究 成果 —— 对偶 学习 ( Dual Learning ) 和 推敲 网络 ( Deliberation Networks ) 应用 在 了 此 次 取得 突破 的 机器 翻译 系统 中 。 微软 亚洲 研究院 副院长 、 机器 学习 组 负责人 刘铁岩 介绍 道 , “ 这 两 个 技术 的 研究 灵感 其实 都 来自于 我们 人类 的 做事 方式 。 ” 对偶 学习 利用 的 是 人工 智能 任务 的 天然 对称性 。 当 我们 将 其 应用 在 机器 翻译 上 时 , 效果 就 好像 是 通过 自动 校对 来 进行 学习 —— 当 我们 把训 机器 翻译 模型 进行 修正 。 而 推敲 网络 则 类似于 人们 写 文章 时 不断 推敲 、 修改 的 过程 。 通过 多 轮 翻译 , 不断 地 检查 、 完善 翻译 的 结果 , 从而 使 翻译 的 质量 得到 大幅 提 升 。 对偶 学习 和 推敲 网络 的 工作 发表 在 NIPS 、 ICML 、 AAAI 、 IJCAI 等 人工 智能 的 全球 顶级 会议 上 , 并且 已 被 其他 学者 推广 到 机器 翻译 以外 的 研究 微软 亚洲 研究院 副院长 、 机器 学习 组 负责人 刘铁岩 周明 带领 的 自然 语言 计算 组 多 年 来 一直 致力于 攻克 机器 翻译 , 这 一 自然 语言 处理 领域 最 具 挑战性 的 研究 任务 。 周明 表示 , “ 由于 翻译 没有 唯一 的 标准 答案 , 它 更 像 可以 说 , 两 个 研究组 分别 将 各自 所在 领域 的 积累 与 最新 发现 应用 在 了 此 次 的 机器 翻译 系统 中 , 从 不同 角度 切入 , 让 翻译 质量 大幅 提升 。 在 项目 合作 过程 中 , 他们 每 选 数百 个 句子 翻译 。 为了 验证 微软 的 机器 翻译 是否 与 人类 的 翻译 同样 出色 , 微软 没有 停留 在 测试 集 本身 的 要求 , 而是 从 外部 聘请 了 一 群 双语 语言 顾问 , 将 微软 的 翻 验证 过程 之 复杂 也 从 另 一 个 侧面 体现 了 机器 翻译 要 做到 准确 所 面临 的 复杂性 。 对于 语音 识别 等 其它 人工 智能 任务 来说 , 判断 系统 的 表现 是否 可 与 人类 媲美 相当 简单 , 因为 理想 结果 对 人和 机器 来说 完全 相同 , 研究 人员 也 将 这 种 任务 称为 模式 识别 任务 。 然而 , 机器 翻译 却 是 另 一 种 类型 的 人工 智能 任务 , 即使 是 两 位 专业 的 翻译 人员 对于 完全 相同 的 句子 也 会 有 略微 不同 的 翻译 , 而且 两 个 人 的 翻译 都 不 是 错 的 。 那 是 因 周明 表示 : “ 这 也 是 为什么 机器 翻译 比 纯粹 的 模式 识别 任务 复杂 得 多 , 人们 可能 用 不同 的 词语 来 表达 完全 相同 的 意思 , 但 未必 能 准确 判断 哪一 个 更 好 。 ” 复杂性 让 机器 翻译 成为 一 个 极有 挑战性 的 问题 , 但 也 是 一 个 极 有 意义 的 问题 。 刘铁 岩 认为 , 我们 不 知道 哪 一 天 机器 翻译 系统 才 能 在 翻译 任何 语言 、 任何 类型 的 文本 技术 、 新 模型 和 新 算法 , “ 我们 可以 预测 的 是 , 新 技术 的 应用 一定 会 让 机器 翻译 的 结果 日臻 完善 。 ” , 这些 新 技术 还 可以 被 应用 在 机器 翻译 之外 的 其他 领域 , 催生 更多 人工 智能 技术 和 应用 的 突破 。 https : //papers.nips.cc/paper/6469-dual-learning-for-machine-translation 。 微软 亚洲 研究院 机器 学习 组 将 这个 过程 沿用 到 了 机器 学习 中 。 推敲 网络 具有 两 段 解码器 , 其中 第一 阶段 解码器 用于 解码 生成 原始 序列 , 第二 阶段 解码器 通过 推敲 的 过程 打磨 和 润色 原始 语句 。 后者 了解 全局 信息 , 在 机器 翻译 中看 , 它 可以 基于 第一 阶段 生成 的 语句 , 产生 更 好 的 翻译 结果 。 个 过程 生成 的 翻译 结果 一样 , 一般而言 比 结果 不 一样 的 翻译 更加 可信 。 这个 约束 , 应用于 神经 机器 翻译 训练 过程 中 , 以 鼓励 系统 基于 这 两 个 相反 的 过程 生成 一致的 机器 学习