快捷搜索:

亲测|Google翻译内核升级:大型数据集神经机器

【TechWeb】5月8日消息,近期,Google翻译悄然进级了其翻译内核。据Google官方供给的数据显示,Google翻译搭载的Google的神经机械翻译(GNMT:Google Neural Machine Translation)系统应用了当前最先辈的练习技巧,因而提升了机械翻译水平,将翻译偏差再度低落了55%-85%。

Google展示的翻译模型质量

十多年前,Google宣布了Google翻译,从前基于短语的统计机械翻译,会将输入句子分化成词和短语,然后对它们进行自力翻译。这种翻译要领的劣势异常显着:句子中蓝本完备的信息被碎片化,无法连贯地进行表达。而这种征象在英中互译的环境下显得尤其显着。

而Google神经机械翻译则将输入的句子作为一个整体翻译。

以中英翻译为例,Google神经机械翻译首先将这句中文的词编码成一个向量列表,此中每个向量都表示了到今朝为止所有被读取到的词的含义(编码器“Encoder”)。读取完备个句子,解码器就开始事情——一次天生英语句子的一个词(解码器“Decoder”)。

上图展示了Google神经机械翻译的中英翻译道理

为了在每一步都天生翻译精确的词,解码看重点留意了与天生英语词最相关编码的中文向量的权重散播。

在被首次提出时,神经机械翻译系统在中等规模的数据集上就与基于短语的翻译系统水平相称。

现在,Google方面表示,经由过程让神经机械翻译战胜在异常大年夜型的数据集上事情的许多寻衅,打造了在速率和准确度上都更好翻译的系统。

今朝,Google神经机械翻译系统已投入到了中文-英语的翻译中。现在,移动版和网页版的Google翻译的中英翻译已完全应用神经机械翻译——天天大年夜约1800万条翻译。

有颠末大年夜型数据集磨练的Google神经机械翻译系统加持,最新的Google翻译效果究竟若何呢?

我们做了一个简单的对照测试。当然,照样在中英翻译场景下。

测试场景:PC端 Google翻译网页版

随机选择了一则英文消息,原文如下:

Since COVID-19 began, we’ve heard from our retail and brand manufacturing partners that they’re hungry for more insights on how consumer interests are changing, given fluctuations in consumer demand. We see these changes reflected in how people are searching on Google. Last month, there were spikes in search interest for household supplies and jigsaw puzzles as people spent more time at home. This month we’ve seen surging interest for sewing machines and baking materials in the U.S., and tetherball sets and chalk in the United Kingdom and Australia.

Businesses are using a variety of resources to understand changing consumer interests—including Google Trends, social listening, surveys, and their own data—in order to help make decisions on the fly. But if they don’t know what to look for, there isn’t an easy way to understand which product categories are gaining in popularity, and might pose an opportunity.

That’s why we’re launching a rising retail categories tool on Think with Google. It surfaces fast-growing, product-related categories in Google Search, the locations where they’re growing, and the queries associated with them. This is the first time we’ve provided this type of insight on the product categories that people are searching for.

旧版Google翻译给出的英译中结果:

进级后Google翻译给出的英译中新结果,血色标记字部分为与旧翻译结果的不合地方。新版翻译详细如下:

比较两段翻译结果,可以看出差别还挺大年夜的。整体而言,新版翻译结果中标红翰墨的表述显着更相符汉语的语法和表述习气。

别的,着末一段的翻译结果优化则更为显着,对Google产品名称“Think with Google”进行了准确识别,避免了乱翻译的为难。

确凿更智能啦!

您可能还会对下面的文章感兴趣: