欢迎访问本站!

首页科技正文

唐山赶集网:DeepL的超强翻译能力不只中翻英、连日文、方言和文言文翻译都超强!

admin2021-02-26321

前几天我们报导过对「DeepL」这个线上翻译服务举行两篇文章的翻译测试,发现比Google翻译来得流通而且准确。而这个情形不只是在台湾,同样的在日本以及中国,也有许多同伙发现了「DeepL」的翻译能力真的超强,中国媒体「大数据文摘」还专程对中国用户会用的微软翻译、百度翻译、有道翻译举行了对照。还从方言、文言文和学术论文的翻译来看看详细翻译成就若何。



日本也以为太准确

最近,一款线上机械翻译软体在日本爆红。 这款翻译软体名叫DeepL,爆红的缘故原由正是由于它事情太卖力了,翻译得太过准确,在日本引起了热议。 





从日本网友的评测来看,不仅日语方言翻译效果超级优越,连文言文也被难不倒它,这可是连Google翻译都办不到的事。 





然则有多准确呢?作为一个严谨的科技软体,固然照样要用数据来语言,DeepL官方也公开了日英互译和中英互译的盲测效果,如下图所示,可以看出,DeepL简直就是一面倒的碾压嘛: 





盲测就是在专业译员评审们不知道哪个翻译版本是由哪个网站翻译的情形下,对翻译文本举行评估,这也一直是DeepL的测试方式之一。 



DeepL由于极好的准确性,也同样引爆了Reddit,有网友指出,DeepL不是像Google翻译那样从字词上举行翻译,从Textractor的设置上可以看到,DeepL还支援用以前的翻译作为上下文对翻译效果举行改善





也有不少网友直呼「DeepL *** 爆了」!





3年前,DeepL刚泛起时就已经吸引到了不少眼光,DeepL首席执行长Gereon Frahling曾示意,DeepL的目的不止于翻译义务,神经网路将从明白文本更先,开启更多可能。 



至于更多可能是若何被开发出来的,做了一次小小的评测,然后再一起来看看DeepL是若何起身的~



 



中国测试:方言、文言文、学术论文,机械翻译大乱斗!

在日本不管是民间评测照样DeepL官方的盲测效果,都表示著DeepL可能是现在准确率更高的机械翻译,到底显示若何,照样要亲自动手试试才知道。



既然DeepL本次更新也包含了简体中文,「大数据文摘」也对DeepL 举行了一次简朴的评测,和现在主流的Google翻译、微软翻译、百度翻译、有道翻译举行了对照



本次评测分为三轮,第一轮方言,第二轮文言文,第三轮学术论文。好,现在我们有请五位选手入场。



第一轮,我们来看看方言。



人人都知道,中国方言文化博大精深,要是不能准确译出方言,那这个准确率照样要打上问号的。



我们选择了东北话十级问题:「我嘞个去,你长得也太磕碜了」。本题有两个得分点,一个是「我嘞个去」,一个是「磕碜」。让我们来看看五位选手的显示。



在第一个得分点「我嘞个去」上,Google翻译成了「I'll go there」,微软和百度以为这是「I'll go」的意思,有道则给出「I don't know」的谜底, DeepL显示很好,准确翻译成了带有惊讶语气的「oh my god」。



在第二个得分点「磕碜」上,五位选手都给出了差别的谜底,Google「shy」、微软「snobful」、百度「shabby」、有道「bad」,DeepL「ugly」。



从得分点上看,百度在第二题显示尚可,有道…委曲过关吧,Google和微软则全军尽没。我们来浏览一下DeepL的满分试卷





这才第一题,不要忧郁,另有翻身的机遇。接下来我们来看看文言文,既然DeepL都能翻译古日文,能不能翻译古​​汉语?



第二轮,文言文

文言文部门以著名唐代诗人张九龄《望月远怀》中的名句「海上生明月,天涯共此时」为考题,这句诗的意思是,在辽阔无边的大海上升起一轮明月,使人想起了远在天涯海角的亲友,他此时此刻也该是望着统一轮明月吧。



本题的得分点是看看列位选手能否用英文把整句诗的意境表达出来。好了,中文版的标准谜底已经宣布,那么五位选手的显示若何呢?



首先从句意上看,Google、微软和百度都直接放弃了后半句的翻译,有道把后半句译成「Tianya at this time」;在前半句的翻译上,微软和百度都用到了born这个词,然则微软的译文是「The sea is born」????



我们来看看DeepL,前半句和Google的谜底一模一样,然则后半句的翻译是不是达到了信达雅的水准不知道,然则读上去感受异常舒适,人人也来浏览一下





第三题,也是最后一道压轴题,我们要考察的是列位选手对学术论文的中英互译。

学术论文的要害除了语句通顺外,还需要在专业词汇上做到准确,这也是本次考察的重点。 



中译英部门,我们选择的是去年刊登在《国际新闻界》上的一篇文章,研究者观察的是社群媒体信托对隐私风险感知和自我流露的影响。



原文:实证效果显示:1.隐私风险感知与自我流露并无显著相关性;2.社群媒体信托负向影响使用者的隐私风险感知,网路人际信托在其中施展中介作用;3.社群媒体信托正向影响使用者的自我流露,网路人际信托在其中施展中介作用。



从翻译效果上看,五位选手给出的谜底都还算让人满足,句型和语法也都没有问题,只是在一些用词上各有千秋。好比,「自我流露」,DeepL和微软用的是「self-expression」,其余三位选手用的是「self-disclosure」;而「网路人际信托」,有道、百度和微软译成「network interpersonal trust」,Google给出「online interpersonal trust」的谜底,DeepL则译为「cyber-interpersonal trust」。



照例,我们照样来看看DeepL的谜底。





在英译中部门,我们选择了帝国理工大学论文的导论部门。在使用者体验上要插播一下,从中译英切换到英译中的时刻,只有百度、有道和DeepL做到了自动辨识,Google和微软仍需要手动选择语言。



原文:The global impact of COVID-19 has been profound, and the public health threat it represents is the most serious seen in a respiratory virus since the 1918 H1N1 influenza pandemic. Here we present the results of epidemiological modelling which has informed policymaking in the UK and other countries in recent weeks. In the absence of a COVID-19 vaccine, we assess the potential role of a number of public health measures – so-called non-pharmaceutical interventions (NPIs) – aimed at reducing contact rates in the population and thereby reducing tran *** ission of the virus. In the results presented here, we apply a previously published microsimulation model to two countries: the UK (Great Britain specifically) and the US. We conclude that the effectiveness of any one intervention in isolation is likely to be limited,requiring multiple interventions to be combined to have a substantial impact on tran *** ission.



从效果上看,五位选手的学术造诣都不错,学术语言使用的规范性也都相差不大。然则,细节见真知,只有有道保留了双破折号的使用,但这在中文中实在并不常见;除有道外,其他三位选手在「非药物干预措施(NPI)」的表达上都没有做到精美绝伦。



仍然,最厉害的照样DeepL,虽然还存在种种小问题,无法获得满分,但也是一张稳健的高分试卷了: 





以上就是本次评测所有的考题了,可以看出DeepL不愧是头号种子选手,不管是方言、文言文照样学术话语,都有不错的显示,看来DeepL官方照样很老实的嘛。 



从Linguee蜕变,机械学习赋能DeepL 

见识到了DeepL的「独秀」显示,接下来,我们就重点先容一下本次评测显示更佳的头号种子DeepL。 



不知道DeepL?那Linguee应该听说过吧,就是谁人运营十多年的在线外语词典,DeepL的前身正是Linguee。Linguee是一款泛起多年的翻译工具,只管使用普遍,也有一批忠实使用者,但其翻译品质尚无法与Google翻译相提并论,尤其是考虑到后者品牌和职位的伟大优势。



真正主要的是Linguee的手艺积累,Linguee的团结创始人Gereon Frahling之前就在Google研究院事情,2007年,他选择开启新的征程,团队数年来一直致力于机械翻译,直到2016年,他们才更先全力开发全新的系统,建设新公司,也就是DeepL。 



Linguee的焦点竞争优势就是爬虫和机械学习系统,前者能够抓取网际网路上跨越10亿句翻译效果和查询的大型数据库,后者在网页上征采相似片断的真实翻译方式并对其评估,两者连系使Linguee成为了那时「世界上首个翻译征采引擎」



十年积累下来,Linguee 无论在数据和对演算法研究上都不能小觑,而这也直接成为DeepL的绝对优势,为团队训练新模子打好了坚实的基础。





DeepL变化性的神经架构在冰岛的一台超级电脑上运行,该电脑能力为5.1 petaFLOPS(每秒5100万亿次操作)不到一秒内能翻译100万单词。「冰岛可再生能源厚实,因此我们可以在这里用异常低廉的成本训练我们的神经网路。我们将继续专注于高性能硬体」,DeepL的CTO Jaroslaw Kutylowski说。 



「我们的神经网路架构已经实现了多个显著改善」,Gereon Frahling示意,「透过用差别的方式放置神经元及其毗邻,我们的网路比现在其他神经网路更周全地映射自然语言。 」



大学、研究机构和Linguee的竞争对手公布的研究进展解释,卷积神经网路才是机械翻译的准确门路,而非DeepL之前使用的循环神经网路,但现在不是探讨二者区别的时刻,对于相关词语的长、庞大字符串,只要你能够控制其弱点,卷积神经网路效果会更好。



例如,CNN一次处置一个单词,当句末单词决议句首单词的形成时,这就成了问题。查找整个句子寻找句首单词,若是网路获取到的第一个单词是错误的,就太浪费了,还得使用该知识重新更先,因此DeepL和机械学习领域的其他机构在CNN转向下一个单词或词组时,使用能够监控此类潜在问题的「注意力机制」来解决。 



DeepL在最新版本增加了对日语和简体中文的支援,包罗日语汉字,平假名和片假名以及数千个汉字。现在,DeepL支持的语言数目增加到11种,虽然语言支持不如其他翻译服务普遍,如Google Translate和Bing Microsoft Translator均支持一百多种差别的语言,但翻译精度也是不能忽视的要害点。



掌握多国语言的Techcrunch编辑Frederic曾这么评价DeepL:「Google翻译的气概异常直接,但却错过了一些细节和俗语(或者把这些俗语翻译错了),而  DeepL经常可以提供加倍自然的翻译效果,就像训练有素的人类翻译一样。」





  • 本文授权转载自信数据文摘

Shares



Facebook LINE,

申博Sunbet

申博Sunbet www.sunbet.xyz是Sunbet指定的Sunbet官网,Sunbet提供Sunbet(Sunbet)、Sunbet、申博 *** 合作等业务。

网友评论

2条评论
  • 2021-01-28 00:07:58

    【信报财经新闻】中银香港(02388)在《亚洲钱币》(Asiamoney)主理的「2020最佳银行评选」获发表「香港最佳企业社会责任银行」殊荣,是自2018年起延续第三年获奖。送你一枝玫瑰花。

  • 2021-02-26 00:02:55

    Allbet欢迎进入allbet欧博官网。allbet欧博官网开放ALLBET欧博真人客户端、Allbet代理网页版、Allbet会员网页版、Allbet会员注册、Allbet代理开户、Allbet电脑客户端下载、Allbet手机版下载等业务。还写吗