HMS Core机器学习服务文本翻译能力提供多种语言和多种应用场景的翻译服务,比如,在出国旅游的场景中,用户可以借助应用的语音翻译播报功能在打车、酒店入住等场景中无障碍沟通,也可以通过拍照翻译功能读懂餐厅菜单、路牌信息等。
当前主流的翻译模式大都以语料资源较为丰富的英文作为中间语言进行“桥接”翻译,但是经英文转移后翻译精度有所损失,且计算资源加倍执行效果降低。为了响应“一带一路”倡议,助力多元开放的全球化进程,国内出海应用语种翻译需求明确且要求系统本地化部署,对部分语言方向如中日、中俄等翻译质量要求较高,同时希望这些语言方向的翻译效果持续提升。
基于此,HMS Core机器学习服务对文本翻译能力进行升级,中日、德、法、俄四国语言的中文直译模型已在新版本中上线。相较于英文桥接翻译,中文直译模型可实现每秒并发300字符,端到端翻译速度小于150ms,翻译时延降低100%,翻译速度更快;针对中文特色词、俚语的翻译结果更地道,翻译质量更优。升级后的文本翻译能力可以满足中企出海或外企入华等对翻译要求更高场景的需求。
中文直译模型方案还参加了WMT2021国际机器翻译大赛子任务(Shared Task: Triangular MT: Using English to improve Russian-to-Chinese machine translation),并以显著的优势在该任务中获得了第一名。

法译中
【原文】Smart Launcher est un lanceur pour d’applications Android qui substitue l'interface classique de votre téléphone avec une autre qui est un peu plus simple et qui vous permettra d'accéder à toutes vos applications plus rapidement et plus confortablement.
【英文桥接】智能启动器是一款Android应用程序的启动器,它可以用一个简单一点的界面取代手机的经典界面,让你更快、更舒适地访问所有应用程序。
【中文直译】Smart Launcher是一款Android应用程序启动器,它用另一个更简单的界面取代了手机的经典界面,这将让您更快、更舒适地访问所有应用程序。
俄译中
【原文】О, да ладно, когда кто-то грубит тебе в коридоре является, без сомнений, самой меньшей из тех проблем, с которыми ты сталкиваешься в старших классах.
【英文桥接】哦,拜托,在走廊里有人对你无礼,毫无疑问,是你高中时面临的最不重要的问题。
【中文直译】哦,拜托,当有人在走廊里对你无礼无疑是你在高中时遇到的最小的问题。
德译中
【原文】Dieser von klassischen Laufschuhen inspirierte Herren-Sneaker zeichnet sich durch einen Materialmix aus Wildleder und verschiedenen Gewebearten aus und präsentiert sich in der Cruise 2020 Kollektion mit einer neuen Mid-Top-Silhouette, die genau bis zum Knöchel reicht.
【英文桥接】这款男式运动鞋的灵感来自经典跑鞋,采用麂皮和不同面料的混合,并采用全新的中帮轮廓,在2020年邮轮系列中一直延伸到脚踝。
【中文直译】这款男士运动鞋的灵感来自经典跑鞋,采用麂皮和不同面料的混合材质,在2020年邮轮系列中呈现出全新的中帮轮廓,完全延伸到脚踝。
中文直译模型借助了华为在机器翻译方面的最新研究成果,通过利用俄英、英中语料进行知识蒸馏,在少量或没有俄中语料的情况下,结合显式课程学习训练策略可以得到质量不错的俄中翻译模型,解决了英文桥接翻译系统的低资源以及冷启动的问题。

中文直译系统

以俄中翻译任务为例,通过多语言模型,引入英中语料并结合知识蒸馏,加强译文侧decoder层的解码能力;引入俄英语料加强原文侧encoder层编码能力。从而极大程度上解决冷启动问题。

在训练过程,结合显式的课程学习技巧,根据噪音量划分三阶段增量式训练方案。在第一阶段,使用全量的带噪语料进行训练,使得模型快速收敛;第二阶段使用双语对齐工具去噪后进行增量训练;第三阶段使用增强后的降噪双语数据进行增量训练,完成模型最终收敛。
FTST全称Forward Translation and Sampling Backward Translation,该技术在Backward Model中使用sampling的方式进行数据增强;在Forward Model中使用beam search的方式进行数据均衡。在对比实验中,取得了最好效果。

除了现有的四种语言以外,机器学习服务文本翻译能力计划今年会陆续上线日、法、德、俄、韩、葡、西、土、泰、阿拉伯、马来、意大利、波兰、荷兰、越南语共计15国的中文直译模型,基本覆盖中国、亚非拉、欧洲、南美洲等全球主要国家和地区。
了解更多详情>>
访问华为开发者联盟官网
获取开发指导文档
华为移动服务开源仓库地址:GitHub、Gitee
关注我们,第一时间了解 HMS Core 最新技术资讯~
我正在尝试使用ruby和Savon来使用网络服务。测试服务为http://www.webservicex.net/WS/WSDetails.aspx?WSID=9&CATID=2require'rubygems'require'savon'client=Savon::Client.new"http://www.webservicex.net/stockquote.asmx?WSDL"client.get_quotedo|soap|soap.body={:symbol=>"AAPL"}end返回SOAP异常。检查soap信封,在我看来soap请求没有正确的命名空间。任何人都可以建议我
我想安装一个带有一些身份验证的私有(private)Rubygem服务器。我希望能够使用公共(public)Ubuntu服务器托管内部gem。我读到了http://docs.rubygems.org/read/chapter/18.但是那个没有身份验证-如我所见。然后我读到了https://github.com/cwninja/geminabox.但是当我使用基本身份验证(他们在他们的Wiki中有)时,它会提示从我的服务器获取源。所以。如何制作带有身份验证的私有(private)Rubygem服务器?这是不可能的吗?谢谢。编辑:Geminabox问题。我尝试“捆绑”以安装新的gem..
我想将html转换为纯文本。不过,我不想只删除标签,我想智能地保留尽可能多的格式。为插入换行符标签,检测段落并格式化它们等。输入非常简单,通常是格式良好的html(不是整个文档,只是一堆内容,通常没有anchor或图像)。我可以将几个正则表达式放在一起,让我达到80%,但我认为可能有一些现有的解决方案更智能。 最佳答案 首先,不要尝试为此使用正则表达式。很有可能你会想出一个脆弱/脆弱的解决方案,它会随着HTML的变化而崩溃,或者很难管理和维护。您可以使用Nokogiri快速解析HTML并提取文本:require'nokogiri'h
尝试通过RVM将RubyGems升级到版本1.8.10并出现此错误:$rvmrubygemslatestRemovingoldRubygemsfiles...Installingrubygems-1.8.10forruby-1.9.2-p180...ERROR:Errorrunning'GEM_PATH="/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/ruby-1.9.2-p180@global:/Users/foo/.rvm/gems/ruby-1.9.2-p180:/Users/foo/.rvm/gems/rub
我在我的Rails项目中使用Pow和powifygem。现在我尝试升级我的ruby版本(从1.9.3到2.0.0,我使用RVM)当我切换ruby版本、安装所有gem依赖项时,我通过运行railss并访问localhost:3000确保该应用程序正常运行以前,我通过使用pow访问http://my_app.dev来浏览我的应用程序。升级后,由于错误Bundler::RubyVersionMismatch:YourRubyversionis1.9.3,butyourGemfilespecified2.0.0,此url不起作用我尝试过的:重新创建pow应用程序重启pow服务器更新战俘
我实际上是在尝试使用RVM在我的OSX10.7.5上更新ruby,并在输入以下命令后:rvminstallruby我得到了以下回复:Searchingforbinaryrubies,thismighttakesometime.Checkingrequirementsforosx.Installingrequirementsforosx.Updatingsystem.......Errorrunning'requirements_osx_brew_update_systemruby-2.0.0-p247',pleaseread/Users/username/.rvm/log/138121
最近,当我启动我的Rails服务器时,我收到了一长串警告。虽然它不影响我的应用程序,但我想知道如何解决这些警告。我的估计是imagemagick以某种方式被调用了两次?当我在警告前后检查我的git日志时。我想知道如何解决这个问题。-bcrypt-ruby(3.1.2)-better_errors(1.0.1)+bcrypt(3.1.7)+bcrypt-ruby(3.1.5)-bcrypt(>=3.1.3)+better_errors(1.1.0)bcrypt和imagemagick有关系吗?/Users/rbchris/.rbenv/versions/2.0.0-p247/lib/ru
在Rails4.0.2中,我使用s3_direct_upload和aws-sdkgems直接为s3存储桶上传文件。在开发环境中它工作正常,但在生产环境中它会抛出如下错误,ActionView::Template::Error(noimplicitconversionofnilintoString)在View中,create_cv_url,:id=>"s3_uploader",:key=>"cv_uploads/{unique_id}/${filename}",:key_starts_with=>"cv_uploads/",:callback_param=>"cv[direct_uplo
这似乎非常适得其反,因为太多的gem会在window上破裂。我一直在处理很多mysql和ruby-mysqlgem问题(gem本身发生段错误,一个名为UnixSocket的类显然在Windows机器上不能正常工作,等等)。我只是在浪费时间吗?我应该转向不同的脚本语言吗? 最佳答案 我在Windows上使用Ruby的经验很少,但是当我开始使用Ruby时,我是在Windows上,我的总体印象是它不是Windows原生系统。因此,在主要使用Windows多年之后,开始使用Ruby促使我切换回原来的系统Unix,这次是Linux。Rub
我想在Ruby中创建一个用于开发目的的极其简单的Web服务器(不,不想使用现成的解决方案)。代码如下:#!/usr/bin/rubyrequire'socket'server=TCPServer.new('127.0.0.1',8080)whileconnection=server.acceptheaders=[]length=0whileline=connection.getsheaders想法是从命令行运行这个脚本,提供另一个脚本,它将在其标准输入上获取请求,并在其标准输出上返回完整的响应。到目前为止一切顺利,但事实证明这真的很脆弱,因为它在第二个请求上中断并出现错误:/usr/b