行业新闻:Skype开启中英实时语音翻译对话新时代

日期:2017-10-15 09:07:25 / 人气: / 来源:网络转载侵权删


  译声获悉了2015年4月9日,Skype宣布在中国市场推出Skype Translator实时语音翻译技术的中文预览版,正式开启中英实时语音翻译对话新时代。Skype Translator预览版适用于Windows 8.1或Windows 10技术预览版的客户端或平板电脑客户端。除了英文和中文普通话的语音翻译之外,还支持四十多种语言的即时文本翻译。 
      新的里程碑
  在2014年12月,Skype Translator支持了英文和西班牙文之间的实时语音翻译,这个记录很快被刷新。
  微软认为,这一新时代的开启得益于深层神经网络与微软成熟的统计机器翻译技术的结合,语音识别能力被进一步提高,随之得到的更准确的翻译结果,使得一对一的语音交谈成为现实。
  中文是一门极具挑战性的语言,大约一万个常用汉字以及多种多样的语音、语调,这对于母语为英语的学习者来说是最大的困难之一,有类似困难的语言还有阿拉伯语日语和韩语。
  微软是语音翻译领域的先驱,在2012年首次演示了英文和中文普通话之间的实时语音翻译技术原型。此后的数年中,微软在的研究团队与位于美国雷蒙德的同事们密切合作,经过多年的研究和专注投入,完成了普通话的语言模型,使Skype Translator的中文语音翻译在终于变为现实。
  Skype Translator中文预览版的推出无疑将微软语音翻译技术能力和Skype的未来应用前景推升到新的里程碑。
  解读Skype Translator工作原理
  机器学习是指软件学习训练数据的能力。Skype Translator构建于机器学习平台之上。通过在预览版阶段获取的训练数据,加之其中的细微差别,软件就能够针对真实使用者的不同话题、口音与语言转换进行学习,实现更好的识别和翻译。
  Skype开启中英实时语音翻译对话新时代
  Skype Translator工作原理信息图
  Skype Translator的机器学习协议训练并优化语音识别和机器翻译任务,就像黏住这些元素的胶水一样,该协议促进对被识别的文本进行更好的翻译。这个过程包括去除造成不流利的字词(例如“啊”“嗯”以及重复措辞)、将文本分解成句子、添加标点符号和大小写识别。
  语音识别和机器翻译的训练数据来源多种多样,包括翻译的网页、配有字幕的视频,以及预先翻译且转录成文字的一对一谈话。Skype Translator通过记录这些对话来分析对话文本并训练系统更好地“学习”各种语言。
  据悉,已经有很多人与Skype Translator分享了他们过去的对话记录,Skype Translator对其进行了分析并为统计模型创造训练数据,该统计模型教会语音识别和机器翻译引擎如何将收集到的语音转换为文本信息,然后将文本信息转换为另一种语言。使用Skype Translator的用户都会在对话开始前得到清晰的系统提示,即对话将被录制并用于提高微软翻译和语音识别服务的质量。
  在准备好的数据被录入机器学习系统后,机器学习软件会在这些对话和环境涉及到的单词中搭建一个统计模型。当用户说话时,软件会在该统计模型中寻找相似的内容,之后应用到预先“学到”的转化程序中,使得音频转换为文本再从文本转换成另一种语言。
  语音识别的发展一直受到错误率高、对麦克风敏感度差异、噪音环境等因素阻碍。为此,微软研究院率先将深层神经网络(DNNs)技术引入语音识别,从而极大程度地降低了错误率,提高了可靠性,最终使这项语音翻译技术得以更广泛地应用,包括Skype Translator。
  Skype Translator的机器翻译部分负责将文本从一种语言翻译成另一种语言。它采用了和必应在线翻译同样的技术:开创性地结合了句法和统计模型,此外更加有针对性地训练对话性语言。这点非常有挑战性,因为现在用来搭建文本翻译系统的典型训练数据都是优化过的清晰、结构严谨的书面语言。Skype Translator的系统在包含必应翻译的丰富语言知识的同时,还额外加入了口语对话中出现的单词及短语。
  另外,Skype Translator创造了一个定制化的机器人程序来协调整个产品体验。如电话中的第三方一样,它负责建立电话连接、发送音频流至语音引擎获取翻译文本,并分别在双方结束说话时翻译其所说的内容。
  在技术实现上,Skype Translator主要克服了语气词、俚语翻译、语言翻译用户挑战(主要是用户对Skype Translator的自动翻译器的适应)等多方面的挑战。
  Skype Translator主要功能
  1.语音读取文字信息。用户可以通过语音收听到对话方发送给自己的即时消息,语音的语言可以自选。
  2.持续性识别。在对方发送语音信息期间可持续性的进行文字翻译。
  3.自动声量控制。您的对话方可以在实时语音翻译期间不间断地说话。同时,您可收听到较高音量的语音翻译,对话方本身的语音信息呈现出较低音量,所以您只要将注意力集中在语音翻译上即可,这可以保证翻译信息的收听流畅。
  4.语言翻译静音功能。您可以任意开启或关闭语音翻译的声音,并直接读取文字翻译。除了语音翻译现有的四种语言(英语,西班牙语,中文普通话,意大利语), Skype Translator的即时通讯文本翻译更是在原有40多种语言的基础上加入了塞尔维亚语,波斯尼亚语,克罗地亚语,玛雅语和奥托米语。
  本文章是由译声整理发布的。

相关阅读Relate

媒体报道相关问答
问:为什么以WORD软件里“字符数(不计空格)”项为字数统计标准?
答: 翻译标准已经做阐述,以WORD软件中的“字符数(不计空格)”已经普遍成为翻译行业字数统计的标准,即在统计中包括了标点符号和特殊字符,因为我们处理稿件时,要考虑标点符号的意义,标点是可以决定句子意思的元素,正如鲁迅先生曾指出的,一篇没有标点符合或错用标点符号的文章不能称其为文章;另外,化学式,数学公式等在翻译中我们也要考虑,而这样做并不比进行纯文本翻译更节省时间。我们建议客户,把给我们的稿件中所有不需要的东西全部删除,在节省您成本的同时、也使我们的工作发挥最大的效力。
问:中文和英文字数统计的区别?
答: 一般翻译客户并不了解,中文和英文字数有一个相对固定的比例,其值为中文字数:英文(西文语种类似)单词数大约=2:1左右。所以,当您给出10000字的中文资料,其译文英文单词数约为5000字左右;当您给出10000单词的英文资料翻译为中文,其译文字数约为20000字左右。
问:我想要翻译一篇文章,请问是怎么收费的?
答:资料翻译报价是根据稿件总字数、专业性程度、翻译领域、交稿时间综合考虑来确定的。一般来说,中译英费用160元/千字,英译中150元/千字,都是基于汉字统计“字符数(不计空格)”数值计算。您可以参看我们的翻译报价。
问:可以处理的稿件内容?
答: 我们通常指的翻译工作是对一篇文章的文本部分进行翻译并排版,如稿件中的部分翻译内容包含在插图和复杂图表中,我们将在其对应插图或图表位置下方将原文和译文同时给出,但不负责对原文中插图和图表进行编辑处理。如需要,费用另议。
问:是否所有的文章内容收费都是固定的?
答:我们对学术类资料精译的基本收费标准是中译英0.18元/字,英译中0.16元/字。但不排除特殊难度的资料采用特殊报价。如中医资料,历史考古,古汉语,哲学等等难度晦涩的专业资料。
问:为什么中文和英文字数不同?
答:一般用户并不了解,中文和英文字数有一个相对固定的比例,其值为中文字数:英文单词书=1.6:1左右。所以,当您给出5000字的中文资料,其译文英文单词数约为3000字左右;当您给出5000单词的英文资料翻译为中文,其译文字数约为8000字左右。
问:如何估算翻译时间?
答:我们建议客户一篇文章至少留2-3天时间进行翻译处理,一方面是因为翻译部门每天都安排了长期项目,您的项目或许会有适当的缓冲时间,另一方面,我们可以按照正常速度处理每个客户每天4000字以内的文字翻译量,同时进行译审,这种速度是最能保证质量的。如果您有一篇4000字以内的稿件,我们建议您留出2-3天时间来处 理,但如果您要求一个工作日内处理完毕,通常情况下我们也是可以满足您的要求的。
问:你们翻译公司做过电子翻译没有?
答:电子翻译是我们的主要优势翻译领域,电子行业客户是我们最大的客户群,我们精通电子行业细分的多个领域。
问:选择自己翻译后再提交修改是不是能够降低翻译时间、节省成本?
答:不确定,实际上我们不推荐这种方式,因为修改过程可能比翻译过程更为耗时、耗力,故而其费用可能和实际翻译费差不多,而且不能节省时间。
问:如果我对文章翻译的质量相对不是那么严格,翻译费用可否降低?
答:无论您对文章翻译的质量要求如何,我们都会按照语际的质量标准严格翻译,这是我们的原则,因此翻译费用不会因为您对质量的要求降低而减少。
本站部分内容和图片来源于网络用户和读者投稿,不确定投稿用户享有完全著作权,根据《信息网络传播权保护条例》,如果侵犯了您的权利,请联系:187348839@qq.com,及时删除。
Go To Top 回顶部
  • 扫一扫,微信在线