全球旧事资料 分类
具有深远意义的“一带一路”战略构想涉及俄罗斯、印度、泰国等超过六十个国家,近四十亿人口,四十多种语言,将极大的促进沿线各国的深度合作和交流。提到合作与交流,首先摆在我们面前的便是语言问题。如何跨越语言障碍,实现各国互联互通呢?全球一体化时代,单靠人力显然是不能完成这样的艰巨任务。好在科技的进步给我们提供了解决方案,以机器取代人,让机器扮演翻译这一重要角色,不仅具有很强的战略意义,在实际经济和文化生活中也举足轻重。显然,这并不是一项轻松的工作,机器翻译需要凝聚计算机、认知科学、语言学、信息论等学科的知识,是人工智能的终极目标之一。国内外的一些行业巨擘都在这一领域发力,努力研发出具备高度可用性的机器翻译技术。百度也是这一领域的佼佼者,联合了国内顶级学术机构展开研究,中国科学院自动化研究所、浙江大学、哈尔滨工业大学、中国科学院计算技术研究所和清华大学等悉数在列。爆发式增长的数据规模给机器翻译带来新的想象空间,百度依托得天独厚的大数据优势,取得了机器翻译核心技术的多项突破。先进的机器翻译背后蕴含着怎样的高科技呢?下面我们一探究竟。互联网学霸:高质量翻译知识获取技术蹒跚学步是新生儿必须经历的过程,当一个人接触到翻译这个工作的时候,熟悉和掌握大量的双语词句就是这个学步的过程。只有了解了大量语句的常用翻译方法,才可以举一反三,融会贯通。我们可以将这个过程理解为“背诵例句”的过程。作为个人,要背诵成百上千的例句就颇为不易,挑灯夜战,痛苦不堪,往往还需要反复背诵以加深记忆。百度机器翻译同样有着这样“背诵例句”的过程,所不同的是,它的背诵能力超出了大多数人的想象。百度研发了基于互联网大数据的高质量翻译知识获取技术,突破了传统翻译知识获取规模小、成本高的瓶颈。互联网就是百度机器翻译的语料库的来源,而基于网页自主拓扑结构和内容互译计算的语料获取方法,也解决了互联网翻译知识质量控制的难题。百度机器翻译“背诵例句”的规模有多大,通过一个数据可以窥豹一斑:“例句”的数量如果按照字数换算成《大英百科全书》,翻译系统在一周内学习的内容相当于千万部《大英百科全书》。即便是最强悍的人类学霸,在这种规模的语料学习前也将一败涂地。翻译方法的突破:基于互联网大数据的翻译方法
f如果将互联网大数据比喻为浩瀚的大海,传统方法犹如一叶扁舟,难以应对互联网大数据带来的冲击。要想显著的提高翻r
好听全球资料 返回顶部