初审编辑:魏鹏
责任编辑:孙华飞
中新网2月23日电 近日,美国权威杂志《麻省理工评论》将语音接口列为2016年十大突破技术,百度硅谷人工智能实验室(SVAIL)最新的研究成果——新一代深度语音识别系统Deep Speech2位列其中。
这也是本次评选入选的唯一一家来自中国科技公司的科技成果。同时入选的还有免疫工程、精确编辑植物基因、DNA商店、太阳能电池工厂、特斯拉自动驾驶、可回收火箭,及空中取电、知识分享机器人、slack通信软件等产品和技术,分别来自谷歌、微软、SpaceX等多个领域的知名前沿科技公司,和加州大学伯克利分校、华盛顿大学、首尔大学等科研机构。
《麻省理工评论》在文中评价说:“随着百度在语音技术方面的不断进步,语音接口变得更为实用和有效,人们可以更为便利的与身边的设备进行互动。百度的深度语音识别系统(Deep Speech 2)包含了一个非常大的、“深”的神经网络,它引入了数以百万计的转录语音。有时它在识别汉语语音片段方面,要比人为识别更加准确。”
2014年底,百度的首席科学家吴恩达及其团队发布了第一代深度语音识别系统Deep Speech,该系统使用了端对端的深度学习技术,主要专注于提高嘈杂环境下的英语语音识别的准确率,在噪音环境下,Deep Speech系统出错率要比谷歌、微软以及苹果的语音系统低10%以上。不仅如此,研究人员还加入了汉语语音查询功能,识别准确率高达94%。这也推动端到端的深度学习算法成为业内改进语音识别最重要的手段。
MIT报道中指出,语音识别和自然语言理解相结合,将为互联网市场创造切实可用的语音接口。由于汉字通过微型触摸屏进行输入的过程耗时且十分繁琐,因此,中国是发展语音接口的理想市场。
汉语语音识别与英文相比,包含两大难点。第一是字符数据量大。相比于英文的26个字母,系统要在每次转录中直接输出8万个中文字符中的其中一个。第二,在普通话的表述中,声调的不同往往会改变一个词的意思。百度通过收集人们常用词,筛选出有用的字符,并省去大量预处理环节,直接输入音频文件,再通过深度神经网络输出字符,从而大大提高系统运算效率。
深度语音识别系统的成功,很大程度上要取决于百度规模庞大的基于GPU的深度学习基础设施。通过使用批处理技术将DNNs部署在GPUs上,Deep Speech的语音识别表现出了极高的训练效率。目前,该系统支持超过26万亿次浮点运算,可在几天内完成深度语言的集中训练。
随着百度在语音技术方面的不断进步,语音接口变得更为实用和有效,将深度语音模型在更小的系统上运行是重要的趋势之一。百度正致力于将该语音模型缩小并植入手机等移动设备,未来,人们可更为便利的与身边的设备进行交流互动。(完)
初审编辑:魏鹏
责任编辑:孙华飞
为了让孩子上个好学校,很多家庭在小孩还未出生时就四处寻觅学区房,学区房的价格也是水涨船高。教育部还“钦点”了24个城市的名,要求这些城市所有县市区100%的公办小学、90%的公办初中要实现划片入学。[详细]
甘肃省兰州市北环路中段工程建设引入的企业不具备投资实力,项目超工期3年多仍未建成。广东省10个国家减排责任书项目未按期建设完成,省“十二五”重点减排规划中69个项目建设进度滞后。[详细]
近日,西区警方已经抓获了中山西区酒吧斗殴案的主犯。令人意外的是,这起案件的行凶者和受害者大部分都是未成年人,而打架的理由居然是因为一句话。[详细]
前段时间,马伊琍在微博发布长文,指出国内机场母婴室形同虚设。除了机场的母婴室,更让妈妈们头疼的恐怕是日常上班的挤奶任务。新加坡一位妈妈最近就忍不了了…… 这位妈妈叫Jen Pan,是一位女摄影师。于是,Jen Pan在网上发布了一系列职业妇女在公共场合哺乳的照片。[详细]
澳大利亚国防部2月24日称,澳大利亚皇家空军C-17A飞机载士兵和直升机抵达斐济Nausori国际机场,参与“温斯顿”热带气旋灾区救援工作。原标题:澳大利亚士兵和直升机抵达斐济 将参与灾区救援 澳大利亚国防部2月24日称,澳大利亚皇家空军C-17A飞机载士兵和直升机抵...[详细]
规模庞大、设施齐全,这是位于北京东部30公里河北燕郊的燕达医院给人留下的第一印象。“非营利性”是燕达医院经营副院长吴亦鸣等院方领导多次提到的词,医院外“公立医院的价格,北京三甲医院的优质医疗服务”标语与之对应。[详细]