前沿科技科大讯飞AI技术助力信息无停滞 ——寄托科技来解决信息无停滞题目
【前沿科技】科大讯飞AI技术助力信息无停滞 ——寄托科技来解决信息无停滞题目
择要:本文对科大讯飞如何充分发挥人工智能(AI)技术上风最大广度和最大深度地降低停滞群体获取信息的难度,更好地服务停滞群体提出解决方案。
关键词:信息无停滞;人工智能(AI);语音识别;语音合成;语音交互
寄托科技来解决信息无停滞题目,不仅吻合国家战略,而且也能切实、经济、有用地为更大范围的特别群体提供无停滞服务。这就必要核心技术能够产业化落地、产品设计上融入信息无停滞元素。同时,科技企业在践行社会责任时除了拥有技术与产品外,还应抱有公益情怀。
一、信息无停滞事业相干背景
信息无停滞是指任何人在任何情况下都能平等地、方便地、无停滞地获取信息、行使信息。随着互联网在生活中的紧张性日益凸显,听障人士和健全人一样享受信息的快捷和方便已成为一种发展趋势。党中间、国务院高度正视无停滞环境建设工作。习近平总书记强调,要正视无停滞环境建设。李克强总理在当局工作报告中提出,要加快无停滞设施建设、支撑无停滞环境建设。
目前,我国残疾人总数约为8500万人,老年人口数量近2亿,且老龄化程度赓续进步。实现信息无停滞,不仅关系到让残疾人获得更多的教育、就业机会,也关系到如何应对即将到来的人口老龄化题目。同时,信息无停滞对于缩小数字鸿沟也具有积极作用。因此在人工智能技术日益壮大的情况下,如何充分发挥其最大上风,最大广度和最大深度地降低停滞群体获取信息的难度,更好地服务停滞群体,就显得尤为紧张。科大讯飞一向致力于行使AI技术帮助停滞群体更加方便快捷地获得信息,共享发展成果。
二、信息无停滞建设需求
1.信息停滞缘故原由分析
(1)语种不同造成的信息交流停滞。随着“一带一起”政策的广泛影响,沿线国家之间的交流日渐增多。“一带一起”沿线国家拥有各自的语言,造成彼此间交流不通行,而周全的开放和接触带来的翻译需求,仅寄托传统的人工翻译目前已经很难知足。
(2)多民族语言造成的信息交流停滞。中国有五十六个民族,大部分民族拥有本身的语言和笔墨。通行的交流是民族稳固、国家协调发展的基础。少数民族语言与汉语言之间的互译对增长民族交流、促进民族协调具有紧张意义。
(3)各地方言造成的信息交流停滞。中国地大物博,仅科大讯飞AI技术助力信息无停滞/165汉语就拥有浩繁口音,如东北、四川、河南、安徽、浙江、广东等。各地不同的发音风俗造成了相互之间交流不畅。寄托人工智能技术可以实现汉语不同口音之间的顺畅交流。
(4)听障人士信息获取困难。听障人士很难像正常人一样通过语音获取信息,无法通过语言进行正常交流,这些都给他们的日常生活带来了极大的未便。
2.信息无停滞场景
(1)日常交流。随着全球化趋势的到来以及“一带一起”政策的深入推进,中外企业、民间整体之间的交流越来越多,导致翻译需求急增。企业日常办公交流、民间整体互访、小我旅游等场景,翻译精准度要求并不高,但是人工翻译的成本及人力均难以支撑。因此可以通过机器翻译、多轮交互的体例来完成沟通。
(2)公共服务信息交流停滞。智能语音技术在当局办事大厅、机场和高铁服务柜台、旅游景点服务站、货运快递等公共服务场所应用后,能有用进步公共服务信息交流服从。在涉外、民族语言互通方面也有很大作用。分外是对听障人士信息交流方面的作用有更加明显。
(3)特别教育信息交流停滞。听障人士在学习过程中会碰到一些困难,以语音笔墨为重要交流手段的传统教学体例就不能很好地实施。假如能把语音转写技术融入特别教育教学场景,就可以很好地解决听障人士的教学工作。
(4)听障人士的文娱交流停滞。听障人士在观看电视节目、网络直播、体育赛事时,因不能及时获得节目内容信息而影响了观看体验。使用语音转写技术后,笔墨就可以展示在直播页面上,能有用帮助听障人士及时获取节目内容。
三、科大讯飞AI技术助力信息无停滞
1.信息无停滞落地应用的前提是跨越技术鸿沟
解决信息无停滞涉及的AI技术有语音识别技术、语音合成技术、语音交互技术等。科大讯飞作为中国智能语音与人工智能产业向导者,长期从事语音及语言、天然语言理解、机器学习推理及自立学习等核心技术研究,并保持了国际前沿技术水平,还积极推动人工智能产品研发和行业应用落地,致力于让机器“能听会说,能理解会思考”。自20世纪90年代中期以来,科大讯飞在历次国内外语音合成评测中,各项关键指标均名列第一。2008年至今,科大讯飞延续在国际说话人、语种识别评测大赛中名列前茅。近年来,科大讯飞还多次在机器翻译、天然语言理解、图像识别、图像理解、知识图谱、知识发现、机器推理等各项国际评测中占有榜首位置。
科大讯飞是目前我国唯一以语音技术为产业化方向的“国家863计划成果产业化基地”“国家规划布局内重点软件企业”“国家高技术产业化示范工程”。“国家智能语音高新技术产业化基地”“语音及语言信息处理国家工程实验室”也先后落户科大讯飞。科大讯飞被原信息产业部确定为中文语音交互技术标准工作组组长单位,牵头制订中文语音技术标准。
科大讯飞两次荣获“国际科技提高奖”及中国信息产业自立创新“信息产业庞大技术发明奖”。2017年6月,《麻省理工科技评论》发布2017全球50大最聪明公司榜单,科大讯飞首次入榜,并名列全球第六、中国第一;2019年再度入榜。2017年11月,科大讯飞入选首批国家四大新一代人工智能开放创新平台。2017年12月,科技部明确依托科大讯飞建设认知智能国家重点实验室,这是我国在人工智能高级阶段———认知智能领域的第一个国家级重点实验室。
2.在产品端的实现上,信息无停滞应是必选项(1)讯飞听见APP。讯飞听见APP使用科大讯飞最新的语音转写和翻译技术,通过手机拾音器将说话人的声音转写成笔墨,并显现在屏幕上,让听障人士能通过手机端敏捷获取沟通讯息。同时,讯飞听见APP还支撑翻译功能,让听障人士与外宾交流变得有可能。手机APP的承载情势让听障人士的沟通成本变得特别很是低。
同时,为了兼顾残障人士的试用体验,讯飞听见APP对产品界面和功能进行针对性优化,包括转写效果全屏表现、笔墨大小缩放、页面主动横屏等,大大提拔了残障人士的用户体验。讯飞听见APP上线后获得残疾人同伙的认可。讯飞听见APP为听障人士免费提供实时语音转笔墨服务,帮助听障人士用笔墨去感受世界,进行日常沟通。获取使用体例很简单,上传残疾人证即可免费申领服务。
(2)讯飞翻译机。讯飞翻译机能为旅游用户提供实时的公有云翻译服务,采用神经网络机器翻译、语音识别、语义理解、语音合成、图像识别、离线翻译以及四麦克风阵列等多项全球领先的人工智能技术。讯飞翻译机支撑语音对话翻译、拍照翻译、离线翻译等翻译模式,分外支撑方言翻译,并推出全球上网、口语学习、SOS等服务,为跨语种信息沟通提供了优秀的产品支撑。(3)讯飞听见M1。听障人士在参加会议及多人交流时更加不方便,无法在第临时间获得谈话人的正确信息,导致信息不能及时同步,紧张延伸了决策时间,影响了沟通服从。偶然候可能会遗漏或错误理解谈话人信息,导致信息不正确,产生信息误差,对决策产生紧张的影响。讯飞听见M1与讯飞听见APP的组合完善解决了多人交流场景的沟通,将所有谈话人的信息依次表现在手机APP屏幕上,让听障人士能在第临时间正确获取谈话人信息,为其正确决策提供依据。
讯飞听见M1是一款以专业录音、实时语音转笔墨及翻译为核心功能的智能硬件。无缝连接讯飞听见APP,支撑长途控制硬件设备,扫码分享实时转写内容。可知足会议内容多终端同步、访谈记录快速出稿、外教课程实时翻译等多场景的录音整顿需求,周全提拔工作服从。讯飞听见M1采用7+1环形麦克风,能清晰正确地记录谈话人的信息,在喧华的场景下也能达到很高的识别率。支撑录音转写,即使无法亲临会议现场,也可以通过会后转写来了解会议细致内容。(4) 讯飞听见L1。听障人士在复杂会议场景下进行交流尤为困难。在没有声音帮助理解的情况下,处于培训会、分享会、长途视频会议等场景中,听障人士很难理解谈话人的正确信息。讯飞听见L1是一款以多功能视频会议、实时语音转写及翻译为核心功能的高端智能设备,具有语音转写及翻译、文档分享、长途会议白板及长途会议文档分享功能。将会议内容通过声音和笔墨两个维度表达出来,相比于声音的即时性,笔墨记录更持久,笔墨信息获取的正确度更高,从而让听障人士在复杂会议场景下也能和正常人士一样获取信息。同时,讯飞听见L1提供的翻译功能,让听障人士参加外文会议变得有可能。设备部署在公共服务场所的问询台、高铁车站的售票窗口及医院、邮政、当局等服务窗口,能帮助听障人士很好地解决信息沟通停滞题目。讯飞听见L1还能为企业涉交际流、企业培训、产品发布、长途会议、长途汇报、长途面试等多个场景提供专业的转写和翻译服务。
(5)讯飞听见智能语音课堂体系。自1951年将盲聋教育纳入国家教育系统、设立特别教育黉舍以来,聋哑教育运用特别体例和设备,如口语、书面语和手语相结合的办法以及直观教具、助听器等进行教学,在聋哑人教育方面取得长足提高。同时也存在一些不足,如手语教学表达内容单一、手语交流易出现歧义、完全丧失听力的聋哑人无法借助助听器等。2015年底,讯飞听见推出针对聋哑人教育场景的智能会议体系——讯飞听见智能语音课堂体系,解决特教教学场景下的教学停滞,将先生的教学语言通过体系实时转写成笔墨,直接用投影大屏幕输出表现,在教学过程中保障特教生能够获取全量笔墨信息,辅助听力停滞门生对教学信息进行理解,有用提拔教学成果。最终结果如下图所示:北京联合大学特别教育学院,一期部署2个教室,2018年扩建到学院内8个教室。2017年6月13日,央视《焦点访谈》栏目播出了一期《熟悉无停滞,共享有通途》的节目,对讯飞听见体系在构建无停滞信息交流方面的促进作用进行报道。此体系还成功在南京特别教育师范学院的30个教室进行教学使用,在宁波特教、扬州特教、杭州聋人黉舍、西安第二聋哑黉舍、深圳中学、福州职业技术学院、东盛残疾人中间等特教院校成功应用。
(6)读屏软件产品。2007年,基于科大讯飞提供的核心语音技术,中国盲文出版社主持研发了新式阅读终端——阳光听书郎。这是一款支撑电子书朗读、语音菜单导航的多功能便携硬件终端设备。
2010年6月,保益互动联合科大讯飞、腾讯科技推出瞽者版手机QQ。基于科大讯飞的语音合成技术,瞽者版手机QQ可以与读屏软件完善匹配,能够朗读手机QQ中的汉字、英文、数字以及表情符,从而让视障人士通过手机QQ与挚友进行即时沟通交流。
2014年,争渡软件正式与讯飞语音云团队达成公益合作,为争渡软件提供讯飞语音的技术接口,让上百万的瞽者同伙受益,体验到讯飞清晰的语音服务。
四、科大讯飞信息无停滞公益运动
1.瞽者聋人信息无停滞需求咨询对接研讨会 2017年1月17日,由中国盲协、中国聋协主理,清华大学无停滞发展研究院、科大讯飞公司联办的“瞽者聋人信息无停滞需求咨询对接研讨会”在京召开。科大讯飞公司展示了目前处于世界领先水平的语音技术和人工智能技术以及为实现瞽者聋人信息无停滞所做的科研工作。与会的瞽者代表、聋人代表畅谈了使用信息产品后的体验感受,表达了瞽者聋人在信息无停滞方面的个性化迫切需求。与会专家及代表就目前信息无停滞发展状态、取得成效、瞽者聋人群体对信息无停滞需求建议以及信息无停滞科技研发、标准化制订、应对对策和将来瞻望等进行了充分研讨,并广泛进行了技术交流。
相干向导透露表现,中国残联将不遗余力地继承推动当局部门和行业组织制订有关无停滞环境建设的政策与措施,促进各项措施真正落地奏效,实现无停滞基本公共服务均等化。同时,携手清华大学无停滞发展研究院、科大讯飞公司等高端智库和科技行业对接无停滞产品与服务,共同推动瞽者聋人信息无停滞工作实现新的局面。
2.《人工智能+共创新世界》 2017年4月14日,“清华大学-东京大学无停滞发展学术研讨会暨无停滞发展研究院年会”在清华大学举办,来自中日两国160余名专家学者、当局工作人员、社会爱心人士以及爱心企业参与了此次运动。中国残联副主席吕世明、清华大学党委副书记邓卫出席,科大讯飞应邀作为企业代表阐述其在无停滞建设事业中的理念及成果,并发表《人工智能+共创新世界》的主题演讲,重点介绍科大讯飞运用自身智能语音及人工智能的技术上风和行业影响力在无停滞领域的应用探索。将来,科大讯飞将充分发挥自身力量,在新建设施的标准落实、已有设施的有用使用和改造、推进信息获取及公共服务无停滞、进步全社会无停滞意识方面,和谐社会各界共同参与无停滞环境建设,协同创新,推动惠及亿万人群的公共服务政策有用实施。
3.“中国政务信息无停滞公益举措分外贡献单位” 2017年12月21日,中国信息无停滞公益举措启动暨中国互联网协会信息无停滞工作委员会的成立大会在京成功召开。科大讯飞成为首批加入委员会的成员单位。此次大会还为政务信息无停滞公益举措凸起贡献单位举行了颁牌仪式,向科大讯飞公司颁发“中国政务信息无停滞公益举措分外贡献单位”奖状。
4.《Web信息无停滞通用设计规范》 2018年7月24日,由中国互联网协会组织的《Web信息无停滞通用设计规范》立项评审会议在京召开,科大讯飞公司作为项目审定的单位成员参与会议,与相干单位一路共同加快深入开展信息无停滞标准制订和信息无停滞建设工作,尽早帮助6亿多的停滞人士融入信息社会,并呼吁更多的企业关注信息无停滞公益事业,积极参与信息无停滞环境建设,让中国互联网更加文明提高。
5.全国政协第68次双周协商座谈会 2017年6月9日,时任全国政协主席俞正声主持召开全国政协第68次双周协商座谈会,科大讯飞高级副总裁江涛作为行业专家出席会议并就无停滞信息交流建言献策。讯飞听见作为科大讯飞智能语音及人工智能领域代表应用,向在场的委员们展示了人工智能技术在无停滞信息交流方面的应用前景。为了加快人工智能服务信息无停滞,江涛建议:首先,应加快相干配套政策和标准的制订,将人工智能技术纳入信息无停滞技术规范和标准,并尽快建立相干技术支持系统,确保政策标准的监督和实施;其次,应扶持和鼓励信息无停滞产业的发展,包括:进一步深化当局及紧张社会信息门户执行信息无停滞改造,在公共媒体和公共服务设施上的无停滞信息化应用,让视听停滞人群可以更方便地获取信息服务;再次,大力扶持人工智能技术在特别教育领域的应用,帮助具有视听停滞的门生上课更方便,享受和健全人一样的教学结果;最后,鼓励企业开发面向残疾人的智能家居、医疗保健体系,积极探索人工智能技术在智能家居、医疗保健上的应用,让残疾人的家居生活和医疗保健更加方便、舒适。
6.“三声有幸”公益计划 在2017年首届全球1024开发者节上,科大讯飞实行总裁胡郁正式对外发布“三声有幸”公益计划。盼望借助拥有公益情怀的开发团队将日月牙异的AI技术赋予到公益领域,帮助更多人提拔幸福感。AI公益案例落地“三声有幸”,扶持了各类公益产品的顺利落地,不仅为关注公益开发的小伙伴们积累了典型案例,而且让越来越多的特别人群从AI中获益。音书科技CEO石城川是一位聋人,双耳听力阈值不足120分贝,戴助听器也无任何结果。一样平常情况下,失去双耳听力的聋人也面临着失去说话能力的高风险,聋和哑几乎是同时存在的。2016年,石城川接触到科大讯飞的语音识别技术,注册成为讯飞开放平台的开发者,并创办了音书科技有限公司。通过识别和转写技术进行语言康复,最终可以流畅地与人对话。虽然失去听力,但人工智能技术的出现让他重新拥有了说话的能力。“三声有幸”项目在接触音书科技后,为其提供了资金、市场和品牌等多方面的扶持。第一,生态扶持。音书科技初期的市场估值为2000万,后期经过“三声有幸”公益项目和创业孵化团队的共同评估,同时结合音书科技的公益创业属性和商业BP,对其追加占股投资。第二,市场扶持。3月22日AI大学将来课栈上海栈亮相全新环节———创意集市,音书科技CEO石城川登场并用5分钟的时间分享了本身的成长经历和创业故事,获得了广泛的媒体关注和报道。第三,技术扶持。音书APP目前支撑识别的语言包括粤语、通俗话、英语在内共7种语言,而用户来自五湖四海,同化着各种方言,现有的音书APP无法做到正确识别。了解到该技术的瓶颈后,开放平台免费为其提供技术支撑,帮助其完美功能。
心智互动是一家聚焦失能人群(部分感官及举动能力消散或退化的人群,如老年人、瞽者、视障者等)社交娱乐的科技社会型企业。心智互动在2017年8月推出一款针对瞽者的手游“听游江湖”。科大讯飞和心智互动联合开发读屏软件,免费开放,让每一个瞽者都能使用智能手机,走进互联网的世界。第一,免费的技术服务。中国目前有1700多万视障人士。在开发读屏软件的过程中,讯飞开放平台提供免费的服务,大大降低了开发成本,缩短了开发测试周期。第二,市场扶持。产品落地后,“三声有幸”项目联合心智互动及中国残疾人康复协会、中国盲文出版社、光明天使基金会等组织联合举办消息发布会,对产品进行多途径多角度宣传。第三,生态扶持。心智互动目前由两位合伙人共同持股,为了后续更好地进行技术支撑,经“三声有幸”和创业孵化团队共同评估后,以技术占股的体例对心智互动进行微占股。
7.AI无界、公益先行——科大讯飞“无停滞联合实验室”在沪正式揭牌 目前,我国有8000多万残障人士,其入耳障人士就超过了2000万。听障人士由于无法接收声音,面临着诸多困境,比如无法与人正常交流、工作困难、自我表达存在缺陷等。久而久之,听障人士越来越难精确有用地与世界沟通,挫败感油然而生,逐步被有声世界边缘化。为解决听障人士的这些困境,2019年7月27日,中国残联无停滞推进办、中国聋人协会、北京联合大学以及科大讯飞公司在上海诺宝中间签署了关于成立“听见信息无停滞研发与应用联合实验室”的合作备忘,并现场举行了揭牌签约仪式。在第十四届信息无停滞论坛的现场,讯飞听见也提供了智能会展的无停滞字幕上屏展示,无论是现场嘉宾谈话,照旧现场视频案例的播放,现场都能将实时语音转化为字幕,帮助听障人士了解会议信息。联合实验室的成立,更反映出科大讯飞将AI技术致力于公益的决心。各单位的加入,也标志着越来越多的科技力量正汇聚到“AI公益”这条路上。我们将和各方一道,共同为听障人士铸就梦想。我们信赖,联合实验室的成立,会将科大讯飞的技术与服务推到更多听障人士的身边。
信息来源:科大讯飞
编辑:燕飞