9月1日-3日,2022世界人工智能大会(WAIC)在上海举办,这场人工智能领域最具影响力的世界级行业盛会吸引了产学研各界广泛关注,科大讯飞高级副总裁杜兰博士获邀出席,在人工智能与产业融合论坛、智能驾驶论坛上分享了最新的行业探索与思考。
从技术的研发,到将技术产业化落地去真正解决人们生产生活的实际需求,这中间需要跨越怎样的鸿沟?在人工智能与产业融合论坛的主题演讲上,杜兰分享了科大讯飞创业23年来,探索人工智能和产业融合的四大路径:用热爱和坚守掌握核心源头技术、用源头技术创新带动全局规划、用系统性创新解决社会重大刚需命题,以及用产业生态搭建让创新生生不息。
用热爱和坚守掌握核心源头技术
用热爱和坚守掌握核心源头技术到底有多难?
杜兰分享了现在众所周知的语音识别技术——当你说话时,屏幕上马上可以看到转写的文字。这样一项“稀松平常”的技术,从刚开始识别10个英文数字、到连续识别一句话、到实验室场景识别准确率超过95%但现实环境却只能下降到70%、再到经过系统性创新算法优化和大数据长期积累后准确率达到95%,现在讯飞输入法的准确率已经达到98%,整个“技术进化”过程足足耗费全球专家70多年时间。
根据Gartner技术成熟度曲线,任何一项技术由研发到产业化应用落地通常要5-10年,杜兰说,这期间要穿越期望膨胀期、泡沫破裂低谷期和生产成熟期,才会迎来真正的产业春天。“我希望大家对核心源头技术创新要有耐心,更要有长期坚守的心态”。
用源头技术创新带动全局规划
杜兰认为,从技术研发,迈向规模化应用落地,需要经历“两级放大器”效应。在这个过程中,关键是要结合技术的特点和各个应用方向,提前做好前后端贯穿的机制设计,规划好技术路线,从而让核心源头技术创新更快更好地带动全局规划。
什么是技术的“两级放大器”效应?杜兰说,从核心源头技术,到解决消费、医疗等各行各业实际问题的技术,经过了两级放大,一级是从基础算法开始,再形成像语音识别、语音合成、自然语言理解、机器翻译等常用技术;二级是在具体使用场景下,结合专家的定标和数据的优化,才能够成为一个解决实际问题的技术。经过“两级放大器”效应后,才能够带动整个产业的落地和发展。
用系统性创新解决社会重大刚需命题
杜兰说,和移动互联网带来的好玩新奇酷炫应用不同,人工智能要解决的是人类生产生活的刚需命题,这必须靠系统性创新。系统性创新分为三个阶段:从单点的技术突破开始,到解决单个场景的应用问题,再到形成行业级的解决方案。杜兰分享了在教育、医疗、工业、消费者等领域如何通过系统性创新进行人工智能规模化应用落地的全面探索。
以消费者领域的C端产品讯飞翻译机为例,首先,科大讯飞机器翻译系统参加CATTI全国翻译专业资格(水平)科研测试,达到专业译员水平,就是突破了单点技术。然后,以机器翻译技术作为核心,同时还要融合语音识别、语音合成、麦克风阵列等技术,形成了讯飞翻译机的核心功能,在真实场景中去解决跨语言沟通问题。最后,要贯通多个关联的场景应用,形成行业级的解决方案,2022北京冬奥会就是一个典型场景,科大讯飞作为大会官方自动语音转换与翻译独家供应商,除了提供翻译机,还提供虚拟志愿者、智能会议系统等行业级解决方案,实现会议组织各方、运动员、裁判员、观众等不同组织和团队的无障碍沟通,从而打造一个沟通无障碍的运动会。
用产业生态搭建让创新生生不息
创新路上,科大讯飞不是独行者,杜兰认为,唯有产业生态,才能让创新生生不息。
2010年以来,讯飞开放平台就开始把核心技术能力开放给各行各业的开发者,目前已经将498项人工智能能力开放给352.7万开发者团队,开发出154万个应用,链接了超过500万生态伙伴。杜兰表示,希望全社会共同关注新技术的发展和落地,打造一个鼓励创新、宽容失败和拒绝平庸的产业生态环境。
*文中数据来源于实际应用
全部评论