众所周知,AI将是推动未来社会发展的主力。不久前的10月21日,便有第六届世界互联网大会的重要产业合作对接活动——IDG“AI+5G 赋能科技 引领未来”专场活动在乌镇互联网国际会展中心举行。其以“AI+5G 赋能科技 引领未来”为主题,齐聚行业大咖,共同探讨在5G时代,人工智能的发展之路,为促进行业交流、实现产业合作提供平台。
纵观现在的国际市场,外有日本软银的孙正义,为了发展AI成立1000亿美金的AI基金,专门投资一些AI领域的公司。内则有如旷视科技、极链科技等AI产业独角兽,积极进取,开拓新领域。这些都体现出了AI在人们心中地位的加重。
可也有不少人对AI产生了质疑声,毕竟目前的电脑程序以及所谓的AI,其对我们人类的自然语言只是达到处理的级别。这方面的专业叫法是自然语言处理NLP,还远远达不到我们期望的自然语言理解的程度。
它的实现方式是,从海量的人类自然语言素材里面,统计出词与词,字与字,以及词组成的短语的模式和出现频率,然后根据这个频率统计,再结合一段文字上下文逻辑的简短推理,来找出统计概率最大的结果。再把这个结果作为答案输出或者根据这个结果寻找统计概率最大的匹配答案。
这样的运作模式和我们人类理解自然语言的方式有一定的相似,但缺失了很重要的一部分,即词语背后所指代的事物的背景知识,而这才是理解人类自然的关键,所以现在AI界的一个重要挑战是,如何让计算机理解我们人类掌握的公共知识,也就是常识。
近期,微软研究团队便通过对上下文建模加以研究,得出了一种新的方法。这种方法能够让 AI 模型通过上下文的历史记录来改写对话中的最后话语。在一份预先出版的论文中,微软研究团队详细地介绍了他们的工作——为开放领域的对话进行无监督的上下文重写。他们声称,在重写质量和多轮响应生成方面,他们的实验结果已经达到了最新基准。
正如研究人员所解释的那样,对话上下文提出了句子建模中所没有的挑战,比如主题转换、共同引用(像他、她、它、他们这种)、长期依赖。大多数系统解决这些问题的方法是在最后一段话中添加关键字,或者用 AI 模型学习数字表示,但这种方法往往会遇到障碍,比如无法选择正确的关键词、无法处理较长的上下文等。
这时候,就是微软研究团队的方法的用武之地了。它通过对语境信息的考量,重新制定了对话中的最后一句话;这么做是为了生成一个独立的话语,既不存在相互参照,也不依赖过去对话的其它话语。
举个例子,如果将“我讨厌喝咖啡。- - 为什么?它挺好喝的啊。”转化成“为什么会讨厌喝咖啡呢?它挺好喝的啊。”,这就借用了“它”和“为什么”。其中,“它”指代的是对话中提到的咖啡,“为什么”则是“为什么讨厌喝咖啡”的缩写形式。
对此,研究人员设计了一个机器学习系统——上下文重写网络,来实现端到端的流程自动化。这个系统是由一个序列到序列模型组成的,它能够将固定长度的话语映射到固定长度的重写句子上。并且,它还具有一个独立的注意力机制,这个机制能够通过最后话语中的不同单词来帮助它从上下文中复制单词。
微软研究团队认为,他们的工作朝着更易解释和更易控制的上下文建模中迈进了一步。另外,该研究团队还表示,他们的模型可以从嘈杂的语境中提取出重要的关键词,然后将这些关键词插入到最后的话语中,使其不仅变得易于控制和解释,还有助于将信息直接传递到最后的话语中。
这个技术可以帮助人工智能在真正理解人类话语的路上跨出一步,尽管该模型在强化学习后偶尔会变得不稳定,不过它依旧显著地提升了话语的多样性。此外,微软今年推出了一款可以识别情绪的工具,根据上传的图片就可以分析出情绪特征,但同时微软也声明目前这款软件还只是以娱乐为主,还不能每次都能正确的识别情绪。
“情绪的产生过程会反映在外周器官状态变化。比如人受到外界刺激感到恐惧的时候,会出现心跳加速或心律不齐、呼吸短促或停顿和血压升高等情况。目前,AI深度学习的情绪识别已经从快乐、惊讶、愤怒、悲伤、恐惧和厌恶等基本情绪发展到了超过二十种更微妙的情绪,例如“愉快的惊讶”、“愤怒的惊讶”、敬畏等。
不可否认,未来已经离我们不远了。无论我们喜不喜欢、乐不乐意,终有一天AI将能真正读懂人类的语言、动作、情绪等各类因素。届时,如何处理好其间可能存在的问题,还需我们提前进行思考。
责任编辑:ct
全部评论