幸运分分彩 首页 > 科技

华为投资深思考,多模态语义理解的时代来了?

2019-10-09 14:21 weila

近日,36氪获悉,深思考人工智能机器人科技(北京)有限公司(以下简称“深思考”)获得华为旗下全资子公司哈勃科技投资有限公司(以下简称“哈勃投资”)的数千万人民币的战略投资。

从深思考官网可以了解到,其最突出的技术是“多模态深度语义理解引擎(iDeepwise.ai)与人机交互技术”。官网显示,该引擎技术可同时理解文本、视觉图像等多模态非结构化数据背后的深度语义,其中,对长文本的机器阅读理解技术、自由跨域的多轮人机对话技术、对多种模态信息的语义理解技术是其非常突出的优势。

让人好奇的核心是两个问题,第一,深思考的核心技术,即多模态深度语义理解与人机交互技术究竟是什么,又面向着怎样的落地场景?第二,华为,或者说华为的子公司为什么要投资深思考,这其中存在着怎样的商业考量与生态布局?

从接下来的文章中,我们或许可以一窥一二。

多模态和多模态语义理解

在8月结束的“2019机器阅读理解竞赛”中,在两项核心技术指标中,深思考均位列第一,从全球2000多支队伍中脱颖而出,取得冠军。当时36氪,曾对深思考人工智能CEO兼AI算法科学家杨志明博士进行过采访。

“人类说话的时候,往往是口语化的、不连续的、支离破碎的,甚至语序颠倒的。语音识别只停留在语音指令,不能理解用户语言及背后的逻辑,实际无法解决用户在很多场景中的刚需。”杨志明举例,人类在看电影时,不仅看画面、听声音,也会看字幕,甚至还会根据电影主题进行联想。

每一种信息的来源或者形式,就可以称为一种模态,例如,人的视觉、触觉、听觉、嗅觉、味觉,信息媒介包括语音、图片、视频、文字等,而传感器则有红外线、雷达、电磁等。

多模态的人工智能就是通过不同的信息维度和信息来源,帮助人工智能以更像人类的方式进行思考和学习。

随着算法、算力、云及芯片等技术的不断成熟,人工智能,尤其是强人工智能在过去几年快速发展。据WIPOP2019年人工智能趋势报告显示,50%的AI专利在过去5年内发表,这意味着从2014年-2018年这五年内,AI产业进入了快速发展的阶段。

当然,相比单一模态的人工智能技术,多模态的人工智能技术无论对算法,还是算力的要求,都复杂不少,甚至可能可以说是指数级的复杂程度,而最终呈现的效果,也会更接近人类思考的效果。

以智能家居场景为例,语音识别技术实现的效果,是听到语音指令,并执行指令,一旦有复杂的语音表述,就会进入,“我没有听懂您说的是什么?”,或是“您的意思是这样吗?”等操作指令的进一步确认和细化。

真正能够帮助机器解决“听懂”和“看懂”的问题是语义理解,而其中的机器阅读理解一直被认为是语义理解和自然语言处理(NLP)的标志性临界点。

据2018年年底腾讯研究院统计,在中国人工智能企业中,融资占比排名前三的领域分别是计算机视觉与图像,自然语言处理,以及自动驾驶/辅助驾驶,而排在第二名的自然语言处理,融资122亿元,占比19%。

深思考的“多模态深度语义理解引擎(iDeepwise.ai)与人机交互技术”,简单来说,就是实现从简单的机器感知到深度的语义理解,而这一点,会使人机交互变得更加智能,也是机器真正迈向智能的关键。

这可能是深思考能够吸引到华为子公司投资的原因之一。

但显然,这不是唯一的原因。

华为以及华为的生态

如今,人们已经很难用一句话来简单概括华为,其产业链包括通信设备、半导体、消费电子、云计算、安防等,公司营收也从2008年的183亿美金增长到2018年的1052亿美金。

不仅手机销量超越苹果,华为在5G、芯片和智能硬件端的表现也十分抢眼,尤其是5G产业上的发力,比如最新旗舰手机Mate30系列手机,其搭载的麒麟990芯片,也是行业中第一枚正式商用的5G SoC芯片。

再比如面向全场景的分布式操作系统鸿蒙OS,据之前发布会介绍,鸿蒙OS已在手机、平板上率先进行了使用,并将会应用在智能手表、智慧屏、车载设备、智能音箱等智能终端上。