人工智能近年来最火热的应用是什么,在中国的发展情况如何?
2016年10月18日的世界人工智能大会上,新智元正式发布《中国人工智能产业发展报告》。这份报告分为产业篇、技术篇、应用热点篇和“新智元100报告”四个部分,力图为当下的中国人工智能发展描绘清晰全景图。
60年前,人工智能概念起源于西方,这技术最早得到发展和应用也是在西方。时间走到2016年,在这波人工智能有史以来最强大的发展浪潮中,中国相关产业发展如何,处于世界什么水平?当下最火热的技术有哪些,中国企业有哪些布局?人工智能近年来最火热的应用是什么,在中国的发展情况如何?中国的人工智能创业是怎样一番图景,有哪些公司取得了令人瞩目的进展,竞争力如何?
竞争日趋激烈,互联网巨头纷纷布局
进入2016年,人工智能仿佛一夜之间成了各大互联网巨头的必争之地:Facebook CEO 马克·扎克伯格在2016年3月划定了以人工智能为核心的“十年路线图”;谷歌CEO Sundar Pichai 在2016年4月第一次明确提出,将人工智能优先作为公司大战略;微软 CEO 萨提亚·纳德拉也在10月提出,人工智能将会成为微软的下一件大事。
这些互联网巨头都在把更多的人工智能技术应用到公司的产品中,并组建专门的研究机构进一步加速技术的发展。以谷歌为例, 这家公司以深度学习技术为依托,涉足人机交互、自然语言理解、机器人等人工智能核心技术应用领域,全方位布局人工智能产业。技术方面,谷歌通过基于深度学习的人工智能技术,提升了谷歌传统搜索、翻译和社交业务,推动集视、听、说、感知和控制于一体的无人驾驶汽车发展,并先后开源了第二代机器学习平台TensorFlow以及自然语言理解软件SyntaxNet的源代码,引领互联网巨头在人工智能领域开源的趋势。谷歌通过对DeepMind等人工智能行业创业企业的并购以及与强生、福特等传统产业巨头的合作,实现人工智能领域全面布局及纵深式发展。
在中国,以BAT(百度、阿里巴巴和腾讯)为代表的互联网大公司也逐渐展开人工智能布局。报告将对这几家公司的人工智能布局展开全面分析,其中包括人才、技术方向、应用、现阶段重点等等。
此外,在中国,以单项人工智能技术为产业化突破点逐渐发展,并展开整体布局的企业近两年也获得了高速的发展。以语音为核心技术的人工智能企业科大讯飞是其中的典型代表,科大讯飞的发展之路也将在报告中得到呈现,其中不乏神秘的“863计划”和“讯飞超脑计划”,这家公司希望在近几年让机器人参加高考并考上清华、北大这样的顶级学府。
产业政策环境方面,《中国人工智能产业发展报告》梳理了中、美、日、韩四国政府从2013年到2016年出台的人工智能相关政策。例如,在中国,2016年5月发改委发布了《“互联网+”人工智能三年行动实施方案》,方案指出,到2018年,打造人工智能基础资源与创新平台,人工智能产业体系、创新服务体系、标准化体系基本建立,基础核心技术有所突破,总体技术和产业发展与国际同步,应用及系统级技术局部领先。
人工智能市场规模方面,报告援引多家分析机构的数字评估认为,2016年年底,世界人工智能市场规模将突破100亿美元,其中,中国市场规模将达到15亿美元左右。未来,人工智能市场有望进一步扩大,到2020年,全球人工智能市场将发展到200亿美元左右的规模。
深度学习:人工智能再次起飞背后的神秘技术
人工智能近年来不断突破新的极限,部署新的应用,获得快速和普遍的发展,与深度学习技术的进步密不可分。深度学习的概念并不新颖,但直到近年才得到认可。业界普遍认为,是超大规模训练数据、复杂的深层模型和分布式并行训练造就了今天深度学习的繁荣。具体来讲,包含多个隐藏层的神经网络,利用现在的高性能计算机和人工标注的海量数据,通过迭代得到超过浅层模型的效果。深度学习带来了模式识别和机器学习方面的革命。
为了更全面地理解新一轮人工智能浪潮的本质,新智元《2016中国人工智能产业发展报告》深入分析了深度学习的发展历史,报告认为,深度学习的发展有三座里程碑:
1.模型初步。2006年前后,深度模型初见端倪,这个阶段主要的挑战是如何有效训练更大更深层次的神经网络。2006年,Geoffery Hinton提出了深度信念网络,一种深层网络模型。使用一种贪心无监督训练方法来解决问题并取得良好结果。这一训练方法降低了学习隐藏层参数的难度。并且该算法的训练时间和网络的大小和深度近乎线性关系。这被认为是深度学习的开端,Hinton也被称为“深度学习之父”。
2.大规模尝试。2011年底,大公司逐步开始进行大规模深度学习的设计和部署。“Google大脑”项目启动,由时任斯坦福大学教授的吴恩达和Google首席架构师Jeff Dean主导,专注于发展最先进的神经网络。初期重点是使用大数据集以及海量计算,尽可能拓展计算机的感知和语言理解能力。该项目最终采用了16000个GPU搭建并行计算平台,以Youtube视频中的猫脸作为数据对网络进行训练和识别,引起业界轰动,此后在语音识别和图像识别等领域均有所斩获。
3.遍地开花。近年来深度学习获得了非常广泛的关注,其进展的一个直观的体现就是ImageNet竞赛。2012年,Hinton带领的研究团队赢得ILSVRC-2012 ImageNet,计算机视觉的识别率一跃升至80%,标志了人工特征工程正逐步被深度模型所取代。另外,强化学习技术的发展也取得了卓越的进展。2016年Google子公司DeepMind研发的基于深度强化学习网络的AlphaGo,与人类顶尖棋手李世石进行了一场“世纪对决”,最终赢得比赛,这被认为是深度学习具有里程碑意义的事件。
报告还具体介绍了各家公司,比如Facebook、谷歌、百度、科大讯飞的深度学习技术,对人工智能行业中前沿企业的深度学习技术应用情况进行纵深介绍。报告综合分析认为,深度学习主要在三个领域掀起了革新,分别是:图像识别、语音识别和自然语言处理。
近年来,人工智能技术和行业发展中,开源成为最新并且最强大的趋势之一。经过分析,新智元《2016中国人工智能产业发展报告》认为,深度学习目前表现出来的趋势,不光是技术,还有商业模式的转变。过去几个月,所有巨头都将自己的深度学习IP开源。核心目的是为了吸引用户、扩大市场,吸引人才、加速创新。开源会使技术发展更快,但主宰市场的仍将是巨头。
除了对著名的TensorFlow、Torchnet、Paddle和Caffee等开源平台进行详尽介绍之外,报告还收集汇总了Github上星级超过1500的深度学习大型开源项目:
报告综合分析认为,深度学习当下的发展依然存在3大缺陷,需要在接下来的发展中逐渐克服。
深度学习四大缺陷
1.缺乏理论支持。深度学习方法常常被视为黑盒,大多数的结论确认都由经验而非理论来确定。不管是为了构建更好的深度学习系统,还是为了提供更好的解释,深度学习都还需要更完善的理论支撑。
2.缺乏推理能力。深度学习技术缺乏表达因果关系的手段,缺乏进行逻辑推理的方法。目前研究者虽然在尝试一些破解此难题的技术,但是效果并不明显。
3.缺乏短时记忆能力。包括递归神经网络在内的深度学习系统,都不能很好地存储多个时间序列上的记忆。这使得研究人员提出在神经网络中增加独立的记忆模块,如LSTM,记忆网络,神经图灵机和Stack增强RNN。虽然这些方法思路很直观,也取得了一定的成果,但在未来仍需要更多的尝试和新的思路。
4.缺乏执行无监督学习的能力。虽然无监督学习可以帮助特定的深度网络进行“预训练”,但最终绝大部分能够应用于实践的深度学习方法都采用了纯粹的有监督学习。
自动驾驶或在2020年前后普及
人工智能最直观的变革力量体现在应用上,本年度人工智能最热门的应用当属自动驾驶。
人工智能产业中走在前沿的众多企业都在自动驾驶上进行布局,借助人工智能相关技术,互联网企业以破局者的身份闯入了百年老店——汽车行业中,引得众多老牌汽车巨头不得不转型,拥抱新技术。利润丰厚的汽车行业、出行市场迎来了一场激烈的争夺战。
2015年末到现在,包括众多老牌汽车行业巨头在内的企业纷纷发布无人车上路或量产时间线。接下来的3到4年将会是这一技术商业化落地的一个冲刺时期。
《2016中国人工智能产业发展报告》对自动驾驶产业的行业分析从自动驾驶所需要的技术出发,首先从感知、决策、地图、车联网四个层面剖析自动驾驶技术。感知层涉及雷达,包括激光雷达、毫米波雷达和摄像头。
对于自动驾驶的研发企业来说,目前的感知技术一般都是采用多雷达+摄像头的解决方案。在这一部分的介绍中,报告对不同雷达的主要技术参数和主导企业进行对比介绍,并用专门的篇幅分析了采用基于摄像头的图像识别感知典型企业:Mobileye,这家自动驾驶提供商在2015年底已经实现全球超过1000万装机量,覆盖20多家车企的273款车型。
自动驾驶中的决策涉及大量的数据处理,对计算能力提出了极高的要求。由此,众多芯片厂商,最为典型的是英特尔和英伟达,也在自动驾驶行业觅到了机会。报告对两家芯片企业在无人驾驶上的布局进行了对比分析,目前看来,英伟达因为GPU的发展暂时拥有优势,但是英特尔的实力不容小觑,随着自动驾驶市场规模不断扩大,两家企业将在自动驾驶芯片市场展开新一轮的激烈竞争。
从行业整体来看,无人驾驶对社会有着深远的影响,在变革人类出行方式上有绝大潜力,因而具有极大的社会价值和经济价值,这也是无人驾驶技术存在变革性的根本原因。
综合已有资料,《2016中国人工智能产业发展报告》认为,未来5年内,自动驾驶汽车将成为交通系统的一部分。自动驾驶这项新技术也将在这期间得到越来越广泛的应用,包括语音和手势识别、虚拟助理和语言界面等信息娱乐系统。
到2035年全球无人驾驶汽车销量将达2100万辆,大幅高于两年前1180万辆的预估值。其中,美国的销量将增长到450万辆,中国将成为最大的无人驾驶汽车市场,销量达570万辆。欧洲的销量将达420万辆,而非洲和中东地区的销量也将达到100万辆。与此同时,日本和韩国市场将售出120万辆无人驾驶汽车。
自动驾驶行业内的竞争异常激烈,企业间人才、资金和技术的流动非常频繁,报告引用彭博社此前发表的一张无人驾驶主要玩家关系图,勾勒了这一进展的竞争关系。
中国研发自动驾驶的企业有百度、阿里、腾讯、乐视、蔚来汽车、车和家、威马汽车等,此外,一大批传统车厂也在通过合作或自我研发的方式,在生产的汽车中加入自动驾驶功能。
在自动驾驶篇中,《2016中国人工智能产业发展报告》认为智能出行是2016年不可忽略的一个发展趋势,就中国的智能出行代表企业滴滴出行和美国的Uber发展道路进行对比分析,报告认为,在未来的无人驾驶交通系统里,叫车服务公司的平台化优势非常明显,通过叫车软件连接客户的出行公司,已经占据入口地位的互联网将在整个生态系统上占有优势地位。
Uber在自动驾驶的研发上显得尤为激进,通过一系列收购整合,Uber目前已经拥有先进的自动驾驶研发团队,并与福特等传统车厂达成合作,并宣布在2017年要让无人驾驶出租车上路试运行。
独角兽出没,资本寒冬下融资依然活跃
在全球范围内,根据CB Insights的数据分析显示2015年全年四个季度在人工智能领域投资约23.88亿美元,共约397笔交易。2016年第一季度共143笔,高于以往任何单个季度的交易笔数,交易额达6.02亿美元,成交次数相当于2015全年的36%。显示人工智能领域的投融资交易比以往任何时候都更活跃。截止2016年6月15日,已有超过200家人工智能初创公司总共获得了近15亿美元的融资。
据报告统计,截止2016年9月20日,中国人工智能创业公司数量约在200-250家,大部分创建于2010年后。语音和视觉依然是创业公司的两大方向,2016年以来,人工智能专用芯片公司获得关注较多。
1、企业规模
100家企业,总人数是8964人,平均值89.64。人数最多的公司人数已经达到近2000(今日头条),最少的只有3人(艾珂智能系统有限公司),中位数25,员工构成中,技术人员占绝大多数。
2、企业技术和应用场景分析
不管是从技术选型还是应用来说,深度学习/机器学习都占据了绝对重要的地位,其次是计算机视觉、自然语言处理和语音识别。深度学习/机器学习目前已经成为人工智能企业的“标配”,有53家企业把深度学习/机器学习用到了产品中。
计算机视觉或图像技术是细分领域中最为热门的,43家的企业在具体场景应用产品中使用这一技术。
在应用上,智能机器人(家用服务型、有硬件实体的拟人型或拟生物型)有35家。
在所列举的14个行业中,在法律和物流布局的企业较少,其他,比如医疗、教育、自动驾驶、游戏娱乐等不相上下。在社交陪伴领域布局的企业最多,其次是家居。
3、企业营收与估值数据
新智元的此次调查中,有32家人工智能企业填报了在2015年的收入情况,总营收达到了7.56亿元,均值为2千万元左右,中位数在20万元。其中经营收入最高的达到了2亿元。共有98家企业向新智元填报了估值数据,估值总数为1014亿元,平均每家公司的估值在10亿左右,中位数2亿,公司间估值差距非常大。从融资阶段来看,100家企业中,绝大部分处于天使轮或者A轮。处于这两个轮次的占到了64%。
4、专利与获奖情况
在获奖方面,100家企业中,42%的企业有过获奖经历。