人形机器人要想成功路还很长,因为它实质上也需要与人的智慧相当的智能。
近来外媒传出 Google 旗下波士顿动力机器人公司将被丰田收购,交易基本完成的消息。看了这消息有的人也许会问,为什么中国公司没尝试购买这公司,答案很简单:
一是你买也买不到,这种是和军事相关度高的行业,美国外资投资委员会这类机构是专门负责毙掉有些国家的企业的;
二是机器人到底怎么来到世间,其实在商业上还看不太清楚,而商业前景不清楚必然会导致动力不足。前一点是一种交易细节,略过不提,下面我们来展开谈谈机器人这产品到底会怎么渗透进人类的生活。
现世兼容与铁轨计划
每种生物都在漫长的时间里进化出了属于自己的,最适合环境的形态,比如青蛙的形态就比较适合跳高再入水。当人类在高速列车上解决类似破障的情形时,就需要把车头做的和青蛙类似。这是一个生物适应环境而改变自己的过程。但人类利用机器的过程与此不同,人类通常会改变机器的存在环境来让机器的优势最大化,比如人类为了让火车能跑要各个地方修铁轨,为了让汽车能跑要各个地方修公路,而不是尝试做一种可以适应各种地理环境的火车或者汽车。
这两种思路正对着两种研发机器人的思路,前者的代表性产品就是人形机器人,后者的代表则是Google做的那种自动驾驶汽车。
人形机器人最主要的好处在于可以和人类的行为高度兼容,如果它的核心问题比如能源动力、平衡等可以解决,那在文明社会中凡是人能做的事情它都可以做,而如果换成轮式或履带式,那比如爬没有电梯的楼就会成问题。这和动物进化自己适应环境并没差别,人形机器人是对现有人类社会形态的终极适应。
自动驾驶汽车看着走得是兼容现有驾驶习惯的路线,但其实Google的那种自动驾驶非常依赖于高精度的地图。更进一步的自动驾驶思路是为自动驾驶汽车加入明显标识,这会导致自动驾驶的实现难度进一步下降。如果按照这条路线展开,那就和为了火车修铁轨,为了汽车修公路相差不多。眼下还无法预测自动驾驶会怎么走,但显然铁轨的方向看着更靠谱一些。难道我们能拿很多的事故验证其可行性?
就像我们很难建造一种直接适应自然环境的火车一样,人形机器人要想成功路还很长,因为它实质上也需要与人的智慧相当的智能,否则是不足以处理复杂多变的环境的。
总的来看,能动的机器人要来到世间,那就只有这两条路好走:要么兼容现世,要么走铁轨路线,前者会对技术提出更高的要求,后者一旦牵涉公共领域,那受社会政治影响较大。
机器人会从哪里首先突破?
抛开不能动的机器人(亚马逊Echo等)不论,能动的机器人基本上可以确定会在垂直领域用铁轨计划进行落地。现在即使做机器人的企业也并没有意识到这点,但我们有理由相信最终大家会不约而同地走上这条道路。因为在垂直领域既可以用铁轨计划降低技术难度,又可以避开繁琐的社会事务处理过程。
此前有报道称万科研究了一种巡逻机器人。那种机器人有点像把一个人形物体放在了滑板车上,看着略有一点滑稽和山寨气息。但如果我们不那么穷究产品细节,单从万科介入机器人这事就可以感受到一点在垂直领域机器人要产生切实作用的气息。万科做机器人只可能有两个收益:一个公关上的影响力提升,一个是切实想解决人力成本上升后的巡逻问题。眼下在中国更可能两者都有,但人力成本越上升后者的权重就会越重。
保安实在是个很适合用机器人取代的行业。首先小区或园区的环境相对固定,更容易建立那种高精度的地图,相当于为机器人铺上铁轨。其次是低速并且所要处理的环境相对单一,这都有助于拉低技术门槛。而保安本身实际能发挥的作用更多的其实就是摄像头的作用,很多时候我们很难指望保安真的去抓捕小偷。
当技术问题可以通过技术自身的发展和产品上的折中解决之后,那剩下的只是性价比问题。而控制成本这事其实和规模和摩尔定律有关,过去很多年的经验都在告诉我们一旦技术问题解决那产品先天有变低价的趋势,数字的部分越多变低价的速度越快。
当然垂直类场景并不只是局限于保安,其中扫地机器人其实已经足够大的销量了。
NC、PC之争再次重来
年纪大点的IT人可能记得在486那个年代,Oracle这种公司曾经提出过Network Computer的概念。简单理解就是这种电脑主要是一个显示器,主要的计算等都靠网络解决,这思路的现代直属后裔看起来是Chromebook。显然这思路在那个年代失败了,在今天也还没成功。手机虽然极度依赖网络,但自身所蕴含的计算能力也是极为庞大的,我们经常听说的骁龙820处理器等增强的都是终端处理能力。
在机器人上依赖云端还是终端这问题再次出现了。
拉动这次人工智能进展的深度学习骨子里需要大量数据和计算量,所以其实是一种云端方案。而无数的事实告诉我们由于网络的可靠性和传输速率完全达不到产品内部各种总线的程度,要想做出体验好的终端产品,必须提升终端的计算量,进行一定程度的本地处理。这就是为什么国内有寒武纪国外有Movidus的原因。很多人会把他们的产品称为人工智能芯片,通俗的也可以看成是GPU的小型化。这种芯片的核心目的是提高终端的计算能力。
但故事到这里还没完,不管终端的计算能力怎么提升,预计也不会达到云端的那种程度,这反过来就又会挑战深度学习,检验它究竟是否能在终端上达到和云端一样的效果。
所以说真的机器人的出现有赖于终端上高计算能力芯片的出现,以及深度学习在相对小的计算能力和数据量上的效果。有了这种基础才是后面各个点的展开,比如通过计算机视觉算法识别物体,通过深度摄像头感知距离,通过激光雷达来感知远处的物体等。
如果是汽车,上面这些问题固然可以拉一个GPU的机柜,但这显然对于小点的机器人是不适合的。这反过来可以验证上面的结论,机器人更会在垂直场景下实现,因为在垂直场景下可以通过建立更稳定的局域网络来做弥补,更容易做出来终端和云端结合的方案。
最后,机器人这事现在来看是大脑发展得比身体发展得快,声音相关的领域发展的比计算机视觉领域快。所以第一个成熟的产品是Echo,下一个成熟的品类则可能是垂直的机器人,而所谓的人形机器人其成熟则还会在普遍意义的自动驾驶之后。