与30年前我刚刚投身人工智能领域时不同,现在人们所谈的人工智能,基本都围绕着机器学习及其应用领域,即我们一直所说的AML(Applied Machine Learning)。研究人员在AML的推广应用方面取得了巨大成功,他们研发出了一系列应用程序,从手写数字识别,到人脸识别和跟踪,到在崎岖地形上行走,到在《危险边缘》里参与问答,再到自动驾驶汽车。所有这些成绩的取得都严重依赖于与AML相关的统计技术。
如果与AML领域的研究人员探讨他们的研究内容,我们会得出这样的结论:学习就是从数据 (或周围环境)当中总结规律和特点,并将其提取,而不是通过导师授课或者阅读教材学习。显然,我们的很多知识都是以这种方式学来的,例如如何辨别橘子和苹果、叔叔和阿姨、猫和狗等。但好像也没有人告诉我们,说 “注意啦,看到猫有长长的胡须了吗?狗是没有这种胡须的”,而是我们自己像AML一样搞清了这些区别。这正是我们学会母语, 学会用词语和句子表达思想的过程。的确,因为我们完全靠自己就掌握了大量知识,而非通过任何口头或书面学习,所以才会忽略那些依靠其他途径学到的知识。
换句话说,这是个巨型拼图问题。
我们如何学习词语?
让我们从思考自己如何学会词语开始。
我们先拿形容词“hungry(饥饿的)”为例。假设我们的父母会讲英语,我们最终学会了这个词的意思。但我们是在什么时候学会的呢?毕竟,可从没有人向我们解释过这个词的意思啊。事实上,是孩子在感到饥饿的时候,常常会听到这个词,因此逐渐将这个词与对食物的需求联系起来。
从某种意义来说,我们无须对“hungry”这个词下定义是件好事,因为语言此时也有些力不从心。饥饿是什么感觉?我们可能会说:感觉不舒服,但也不痛苦,至少刚开始还不痛苦。这就是个温和的提示,告诉你该吃东西了。但这种感觉与其他如口渴或眩晕等感觉有何异同呢?
有趣的是,仅仅是我们的身体做出了某种提醒,并不意味着一定有形容词对其进行描述。例如,在法语中,没有表示“hungry”的词,意思与之最为接近的是形容词“affamé” ,但它的意思更像是“饿极了”,形容比饥渴更为强烈的感觉。在法语中,我们说“ J'ai faim”,字面意思是“我有饥饿”,或者“我有饥饿的感觉”。
由此可见,对于哪些身体提示会有对应的文字表达,我们目前尚不清楚。例如,有一种感觉与饥饿一样人人都曾感受到,尤其让幼儿的父母们每天烦恼不已,但令人惊讶的是,英语中竟然没有与之对应的形容词,这种感觉就是人想要小便时的感觉。
不管怎样,我们不是通过反复解释,而是长期沉浸在适当的语言环境中才习得了“饥饿”及其同类词语的含义。
那么,这就是学习词语的过程吗?让我们将巨型拼图问题铭记在心,然后继续探索。
现在考虑一下“ incarnate(化身)”这个形容词。我们通常是通过另外一种方式学习这个词的。我们需要通过别人解释才能明白这个词的意思:我们得知,该词用于指代由于某种原因附于肉体之上的精神或无形物体。我们可能还需要在字典里查一下,该词的两部分“in” + “carno” 字面意思就是“into(进入)” + “flesh(血肉)”。所以,所谓化身,就是转化为血肉之身。(在某一年龄,我们可能还要查查“flesh”的意思。)
如果我们真正学会了这个词,那就要归功于语言,因为我们听到或读到了关于词义的解释。我们无须反复练习,只需在词典里查一查,就可以正确地使用它。因此可见,习得词语的方法的确与众不同。
表面上看,通过经验这种较为直接的方式(如饥饿等词)与通过语言学习词语(如化身等词)相比,显得更为基础,也更有意义。要通过语言习得词语,我们必须掌握足够的语言能力才能理解对于词语的解释。那么更为基础的问题可能便是:我们是如何掌握这种初始语言的?
毫无疑问,我们如何通过在语境中听到词语来学习是个令人兴奋的话题。这个过程始于我们能够说话之前,一直延续到我们成年之后。每个家庭都能讲出萌宝们在牙牙学语时用词张冠李戴的故事,温馨可爱。(我还记得女儿小时曾撅起小嘴与大人争辩, 说不让她做某事“太公平了”。)语言学家诺姆·乔姆斯基(Noam Chomsky)指出,由于孩子们接触到的数据总量较小,他们究竟是如何学会一门语言的,至今仍然是个巨大的谜。
我们如何学习事实?
现在谈一谈我们是如何掌握生活中的常识的。
请思考这样一个简单的事实:柠檬是黄色的。很多水果有自己独特的颜色(包括很多有趣的颜色变体):显而易见,蓝莓是蓝色的;黑莓是黑色的;橙子是橙色的;覆盆子是红色的;豌豆是绿色的;李子是紫色的;苹果是红色、绿色或金色的;柠檬就像香蕉一样,是黄色的。可能在生命之初柠檬是绿色的,在生命后期时是深褐色的,但是新鲜采摘的健康、成熟的柠檬通常是黄色的。
现在问问你自己:我是怎么学到这些知识的?好像不是通过语言学来的。当然,这些信息在书本中就有,但是很有可能你在读到关于柠檬的文字之前,就已经见到过柠檬(或柠檬的彩色图片)了。而且,在有关柠檬或其颜色的语句当中,讲述者或作者可能都认为你已知晓柠檬的颜色,并用它来形容其他东西。
这种关于柠檬颜色的知识就是我们通过直接经验,而非语言学习的例证。
现在思考这样一个事实:熊会冬眠。鹅、鲸鱼和黑脉金斑蝶等会迁徙到南方过冬;狼、鹿和大多数鱼类等不管气候多么恶劣,都会留守家园;冠蓝鸦等只在有些时候迁徙南方;而熊大多会在深秋季节找到一处洞穴,开始冬眠(或进入某种蛰伏状态),直到春暖花开。
再问一下自己:我是如何学到这些知识的?有一点是肯定的:我们不是通过对多只熊亲自观察,并发现其中的周期性规律的。如果你不是专门研究熊类动物的专家,那么你一生当中实际看到的活熊数量可能非常少,而且几乎没有一个是在冬眠的。你可能看过一些自然纪录片,纪录片介绍进入冬季后,熊会躲在洞穴里睡觉,到了来年早春再摇摇晃晃地从洞穴里爬出来。但在纪录片里,你只能看到熊在秋天钻进洞穴,然后在春天从洞里爬出的景象,纪录片并没有太多交代熊在这期间的情况。熊在洞穴里一睡几个月,不吃不喝的信息需依靠旁白解说来传达。如果你没看自然纪录片,就只能通过别人的讲述掌握这个知识,有人告诉过你或你曾经在哪里读到过它。
这种动物世界的知识就是我们完全通过语言进行学习的范例。
我们在这里得到了两点常识:第一,柠檬是黄色的;第二, 熊是会冬眠的。但我们学习这两点常识的方法却截然不同。
我们如何学习行为?
最后,来看一下我们是如何学习新的行为的。
首先,想想你是怎么学会骑自行车的。你肯定不会去找本自行车学习手册,仔细研究,然后就开始第一次的骑行。恰恰相反,可能是有人教你,而且你在年龄很小的时候就开始在幼儿自行车上训练。第一次自己骑自行车的时候,你肯定摇摇晃晃,甚至还要摔倒几次。如果说老师对你有过指导的话,也仅仅是告诉你不要骑得太快(否则撞车会很痛),也不要太慢(否则自行车会不稳)。从来不会有人告诉你应该如何调整自己的重心,或者如何转动车把,防止自行车倒向某个方向。也从来不会有人告诉你在转弯时身体是该探出还是缩回,你依靠反复实践,不断纠正错误,获得提高,就像鸟儿学习飞翔一样,你掌握这一技能之后,它就成为你的第二天性。一段时间之后,你逐渐将此事淡忘。但是当你再次骑上自行车时,你的身体会不由自主地就知道该怎么做,而你则可以自由自在地思考别的事情。
这就是学习行为的意义吗?让我们继续深入探讨。
现在,想想你是怎么学会饲养宠物金丝雀的。可能你恰巧生活在金丝雀养殖场,跟随金丝雀养殖专家学习饲养技术。或者你父母养了一只金丝雀,你通过在日常生活中观察他们的行为,学会了如何饲养金丝雀。又或者,是别人给了你一只宠物金丝雀, 或者你从宠物店买了一只金丝雀,但你却没有多少饲养金丝雀的实际经验。但无论如何,以下的情况是不可能出现的:你反复试验、不断摸索如何饲养金丝雀,比如尝试给金丝雀喂各种食物, 只要每次不吃死就算成功等。你绝对不可能用这种方式饲养金丝雀,否则你就准备给它收尸吧。
但这也不是什么尖端科技。掌握相关饲养知识就和学骑自行车一样,非常容易。与宠物商店老板进行简单的交谈、阅读饲养手册或者上网搜索都可以解决问题。需要注意的是,在这种情况下需要提供一些语言难以表达的基本事实,这一点是与尖端科技类似的。
这些基本事实如下:
如果想要金丝雀健康快乐成长,必须提供新鲜果蔬。
如果没有水,金丝雀无法存活24小时。
金丝雀对各类毒素都非常敏感。
如果饲养金丝雀的笼子直接暴露在阳光下,金丝雀就会体温过热。
毫无疑问,我们可以通过在大量金丝雀身上反复试验、不断摸索,或在庞大的金丝雀数据中进行搜索来获得上述信息。但是生命短暂、时间宝贵,我们更愿意从他人提炼成书的经验中获得饲养金丝雀的知识。
我们如何超越经验?
当总结我们是如何认识周围的世界时,我们发现,似乎至少有两种相互独立的机制在起作用。第一种是通过经验进行学习, 我们需要反复收看或收听相关经验数据,可能还会经历相当多的试验和摸索。第二种是通过语言进行学习,这种情况可能只需收看或收听一次相关数据就能达到目的。正因如此,第二种形式似乎与自适应机器学习(AML)所使用的统计技术毫不相干。(虽然重复与记忆在通过语言学习的过程中仍然会起作用,但在这里, 这些重复的统计属性没那么重要。)
虽然英语中有很多术语可以用来描述人类学习的不同特性,但没有哪个术语完全符合上述方式。我们谈论的学习是通过教育、教学、培训、训练进行的,而且每种方式的侧重点各不相同:教育指广义的开阔心智;教学强调某一特定科目的教育,如学校课程或技术手册;培训强调对于某一技能的教育和实践,例如如何控制皮划艇或怎么做解剖;训练则侧重于培训的反复性,如算术练习或举重。上述每种方式都涉及语言数据和经验数据的相互平衡,而且这种平衡会根据学习的不同类型发生变化:语言的重要性也按照教育、教学、培训、训练的顺序逐渐下降。
我们人类是通过两种不同的方式进行学习的,这一事实也带来了一些非常有趣的问题。比如当两者之间发生冲突时,我们该怎么办?根据经验,我们知道太阳是从东方升起的,但通过语言,我们学到太阳其实根本不会升起。通过语言,我们认识到了一些事物的存在,而如果根据直接经验,这些事物根本不存在。事实上,我们也清楚自己通过语言学到了很多虚构的事物,比如圣诞老人饲养的驯鹿的名字。
这其中一个非常有趣的问题是:为什么我们进化得能够通过语言进行学习,而其他动物却不能?为什么只有直接经验是不够的?在学习的时候,语言给我们带来了怎样的额外优势?
塞缪尔·早川(S. I. Hayakawa)曾说:“我们并非只有一次生命;如果我们能够阅读,就能够随心所欲地拥有多次生命和多种活法。”这话可以被看作是对这一观点的经典概括。在语言的帮助下,我们可以在自己的一生中了解前人的生活经历,我们无须经历前人的过程,就可以学到他们的经验。
由此可见,如果仅仅将人类语言视为一种沟通手段,那么绝对是严重低估了它给予我们的帮助。毫无疑问,语言能够沟通, 但是沟通还可以通过其他途径得以实现,比如指一指相关的东西, 或发出响亮的声音。几乎所有动物都会通过某种方式沟通,但是人类语言让我们得到了更多。一本宠物金丝雀饲养手册与莎士比亚的名剧《麦克白》(Macbeth)显然不可同日而语,但两者之间也有非常重要的共同点:有了它们,我们无须经历那些可能令人痛苦或不切实际,甚至难以忍受的生活经历,就能学到我们想要的东西。
艾萨克·牛顿在总结自己的科学成就时曾说:“如果说我比别人看得更远些,那是因为我站在了巨人的肩上。”他通过阅读前人撰写的书籍文稿,获得了巨大的优势,能够从他们停下的地方开始,而无须重新经历他们所经历的过程。这也是我们学习语言文字、了解熊的冬眠习惯以及学会饲养金丝雀的方式。