今天这篇可能会有争议,不过是发自内心的肺腑之言。
缘起是读到何世柱博士的《让问答更自然》:“据我了解,真实的工程实践上,问答系统还是使用模板和规则,很少或者根本不会用到统计模型,更别说深度学习的模型了。而目前在研究界,问答系统几乎全部采用深度学习模型,甚至是完全端到端的方法。究其原因,我个人认为问答系统是一个系统工程,而不是一个纯粹的研究任务,目前研究界对问答系统还没有一个统一的范式(不像信息检索、机器翻译、信息抽取等任务),因此,未来问答系统可能需要总结出一个或几个通用范式和流程,可以分解为若干子任务,这样会更易于推动问答的研究发展。”
我自己也曾从事问答系统的研究,对何博士的这个观点深表赞同。
但是也有观点认为,学术界和工业界的评价标准本来就不同,发论文和做工程的套路本来就不一样。也有观点把做工程看成大多数在处理边边角角的情况,并没有什么创新性。另有一种观点认为,学术研究最重要的是给人带来了什么启发,而不是处理了什么问题。
其实我本人在很多年以前,也有类似的观点。但是随着经验的积累,发现这种留在象牙塔的舒适感,对真正达到第一流的研究,是有害的。
在我成长的过程中,有幸得到几位领域内最优秀的学者的指引。正是他们告诉了我,不能把学术前沿研究和工程实践割裂开来,不能以学术界和工业界的评价体系不同,就去研究“屠龙之技”,自娱自乐。从实践中来,到实践中去,才是培养第一流研究的根本。
我在RPI的导师是Jim Hendler,语义网领域的奠基人。RPI的学风就是理论联系实际,强调学生的动手能力。 Jim本人格外强调工程的可实现性;强调做任何一个研究,先做现实世界的调查研究。当初在设计OWL语言(一种知识表达语言)的时候,有人认为应该从逻辑表达的理论性能出发来设计。Jim则认为,应该看看现实的网络世界里,人们在用什么方式表达。那些理论上完美的表达,如果人们不会用、不屑用、不明白,又有什么意义呢?他带着学生去做语言特性的应用统计;他向各行各业的人去普及和教育OWL,并从中获得反馈。他非常关注工业界的进步,如RDFS++、RDFa这些实践的总结,并融入到研究中去。知识表达可能是最抽象的一种研究,但是Jim并没有因此把它看成一个纯学术的行为。之后的实践也证明了这个路线的正确性。OWL2这样的从理论优美出发的语言,并没有被实践认可,而知识图谱这类符合Jim路线的方法得到了发扬光大。
我在MIT DIG实验室师从Tim Berners-Lee,Web的发明人。Tim是美国科学院和工程院两院院士,所有科学荣誉拿了个遍(包括最近的图灵奖)。他也同样注重工程实践。我就目睹过他亲自教实习生写程序,从很具体的细节入手来理解Web科学的理论。Tim极为重视工作的实践可操作性。当初语义网的主流的语法是RDF/XML,一种很繁琐而难懂的语言。Tim就亲自操刀来简化,设计了N3,并最终演化为Turtle,现在已经成为最常用的语法。当时的规则表达语言(如RIF)也过于注重形式化的理论优美,而忽视现实的可用性。Tim又带着大家设计了AIR语言,用更简洁实用的形式去满足真正来自现实的需求(我参与了其中的语义模块)。Tim做研究,一贯自己动手做实现,他写了语义浏览器Tabluator和推理机cwm。他做研究,首先考虑的是现实中的人,他们会怎么来用我的创造?三十年前他发明Web就是基于这个理念;之后三十年他的科学实践,也一直是这个思路。
MIT DIG实验室的隔壁是David Karger的实验室,和David及他的学生也有很多交流。他早年做算法出身,一个著名的蒙特卡洛算法以他命名(Karger算法)。近年来他逐渐关注算法的可应用性,其研究对知识图谱和搜索都产生了巨大的影响。在领域内大多数人都从机器角度思考问题的时候,他则想,使用这些语义数据的人是怎么样的?怎么让他们能更好理解数据、使用数据?语义数据到底在软件应用中起到什么核心作用?他从认知和人机交互的角度去实践。他是最早一批认识到分面浏览器的意义、及其与语义数据关系的学者。他领导设计了Haystack,Exhibit这些实用的系统。这些系统又深刻影响了Freebase的设计,并随着Freebase被谷歌收购,影响着今天每一个人用的谷歌知识图谱和搜索引擎。David并不把理论和实践割裂开来——其实这可能也是MIT一贯的风气,在MIT动手实践、通过现实应用来检验研究几乎是融入研究血液的一种习惯。
在BBN访问期间,我的导师是Mike Dean。作为DAML工作组的主席,他也曾为语义网领域的诞生做出了杰出的贡献。但是贵为主席也不能阻碍他去亲自动手实践。他开发了DAML的爬虫、阅读器、数据库、移动端(那可是2000年)、HTML扩展、地理应用等等各种工具,通过具体的可用性研究来确定语言设计的取舍。我第一次和Mike合作是用Semantic wiki来做知识库构造。和大多数学者不同,Mike建议我们先做实践的可行性研究,真的搭一个最小化系统,找非专业人员来实操,发现真正的瓶颈在哪里。这个方法可以说救了我们,让我们在之后的研究中少走了很多弯路。后来,我和他合作做一个纯而又纯的理论研究:语义信息论。他同样是先和我一起从use case的构造开始,他自己动手写了很多案例。在我们得到了理论框架后,他就开始想具体的应用场景,诸如保密通信、信息压缩,并思考真正的应用的瓶颈在哪里。Mike是一位伟大的科学家,但是在临终遗嘱里,他都没有忘了实践,号召大家给维基媒体基金会和万维网基金会捐款。
这些世界级的学者,身体力行、言传身教,告诉后辈们,什么样的研究才是有意义的研究,我们怎么才可能得到研究的灵感,获得第一流的成果。他们从来不把理论和工程割裂开来,而是把工程作为理论的土壤。当他们发现工业实践和学术界脱节的时候,不是以“评价标准不同”为借口,不关心实践而留在象牙塔里闷头发论文,而是兴奋起来,因为实践的瓶颈就是理论突破的金钥匙啊!
实践是检验真理的唯一标准!
留在象牙塔的舒适区,就是谋杀自己的生命。