用户名:  密码:   
网站首页即时通讯活动公告最新消息科技前沿学人动向两岸三地人在海外历届活动关于我们联系我们申请加入
栏目导航 — 美国华裔教授专家网科技动向学人动向
关键字  范围   
 
鲍捷:留在象牙塔的舒适区,就是谋杀自己的生命
鲍捷:留在象牙塔的舒适区,就是谋杀自己的生命
2017/5/11 23:53:07 | 浏览:2266 | 评论:0

鲍捷:留在象牙塔的舒适区,就是谋杀自己的生命

今天这篇可能会有争议,不过是发自内心的肺腑之言。

缘起是读到何世柱博士的《让问答更自然》:“据我了解,真实的工程实践上,问答系统还是使用模板和规则,很少或者根本不会用到统计模型,更别说深度学习的模型了。而目前在研究界,问答系统几乎全部采用深度学习模型,甚至是完全端到端的方法。究其原因,我个人认为问答系统是一个系统工程,而不是一个纯粹的研究任务,目前研究界对问答系统还没有一个统一的范式(不像信息检索、机器翻译、信息抽取等任务),因此,未来问答系统可能需要总结出一个或几个通用范式和流程,可以分解为若干子任务,这样会更易于推动问答的研究发展。”

我自己也曾从事问答系统的研究,对何博士的这个观点深表赞同。

但是也有观点认为,学术界和工业界的评价标准本来就不同,发论文和做工程的套路本来就不一样。也有观点把做工程看成大多数在处理边边角角的情况,并没有什么创新性。另有一种观点认为,学术研究最重要的是给人带来了什么启发,而不是处理了什么问题。

其实我本人在很多年以前,也有类似的观点。但是随着经验的积累,发现这种留在象牙塔的舒适感,对真正达到第一流的研究,是有害的。

在我成长的过程中,有幸得到几位领域内最优秀的学者的指引。正是他们告诉了我,不能把学术前沿研究和工程实践割裂开来,不能以学术界和工业界的评价体系不同,就去研究“屠龙之技”,自娱自乐。从实践中来,到实践中去,才是培养第一流研究的根本。

我在RPI的导师是Jim Hendler,语义网领域的奠基人。RPI的学风就是理论联系实际,强调学生的动手能力。 Jim本人格外强调工程的可实现性;强调做任何一个研究,先做现实世界的调查研究。当初在设计OWL语言(一种知识表达语言)的时候,有人认为应该从逻辑表达的理论性能出发来设计。Jim则认为,应该看看现实的网络世界里,人们在用什么方式表达。那些理论上完美的表达,如果人们不会用、不屑用、不明白,又有什么意义呢?他带着学生去做语言特性的应用统计;他向各行各业的人去普及和教育OWL,并从中获得反馈。他非常关注工业界的进步,如RDFS++、RDFa这些实践的总结,并融入到研究中去。知识表达可能是最抽象的一种研究,但是Jim并没有因此把它看成一个纯学术的行为。之后的实践也证明了这个路线的正确性。OWL2这样的从理论优美出发的语言,并没有被实践认可,而知识图谱这类符合Jim路线的方法得到了发扬光大。

我在MIT DIG实验室师从Tim Berners-Lee,Web的发明人。Tim是美国科学院和工程院两院院士,所有科学荣誉拿了个遍(包括最近的图灵奖)。他也同样注重工程实践。我就目睹过他亲自教实习生写程序,从很具体的细节入手来理解Web科学的理论。Tim极为重视工作的实践可操作性。当初语义网的主流的语法是RDF/XML,一种很繁琐而难懂的语言。Tim就亲自操刀来简化,设计了N3,并最终演化为Turtle,现在已经成为最常用的语法。当时的规则表达语言(如RIF)也过于注重形式化的理论优美,而忽视现实的可用性。Tim又带着大家设计了AIR语言,用更简洁实用的形式去满足真正来自现实的需求(我参与了其中的语义模块)。Tim做研究,一贯自己动手做实现,他写了语义浏览器Tabluator和推理机cwm。他做研究,首先考虑的是现实中的人,他们会怎么来用我的创造?三十年前他发明Web就是基于这个理念;之后三十年他的科学实践,也一直是这个思路。

MIT DIG实验室的隔壁是David Karger的实验室,和David及他的学生也有很多交流。他早年做算法出身,一个著名的蒙特卡洛算法以他命名(Karger算法)。近年来他逐渐关注算法的可应用性,其研究对知识图谱和搜索都产生了巨大的影响。在领域内大多数人都从机器角度思考问题的时候,他则想,使用这些语义数据的人是怎么样的?怎么让他们能更好理解数据、使用数据?语义数据到底在软件应用中起到什么核心作用?他从认知和人机交互的角度去实践。他是最早一批认识到分面浏览器的意义、及其与语义数据关系的学者。他领导设计了Haystack,Exhibit这些实用的系统。这些系统又深刻影响了Freebase的设计,并随着Freebase被谷歌收购,影响着今天每一个人用的谷歌知识图谱和搜索引擎。David并不把理论和实践割裂开来——其实这可能也是MIT一贯的风气,在MIT动手实践、通过现实应用来检验研究几乎是融入研究血液的一种习惯。

在BBN访问期间,我的导师是Mike Dean。作为DAML工作组的主席,他也曾为语义网领域的诞生做出了杰出的贡献。但是贵为主席也不能阻碍他去亲自动手实践。他开发了DAML的爬虫、阅读器、数据库、移动端(那可是2000年)、HTML扩展、地理应用等等各种工具,通过具体的可用性研究来确定语言设计的取舍。我第一次和Mike合作是用Semantic wiki来做知识库构造。和大多数学者不同,Mike建议我们先做实践的可行性研究,真的搭一个最小化系统,找非专业人员来实操,发现真正的瓶颈在哪里。这个方法可以说救了我们,让我们在之后的研究中少走了很多弯路。后来,我和他合作做一个纯而又纯的理论研究:语义信息论。他同样是先和我一起从use case的构造开始,他自己动手写了很多案例。在我们得到了理论框架后,他就开始想具体的应用场景,诸如保密通信、信息压缩,并思考真正的应用的瓶颈在哪里。Mike是一位伟大的科学家,但是在临终遗嘱里,他都没有忘了实践,号召大家给维基媒体基金会和万维网基金会捐款。

这些世界级的学者,身体力行、言传身教,告诉后辈们,什么样的研究才是有意义的研究,我们怎么才可能得到研究的灵感,获得第一流的成果。他们从来不把理论和工程割裂开来,而是把工程作为理论的土壤。当他们发现工业实践和学术界脱节的时候,不是以“评价标准不同”为借口,不关心实践而留在象牙塔里闷头发论文,而是兴奋起来,因为实践的瓶颈就是理论突破的金钥匙啊!

实践是检验真理的唯一标准!

留在象牙塔的舒适区,就是谋杀自己的生命。

相关栏目:『学人动向
孙立平:人类历史上的三次大分岔 2024-03-26 [78]
对话古生物学家:《沙丘》的沙虫有没有地球版 2024-03-26 [25]
方绍伟:为什么秦晖的文化观念是错的? 2024-03-26 [30]
杨培东院士,最新Nature Catalysis! 2024-03-26 [21]
诺奖得主MacMillan最新Science:SH2自由基分选实现醇-醇交叉偶联 2024-03-26 [20]
室温超导“造假”论文是如何登上《自然》杂志的? 2024-03-25 [88]
俞敏洪丨让孩子用脚步丈量真实的世界 2024-03-25 [226]
北大教授尹保云 | 中国思想界的两大鸦片:“西方没落说”和“文明无优劣” 2024-03-25 [236]
赵鼎新:撤了 2024-03-24 [161]
张鸣:当心国学是国渣! 2024-03-24 [100]
相关栏目更多文章
最新图文:
游天龙:《唐人街》是如何炼成的:UCLA社会学教授周敏的学术之路 :“为什么海外华人那么爱国,但是让他回国却不愿意?...“ :学术出版巨头Elsevier 彻查433名审稿人“强迫引用”黑幕 :中国336个国家重点实验室布局 :中澳政府联合出手打击洗钱和逃税漏税 大量中国居民海外账户遭冻结 :摄影师苏唐诗与寂寞百年的故宫对话6年,3万张照片美伦美奂 :大数据分析图解:2019中国企业500强 张梦然:英国惠康桑格研究所:人体内的微生物与出生方式有关
更多最新图文
更多《即时通讯》>>
 
打印本文章
 
您的名字:
电子邮件:
留言内容:
注意: 留言内容不要超过4000字,否则会被截断。
未 审 核:  是
  
关于我们联系我们申请加入后台管理设为主页加入收藏
美国华裔教授专家网版权所有,谢绝拷贝。如欲选登或发表,请与美国华裔教授专家网联系。
Copyright © 2024 ScholarsUpdate.com. All Rights Reserved.