随着人工智能的崛起,一个叫ImageNET视觉识别的挑战赛(ILSVRC)在近几年里备受瞩目。
李飞飞,这三个字几乎是AI(人工智能)界无人不晓的名字。
她不仅是斯坦福AI实验室主任,还是斯坦福大学的终身教授。
在顶级期刊上,她的高质量文章就有100篇以上,引用量更是高达33215-44773次。
2015年入选“世界百大思想者”,2016年她还被美国评为“年度杰出移民”之一,以前获此殊荣的还有爱因斯坦、基辛格等
前一阵子,谷歌宣布李飞飞成为谷歌云计算首席科学家,也在业界更是引起了不少轰动。
此前,李飞飞一直都专注于实验室,与业界联系不深。
她现在走出实验室的举动,让许多人都对人工智能的发展了充满信心。
然而,这位站在金字塔顶端的女科学家背后,却有着一段鲜为人知的励志人生。
早年的她竟然还有过清洁工、中餐馆收银员、帮人遛狗、开干洗店等工作经验。
1976年出生的李飞飞在四川长大。
16岁时,她便随父母远渡重洋来到充满希望的美国,落户在新泽西洲的Parsippany小镇。
但李飞飞并不是富二代,父母都是清贫的知识分子。
初到美国,对英语一窍不通更是全家最大的阻力。
光是择校问题,她就奔波了好几个月,费了九牛二虎之力才得以在当地一所排名中游的学校上学。
图:李飞飞一家
那时,爸爸去帮别人修相机,妈妈就去当收银员。
但这类工作的收入,完全不足维持生活和支付她的学费。
所以到美国后的很长一段时间,李飞飞生活的关键词就是“谋生”二字。
在唐人街附近的很多零工,包括收银员、清洁工、服务生等她都做过。
然而在打工之余,李飞飞却还要应对两年后的美国大学入学。
作为新一代移民学子,她不但要迅速掌握英语,还要拿出一份极其优秀的成绩单,才能考上好的大学。
那时候,打工和学习几乎占满了她的全部生活。
最辛苦时,一天只睡不到4个小时。
图:1995年, 高中时期的李飞飞Parsippany - 镇上关于李飞飞的报道
只要你想,全世界都会为你让路。
凭着这股毅力,这位华裔少女收到了普林斯顿大学计算机系的offer,还是提供全额奖学金的那种。
当时这个消息在小镇上算是个大新闻,还有报纸专门刊登了她奋斗的故事,称她的“美国梦”成真啦!
图:李飞飞在普林斯顿大学
在普林斯顿大学她接触到了大量优秀的人才,这对她而言更是莫大的鼓舞。
然而,在大学她依然不改拼命三郎的性格。
看着父母还是做着入不敷出的零工,李飞飞决意借钱买下了一家洗衣店,交给父母经营。
从此,她也就过上了周一到周五在普林斯顿拼命学习,周六日则赶回家中,继续当洗衣妹的日子。
她不但独立,浑身上下更是散发着对生活的热爱。
“我爱普林斯顿,也非常爱我的洗衣店”
“我觉得辛苦不算什么,因为我父母也同样在努力工作。我们一家人只是为了好好地生活。”
1999年,李飞飞从普林斯顿大学毕业。
然而,那时的她却拒绝了多家金融公司的工作邀请。
在父母的支持下,开始追随自己的内心,毅然踏上一年的西藏之路研究藏医。
图:李飞飞在西藏的日子
完成了这一梦想后,她再次拒绝了华尔街的高薪工作,开始了下一个梦想——读博士。
然而,在读博期间,她的母亲却不幸得了癌症,之后又中风。
生活的重担几乎压得她喘不过气来。
“人生最难的不就是,如何发挥自己最大的潜能,同时兼顾自己所身负的责任,然后又必须忠于自己的内心吗?”
而李飞飞用自己的行动告诉我们,她做到了!
在博士毕业后,她进入了斯坦福大学AI实验室,选择了当时不被看好的研究方向——计算机视觉识别领域。
通俗的说,就是拿一张图片,让计算机认出来这张图片所包含的内容。
比如,你告诉计算机,“猫”是由圆脸、胖身子、两只尖耳朵和一条长尾巴组成的东西。
然而在现实生活中,猫就有成千上万个品种,就算是同一只猫,也能摆出上百种姿势。
如果遇到一些骨骼清奇的猫,换个姿势计算机估计就懵逼了。
那个时候,图像识别已经走过了20个年头。
但全世界能够识别的物体也不过4到20种。
然而大千世界这么多的物品,如果计算机只能识别豹子、飞机、人脸和汽车这几样是远远不够的。
面对图像识别如此匮乏的“词汇量”,李飞飞产生了一个疯狂的想法。
她拿出一本字典,决定要让图像识别涵盖到字典里的每一个词条。
图:李飞飞与导师
当她把这个想法告诉其他教授时,大家都纷纷劝她换个方向,因为研究这个是“拿不到终生教授”的。
她还找了好几个教授想要寻求合作,也全然被拒绝了,都认为“看不到结果”,“不值得”。
但是李飞飞却没有想那么多,先别管“终生教授”的事,首先要做好自己认为重要的事情。
图:李飞飞在斯坦福大学授课
刚开始时,李飞飞将很大部分的精力都放在算法的优化上,然而这并没有带来太大的突破。
突然有一天,一个非常简单但却非常有冲击力的想法,使李飞飞找准了方法。
她想,没人教婴儿怎么“看”,也没有人告诉他们“猫”的特征。
但是他们却能够很快的知道这就是猫,无论什么品种或什么形态。
因为人类的眼睛就好像一个生物照相机,每200毫秒就能获取一幅图片。
一个三岁的孩子就已经见过上亿副图片了,能分辨图片当然不在话下。
所以要让计算机学会“识图”,关键是在于训练量——让计算机看更多的图片。
从2007起,李飞飞与团队便从互联网上下载了近10亿幅图片。
在这之后便是对这些图片进行分类、打上标签,为计算机提供学习用的“题库”,而这个“题库”就是现在的ImageNet。
然而,当他们给图片打标签打了几个月后,研究经费很快用完了。
而且按照这个速度,至少得十几年才能完成目标,因为图片实在是太多了。
但李飞飞却从来没想过放弃,在最困难时,她甚至还想重操旧业开洗衣店,为研究筹集经费呢。
正当大家一筹莫展时,他们遇到了美国最大电商平台——亚马逊。
当然不是在上面买书,而是和亚马逊的众包平台合作。
通过众包平台,李飞飞在网上雇佣到了来自167个国家的5万人,为这十亿张备选图片筛选、排序、打标签。
当时的李飞飞,一度是这个众包平台上最大雇主。
到2009年,ImageNet数据库就包含了1500万张照片,涵盖了20000多种物品。
回想在2006年那4到20种物品,ImageNet数据库无论在质量还是数量上,都是空前的。
然而,最重要的是,ImageNet这个如此庞大的图片数据库竟然是免费的。
这就意味着,全球所有致力于计算机视觉识别的团队,都能从这个题库里面拿“试题”,来测试自家算法的准确率。
图:ImageNet挑战赛的机器错误率, 七年来从28%降到了3.6% ,比人眼识别的错误率5.1%还要低。
为了激发各界对计算机视觉研究的热情,李飞飞每年都会举行一场ImageNet视觉识别挑战赛。
在这场考试中,无论挑战者的输与赢都代表着一次新的发展。
如果考生能轻易答对“试题”,这就说明了视觉识别技术的更上一层楼。
但如果“试题”难倒了考生,也不用担心,这也意味着算法的突破口就在这。
不过,对于现在一度“过热”的人工智能,李飞飞也一直在强调“人工智能现在越火,越需要有冷静做研究的人”
她说“我做研究的心得就是,眼睛看到的前方应该是比较空旷的。如果你眼睛看到的前方是热闹的,那这个方向就不是最好的研究方向。而空旷的地方一般都不是热点,因此你必须找准自己的焦点”
图:李飞飞首度亮相谷歌云大会
关于未来的AI开发,李飞飞认为不但要在学术上还要结合工业上的开发。
因为AI的最终目的就是服务于人类,这也是李飞飞加入谷歌的原因。
为的就是拉近AI与人类日常生活的距离,使AI"更接地气"。
图:谷歌街景搜集的车辆数据
在今年2月末,李飞飞又发表了最新的论文:《用深度学习和谷歌街景估算美国人口结构》。
文章主要论述了如何将谷歌街景搜集来的机动车辆数据,结合机器学习算法。
从而估算出本地区人口的特征和组成,甚至这一地区居民的政治倾向。
在李飞飞看来,目前的图像识别和人工智能,还相当于一个牙牙学语的3岁孩童。
而3岁到10岁的过程,才是人工智能的难点和关键。
就算李飞飞说图像识别的路还有很远,但也完全不妨碍我们畅想未来。
去超市买东西,直接“刷脸”付款;
在追击违法分子上,可能罪犯刚一上街就已经被一双神秘的眼睛锁定;
图:完全不用看红绿灯的“未来式过马路”
在未来交通上,人们不用自己抓方向盘,也有“老司机”带你飞;
在医疗上,医生和护士会多了一双永远不用休息的眼睛,帮忙诊断和照顾病人;
在TED演讲的结尾,李飞飞表示:她现在所有的追求,就是赋予计算机视觉智能, 并为Leo(她的儿子)和这个世界, 创造出更美好的未来。
这个集才华与美貌于一身的女子,能把人类带到哪个未知领域,我们也翘首以待。