孙健计算机科学家,一个帮助计算机“看”和理解世界的人,是迪法恩斯研究院的前院长。2022年6月14日,突发疾病去世,享年45岁。
温雅药引弥和甘明程曼琪编辑姚音蜜
“计算机领域有点像沉积岩。你贡献了薄薄的一层,让山更高。但最终人只是站在山顶,只有用x光才能看到里面是什么样子。”史蒂夫·乔布斯
自从计算机成为一门科学以来,人们发表了许多关于互联网技术将如何改写我们族群未来命运的科幻想象。最一致的图景是,计算机可以像人类一样“理解”世界。
现有的AI应用无处不在,从手机可以完成的夜间照片到实时翻译对话,从汽车的半自动驾驶到屏幕上的缺陷产品工厂检查。和所有技术一样,AI的进步隐藏在产品营销的背后。大企业聘请一些工程师跟踪前沿研究,实现AI的功能。
这些应用看似轻巧,实则踩着科研人员的聪明才智和研究,是借助超级计算能力和电力积累起来的数据巨兽。在过去的二三十年里,科学家日复一日的努力,无非是在计算机拥有真正的智慧之前,动动人类的感官。
视觉是“机器要有智能”最重要的意义。孙健是计算机视觉领域有影响力的科学家。他拥有40多项专利,在顶级学术会议和期刊上发表了200多篇论文,在谷歌上被引用了280,000次,H指数为121。根据被引论文统计,孙健在世界计算机视觉领域的学者中排名前五。
由孙健领导的ResNet是深度学习领域最重要的研究之一。在很多人心目中,“一”是可以去掉的。亚马逊首席科学家李牧曾经评价:如果你在用卷积神经网络,有一半的几率你在用ResNet或者它的变种。这篇论文被引用了惊人的12万次。
用户可能并不总是意识到产品的便利性得益于更精确的AI技术。正如乔布斯所说,技术的积累就像沉积的岩石。孙健,以及许多先行者和后来者,用他们的一生把技术的山建得更高,为进一步的社会变革积累了一些基础。
第一个回答问题。
孙健是一名在中国长大的计算机视觉科学家。他的硕士和硕士学位都是在Xi交通大学完成的。原本是自动化专业,大三的时候对数字图像处理感兴趣。博士阶段,孙健由Xi交大和微软公司联合培养,加入新成立的微软亚洲研究院,进入视觉组,在院长兼首席科学家沈向洋的指导下学习。
毕业后,孙坚留在了MSRA,在微软工作了13年。后来,MSRA在互联网领域声名鹊起,被誉为“中国互联网的黄埔军校”,为多家公司贡献了技术高管和首席科学家。
21世纪初是外国公司在中国的黄金时代,MSRA人才济济。在Xi安完成第一年的博士课程后,孙健来到微软新大楼实习。已经有研究人员和助理研究工程师在研究所工作。“他们的编程能力特别强。”当孙健看到这一点时,编程之路可能行不通。“差距太大了。”只剩下一条路:认真做科研。
但是,把一生都奉献给科研和实践,并不完全是孙坚所描述的那样,而是一种谦虚选择的结果。他对的科学研究有一种发自内心的热爱,“有一颗纯洁的心”,他的同事魏回忆说。孙坚曾经告诉我们,很多博士毕业后从来不想写论文,但他一直想写,一直能写。他在无视近200人的管理团队,但工作站上仍有一个显示屏,始终开着论文。
像许多科学领域一样,计算机视觉的重要问题只能回答一次。在这个垂直的科研宇宙中,每时每刻都有几个核心问题,对应着一些未解决的目标。研究人员很好奇,想先了解一下。
在MSRA期间,许多同事目睹了孙健对科学研究的痴迷和对他论文的研究。他在去洗手间的路上也看了。大家都11、12点下班了,他还在看书。在阅读Inspired generate的时候,孙健会拿着论文冲出办公室,经过开放的工作站,拉着同事们热烈讨论。
2003年,智能手机还是少数极客的玩物。“当时我们谁也不敢想这种技术能用在手机上。”那时,孙健开始研究如何使用软件和算法来拍摄更好的照片。那个全新的研究领域后来被定义为“计算摄影”,而转型的首要对象就是数码相机。
条件有限,能看到当时在好大学看不到的专用电脑显卡,就能让他们很开心。为了研究,孙健和佳佳雅把每个月的工资凑在一起,花巨资买了当时市面上比较高端的单反相机,然后结合MSRA环境,得到更多的实验数据。他们整天讨论问题,每年都有很多通宵可以度过。
孙健手里的项目最多,同事帮他订好外卖。凌晨十二点,饭菜一上来,孙健就快速地吃了起来,吃完后就快步走了。有时候,当每个人都在做一个项目时,他们突然发现孙健不见了。当他们在大厅里向外看时,他们发现他已经在沙发上很快睡着了。当他醒来时,孙健能够继续做实验和写论文。佳雅好羡慕,睡眠都不怎么好。
后来,孙健的洞察力越来越敏锐,在MSRA视觉集团的地位也越来越高。贾亚说,许多人意识到孙健是一个很好的倾听者,他总能在讨论中找到问题的本质,帮助他们打开思维。
几年后,孙健和佳佳雅成为中国计算机视觉领域最重要的人物。其中一人在MSRA工作了十三年,成为了旷视科技的首席科学家;一个毕业后加入香港中文当教授,担任腾讯优图实验室联席负责人,后创办思谋科技。
在MSRA,孙健和佳佳并排坐着。他们都是沈向洋的学生。他们总是瑞典图勒图勒背包说想法和听,背诵一样。他们在计算摄影领域合作发表了许多重要论文。是“老大哥”,大家都叫他“孙大哥”。
后来,他们一起参加了一些活动。佳佳雅背着几斤重的单反和孙健一起爬山,一路上拍了很多照片。孙健在生活中总是喜欢拍照,不仅因为他喜欢摄影,还因为他需要数据。他告诉佳佳雅,不管多少钱,他将来总会用到的。
在同意接受我们的采访后,佳佳雅用真挚的感情写下了悼词。到了约定的面试时间,他无法安静的看书,只好交给艾朗读。近5000字的文章,机器人用平静的语气读了近20分钟。佳雅一直红着眼睛,几次离开座位。最后,他干脆关掉了摄像头。黑暗的画面下,艾读完了悼词的结尾,然后只剩下佳佳雅的几声抽泣。
“如果你不尽力,存在就没有意义。”
有时候,一个人在行业中的地位高,可能是因为他在这个领域呆的时间够长了。然而,孙健的地位不是简单努力的结果。计算机视觉经历了许多大大小小的技术变革。因为独特的眼光、快速的转型和一如既往的努力,孙健一直能够站在技术的最前沿,引领行业。
在深度学习之前的古代,计算机视觉的领域比较小,虽然也有一些应用。希望不要像今天这样广泛深入。“一个产品过不了一个技术门槛,就成不了产品。”人脸识别曾经是孙健重要的研究方向,但当时的技术水平还做不到今天的刷脸支付。
2012年,多伦多大学的Geoffrey Hinton团队提出了8层卷积神经网络模型AlexNet。ImageNet上的识别错误率仅为16.4%,比之前最好的传统视觉方法低了近10%,在整个视野范围内引起了轰动。但由于深度学习的长期压抑,仍然有很多学者不相信、不接受这个“新生事物”。在关键时刻,孙健毅然带领团队完成转型。后来的故事大家都知道了。
孙健的职业生涯和研究重点做了很多成功的转型,从计算摄影到图像检索,到人脸识别,到自然人机交互界面,一路到深度学习。每一次技术和方向的改变,都会有一些“弄巧成拙的武功”。在新的赛道上,我们将与其他众多竞争者回到同一起跑线上,重新出发。
魏知道做出这个看似随意的决定是多么的勇敢和果断。魏对本人也有很深的了解。他的博士研究课题是3D重建,这是一个比较小但比较成熟的领域。加入MSRA之初,我甚至找不到合适的研究课题。他迷茫了很久:没有转型,看不到方向;转型就意味着之前的经验和知识被束之高阁,真的不甘心。孙健的一句话让他醒悟了:“就复读一个博士吧。”多年以后,魏仍然记得当时的内心触动。
我身边的很多朋友都知道孙健有一个“走简约之路”的诀窍。他善于用最简单的话,把最直接的话说到人们的心里。让这些原则生效的关键在于孙健自己已经实践并做到了。
2015年,由领衔、何、和任完成的深度为152层的残差神经网络模型ResNet,参加ImageNet大规模视觉识别挑战赛,错误率降至3.57%,首次超过人眼准确率,在所有细分比赛中获得冠军。在2016年计算机视觉顶级学术会议CVPR上,ResNet paper获得最佳论文奖,这是孙健带领团队第二次获得该奖项。以前没有科学家取得过这一成就。
ResNet已经被写进教科书,是每个AI从业者都应该掌握的基本功。在ResNet出现之前,研究人员苦于无法成功训练深度神经网络,从而无法充分发挥神经网络优越的建模能力。ResNet彻底解决了这个基本而重要的问题。不仅适用于计算机视觉,还适用于语音识别和机器翻译等任务。后来DeepMind开发的升级版围棋人工智能AlphaGo Zero就用了ResNet。
也许孙健一直珍惜他作为一名技术研究员的机会。“因为技术变革不会经常发生,所以我觉得遇到他们很幸运。”
他对自己非常严格。他曾经在自己的电脑上贴了一张纸,上面写着“只有成功,没有失败”。他还要求他的团队“在某个词领域找到最佳算法和特定问题的最佳解决方案”。而且,还不能一成不变,还得一直最强。“如果不做到最好,那就没有存在的意义。”
技术一定是有用的。
科学研究是一个需要全力以赴的领域。他成年后几乎都在做一件事,就是在自己最喜欢的计算机视觉领域做科学研究,并尽可能将研究成果应用到实践中。
MSRA是一个由企业领导的研究团队。虽然有学术氛围,但更强调技术的应用前景。孙健是一个非常彻底的技术实用主义者,他留下的技术思想影响了他的同事和学生:
“价值是务实的。”
“这东西管用吗?”
“既是神又是鬼。”
孙健一直是MSRA视觉集团的核心成员。每年微软总部的技术节,孙坚都会带领同事找产品部门的业务负责人交流,寻找技术落地的方向。
微软的图像处理软件Digital Image Suite在处理照片方面得到了孙健团队的大力帮助。有一段时间,孙健想把计算机视觉技术植入微软办公软件。“那就会有几千万用户能用上。”然后他真的做到了。
2016年,微软在当年的Build大会上发布了新的云服务产品CaptionBot。它用于为盲人设计的看东西AI眼镜等硬件设备中,可以将摄像头拍摄的图像变成文字描述,然后通过语音技术读给盲人听。后来,这项技术演变成了Office Power Point的一个小功能:插入图片时,会自动生成文字描述,不再需要手动添加文字来供视障人士阅读屏幕。
当时在微软总部工作的人工智能科学家何晓东邀请孙健合作这个项目。何晓东回到中国,并于2018年加入JD.COM。他也赞同技术实用主义的观点。他说,“AI工程化和产品化是保证AI永远不会回到寒冬的重要一点。”
迪法恩斯研究院的一名前员工对孙健在一次内部论坛上的发言印象深刻。一位研究员问孙健如何平衡工作和生活。孙健表达的大意如下:为什么要区分工作和生活?它们应该是一体的。工作对生活有帮助,生活也能激励工作。
如果是别人说了同样的话,这位前员工可能会觉得公司高管在暗示员工会为公司“引火烧身”。”但因为是孙先生说的这句话,“他仔细读了,想了想其中的道理,一直记到今天。
2016年,孙健加入人工智能视觉初创公司Vision Technology,担任首席科学家。创始人殷琦是他的学生,唐文斌也在MSRA实习过。
那是科学家们陆续进公司的时候。随着技术变革的到来,越来越多的研究人员意识到,初创公司有更多的机会和资金,可以在细分领域有更多的自由度,其科研成果可以更快地应用于工业领域。
孙健的大多数同事和学生也进入知名公司或自己创业。何余明加盟脸书,担任脸书AI研究院研究科学家;曹旭东创立Momenta,一家自动驾驶技术公司;任邵青离开Momenta后,加盟蔚来汽车,担任北美自动驾驶助理副总裁;魏于2018年加入迪法恩斯,担任迪法恩斯上海研究院院长。
出于轻蔑,孙健还要求研究人员申请该项目,他们必须首先确保该项目在三年内能够具有工业应用价值,然后才能开始研究。他还要求项目的重要负责人“离开现场”,检查技术应用的真实环境,而不是仅仅坐在办公室电脑前,想象一个有公式和代码的应用程序。
很多国产手机厂商和产品都使用了迪法恩斯研究院的技术,更清晰的夜拍,更精准的工业相机,方便现代人。
迪法恩斯公司从孙健那里获益匪浅。自孙健接手旷视研究院以来,重要科研成果包括AI生产力平台Brain++、开源深度学习框架天元MegEngine、移动高效卷积神经网络ShuffleNet等。在多个顶级学术会议和期刊上发表学术论文120余篇,是国内人工智能领域发表论文最多的公司之一。
迪法恩斯员工尊重孙健,迪法恩斯研究院在公司也有非常重要的地位。有了孙健,鄙视很容易吸引优秀的计算机视觉人才,很多年轻人为了孙健而加入进来。
接过衣钵,继续前进。
轻蔑之后,“孙老板”变成了“孙老师”,传遍了全公司。与世界上大多数公司里的“老师”相比,孙健更接近一个真正的老师。
尽管管理工作十分繁重,但孙健始终保持着对科研的热情,经常亲自参与研究所重要论文的讨论和撰写。同事或学生经常向孙健询问科研甚至生活方面的话题。孙健总是耐心地与他们沟通,设身处地为他们着想。“我觉得这超出了职场的职责范围。按理说不需要那个。大家都在工作,真的很难得到。很多年轻人的学术观点受他影响很大。”孙健的一位师弟说。
在每个人的描述中,孙健的形象都是一样的。他总是带着温和的微笑。即使不认同某些结论,他也很少直接站出来强烈表示反对。没人见过孙坚发脾气。后来,熟悉孙健的同事和学生知道,沉默意味着孙先生对讨论有疑虑。
无论是MSRA视觉集团还是迪法恩斯研究院,里面的科研人员都深深地依恋着纯净的环境和努力工作的氛围。多年来,孙健一直默默地塑造和保持着这种独特的气质。
在公司走廊里,孙健遇到的研究员会被问及上次讨论的进展情况。有些人无法回答,孙健微笑着离开,留下温柔却无形的压力。后来,一些学生故意绕过位于交通要道的孙健站。
改变和影响人并不容易。孙坚有润物细无声的力量。“早些年,我的论文写得不好,每次给孙老师看都很尴尬。”魏回忆说:“孙老师会尽量提出意见的。有时候我再也受不了了。孙老师会很客气的说:“要不你回去好好想想?“神奇的是,这样几次之后,真的完成了。人的潜力就是这样被逼出来的。
孙健谦虚低调。他不太愿意参加公共活动,更多的是参与面向技术人士的活动。当鄙视的名气越来越大的时候,孙健依然拒绝大部分的采访、活动和公开的颁奖邀请。他总是说,给英奇打电话,给文彬打电话。随后,他还鼓励张翔宇、范浩强、周尔晋等青年骨干代表研究所参加活动,分享学术和实践成果。
他个人多年来一直保持着简单的生活方式,主要有三个要素:科研、运动、美食。
早在MSRA,孙健就非常喜欢运动。和魏常年在一起打羽毛球。起初,孙健甚至不能发球。然而,没过多久,魏就发现的科技突飞猛进。孙健利用自己严谨的科研专业,练习羽毛球,观看大量教学视频,请教练,坚持长期练习,总结出方法和经验。后来,他们一起获得了MSRA羽毛球团体赛的冠军。
在过去的几年里,孙健沉迷于骑自行车和跑步,不得不带着学院的学生一起锻炼。在轻蔑的内部体育打卡小组中,孙健是少数几个每周至少能打卡三次的人之一。学院的团建一定和体育有关。孙健将带学生去爬山、跑步、体验射箭和冰壶运动。有科研人员苦于孙对体育的狂热,不得不在电脑上进行无声但无效的抗议——我不想举铁!
在论坛上,孙健发表最多的内容不是关于技术,而是关于如何科学健身。他家里有很多健身和运动相关的书籍,他还会告诉同事们如何在跑步前进行科学的热身,如何在跑步过程中保护膝盖,以及如何在跑步后进行拉伸。一位以前的同事记得,孙健曾做过一个PPT在公司里分享。他还开玩笑说,以后可以叫他“孙健身”。
6月14日凌晨,孙坚因突发疾病猝死。因为消息来得太突然,他身边的很多人还是没有很好的消化这个事实。孙健的工作站保持不变。员工上班的时候,会在办公桌上放一束花。
6月18日是张翔宇的生日。往年,孙坚都会早早给亲人送上生日祝福。昨天,张翔宇带着一束花来到公司,向孙健的位置深深鞠躬。他在知乎注册以来的第一个回答。他说:要独立,要坚强;接过衣钵,继续前进。
人类的历史很长,人类的生命很短。当一个人匆匆来到这个世界,又匆匆离开,他的个人痕迹也许总会被时间抚平,但他的智慧会成为这个世界的一部分。
* LatePost在2020年6月采访了孙健,本文部分内容来自那次采访。还要感谢佳佳雅、魏、何晓东、、老师们,以及很多曾经忽略孙健的人对本文的帮助。