首页 文章详情

AlphaFold「奠基人」周耀旗:用37年的边角料研究,找一座「精神乌托邦」

雷锋网 | 301 2022-08-16 07:32 0 0 0
UniSMS (合一短信)

每次看到家中昙花盛开,周耀旗会想到自己的科研生活:长时间寂静,一霎那绽放。这些年里,他找到了一种打理自己的方式,就是把自己的经验教训写进博客。他乐于将个人的故事与公众分享,如同他总会接纳外界的声音。


作者 | 吴彤
编辑 | 李雨晨
当全世界都沉浸在进入新世纪的喜悦时,37岁的周耀旗在家中挑灯夜战,他憋了一口气,要写出一份最好的申请书,拿到他独立研究时的第一笔经费。
从2000年开始,每年的申请季,周耀旗就会陷入时刻琢磨申请书的状态。但直到第三年,他才拿到首笔经费。
周耀旗的女儿曾在日记中写道,“有几次,爸爸刚放下怀里的电脑,才夹了一筷子菜,突然想起什么,冲向沙发,抓起电脑,乒乒乓乓一阵敲打。”
那是周耀旗的第一份教职,学校坐落在纽约州第二大城市布法罗。
彼时,这位刚从哈佛大学离开的博士后,师从诺贝尔奖获得者Martin Karplus、直博就读于杨振宁所执教的纽约州立大学石溪分校、八十年代中美化学研究生项目中的两百余人之一,在20世纪刚刚结束时,结束了他16年的求学岁月。
在外界看来,那些经历本应是周耀旗最大的荣耀与敲门砖,但从他做独立研究的那一刻,所有的光环仿佛消失了。
他困顿、焦虑、沮丧、又重振旗鼓,用新成果对抗失败。
在那些漫长的探索中,有一条周耀旗始终坚持着的科研主线——蛋白质结构里的二面角的预测。他自嘲,做的是科研中的“边角料”工作,却将那些不起眼的工作做到极致。
正是有那些积累,让他第一个把深度学习方法应用到蛋白质主链结构预测中。早在谷歌大热的AlphaFold出现之前,就与团队发展了神经网络回归预测蛋白质真实二面角,推断出蛋白质结构的预测方法,是端对端的蛋白质结构预测在神经网络外的实现。
在科研的另一面,周耀旗的经历同样吸引人。
他离家张家港,学至中科大,东征纽约直博,西至加州创业,辗转重回纽约,博士后南下北卡,又北上哈佛,在布法罗、印地安纳、澳洲,度过了二十年的教学岁月。
从周耀旗身上,我们能看到一个科研人如何延续学科中的最小分支,也能看到一个人的三十年,是如何创业折返、三换导师、四次跳槽,以及无数次经费被拒的经历。
如今,在与祖国阔别了36年后,周耀旗来到代表中国40年发展奇迹的城市,在深圳湾实验室里,开始新的故事。

1

一次被“抓壮丁”的出国机会

“没主见、不主动、不爱说话,只有学习好一点。”
这是周耀旗的父亲给他的评价。
1963年,周恩来在上海科学技术工作会议上,强调实现科学技术现代化时,周耀旗出生了。
六十年代,周耀旗的家乡张家港依港而兴,成为那个年代最早对外开放的窗口。那时的周耀旗不会想到,自己将从这个小港口出发,在大洋彼岸开始36年的异国生活。
周耀旗在国内读书时有两个重要经历,一次是提前冲刺高考,一次是意外获得出国机会。
1979年,读高二的周耀旗作为毕业生参加高考,尽管高一时冲击未果,但这一次,他顺利考进了中国科学技术大学,并以化学高分的成绩录取到近代化学系。
那一年,全国有468万青少年走进考场,录取约28万,录取率不足6%,周耀旗成为当中幸运的一份子。
至于为何学起了化学,周耀旗说道,79年的高考化学特别难,自己倒是发挥不错,也就因为这个优势,填了中科大的近代化学系。

周耀旗在中科大校门口

第一次去外省上大学,16岁的周耀旗有些忐忑不安。
他有一本小本子,上面记录了很多灵光乍现的“民科”想法,比如人死后会不会投胎、太阳系、原子和夸克结构的关系,什么样的老师最受欢迎,其中一些小文章还登过中科大校刊。
在同学看来,这位“小同学”特别喜欢胡思乱想,还有点专攻旁门左道,人送外号“爱因斯坦”。
好在七、八十年代,学术气氛高涨,李政道、杨振宁、丁肇中等华人接连获得诺贝尔物理学奖,周耀旗那些稀奇古怪的想法算不上离经叛道,还暗中为他从事需要冥想的理论研究打下了基础。
1984年夏,五年制的本科生活要结束时,周耀旗也像大多数毕业生一样,对就业手足无措。况且自己还年轻,资历尚浅,能到社会上做些什么呢?
大多数同学考研,周耀旗也跟风,几乎没有备考就考上了本校的理论化学研究生。
这紧要的一步,改变了周耀旗一生的命运。
上世纪八十年代,邓小平关于出国留学的指示促成了三大项目:CUSPEA(中美联合物理研究生招生计划)、CUSBEA(中美联合生物研究生招生计划)、以及CGP(Chemistry Graduate Program)——中美化学研究生项目。
在这段持续五年的CGP项目里(1982-1986),共有242名化学系学生奔赴美国和加拿大,成为推动中国基础研究的关键。
1984年,周耀旗所在的中科大分到了6个出国统考名额。按照遴选标准,需要在有出国意向的应届中国化学系研究生考生中统一考试,择优录取。但考试结束,有几个学生因为英语和政治没过及格线,以数分之差落榜出国统考。
6个名额迟迟不满,中科大近代化学系的系主任突然想到周耀旗——已经考上本校研究生,虽然没有出国意向,去充个数也好。
出乎大家的意料,当年的CGP考试仅有3个中科大学生通过了两轮筛选,而出国排名的最末尾,就是周耀旗。
对冷不丁窜出来的周耀旗,老师和同学都大为震惊,称他是系里的一匹“黑马”。
但在那时,周耀旗对出国没有什么概念,认为自己不过是赶巧被抓去“充了壮丁”。毕竟他在中科大的成绩中等,也从没得任何奖,无论如何也轮不到自己。
对于突如其来的出国机会,周耀旗兴奋又发怵。
从小学到高中,周耀旗去过最远的地方就是邻县的亲戚家,大学也只是去了邻省,离家不过五百公里。而现在,接踵而至的问题就是申请美国学校,一切都太陌生了。

1985年,周耀旗(后排右五)在中山
大学进行一年的英语集训
按规定,所有入选学生要在中山大学进行一年的英语集训,期间,周耀旗的一个同班同学王主伦去了纽约州立大学石溪分校就读,他也赶紧写上了这所学校。
周耀旗清楚记得,石溪是杨振宁所执教的学校。1985年,正是杨振宁在石溪的第19个年头,在他的率领下,该校的理论物理研究所多次获得国际大奖。
仿如一张白纸的周耀旗,也将与这所学校结下情缘。

2

导师的误解与一家只有

三个人的创业公司

在历经两天的轮航中转后,周耀旗终于踏上了美国的土地。
他打量着这个新世界,不曾想,他直博的起点,却是他科研生涯中的“至暗时刻”。
出国前,周耀旗就确定了心中的导师首选——石溪化学系主任Jerry Whitten,一位国际上负有盛名的量化计算理论研究学者。此前,周耀旗的本科毕业论文也是这一方向
但当周耀旗到了石溪,Whitten的第一句话是,“你可以找任何一个教授做导师”。这让初到英文环境中的周耀旗误以为系主任对他不感兴趣,只好重新找起了导师。
1986年春,周耀旗决定,去系里“唯二”做理论研究的Harold L. Friedman教授那里毛遂自荐。
当周耀旗说出在石溪的成绩时,Friedman看着眼前这个功课全A的中国学生,产生了一股好感,不到五分钟就把他收进了自己组。
就这样,周耀旗“糊里糊涂”地跟着Friedman做起了液体统计力学理论——一门他在国内听都没听过的学科。

Harold L. Friedman 教授

但这段博士生活并不轻松。根本问题是周耀旗并不适应Friedman的教研风格,往往因为Friedman给的方向太确定,没有什么可变的余地,而不确定是否找到了喜欢的科研。
在不适合的方向上,周耀旗的成果几乎为零。他曾在博客中写下,“导师给的几个题目,我做出来的结果总是和原来的设想相反,方法不仅没有改进,还变得更糟糕,最后连导师都不知道该给我什么题目了。”
而Friedman显示出极大的耐心,他知道这位学生只是一时没找对门路罢了,常常鼓劲儿似地问周耀旗:“Anything exciting?(有激动人心的结果了吗?)”。
听到导师这样问,周耀旗心情更加复杂,“如果再做不出成果,岂不是坏了Friedman的名声。”
经历一年的痛苦磨合,1987年,原来化工系的George Stell教授转到了周耀旗所在的化学系做全职教授。为了帮助周耀旗推动进展,Friedman马上向Stell建议,一起带带这位“不出活”的学生。

George Stell 教授

于是,在石溪的第三年,周耀旗多了一个导师。
Stell的教育方法完全不一样,他不给学生具体的课题,而是拿出一堆自己认为有题可做的论文,让学生去分析。
这给了周耀旗很大的“创作自由”,也似乎解开了周耀旗零成果的死循环。
不久后,周耀旗想到一个思路,如果把一个硬球的半径变成无穷大,那么液体统计里的积分方程,就能跳出三维径向硬球体系,转而研究出硬球在一个硬平面附近的分布。
顺着这个思路,周耀旗举一反三。他把一个硬球体系继续变形,从常规球体变为球形孔穴、柱型孔穴、两个硬面、半透膜(球型,平面型,球内半透,球外半透),直到把所有硬球体系都做了一遍。
延续这个方法,周耀旗又将球体推广到离子体系,一口气发表了6篇论文。
在找到研究的门路后,周耀旗显示出了极高的研究热情,论文也变得高产。
他复制此前的成功,在以前论文的基础上,将两个自由离子看作一个分子体系,得出了溶解自由能随离子间距离的变化,从而推断出电子转移反应的溶剂效应。
在这个方向上,周耀旗又发表了8篇论文。
在博士的最后三年里,周耀旗一共在凝聚态理论方面发表了22篇论文。其中19篇是第一作者,还有多篇成为了液体统计理论上的开创性工作。
直到毕业前,周耀旗写下一首打油诗,“乘风驾云把西征,面壁五年为求真。悬梁刺股秋风寒,冬天过了终于春。”
他以此记录自己那五年中的混沌与觉醒。

周耀旗(右一)与两个导师以及表情各异的同学们合影

1990年3月,长岛的寒冰刚刚破碴,周耀旗的科研生涯告一段落,第一次站在了人生的十字路口。
原来从来没有想过留下来的他,由于当时国内外的社会气氛,回国的念头被打消,但也不知道找工作怎么找,从哪里开始。
这时,校友张永峰打来了电话。他曾在中科大做过老师,通过杨振宁特别项目在石溪读了计算化学博士,毕业后去了加州理工做了诺贝尔奖获得者Rudolph A. Marcus的博士后。
他邀请周耀旗加入应用物理化学实验室(Applied Phys and Chem Lab,APCL),去从事量子化学方面的科研。
去了之后周耀旗才知道,这是一家3个人的初创公司,好在刚开始日常工作与周耀旗的博士研究相差不大,随遇而安的他每天兢兢业业,动脑卖力,很快发表了一篇量子化学方面的论文。
但不久,公司发现搞科研没有“钱”途,转型成为营利公司,专做环境保护测试。周耀旗也跟着换了岗位,做起了实验室信息系统管理、市场、推销、客户服务、业务管理,不久成了全面负责的实验室主任。

周耀旗(右一)与加州应用物理化学实验室
(APCL)同事合影,张永峰(左一)
这是他的第一份工作,但三年后创业新鲜感过去了,日常工作变得重复琐碎。
虽然那时公司事业变得蒸蒸日上,团队从几个人到了二十多个,但周耀旗却开始自我质疑,“人活着难道就是为了挣钱?这是做事业的感觉吗? 如果钱赚得多一点,做管理就算有出息的话,这样的出息有什么劲?”
他特别怀念一门心思做科研的日子,那种生活虽然也非常辛苦,但自己享受那个过程。“如果能做自己喜欢的科研,还能有口饭吃,岂不是更好?”
三十岁那年,周耀旗下定决心:回去做学问,赌一赌自己有没有做教授的命。
周耀旗选了一个“崭新”的日子:1994年1月1日,他辞掉了自己的第一份工作,回到石溪,在两个博士导师那做起了博士后。
在周耀旗看来,这不是走回头路,而是重新获得了一段沉浸自己的时间。多年后,周耀旗这样描述这段时光,“我是三十才立志,才知道自己该追求什么。”
他在博客中一字一句写下,“三十岁以前,我一直是随波逐流,没有自己的主见,别人替我做选择。之后的日子,我要自己做决定,就算衣带渐宽,几经波折,从此浪迹天涯,也无怨无悔。”

3

三换博士后导师、连投三年简历

事实证明,周耀旗赌对了,但过程也极其曲折:他曾三换博士后导师,博士后第二年才拜入哈佛大学Martin Karplus教授门下。兜兜转转中,他也找到了倾其一生的事业——计算生物学。
1994年初,周耀旗回到Friedman和Stell那里。两个月后被告知,“科研经费马上要用完了,你需要另找其他学校的博士后。”
海投了几十份申请信,只要跟理论计算相关的教授,不管有没有发出招聘广告,周耀旗都要抓住尽可能的机会。
但因错过最佳就业季,最后只有4人给了答复,分别为伯克利大学的教授David Chandler、威斯康星大学麦迪逊分校新上任的助理教授Arun Yethiraj、MIT化工系做统计力学的副教授Jonathan Harris、以及哈佛大学的教授Martin Karplus。
前两位都因为经费不足而婉拒,Karplus则告知自己不在哈佛,第二年再联系。只有MIT的Jonathan Harris给了周耀旗一个面试机会,却在周耀旗做讲座时睡着了一会儿。这唯一的一次面试也以失败告终。
与此同时,周耀旗也申请了多个助理教授的职位,均无回应。
这一刻,周耀旗走投无路了。
幸运的是,老板Stell亲自出面,找到了他在北卡州立大学做正教授的前学生Carol Hall。在最后一刻,周耀旗通过师门关系,在师姐那儿续上了博士后。
周耀旗去了之后才知道,那并不是一个全职博士后,工资只有离开公司时候的四分之一,连健康保险都没有。
1994年的8月,周耀旗在北卡开始了第二段博士后工作。
在Hall组里,他第一次离开简单分子,开始了高分子的统计力学理论的计算。
此外,他学会了此后对他帮助重大的方势阱液体模拟,为他日后用非连续动力学研究生物大分子打下了计算基础。

周耀旗(左三)在Carol Hall (前排左二)组做博士后

哈佛的Karplus在得知周耀旗去了北卡后,主动留下一句话:“如果你能申请到博士后奖学金,就到我这儿来。”
周耀旗查了查文献,把自己在北卡的简单高分子的工作往Karplus计算生物方向靠,决定把液体统计理论推广到生物高分子蛋白质上,研究“不同简单溶剂对蛋白质高分子稳定性的影响”。
他用这个设想投了两个申请,一个NSF(美国国家科学基金会),一个NIH(美国国立科学研究院)。
申请结果出来前,原来加州公司的张永峰又找到周耀旗,邀请他去新开的制药公司Amphastar Pharmaceuticals继续一起创业。但周耀旗已经下定决心,要走学术这条“不归路”。
因为博士后的申请同时需要未来博士后导师的推荐信,Karplus给力的推荐信,帮助周耀旗一举拿下了上述的两笔经费,在1995年9月正式开始了自己的第三个博士后。
也正是从这一年,周耀旗开始了计算生物领域近三十年的研究历程。

周耀旗与Marcy(左)和Martin Karplus夫妇

入组后,周耀旗得知Karplus有两个组,一个在哈佛,一个在法国。海投简历的那一年,Karplus一直待在法国,传说是更方便与提名诺贝尔奖的欧洲科学家打交道,而真正的原因是Karplus本人十分痴迷法国美食。
周耀旗被同事告知,“平常是见不到Karplus的。”但没想到刚进组,Karplus经常询问周耀旗进展,比前几个老板还盯得紧。
周耀旗利用他的理论优势写了一篇《关于盐对蛋白质滴定和结合相互作用的影响》的文章,Karplus看后,鼓励周耀旗继续做下去。
这是来自Karplus的第一次肯定,周耀旗自然十分重视,但他依然决定换个方向,改做计算机模拟,毕竟Karplus以蛋白质计算模拟成名的。
在此之前,周耀旗也曾与师姐Hall做过高分子理论研究,毕竟是在简单液体理论之外的初次尝试。
当与计算生物背景的Karplus联手,周耀旗尝试使用计算机做蛋白质简单模型的动力学模拟。他把Hall那里学来的方势阱液体模拟的程序进行了改进,增加了幽灵粒子,准确模拟出了单链均聚物在不同温度下的热力学性能。
这让周耀旗在分子动力学中的有了一个重要发现:单链在超过32个单体后,就开始在低温下有单分子液体到固体的相变,而且是有能量大幅度地接近一级相变的变化。
周耀旗将其称之为“Surface-Molten Solid——表面融化的固体”。直到现在,周耀旗仍然觉得这是生物高分子中一个重要的概念,“相当于一个物质的两态在同一个体系里体现出来了”。
Karplus看到这个结果也很惊讶,两人合写了第一篇论文,发表在了影响因子8+的Physical Review Letters期刊(物理领域最顶级期刊)上。
与此同时,周耀旗把这个一级相变,和同样是单分子链的蛋白质热力学性能联系起来,构造了一个新蛋白质模型,用来模拟蛋白质的可能相图。
这项工作得出了“蛋白质单分子是表面融化的固体”这个结论,论文发表在了影响因子11+的PNAS期刊(世界四大名刊之一)上。
此时,周耀旗忽然发现,自己喜欢上了生物高分子中的物理问题。
他表示,“做理论物理学的人都喜欢用简单的概念看物理问题,而生物高分子的问题也是一个物理问题。”
他抱有一个想法,或许化学物理和生物有某种契合,会碰撞出新的发现。在与Karplus的合作中,他愈发坚定走生物计算这条路。
周耀旗也很直白地讲,计算生物领域要比化学物理更容易获得经费,化学物理只能申请美国国家科学基金会(NSF)的钱,比较少,很多研究持续不了。
在哈佛的工作稳定下来后,周耀旗忽然心血来潮,想去拜访一下隔壁MIT拒绝过他的MIT教授Jonathan Harris。
当周耀旗在网上搜索这位教授的近况时,他大吃一惊,这位教授居然在有钱、有论文的情况下,没拿到终身教授的位子。1995年,在周耀旗到哈佛前夕,就彻底离开了学术界。
想当初,周耀旗因被拒无奈下去了北卡,过渡一年才去往了哈佛,最终找到喜欢的方向。此时的他,颇有一种“塞翁失马,焉知祸福”的感觉。
转眼到了1997年,三年多的博士后,周耀旗发表了10多篇论文,打算凭借这些成果找教职。
但挫败又一次来临。他接连投了三年简历,直到1999年,才凭借一篇Nature论文拿到布法罗大学的助理教授职位。
“决不夸张地说,凡是听说过的有位置的学校,我都申请过。每年寄求职信的邮资就几百块美元。”
在这期间,周耀旗的第一个女儿出生,找到一份工作变得更加迫切,周耀旗第一次感受到,该养家糊口了。
1998年,他决定从非连续分子模型模拟蛋白的研究中跳出来,主动向Karplus老板要来了分子力学模拟蛋白质分子动力学方面的题目。
接下来的一年时间里,周耀旗一边投简历一边做科研,先后有三篇文章送审Nature。
但结果都是被拒,最后一篇是Karplus亲自打电话给编辑,指出审稿人自相矛盾,才成功把文章救活。
周耀旗坦言,“如果没有Karplus的名声,这种起死回生的事是不可能的。”
这篇论文也对结束周耀旗的多年博士后生涯起到了决定性的作用。
1999年9月底,周耀旗的这篇Nature终于刊载,并在接下来获取的六个大学教职机会里面,选择了启动经费最高的纽约州立大学布法罗分校,成为该校医学院生理和生物物理系的助理教授。
回顾在美国找教职的那些日子,周耀旗称,用一个字来描述的话,就是“累”——看不到前景的累,没有希望的累。
但熬过来之后,又觉得是一种磨练,刻骨铭心的磨,浴火重生的练。这时候的他,也带着新的人生理解,走入了新世纪。

4

从0到1的原创科研,

二十年终现天光

从周耀旗新世纪的研究里,能看到他着力点的转向。
在此之前,他博士期间研究的是凝聚态物理和统计力学,博士后转向了计算生物学的分子动力学和蛋白质折叠。此时,在他独立做教授后,又将结构生物信息学作为了研究主线。
到了布法罗之后,周耀旗的精力分成了两股,一边做科研找经费、一边利用余下的时间招聘博士后。

周耀旗一家人,在布法罗附近的尼加拉瓜瀑布

他延续了博士后期间的贝类血红蛋白项目,并以此写下了布法罗的第一笔NIH基金申请书。
为了第一笔经费,周耀旗付出了很多心血,先从在MIT化学系做助理教授的Bruce Tidor师兄那里要到了一份成功的申请样本,用三个月的时间写作、完善细节,完稿后又到处征求意见。
他憋足了一口气,拼命工作,每天回到家就像瘫了一样。博士后期间受到的Karplus一直抠细节,强调数据重要性的训练,为写出一份上佳的申请书发挥了极大作用。系里的老教授和同事,都对他的申请书作出了极高评价。
然而,自从2000年6月提交申请后,直到第三个月才有了结果——没进前50%,连评分也没有。
周耀旗一点心理准备也没有,这个结果对他就是一种晴天霹雳。
“反差太大了!我辛苦那么长时间、业内朋友的评语那么好,得到的却是最差的结果。”
又经过了一个月的修改,周耀旗重新提交了修改版本,并转投了NSF。过了半年,申请书退了回来。这样来来回回一共退了两次,每次都是旧问题解决了,新的审阅人又有了其他意见。
2003年,周耀旗彻底绝望了,他不可能打中一直在动的目标。
与此同时,和周耀旗同期入职的三个同事,都在两年内拿到了第一笔NIH经费。系主任也多次提醒,“如果还拿不到经费,你必定不能通过2005年的终身教授考核。”
那两年里,周耀旗屡败屡战。但当他回到家与妻子聊起时,再也控制不住自己情绪,第一次当着妻子的面掉了眼泪。
周耀旗感觉身体素质明显下降,拿不到经费成了他心中的郁结。
好在妻子一直支持他,周耀旗终于明白,拿经费和终身教授教职是一场持久战,心急不得。
终于,在多个项目同时不断的申请中,2003年的2月,周耀旗凭借“基于结构的蛋白质折叠机制预测”,拿到了在布法罗的第一笔75万美金的NIH经费。
周耀旗总结,这次的成功是他延续了之前的Nature研究,做出了把简单蛋白质模型发展成全原子模型的创新。
他也终于看清了, NIH和NSF对贝类血红蛋白体系没有兴趣,才是第一个申请失败的根本原因。
只过了一个月,周耀旗凭借“统计势函数的发展和应用”又拿下第二笔60万美金的NIH经费。系主任马上决定启动并在2004年提前通过了他的终身副教授审核。
周耀旗明白,用自己的数理知识去冲击新方向,更容易产生新火花。这也反映在他招聘博士后时,非常喜欢招一些有数理基础的其他科研背景的人。
2000年进组的博士后周宏毅,2004年入组的以色列博士后Ofer Dor,就是因此结缘。他们分别为高能核物理和计算科学背景。
周耀旗在与他们的合作中,经常碰撞出新的思路。其中一个让周耀旗印象深刻的成果,是他与周宏毅发展出一个基于模板的蛋白质结构预测方法--SPARKS和SP3,并一举拿下2004年CASP(国际蛋白质结构预测比赛)基于模板预测的第一名。
这次成功给了周耀旗极大鼓舞,在和Dor的不断改进中,使用机器学习方法预测的主链二级结构达到了80%的准确度(当时最高)。
在周耀旗看来,或许他可以冲击一个更难的问题:绕过粗略的三态二级结构,直接预测连续的二面角(psi角)。
这是结构生物信息学领域一个长期存在的问题,学术上既定的习惯是避开直接预测连续的角度。周耀旗也吃了瘪,因为无法处理好角度的周期性问题,导致预测出来的误差过大。
多次碰壁下,2006年,Ofer回到了以色列创业,周宏毅完成博士后去Georgia Tech做专职研究员,周耀旗也离开了布法罗,以正教授的身份在印第安纳大学开始了第二段教职。

周耀旗和他在印第安纳的部分团队:学生赵慧英(左一,现中山大学孙逸仙医学院副研究员),李职秀(左二,澳大利亚昆士兰技术大学研究员),德州学院访问教授王吉华,博士后詹剑,杨跃东(右一)。背后就是用预测主链二面角构建蛋白质结构的论文招贴

虽然之前对psi角度预测不算成功,但周耀旗仍旧不死心,将这个课题交给了生物物理专业出身的博士后薛斌。
2007年,周耀旗和薛斌首次使用神经网络预测蛋白质主链真实二面角,同时预测psi和phi,从而可以直接构建主链结构。
在当时,这是世界上第一个同时预测psi和phi真实连续角度的方法,但误差还是比较大(psi的误差38°),仅仅发表在影响因子3左右的《蛋白质》期刊。
后来,杨跃东(现为中山大学计算机学院教授、国家超算广州中心副总工程师)、Eshel Faraggi、詹剑(现深圳湾实验室研究员)等人进组,通过团队不断地改进,2009年,他们成功将psi的角度误差降到了33°。
2011年,周耀旗和团队又有了重大发现:通过预测真实角度来建立、约束、和能量优化主链结构,完全不需要用蛋白质的已知结构,或者已知结构碎片来作为模块。
周耀旗和团队欣喜,他们多年来的工作,为蛋白质结构预测和重建,开辟了一条新路。
通过不断地改进,他们不仅证明了连续分布的二面角可以准确预测,而且通过二面角可以直接构建准确的蛋白质结构、从而为若干年后的第一个端到端深度学习的预测方法,搭好了框架。
一场由AlphaFold掀起的革命性突破,也在此刻落下了时代的注脚。
2013年,带着这些成果,周耀旗以正教授身份被引进澳大利亚格里菲斯大学,开始同时进行计算和实验的研究。

周耀旗(右一),澳大利亚格里菲斯大学糖组学研究所的实验室

周耀旗在计算方面也有了新的合作伙伴,格里菲斯大学的Kuldip Paliwal教授。
Paliwal是国际著名的机器学习专家,曾第一个提出双向循环神经网络。在与Paliwal的合作中,周耀旗开始使用不同深度的深度学习方法,进一步改进蛋白质连续角度预测。

Kuldip Paliwal教授

经过一年的努力,2014年,在两人合作的第一篇论文中,终于解开了困扰周耀旗八年的问题——如何解决角度的周期性。
他们将角度的直接预测,改成先预测SIN和COS,再通过计算ARCTAN来得到真实角度,从而避开了角度的周期性。
有了这个思路,周耀旗和Paliwal又用了五年时间,一点一点将psi角的误差从33°降到30°、27°、最终降到23°,phi的误差降到了16°。
2019年,周耀旗终于说出,“我们的二级结构的预测接近了理论的极限,准确度达到86%。”,同年,哈佛大学的Mohammed AlQuraishi研究员将周耀旗的无结构碎片结构预测的方法,全部搬到深度学习的神经网络内,从而避开了没有好的能量函数的这个难点。
周耀旗已经预料到,这个端到端的、从主链二面角到蛋白质三级结构的训练和预测工具,将成为蛋白质结构预测中的一个重要的转折点。
但他没想到的是,这场生物信息学的革命来得如此之快。2020年底,一个名为“AlphaFold 2”的AI工具席卷整个产学研领域。
尤为注意的是,AlphaFold 2中的深度学习方法,明显受到了AlQuraishi进行端到端结构预测的启发,并创新为端到端的“支链二面角预测--主链结构构建--结构误差反馈”的思路。
一个关键是,在第一步中,AlphaFold2也采用了周耀旗曾使用的避开角度周期法
周耀旗第一次离科学革命如此之近。二十年来,他突然觉得,蛋白质的二面角预测,有了一种“被关注到”的感觉。
他说,“解决一个科研难题像是一场长跑接力赛,虽然不是最后一个到达终点的,但能成为递送接力棒中的一员,也是一种无上的幸福。”
从世纪初到2020年,周耀旗二十年饮冰,终是窥见天光。

5

58岁回国,一场跨越

36年的异国旅程

那一切发生在周耀旗58岁之前。
2021年3月,周耀旗做了一个大胆的决定,全职回国。
三十六年里,他也不止一次地想要回来,直到他入职澳洲后,回国的机会才变得多了。
2013年,周耀旗来到妻子的故乡山东,连续六年兼职担任德州学院物理与电子学院的海外特聘教授。正是在这段时间里,他看到了国内的生物技术的高速发展,以及生物学新药在临床上的重大突破。
他毫不犹豫地说出,这是一个生物科技制药的时代。
此后多年,周耀旗一直寻找一个最合适的回国时机。终于,2021年3月,深圳湾实验室的常务副主任吴云东院士,邀请他入职了系统与物理生物学研究所。
巧合的是,在上世纪80年代,吴云东是比周耀旗更早批参与到中美合作化学研究生项目(CGP)。他长周耀旗六岁,同是江苏子弟。在学术上,吴云东坚持着“不退休”的思想,他看中了周耀旗还在不断上升发展的趋势,邀请周耀旗回国内,“再干几十年”。
回国后周耀旗开始快速招聘研究助理、博士后、助理研究员、副研究员。团队成员从2021年7月的11个人扩充到25个人,其中不乏生物、物理、化学、人工智能计算和软硬件等多学科背景的研究人员和工程师,现在还在继续寻找各方面的优秀人才。

团队在2022年元旦时留影

目前,周耀旗已和团队确定了三个研究方向:
一是基础研究,延续周耀旗在蛋白质/RNA结构预测上多年耕耘的专长,期望通过计算和高通量实验的结合,在AlphaFold的成就上更上一步;
二是应用研究,利用AI、深度学习对生物、医疗大数据进行挖掘,希望设计出针对病毒和癌症的小分子药、生物药、纳米抗体,加速新药的发现和应用;
三是原创研发,目前正在设计制造新一代的免疫印迹成像仪和自动进化仪,目标是超越国际顶尖水平。
周耀旗称,“这是投笔从戎,做一些能落地的事情。”
去年中秋,是周耀旗过去36年在国内过的第一个团圆节、他发了一个朋友圈,感慨国内科研环境生机勃勃,“每开一次会,出一次差,吃一次饭,微信朋友都长一圈。”
周耀旗愈发觉得,“回国的目的是圆梦,圆一个把事情做大的梦。”
此外,让他兴奋的是,回国的生活要比想象中更容易适应。当初自己还为了国内的蹲厕习惯提前练习了半年,回来才发现,国内的医、食、住、行各方面很便利。
周耀旗的学生们经常看到,老师总会背着双肩包,骑着一辆自行车上下班,像是一个刚毕业的同龄人。

周耀旗终于完成了一个心愿,妻子在他回国大半年后也回来定居了。他笑着讲,“毕竟筑巢才能引凤,安居会更乐业。”
这些年里,因为他的工作调动,妻子和两个女儿也经常换工作和学校,从美国转战各地再跟随到澳洲。
和周耀旗一样的是,这种颠簸非但没有让她们觉得不适应,反而让她们也在不同的环境里,看到了不同的世界,沉淀出不同的人生。
妻子放弃了汇丰美国总部工作,重新考取教育硕士,改行中文老师,找到了自己最热爱的汉语教学事业。两个女儿则分别去了哈佛和MIT,一个成为了父亲的校友,一个圆了父亲的MIT梦。

周耀旗一家人在二女儿高中毕业时的合影

在人生的即将到来的60岁,周耀旗说起自己的倒霉处,时不时升高语调,眼睛笑成两个扇形,对得失看得开阔。
他总拿一句话与家人共勉,“Growing old along with me, the best is yet to be.”周耀旗将它翻译为,好戏在后头呢。
回头看,如果不是32岁,转行去做了生物计算,或许周耀旗还在研究液体统计理论。
如果不是30岁,下定决心从朋友的创业公司搬出来,或许周耀旗每天还是“稀里糊涂做一些重复性的东西”。
如果不是21岁,大学最后一年被系里拉去“充壮丁”考出国研究生,或许周耀旗毕生都在研究化学物理。
在博客里,周耀旗几乎把过往四十年的经历都写了出来,也经常在落笔后,回想“当年如果没做那个决定,结果会不会又有点不一样?”
三十多年的岁月里,周耀旗的顿挫波折,总与生物信息学的跌宕起伏交织在一起。
正如在浪潮中,总会涌现出一批前仆后继的学者,如李明、潘毅、徐鹰、许东,他们八十年代求学海外,见证了生物信息学的从无到有,成为最早扛起学术大旗的一群人。
新世纪前后,又有许锦波、韩敬东、彭健、唐建等一批计算、医药、AI背景的后辈,接过老一辈的接力棒,沿承着学科脉络。
三十载里,他们见证了生物信息学的大火、忽视、革新,坐过冷板凳、也站过聚光灯,但无论如何,他们推动了一个生物科技时代的到来。
这是他们人生中的三十年,也是一个时代和学科的三十年。

作者注:

1993年,中国参与人类基因组计划,生物信息学科迎来大爆发。

在近三十年的时间里,一大批生物、化学、物理、计算等专业的学者,前仆后继加入到学科的产研建设,那是一个灵感迸发、情谊绵长的年代,也是一个走出质疑、迷茫的年代。

目前,雷峰网启动《生物信息学的三十年往事》专题,将陆续推出徐鹰、潘毅、周耀旗、许东、唐建等新老学者的人物故事,记录光辉岁月,以照后人之路。

关于生物信息学的更多故事,欢迎与本文作者吴彤交流,微信号:icedaguniang


END


推荐阅读







good-icon 0
favorite-icon 0
收藏
回复数量: 0
    暂无评论~~
    Ctrl+Enter