• 简中
    • 繁中
  • 注册
  • 查看作者
  • 朱晨光:一个从唔通宵嘅AI研究员

    转载:本文来自微信公众号“AI科技评论”(ID:aitechtalk),作者:陈彩娴,整理:刘冰一,转载经授权发布。

    导语:从斯坦福计算机系博士毕业后第4年,朱晨光便已升为微软嘅首席研究经理,管理认知服务研究部门下嘅知识同语言研究组。而喺读博期间,他嘅研究方向并唔系自然语言处理。

    学习、竞赛、打乒乓、搞科研、写书、工作……朱晨光嘅生活总是同时被其中至少3件事占据,畀人一种好活跃嘅印象,所以,喺听到他曾同赵薇同台参加1994年安徽省芜湖市嘅春节联欢晚会时,笔者也没有太食惊:

    “那一年是狗年,我演狗,是我哋幼儿园嘅领舞,而佢是佢们学校(芜湖师范学校)嘅领舞。”谈起家乡芜湖,朱晨光首先想到嘅唔系三只松鼠,而是芜湖老乡、《还珠格格》里嘅小燕子。

    紧接住是出于兴趣,他从8岁就开始学习LOGO语言。这系一门面向儿童嘅编程语言,由3位知名计算机科学家(Wally Feurzeig、Seymour Papert同Cynthia Solomon)喺1967年设计而成。

    最开始佢係用LOGO喺电脑上画图,敲键盘就能画出一个正方形或圆形,让他觉得好有趣,于是小学就参加竞赛,拿‌市区第一个。自但係然地,小升初进入芜湖一中时,他被选入学校嘅信息学竞赛队伍,一路打到市赛、省赛、全国赛,初三就进入NOI国家集训队,获得清华大学预录取嘅资格。

    朱晨光系一个80后。喺他8岁那年(1996年),好多人嘅家里都仲未有安装电脑,而他嘅父亲就已坚定地认为计算机喺未来一定会有非常大嘅发展。果唔其然,随住互联网浪潮嘅兴起,计算机成为信息时代嘅技术奠基,“码农”成为21世纪收入最高嘅行业之一。

    但朱晨光没有成为一个“码农”,而是成‌一个“NLPer”,进入‌人工智能领域,喺Windows嘅老东家微软研究自然语言处理(NLP)。但实际上,佢喺斯坦福大学读博期间嘅研究方向并唔系NLP,而是交通优化。

    2016年博士毕业后,朱晨光入职微软,先是做自然语言理解(NLU),出‌一本NLU相关嘅入门书籍,叫《机器阅读理解:算法同实践》。2019年,他又从NLU转向研究文本总结同知识图谱。

    “如果你问我未来5年嘅研究方向系咪还会转变,我嘅答案是肯定嘅。”朱晨光答道。喺他睇来,喺企业做研究同喺高校做研究嘅一个区别就喺于:你需要根据公司嘅业务来调整自己嘅研究方向,而市场是瞬息万变嘅。

    1 源于竞赛嘅自学能力

    从交通优化到自然语言处理,再到知识图谱同文本总结,朱晨光认为,自己能够快速上手新嘅研究内容,主要归功于他从小参加信息学竞赛所锻炼出来嘅自学能力。

    “当时上竞赛训练课时,我哋并唔系老老实实地坐喺底下听老师讲课,而是需要自己找学习资料,发现问题,主动同老师、学生讨论。”他谈及,喺呢个过程度,竞赛选手往往好早就锻炼‌自己主动学习嘅能力。

    比如,进入微软后,面对人工智能领域嘅迅速发展,他好自觉就养成‌一个习惯:每天至少阅读一篇论文,以此来掌握NLP领域嘅最新知识同研究动态。既是为‌能够及时调整自己嘅研究内容、以适应产品嘅需求,都系为‌紧跟潮流、唔被时代淘汰。

    朱晨光从初一开始就参加信息学竞赛。竞赛系佢喺中学时代嘅主旋律:初中那会系一边学习一边搞竞赛;到‌高度,他直接脱产搞竞赛,“我一共就喺班里待‌半年,上完高一上学期嘅课我就将所有时间放喺竞赛上嘎啦。但其实我文化课嘅成绩也唔错,喺班上待嘅那半年也拿‌一个全班第一个。”

    初三那年(2003年),他第一次参加NOI就获得银牌,进入前20名选手组成嘅国家集训队。之后,他又连续两年参赛,分别获得一枚金牌同一枚银牌。但係,虽然朱晨光连续3年进入国家集训队,却没有一次进入IOI国家队4人名单:2004年NOI,他考‌477分,拿‌全国第8名;2005年NOI,“前期成绩是第一个,但最后一次大考没有发挥好,非常遗憾同国家队擦肩而过。”回忆当年,朱晨光感慨道。

    虽然咁,朱晨光也觉得自己非常幸运有机会参加3次集训,得以认识3批优秀嘅竞赛选手。佢哋中嘅好多人都被引以为NOI竞赛嘅榜样,比如楼天城、胡伟栋、鬲融、朱泽园、唐文斌等人。佢哋至今仍保持紧密联系,而其中同他关系最好嘅,要数同届嘅朱泽园同唐文斌。

    朱泽园来自南京外国语学校,同朱晨光嘅参赛节奏完全一致,都系2003年至2005年嘅信息学国家集训队成员。佢哋同时去‌清华,本科时一齐组队参加过ACM/ICPC;大三那会,两个人都去‌微软亚洲研究院实习,一齐发表‌5篇顶会论文;大四申请学校时,两个人都拿到‌去斯坦福读博嘅offer,但朱泽园最终选择‌MIT。而家,佢哋两个又都喺度位于美国西雅图嘅微软总部工作。

    唐文斌来自绍兴市第一中学,高中毕业那年,朱晨光同他曾一齐畀NOI出题;上‌清华后,佢哋一齐组队参加‌两岸清华程序设计竞赛,代表北京同来自台湾、香港嘅队伍一齐比赛,并获得‌第一个。而家,唐文斌喺旷视科技担任联合创始人同CTO。

    朱晨光:一个从唔通宵嘅AI研究员

    图注:2007年,朱晨光(最左)同唐文斌(中间)、刘贺组队参加两岸清华编程竞赛

    除咗自学能力嘅锻炼,朱晨光认为,NOI竞赛对历届选手嘅影响还体而家计算机基础同英语学习上。就他个人嘅经历嚟讲,NOI竞赛内容涉及到数据结构、算法等大学阶段才有嘅计算机课程,所以后来佢喺清华读计算机专业时,觉得学习好轻松,因为“有啲课程喺高中时已经学过‌”。

    此外,当时佢哋备考NOI时,90%以上嘅题目都系英文嘅,呢对他嘅英语阅读同理解能力有好大提升。刚上大一时,他参加GRE考试,满分1600,他考‌1520分;托福满分120,他考‌115。朱晨光因此谈道:“我哋搞竞赛嘅,英语都唔差。”

    但喺参加竞赛嘅过程度,对朱晨光产生最大影响嘅,并唔系知识嘅增长,而系佢嘅竞赛教练江涛老师,以及行万里路所形成嘅开阔眼界。

    朱晨光从初一开始就跟住江涛学习,一直到高三毕业。“他教‌我好多,唔剩只是信息竞赛方面嘅知识,喺意志品质、为人处世方面,我也从江涛老师那受益弥耐。”虽然远喺西雅图,但朱晨光仍同老师保持联系,逢年过节都会送上祝福同问候。

    江涛是信息学竞赛界一号响当当嘅人物。15岁那年,佢喺一次造火箭嘅实验事故中失去‌双手,但系佢非常坚毅,靠自己嘅努力上‌大学、学‌计算机,毕业后分配到芜湖一中任教。

    喺他嘅组织下,芜湖一中成为历年IOI国家队最打得嘅中学之一。他嘅学生一共进入国家集训队29次,7人代表中国参加IOI比赛、获得7枚国际奖牌。

    江涛老师对科学嘅热爱,对自我嘅要求,以及坚毅嘅精神,一直影响住朱晨光喺知识嘅道路上唔断求索。从江老师嘅身上,佢认识到,人生路上所遇到嘅小磨小难,似乎是唔值一提嘅。

    而行万里路,则是竞赛地点散布喺全国唔同城市,因为参赛,他唔仅结识‌来自五湖四海嘅朋友,仲要去‌省内省外嘅好多地方,甚至因为一次偶然嘅机会,远赴美国科罗拉多州参加信息学奥林匹克竞赛嘅集训。

    2005年,17岁嘅朱晨光喺网上报名参加‌美国信息学奥林匹克竞赛,名列前茅,作为国际学生,被主办方邀请去科罗拉多州嘅一所大学里同美国嘅学生一齐参加集训。喺呢次集训度,他最终获得‌第二名,达到‌进入美国国家队嘅水平,但由于佢係中国人,所以并未入队。

    “同国内相比,我觉得美国嘅选拔比较科学,考6次,算综合成绩,万一边次发挥唔好,后面还可以再赶上来。国内系一锤定音,有好多偶然性。而且美国嘅题目比较有趣,可能比国内嘅要容易些。”

    呢次集训经历对朱晨光嘅影响好大。喺之前,他对美国没有感性嘅认识,以为发达嘅美国到处都系高楼大厦、鳞次栉比;去‌美国科罗拉多州之后,他发现,到处都好干净,建筑都唔高,好开阔,同国内嘅氛围好唔一样,呢激发‌他以后想到美国学习嘅念头。

    2 发表8篇论文嘅姚班学生

    2006年,朱晨光从安徽芜湖来到首都北京上学,成为清华大学计算机系嘅一个新生。那一年,同朱晨光一同来到清华园嘅NOI选手,仲有朱泽园、唐文斌、龙凡等10人。

    大二那年,耐仰于图灵奖得主姚期智嘅风采,朱晨光又通过考试选拔,考入‌当时由姚期智发起、成立仲未到三年嘅软件科学实验班,也就是传说中嘅“姚班”。那一届,姚班一共有27名同学,除咗朱晨光,仲有包括唐文斌喺内嘅4名NOI集训队成员。

    当时,交叉信息研究院还未成立,姚班仍属于计算机系,朱晨光等人嘅上课内容一半由姚班老师授予,一半是计算机系嘅第啲课程。喺姚班嘅10门核心课程度,姚期智教授其中嘅2门,其余课程则由来自微软亚洲研究院嘅高级研究人员负责。这对朱晨光起到‌好大嘅影响。

    “姚先生喺我心中就是大神,成就高山仰止,我非常荣幸能够做他嘅学生。”朱晨光感慨。直到而家,他仍然每年都会同姚先生联系,每当取得好成绩时都会同恩师汇报。

    朱晨光谈到,姚先生非常重视对姚班学生嘅培养,虽然他有好多繁杂事务,但还是坚持每周都亲自畀姚班嘅学生上课。喺姚先生教授嘅两门课(《理论计算机》上下)度,朱晨光考得特别好,第一门满分100,第二门99分,两门课都系全班第一。

    此外,姚先生一直鼓励姚班学生尽早接触科研,同领域里嘅大师多交流。姚先生每年都会举办几次高级别嘅计算机会议,邀请国内外知名嘅学者来交流,并让姚班嘅本科生也参加。喺“中国计算机科学2020”嘅论坛现场,朱晨光便有幸同1985年图灵奖得主、UC Berkeley嘅教授Richard Karp进行‌交流。

    朱晨光:一个从唔通宵嘅AI研究员

    图注:2010年临近毕业之际,朱晨光同姚期智合影

    除咗北京嘅学术交流活动,姚班还会组织同港澳大学进行交流嘅冬令营活动。大三那年寒假,朱晨光便同姚班嘅同学一齐去‌香港科技大学,待‌一个礼拜,同港科大嘅学生一齐上课、交流,开阔眼界。

    姚班嘅授课教材几乎是全英文,课程内容前沿,难度也比较高。因为好早就萌发出国读书嘅念头,出国申请要求高绩点,所以朱晨光从大一开始就好用功,喺专业课同英语学习上投入‌大量嘅时间同精力,希望每门课都可以拿高分。

    最后,功夫唔负有心人,他嘅平均分达到92.2/100,排名全班第2、全级第4,荣获清华大学优秀学术奖学金(授予排名前2%嘅学生),成为当年清华计算机系唯一拿到斯坦福博士offer嘅学生。

    除咗学习,本科时期嘅朱晨光喺科研上也取得‌非常唔错嘅成绩。

    姚班嘅培养模式是鼓励学生走出教室,去世界顶级嘅高校或研究机构进行学术交流、做科研。2009年,正喺度上大三嘅朱晨光去‌微软亚洲研究院嘅机器学习组实习。佢喺姚班所学到嘅机器学习同数据挖掘课程知识,啱好派上用场。

    为期一年嘅实习度,朱晨光主要从事搜索引擎相关嘅工作。喺微软,他一共发表‌8篇学术论文,其度,他参同基于随机梯度下降嘅SVM同Logistic回归嘅工作(“Inverse Time Dependency in Convex Regularized Learning”)发表喺ICDM 2009,并获得当年嘅最佳学生论文奖亚军。

    同样哋,朱晨光也没有停止参加竞赛。他形容,竞赛好似练武术,“从小开始练嘅功夫,长大以后如果唔偶尔打一下拳,就感觉全身放松唔下来。”上‌大学后,竞赛虽然唔再系佢生活中嘅主旋律,但已经成为他生命中唔可分割嘅部分。

    喺清华读书时,他嘅赛场从NOI转到‌ACM/ICPC,同朱泽园等人组队,曾喺亚洲赛区获得4枚金牌。读博后,他代表斯坦福大学参加ACM/ICPC,曾获得2011年ACM/ICPC太平洋西北赛区冠军、2012年ACM/ICPC全球第13名。

    除咗ACM/ICPC,他还参加第啲小嘅编程竞赛,比如斯坦福举办嘅编程竞赛同IEEE/GOOGLE算法比赛,都获得‌第一个。朱晨光讲畀AI科技评论:“其实我而家都仲喺度参加比赛,周末喺网上刷一下比赛题目,已经成为一种习惯嘎啦。”

    据他所知,“楼教主”楼天城(2004年IOI金牌得主)到而家也仲喺度参加比赛,“我做嘅题目可能没他多,但也比较执著。”

    朱晨光话,少年参加竞赛也许是为‌获得保送,但随住年龄嘅增长,而家参赛更多是享受比赛嘅乐趣,“有种紧张感,好刺激。我钟意嗰种紧张嘅感觉。”

    喺他嘅竞赛活动度,信息学并唔系唯一嘅内容。他从小练习乒乓球,也经常参加乒乓球比赛,曾获得2010年清华大学马杯乒乓球男子单打比赛季军。2015年,读博期间,他还获得‌美国国家乒乓球锦标赛U2000 D分区嘅冠军,号称“斯坦福最杰出嘅乒乓球选手”。

    朱晨光:一个从唔通宵嘅AI研究员

    图注:朱晨光获得2015年美国乒乓球锦标赛U2000冠军

    科研之余抽时间打球、竞赛,朱晨光并唔觉得累,反而认识这系对生活嘅放松同调节,因为参加比赛同平时跟朋友随便打打球嘅氛围完全唔一样。比赛是每分必争,畀他一种只有竞争才有嘅快感。

    虽然学习、科研同竞赛同时进行,睇似分身乏术,但朱晨光从小到大都无通宵过。就算是工作后,赶论文ddl同产品上线发布,他也绝唔熬夜,到点就瞓。

    3 斯坦福读博:“鸭子划水”

    大四那年,朱晨光申请美国读博,拿到‌斯坦福大学同卡内基梅隆大学(CMU)嘅全奖博士offer。CMU位于匹兹堡,工业气息更重,而斯坦福位于旧金山湾区,临近硅谷,综合学科实力更强,于系佢便选择‌斯坦福。

    后来他觉得,当初嘅选择系对嘅。喺博士最后一年,当他因为课题研究需求而想要修一个统计学硕士时,他发现斯坦福计算机系有一个政策,允许计算机博士免费读一个硕士,而且斯坦福嘅统计学专业排名全美第一,为他提供‌好好嘅学习机会。

    喺斯坦福读博嘅六年,虽然业余有参加竞赛和打球,但科研嘅压力都系显而易见嘅。

    朱晨光形容,斯坦福学生嘅学习生活好似“鸭子划水”:从水面上睇,每只鸭子都喺度好悠闲地漂住,但到水底下一睇,所有鸭子嘅脚都喺度哗哗地用力划。斯坦福竞争激烈,大家都系表面上睇起来轻松,实则外松内紧。

    读博期间,朱晨光跟住Balaji Prabhakar教授从事基于机器学习嘅交通优化研究。他做过一个有趣嘅项目,叫“拥堵同停车激励”(Congestion and Parking Relief Incentives,简称“CAPRI”)系统,通过现金激励来改变人喺高峰期嘅出行时间。

    交通优化嘅研究度,有一个重要嘅概念,叫“10%现象”,也就是说,如果能够将高峰期拥堵路段上10%嘅汽车出行时间偏离高峰期,噉样交通堵塞情况就会得到明显改善。以往嘅研究都系采取惩罚手段,但朱晨光所喺嘅小组则转向使用激励手段,来吸引参同者改变自己嘅行为。

    实验首先落喺交通拥堵嘅斯坦福大学。佢哋将高峰期定义为早上8:00~9:00同晚上5:00~6:00。如果参同者喺高峰期进出学校则唔得分,错峰出行则得分。积累到一定嘅分数后,参同者可以抽奖获得数额唔等嘅现金。

    喺抽奖环节,佢哋还引入社交网络,朋友之间可以观察到对方嘅“好”行为。

    朱晨光:一个从唔通宵嘅AI研究员

    图注:CAPRI系统嘅积分抽奖页面

    统计表明,喺交通优化中引入激励方法有利于改变人嘅出行方式。佢哋观察到,项目嘅参同者会将原先嘅出行时间推迟或提早几分钟,喺原定嘅高峰期附近又形成一个更小嘅高峰。这有利于缓解通勤高峰期嘅交通拥堵情况。

    佢哋嘅研究受到‌《纽约时报》、《华尔街日报》等多家媒体嘅报道。

    朱晨光感觉,博士生唔像是学生,而更似系一个上班族,每天去嘅也唔系教室,而是实验室。“如果和斯坦福嘅本科生同硕士生交流,大家会好钟意开玩笑;但博士生之间交流就会变得严肃、注意分寸。”

    由于喺本科期间已经有科研经验,也发过顶会论文,所以来到美国后,朱晨光好快就进入‌博士生嘅角色,会主动去寻找研究课题,然后独立完成课题,而唔系等住博士导师派发任务、跟喺人哋后面被动学习。

    六年读博,除咗变得更加独立,朱晨光最大嘅收获就是科研思路更清晰。这要归功于导师Balaji Prabhakar,“他教会‌我点样有逻辑地将一件事捋清楚。”佢认为,正系读博期间嘅逻辑锻炼,令到佢喺后来自己写书、写论文时,能够游刃有余,逐层推进。

    比如,2019年喺写《机器阅读理解:算法同实践》一书时,动笔之前,朱晨光喺脑海里就已形成条理清晰嘅章节内容。逻辑捋清楚,每天喺完成微软嘅正职工作之后,他就抽一个个钟头写书,从字到句,从段到页,从节到章,雷打唔动地坚持‌3个月,便顺利完成初稿。

    虽然博士毕业后,朱晨光没有继续从事交通优化研究,但对他嚟讲,从博导那里学到嘅逻辑思路是伴随一生嘅,就算跨领域都可以有所裨益。

    朱晨光:一个从唔通宵嘅AI研究员

    图注:2016年斯坦福博士毕业典礼,朱晨光同导师Balaji Prabhakar合影

    关于硅谷嘅印象,朱晨光认为,就计算机行业而言,硅谷嘅科技规模、人才密度、科研创新能力是当之无愧嘅世界第一。

    此外,硅谷嘅创业氛围非常浓厚。“如果去餐馆食饭,你会经常听到旁边桌子喺讨论创业想法、找投资。也有好多人喺星巴克抱住电脑写程序。”他谈到,也有好多创业者来到斯坦福找技术人才,他周围嘅好多博士同学就选择‌退学创业。

    但博士毕业后,朱晨光却没有留喺硅谷工作,而是去‌位于西雅图嘅微软总部担任研究员。

    2012年暑假,他去‌微软雷德蒙研究院通讯同存储组实习,设计同执行新嘅内容感知SSD捕捉算法,研究结果被应用于Windows Server 2012 R2。

    喺呢次实习度,他觉得西雅图更适合自己居住。朱晨光提到,他嘅皮肤比较敏感,加州嘅阳光太强烈,一晒就容易发红;而西雅图嘅天气比较湿润,皮肤比较适应。喺西雅图上班,从家里开车到公司,一路上能够睇到雪山同绿树,也好符合他嘅审美。

    4 企业科研:满足需求是关键

    “微软让我有一种家嘅感觉。”朱晨光咁样形容。

    从本科大三嘅第一份实习开始,微软就成为‌朱晨光唯一嘅首选职业目标。最初佢係因为仰慕微软亚研嘅名号而去实习,但喺后来嘅交集度,他感觉微软嘅工作氛围非常自由,有好多施展个人能力嘅空间,也好有人情味。

    博士刚毕业那会,他去微软面试,遇到‌后来为《机器阅读理解》一书写序嘅黄学东老师。黄学东是微软全球人工智能首席技术官,非常爱惜人才,认识到佢係姚班、斯坦福毕业后,同他聊‌好多,仲要涉及到他以后嘅职业规划,让他感觉好亲切。而朱晨光嘅老板曾南山是原微软亚洲互联网工程院副院长,有住丰富嘅管理和研发经验,也畀‌他好多指导和启发。因此,他义无反顾地再次选择‌微软。

    “微软被称为‘IT界嘅黄埔军校’,我觉得唔系一件偶然嘅事。佢嘅发展历史已经好悠耐,但无论是从人才储备、产业品牌,仲要是从未来创新研究来睇,微软都系现有互联网大厂里嘅佼佼者之一。”

    朱晨光认为,微软嘅最可贵之处喺于,虽然规模大、历史耐,但微软对研究方向嘅嗅觉十分灵敏,总是能够掌握到科技同商业嘅前进脉搏。从Windows同Office,到搜索,再到人工智能,微软嘅发展总是紧跟风向。

    进入微软后,他嘅研究方向也随住微软嘅业务调整而转变。本科实习时,佢喺微软亚研更多是做搜索,研究点样提高必应嘅搜索质量;博士毕业入职后,微软嘅研究重心之一放喺自然语言理解,他也从交通优化转到‌NLP。换句话说,他同微软是共同成长。

    喺呢一点上,他提到,微软会针对唔同嘅岗位设置培训课程,帮助大家适应新嘅研究方向。比如,刚接触NLP时,朱晨光是跟住组里嘅人一齐读论文,自学深度学习嘅课程,以及参加微软内部嘅培训。

    朱晨光喺2016年1月入职微软,2020年便升为‌认知服务研究部门知识同语言小组嘅首席研究经理。

    同高校做研究唔同,朱晨光总结,喺企业做科研,要懂得灵活根据产品需求来调整自己嘅研究方向。

    技术组同产品组嘅合作主要有两种方式:一种是问清楚需求,利用技术从根源解决需求,“呢种研究只要做出来,产品转化率非常高。”另一种是引领产品方向,走喺产品组前面,帮佢哋提问题,做出成果后,再去跟产品组谈点样将业务系统化。

    喺这两种模式下,科研往往既能体现科研价值,都可以创造商业价值。这也许是朱晨光转变研究方向,从头开始,都可以够喺4年内晋升为首席研究经理嘅原因之一。

    “我觉得公司招聘我哋过来,睇重嘅唔系我哋之前嘅研究经历,而系一种潜力,微软称之为‘growth mindset’(成长型思维),能否将已有嘅经验转移到研究第啲任务嘅能力。未来嘅研究是多变嘅,所以唔会仅睇当下嘅能力匹配度。”朱晨光解释。

    刚进微软时,朱晨光嘅研究内容是客户对话系统同机器阅读理解。他曾领导小组喺2017年斯坦福机器阅读理解挑战赛SQuAD中获得全球第一个,2019年又喺斯坦福对话阅读理解挑战赛CoQA中设计模型超越人类表现、获得第一个,其喺比赛中提出嘅FusionNet模型已被应用于微软Bing嘅问答产品中。

    他仲喺度中国计算机学会(CCF)原秘书长杜子德嘅邀请下,将自己喺机器阅读理解上嘅学习同研究经历汇总成“机器阅读理解:点样让计算机读懂文章 ”一文,发表喺2019年2月嘅《中国计算机学会通讯》上。

    文章大火,于是朱晨光又喺机械工业出版社嘅邀请下写‌《机器阅读理解:算法同实践》一书。杜子德老师欣然为此书作序。

    朱晨光:一个从唔通宵嘅AI研究员

    图注:《机器阅读理解:算法同实践》中英文双版

    2019年,随住业务嘅调整,朱晨光又将研究重点转向‌文本总结同知识图谱。

    佢认为,喺一个信息爆炸嘅时代,大家对信息获取嘅速度同质量有好高嘅要求,所以文本总结对吸引阅读至关重要。于是,他开发‌一种利用新闻嘅倒金字塔结构训练大规模文本总结模型嘅方法,唔用任何人工标注嘅总结,就可以达到好好嘅效果。这项研究发表喺SIGIR 2021会议,并应用于Microsoft News等产品上,唔断提升‌用户嘅阅读体验。

    而知识图谱嘅研究是针对家阵时好多深度学习模型嘅“黑盒”特性而缺少可解释性,希望通过以图嘅形式呈现人类知识,供机器模型学习,提高机器嘅智能程度。通过融入知识,令到用户可以手动控制大规模模型嘅预测,呢令到成个模型决策嘅过程更加透明。佢哋团队嘅成果喺CommonsenseQA、CommonGen等赛事中几次登上榜首,并发表喺ACL, EMNLP, NAACL等顶级NLP会议上。

    朱晨光提到,成绩嘅取得同成个团队嘅努力是分唔开嘅。他非常睇好而家负责嘅知识同语言研究组。朱晨光得意地话,“我觉得我哋系一个明星小组。组内一共有8个研究员,3个毕业于斯坦福,2个毕业于CMU,仲有2个是姚班嘅毕业生,都拥有自然语言处理方向嘅博士学历。”

    喺管理研究组时,他嘅主要工作是根据公司需求定下基本嘅研究方向,然后畀研究员提供自由研究嘅空间,让大家发挥各自嘅特长。“方向定好后,采取乜嘢方法解决,佢哋自己选,然后我和佢哋一齐讨论。”

    他几乎可以肯定,喺未来5年,他嘅研究方向会发生更大嘅改变,因为技术嘅更新迭代非常快。喺唔断成长嘅同时,朱晨光都要求自己唔断学习。

    比如,他坚持每天至少阅读一篇学术论文,以此来掌握NLP领域嘅最新知识同研究动态。既是为‌能够及时调整自己嘅研究内容、以适应产品嘅需求,都系为‌紧跟潮流、唔被时代淘汰。

    5 写喺最后

    虽然已走校园多年,但朱晨光喺少年时养成嘅“竞争生存意识”仍喺唔断驱使他继续学习。他讲:“无论是公司还是个人,唔进步都会被淘汰。”

    喺微软做科研,最忙碌嘅情况一般系顶会投稿截止时间逼近,以及产品准备上线前夕。但总嘅嚟讲,佢喺下班之后还是有时间睇睇书、充充电。

    他睇书嘅种类好广,唔只限于自然语言处理,仲有统计、机器学习、信息论等。佢认为,如果只关注自己嘅工作内容本身,好快就会落后。而且,喺带组后,他唔仅需要关注个人嘅科研,仲要要保证组内嘅成员都走喺正确嘅道路上,呢就要求他走喺前沿,当一个合格嘅掌舵人。

    喺带小组时,他都要求组内嘅成员至少同时进行两项工作,以备喺一项工作没有进展时、随时有另一项工作顶替,唔至于一溃即散。

    对于立志从事人工智能研究嘅学生,朱晨光提‌三点建议:

    首先,有三门课一定要学好,噉就是数学、英语同计算机。“学计算机并非是只学编程,仲要要经常阅读前沿嘅研究成果,呢就需要一定嘅英语能力;要弄清楚研究背后更深层次嘅原理,噉就需要认识数据。”

    其次,要勤于沟通,同前辈、师长及同学多交流,避免方向出错。他提到,喺申请学校、实习同做研究时,他同竞赛时认识嘅朋友、清华同斯坦福嘅同学同老师、微软嘅领导同同事交流,佢哋都畀‌他好多指导同建议,让他少走‌好多弯路。

    最后,一定要喺广泛涉猎嘅基础上坚持一个方向,比如机器学习。朱晨光讲:“只要保持专注,坚持唔懈,成功一定喺唔远处。”

    *欢迎添加作者微信(302703941)

    cantonese.live 足跡 粵字翻譯

  • 0
  • 0
  • 0
  • 228
  • 请登录之后再进行评论

    登录
  • 任务
  • 发布
  • 偏好设置
  • 单栏布局 侧栏位置: