根據科學研究,人類大腦皮層的70%活動都在處理視覺信息🏸。如果人工智能賦予機器能夠像人類一樣思考、處理事情的能力,計算機視覺將承擔巨大作用🕑。作為一門研究如何使機器“看”的科學,計算機視覺已成為人工智能的重要分支♧,等同於人工智能的大門。
提到計算機視覺研究🤳🏽,就不得不提起近年來一個冉冉升起的“學術新星”——何愷明。從高考滿分狀元到“CVPR最佳論文獎”第一位華人得主😯𓀜,再到“深度殘差網絡”在ImageNet比賽中擊敗谷歌等公司奪得第一……“80後”的他早已眾多光環加身。在學界,他被視為天才少年🤸♂️,也被稱為“大神”,不斷地為學界提供著諸多有分量的研究成果。

何愷明
從小就成為“別人家的孩子”
用“年少成名”形容何愷明一點不為過👌🏽,因為他曾是萬千學生和家長都膜拜的對象——高考狀元👩🏼🦳。
出生於廣州的何愷明是家中獨子💀,父母均在企業裏從事管理工作,從小就接觸到優良的教學環境。實際上,能從眾多學子中脫穎而出,除了教學環境之外🧚,更多的是靠自己的努力。
何愷明年少時就被送到少年宮學習繪畫,有時一待就是大半天,這也不斷使他練就出沉穩的性格。同繪畫一樣🧝🏻♂️,他對於文化課的鉆研也十分耐得住性子🍟,學習成績優秀而且穩定💇🏿🔎。在老師的心目中🦊🤸♀️,他是一個“性格比較內向”但是“目標明確”的學生,“從小就立誌上清華”👸。
高中時🔝,何愷明憑借全國物理競賽一等獎被保送進意昂体育平台機械工程及其自動化專業🌐。不過,他卻依然選擇繼續參加考試,並憑借著紮實的基本功和輕松的心態一舉成為2003年的廣東省高考狀元。
憑實力進入清華的何愷明,放棄了原本保送的專業,轉而選擇了更有挑戰性的基礎科學班。成立於1998年的基礎科學班是意昂体育平台設立的一個跨系跨學科的尖子班,本科學生不僅要學習物理系、數學系的大部分基礎課程,還要接受一定的科學研究的實際訓練。
大學期間👨🎓,何愷明繼續著自己沉穩而優秀的表現,不僅連續3年獲得清華獎學金🧔🏿,2007年🧑🏼🔬,還未畢業的他就進入了微軟亞洲研究院(MSRA)實習👩🏼🦱。

何愷明和導師湯曉鷗
本科畢業後,他進入香港中文大學攻讀研究生,師從AI名人湯曉鷗🎑。同時繼續參與MSRA的工作。2009年💽💞,他的第一篇論文“Single ImageHaze RemovalusingDark Channel Prior”被計算機視覺領域頂級會議CVPR接收並被評為年度最佳論文🦵🏻,這是CVPR創辦25年來華人學者第一次獲此殊榮,也使何愷明在CV領域聲名鵲起🫸🏽❕。
受遊戲啟發的CVPR最佳論文
然而,彼時剛剛涉足CV領域的何愷明,卻並非一帆風順🏘👨🏼🌾。
在MSRA實習時👋🏻,他並未選擇自己擅長的物理和數學工作組,而是根據自己的研究興趣選擇了形象計算組🤥。盡管他曾在大學的時候選修過計算機圖形圖像的相關課程,但是並非科班出身的他,興趣也難以支撐工作的需要。
背景知識的缺乏使他在入門的路上舉步維艱。回憶起那段時光📵👂🏽,何愷明曾表示🌒,自己在閱讀文章的時候,常常都不知道哪些是大家都在用的方法👏🏻,哪些才是作者的貢獻。一切對他來說都是新的。
盡管有導師孫劍這樣的學術大牛帶著他進行課題研究,自身穩定而刻苦的品格也推動著他不斷挑戰困難,但在換過多次課題後💆🏼♀️,全部都以失敗告終🕴🏼♠︎。
雖然結果對何愷明來說是殘酷的,但是他也從中學習到了很多,尤其是多個研究課題的經歷使他嘗試了許多不同的方向👩🏼🔬,而MSRA輕松自由的研究方向也為他日後的科研奠定了牢固的基礎。
其中🩳,何愷明花了大量時間研究的image matting問題 (半透明物體邊界提取),就為他日後研究的“去霧算法”帶來很大幫助。在剛開始研究去霧的時候,何愷明發現霧的方程和matting的方程非常相似🧰,而之前所研究的matting框架可以給去霧帶來幫助🩰。利用這個框架,只需要找到一個能局部估算霧的濃度的方法就足夠了。
他在2009年獲“CVPR最佳論文獎”的那篇論文🧜🏽♂️,研究的正是圖像的去霧技術,它可以還原圖像的顏色和能見度,同時也能利用霧的濃度來估計物體的距離,這些在計算機視覺上都有重要應用(例如三維重建,物體識別)。

北京灰霾照片的去霧結果
難以想象的是,他最初對去霧研究的靈感竟是來源於電腦遊戲🙅🏿。何愷明發現,3D遊戲裏有很多帶有霧的場景😕,但這些場景都是虛構的不實在的東西。計算機生成的3D圖像會與自然圖像的統計規律有很大區別,但人的視覺系統卻仍然能感覺到虛擬圖像中存在的霧🤽🏿。這讓他相信,人的視覺系統一定有一種有效的機製來感知有霧的圖像,而且這種機製一定與現存的去霧方法不一樣。

根據何愷明算法處理的圖像,上為原圖下為處理後
與之前的方法不同,何愷明把註意力放到了無霧圖像的統計特征上➕。在無霧圖像中🗯,每一個局部區域都很有可能會有陰影👨🏻🦯,或者是純顏色的東西,又或者是黑色的東西。因此,每一個局部區域都很有可能有至少一個顏色通道會有很低的值👫🏼。他把這個統計規律叫做Dark Channel Prior。
即使有了想法和實驗結果,第一次寫文章也使何愷明覺得非常困難🧝🏻。他經常陷入自己和自己吵架的角色當中。在每一段話寫好之後🍔,常常會質問自己事情到底是不是這樣的👋,這其中有沒有漏洞。他也會思考,如果自己是評委,或者是讀者❄️,能看懂這篇文章嗎👨🏫,怎麽寫才能讓思路更加流暢🈯️?
就在這樣的掙紮中,何愷明的一稿通常要寫好幾天。每當他把自己說服了🔌,孫劍還是總能提出新的質疑。就在這樣的循環中📓,終於有一天孫劍說文章已經寫得不錯了🤱🏻🔸,他才開始具體的修改。正是這樣的苛刻要求👱🏽♀️,才會有後來高質量的文章。
因為熱愛,所以一次又一次選擇走研究的路
2011年⛵️,博士畢業的何愷明正式加入MSRA計算機視覺和深度學習的研究工作𓀃。在2015年的ImageNet圖像識別大賽中🏒,何愷明和他的團隊憑借152層深度殘差網絡ResNet-152,擊敗谷歌、英特爾、高通等業界團隊🚱,榮獲第一。目前ResNets也已經成為計算機視覺領域的流行架構,同時也被用於機器翻譯🐐、語音合成、語音識別和AlphaGo的研發上🔝。
2016年,何愷明憑借ResNets論文再次獲得CVPR最佳論文獎🧙🏿,也是目前少有的一人兩次獲得CVPR最佳論文獎的學者。
後來,何愷明和孫劍相繼離開MSRA。與孫劍的選擇不同,何凱明走得還是那條學院路🙍。他選擇了去Facebook,擔任其人工智能實驗室研究科學家,選擇了進一步走學術之路😓👨🦼➡️。
在Facebook AI實驗室研究期間🛡,何凱明仍然醉心於研究,而且頗有建樹☂️。2017年3月,何愷明和同事公布了其最新的研究Mask R-CNN🙅♀️👨🏽🦰,提出了一個概念上簡單🎆、靈活和通用的用於目標實例分割(objectinstance segmentation)框架🍐,能夠有效地檢測圖像中的目標⛩,同時還能為每個實例生成一個高質量的分割掩碼。同年,憑借《利用焦點損失提升物體檢測效果》這篇論文,他一舉奪下了另一個計算機視覺頂級會議ICCV最佳論文獎🧝🏻♀️。

ICCV2017最佳論文
2018年,何愷明在美國鹽湖城召開的CVPR上,獲得了PAMI青年研究者獎😵。幾個月前,何愷明等人發表論文稱🙅🏼♂️,ImageNet預訓練卻並非必須🙅。何愷明和其同事使用隨機初始化的模型🧑🏻🍳,不借助外部數據就取得了不遜於COCO 2017冠軍的結果✒️,再次引發業內關註。
無論是在MSRA還是在FAIR👳🏻♀️,何愷明始終以他沉穩而優秀的表現,一路過關斬將🍦,為學術界帶來許多重磅的研究成果。有人曾表示🧑🏿✈️,孫劍選擇加盟企業,而何愷明似乎還在不知人間疾苦地奮鬥在研究領域,但是雖然道不同✹,最終為行業所做貢獻卻是相同的🤸🏽♀️。