作為一個在上海工作的東北人,香港中文大學教授湯曉鷗不失東北人與生俱來的幽默感。
在7月6日的世界人工智能大會開幕式發言中,作為人工智能領域前沿的知名學者與實踐者,湯曉鷗說,自己每天晚上睡覺前,都是一邊聽著于謙老師的相聲,一邊在想:“機器怎么可能超過這樣有趣的靈魂?我不信。”
【資料圖】
在今天的演講中,他分享了三名學生王曉剛、何愷明、林達華在深度學習領域追夢的故事,強調了中國年輕學者在大模型研究中所作出的原創貢獻。
他同時感慨:在人工智能領域,新一代的學生已經在上海成功起步。
回溯歷史,湯曉鷗提到,2018年度圖靈獎授予了約書亞·本吉奧(Yoshua Bengio)、杰弗里·辛頓(Geoffrey Hinton)和楊立昆(Yann LeCun) 三位深度學習之父,而摁下這扇大門第一聲門鈴的,是2011年杰弗里·辛頓和微軟的中國學者鄧力在深度學習語音識別上劃時代的突破,此后2012年,在圖像識別比賽中同樣取得了劃時代的突破。
在深度學習剛剛開始的幾年,湯曉鷗和他的學生們在做什么?他講到了第一個學生:王曉剛。
王曉剛本科是中國科大少年班,并且是00班的第一名,碩士期間他在湯曉鷗實驗室就讀,后來去了MIT讀博士,博士畢業后回到湯曉鷗在香港中文大學的實驗室做教授。2011至2013年期間,在CVPR(國際計算機視覺與模式識別會議)和ICCV(計算機視覺國際大會)兩個視覺領域頂級會議上,全球共有29篇文章做了深度學習,其中有14篇出自湯曉鷗的實驗室,全世界其他的實驗室做了15篇。
“我們有18項工作在全世界第一次將深度學習用到視覺問題上,包括人臉識別、人臉檢測、人臉重建、物體檢測、人體姿態、圖像超分、三維形狀識別等計算機視覺最核心的問題。在深度學習的大門上,我們按了18次門鈴。”湯曉鷗說。
他介紹,王曉剛還有一項工作是讓機器做的人臉識別超過了人的眼睛,這比Facebook做得還要早。 2015年,王曉剛帶隊打敗了谷歌團隊,取得了中國學者史上第一個ImogeNet(一個基于圖像分類和物體識別的國際競賽)世界冠軍。
第二個學生是何愷明是2003年廣東高考狀元,本科在清華大學就讀物理專業,博士是在湯曉鷗的香港中文大學實驗室取得的。湯曉鷗說,何愷明在實驗室讀碩士期間就發了第一篇文章,取得了CVPR最佳論文,這是CVPR25年歷史上從亞洲出來的第一篇最佳論文。當時的湯曉鷗和何愷明開玩笑,說他一出手就到了巔峰,從此以后的學術生涯就只能往下走了。結果他去微軟和Facebook工作后一路走高。
何愷明第一項工作是在MSR(微軟研究院)進行。在2015年之前,深度學習最多只能訓練到20多層,何愷明在網絡的每一層引入了一個直聯通道,從而解決了深度網絡梯度傳遞的問題,獲得了2016年的最佳論文。在這之后可以有效的訓練超過百層的深度學習。在大模型時代,以Transformer為核心的大模型,包括GPT系列,也是普遍采用了這個結構,以支撐上百層的堆疊。
湯曉鷗總結起來,何愷明把網絡做深了,谷歌把網絡的入口拉大了,這才成就了今天的大模型。
何愷明的第二項工作Mask R-CNN是在Facebook做的,他首次提出了一個真正高性能的物體檢測和算法框架,獲得了ICCV2017年最佳論文。湯曉鷗表示,何愷明是世界上唯一一個在畢業不到十年內,三次以第一作者的身份獲得CVPR、ICCV最佳論文的人。他首次把基于原碼的自編碼思想用于視覺領域的非監督學習,開啟了計算機視覺領域自監督學習的大門,并被推廣到三維、音頻甚至是AI領域。
第三個學生林達華本科就讀于中國科大,碩士在香港中文大學,博士是MIT。他2010年在MIT讀博士期間,獲得NIPS最佳學生論文,2014年回到湯曉鷗的實驗室做教授。
林達華的第一項工作是OpenMMLab,在2018年從一個小團隊開始,在沒有推廣投入的情況下,以口口相傳的形式成為國際上最具影響力的視覺算法開源體系,目前用戶遍及全球140多個國家和地區。
湯曉鷗還介紹了林達華的其他兩項工作成果,即將正式發布的千億參數、8K的多語種大語言模型“書生·浦語”,和有2000億參數、覆蓋100平方公里的城市級實景三維大模型LandMark。
對于三名學生在人工智能領域的成就,湯曉鷗評價:王曉剛在深度學習興起的最初幾年,灑下了很多原創的種子;何愷明將深度學習的根基打得非常牢、非常深;林達華通過開發和大模型讓它枝繁葉茂。
湯曉鷗表示:“讓我非常欣慰的是,這顆大樹已經開始開花結果。就在兩周前,我們的自動駕駛大模型從9155篇文章中脫穎而出,獲得了CVPR2023年的最佳論文獎。”
他援引谷歌學術統計,稱這是改革開放40多年來第一篇全部由中國學者完成的國際計算機視覺三大頂會的最佳論文,文章的牽頭作者是王曉剛帶出來的博士。此外,OpenMMLab是林達華帶出來的博士陳愷做出來的,當年湯曉鷗實驗室做的另一篇超過人眼的人臉識別的文章的作者陸超超,也從劍橋大學博士畢業回到了上海,正在和中國唯一的圖靈獎獲得者姚期智先生在上海期智研究院合作,從事AI基礎理論研究。“新一代的學生已經在上海成功起步。”
在演講的最后,湯曉鷗再一次感謝上海,感謝這些學生,并援引了他認為AI難以超越的“有趣靈魂”于謙在電影《老師好》里的一句臺詞: “我不是在最好的時光遇見了你們,而是遇見了你們,才有了這段最好的時光。”
關于我們| 聯系方式| 版權聲明| 供稿服務| 友情鏈接
咕嚕網 www.fyuntv.cn 版權所有,未經書面授權禁止使用
Copyright©2008-2023 By All Rights Reserved 皖ICP備2022009963號-10
聯系我們: 39 60 29 14 2@qq.com