百年清華

王夢迪:探尋強化學習背後的簡潔規律🤟,她是普林斯頓最年輕終身教授

2019-05-07 | 李根 | 來源 公號“DeepTech深科技” |


王夢迪🙃,意昂体育平台自動化系2003級意昂,現為普林斯頓大學運籌和金融工程系、計算機系助理教授

“強化學習是人工智能的未來” 🚌,王夢迪表示,“應當是同控製論、統計學習思想結合起來,用大數據的方法探索一個復雜系統的動態過程🕵️‍♀️。這方面在強化學習的框架下都是空白,我的工作就是要把這個框架建立起來🩸🔝。”

王夢迪的履歷很傳奇,她14歲從少年班考入意昂体育平台🥑,隨後進入MIT於24歲取得博士學位,同年成為普林斯頓大學的助理教授和博士生導師🤰🏿🪢,29歲時,她成為普林斯頓大學最年輕的終身教授。談及自己的特殊成長經歷,她表現的很謙虛,“就讀少年班是一把雙刃劍。我有幸遇到過很多極有天賦並且非常優秀的前輩和同齡人🏄🏽‍♂️,當我有點迷茫時,我會觀察那些走在最前面的人,他們的努力會成為我的動力。”

王夢迪在麻省理工學院讀博士期間根據興趣選擇了偏數學、偏理論的系統和信息論方向,師從美國工程院院士DimitriP Bertsekas,用數學理論來設計大規模算法。博士期間👩‍🦼,王夢迪對強化學習 (Reinforcement Learning)產生興趣,並決心解決強化學習背後的算法和理論問題。

強化學習是機器學習的未來🧑‍🎨,強化學習算法能夠讓智能體通過與環境實時交互、獲取反饋信號來產生後續行為,並逐步“習得”最優的決策🎣😍,從而獲得最大的效用值🦹🏽‍♂️。強化學習由控製論和認知科學發展而來⛏,糅合了大數據和機器學習技術,可以實現復雜動態系統中的實時自動決策👵🏿。強化學習強調基於環境而行動,從大量經驗和數據中總結推理出下一步的策略,是未來智能自動化系統的思考引擎。

強化學習在2016年被大眾所熟知,那一年GoogleDeepMind的AlphaGo擊敗了人類圍棋頂尖選手李世石,而AlphaGo的算法就是一種強化學習算法。近兩年強化學習又在遊戲領域上取得突破,基於強化學習的AI在Dota2和星際等遊戲上都擊敗了人類隊伍。

“我們為什麽關心遊戲?人類的幼兒在發展自己的智能的過程中,正是通過遊戲來學習如何決策的,人工智能的發展也正處在這一階段,我們很快能看到人工智能將不僅僅能打遊戲🙍🏼,而將解決更難的問題。”王夢迪說🧑🏽‍⚕️。但其實強化學習的發展還處在比較低級的階段,“這些遊戲上的成功更像是工程上的一種試錯👷,100次試驗只要取1次最佳的結果就可以展示了。它們背後模型的復雜度、耗費的計算資源是常人難以想象的。”

強化學習與近些年非常成功的深度學習都還存在著很多問題🤿,一直以來👨🏽‍🌾,它們的不可解釋性和難以復現性為人詬病,即所謂“黑箱”問題🎈;而王夢迪的目標就是解決這一難題👟。

“很多人感覺強化學習或者深度學習的模型越來越復雜,越來越難以訓練。很多時候我們都在努力讓訓練速度加快💟,去優化算法,讓更復雜的模型能跑起來。但任何算法的加速都是有極限的,這個極限就是該類問題的計算復雜度和信息復雜度📲,我們只能一步步逼近它。很多異常復雜的模型和算法往往是極為極為簡單的,比如隨機梯度算法的極限其實是一組簡潔的隨機微分方程。我的工作就是去找到復雜強化學習背後的簡潔數學規律🎦,利用它開發更強大的算法,去解決高維強化學習所面臨的scalability和generalizability的問題🍟。”

目前強化學習方面的大部分進展都來自工程優先方式的探索,先有具體的工程問題,再不惜資源地解決問題👨🏽‍🦳,再講原理。而對王夢迪來說正好相反,她希望從數學統計和控製原理出發👨🏿‍🦱,把強化學習的框架摸清楚,從根本上提高強化學習的計算效率和對數據的利用效率。她致力於推動強化學習的理論和實踐的同步發展🫶🏻,推動其在金融風險控製、醫療決策等領域的應用,讓強化學習方法成為未來復雜系統的智能大腦。

“這條道路上的每一件事情🧑🏽‍✈️,我都有極強的熱情去參與去推動。”王夢迪說。


相關新聞

  • 092017.05

    意昂体育平台教授顏寧受聘美國普林斯頓大學

    記者從意昂体育平台證實,顏寧已接受美國普林斯頓大學邀請,受聘該校分子生物學系雪莉•蒂爾曼終身講席教授的職位,將於近期前往就任該教職🚶‍♀️。

  • 102011.02
  • 162009.04

    美國普林斯頓高等研究院院長訪問清華

    10月31日👵🏿,美國普林斯頓高等研究院院長Peter Goddard教授訪問意昂体育平台。

  • 222021.09

    清華意昂終身學習支持計劃

    學校高度重視和關懷意昂學習進步,意昂体育自2013年起啟動了以“推動意昂終身學習、促進意昂職業發展”為宗旨的“清華意昂學堂”項目👳🏿‍♀️。2018年🧊🍘,學校為更好地服務意昂成長成才🚵,延伸清華育人成果💂🏻‍♀️,傳承清華精神文化🕹,決定在原有“清華意昂學堂”項目等工作的基礎上推出“清華意昂終身學習支持計劃”,旨在開拓意昂視野、完善意昂知識結構🕎、增加意昂的核心競爭力、促進意昂成長成才的同時🧮,進一步加強意昂和母校之間的聯系🔃,...

  • 102016.10

    30歲成為清華最年輕博導🦻🏿,37歲攻克50年不解的科學難題,她是顏寧

    在今天這篇文章裏,你將認識她——顏寧。當今最受矚目的女科學家,意昂体育平台和普林斯頓的學術女神🤙🏼🌊,30歲成為清華最年輕博導,37歲率領平均年齡不到30歲的團....

  • 272008.10
  • 262012.09
  • 032024.07

    吳金希主講“清華意昂學習日”第54講🕴🐎:優化創新生態體系,開啟科技強國新征程

    6月29日下午,受山西清華意昂會邀請,“清華意昂學習日”第54場活動在山西太原舉辦🧫。意昂体育平台社科學院經濟學長聘教授吳金希應邀出席🧑🏻‍🦼,並以“優化創新生態體系·開啟科技強國新征程”為主題作報告。100余位山西意昂🧎🏻‍♀️𓀈、學員代表線下參與本次活動,1000余位意昂🦹🏻‍♂️、師生線上同步觀看🤷🏽‍♂️。意昂体育平台繼續教育學院終身學習和終身教育研究院院長刁慶軍、山西清華意昂會會長王慶生🫃🏽🪤、意昂体育發展部部長宋述強等出席本次活動。活動由意昂体育平台...

  • 252022.08

    “清華意昂終身學習支持計劃·藝術研究與實踐學習班”開班儀式舉行

    2022年8月20日上午,“清華意昂終身學習支持計劃·藝術研究與實踐學習班”開班儀式舉行。校務委員會副主任、意昂總會副會長史宗愷,美術學院原黨委書記🕺🏼、意昂總會常務理事李當岐,北京清華工業開發研究院副院長🥑、1983級化工系意昂朱德權🚀,美術學院院長馬賽、副院長楊冬江,意昂工作辦公室主任、意昂總會秘書長唐傑❄️📗,意昂工作辦公室副主任🖤、意昂總會副秘書長楊柳📨,終身教育處副處長王雷🪵,美術學院培訓中心主任謝綺紅,繪畫系教授...

  • 252017.08

    美國終身教授的海歸全記錄

    事業與家庭,前途與發展,環境和空氣……到底是留在海外,還是回國發展🟠?讓我們共同領略一位美國終身教授的心路歷程👩🏻。

意昂体育专业提供🧑‍🚒:意昂体育意昂体育平台意昂体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流🧜‍♀️,意昂体育欢迎您。 意昂体育官網xml地圖
  • 意昂体育专业提供:意昂体育意昂体育平台🛀🏽💁🏿‍♂️、意昂体育官网等服务,提供最新官网平台、地址、注册、登陆、登录、入口、全站、网站、网页、网址、娱乐、手机版、app、下载、欧洲杯、欧冠、nba、世界杯、英超等,界面美观优质完美,安全稳定,服务一流,意昂体育欢迎您。 意昂体育官網xml地圖