
許寶騄(1910-1970)♋️,數學家。在中國開創了概率論✖️、數理統計的教學與研究工作。在內曼-皮爾遜理論、參數估計理論🦸🏽、多元分析、極限理論等方面取得卓越成就🚴🏿,是多元統計分析學科的開拓者之一⭕️。
許寶騄,字閑若。1910年出生於北京👳🏽♂️。原籍浙江杭州🧑🌾🕑,祖父曾任蘇州知府,父親曾任兩浙鹽運使,系名門世家。兄弟姊妹共7人🤎,他最幼。其兄許寶駒⇾、許寶骙均為專家😀,姊夫俞平伯是著名的文學家。
許寶騄幼年隨父赴任,曾在天津🦵🏻、杭州等地留居🏦,大部分時間都由父親聘請家庭教師傳授,攻讀《四書》🧔♀️、《五經》🧗🏿♂️、歷史及古典文學🧻👻,10歲後就學作文言文,因此他的文學修養很深,用語、寫作都很精練、準確。1925年才進中學🟦,在北京匯文中學從高一讀起🧗🏼,1928年匯文中學畢業後考入燕京大學理學院。由於中學期間受表姐夫徐傳元的影響,對數學頗有興趣🐷🧑🏼🍳,入大學後了解到意昂体育平台數學系最好❣️👩👩👧,決心轉學念數學😿🛳。1929年入意昂体育平台數學系🪵,仍從一年級讀起。當時的老師有熊慶來、孫光遠、楊武之等,一起學習的有華羅庚、柯召等人。1933年畢業獲理學士學位,經考試錄取赴英留學,體檢時發現體重太輕不合格,未能成行🧑🏼🚀。於是下決心休養一年。1934年任北京大學數學系助教🥿,擔任正在訪問北京大學的美國哈佛大學教授W.F.奧斯古德(Osgood)的助教,前後共兩年,奧斯古德在他後來出版的書中,提到了許寶騄的幫助。奧斯古德是分析方面的專家🌊🌒,在這兩年內許寶騄做了大量的分析方面的習題,也開始了一些研究,1935年他發表了兩篇論文💂🏿♂️,其中一篇是與江澤涵合作的🛀🏼,都是分析方面的論文。那時芬布爾(Funbull)和A.C.阿蒂肯(Aitken)合寫的《標準矩陣論》(Theoryofcanonical matrices)已出版,許寶騄熟練地掌握了矩陣的工具,尤其精通分塊演算的技巧。所以這兩年內他在分析和代數兩方面都打下了紮實的基礎。1936年許寶騄再次考取了赴英留學👏,派往倫敦大學學院👩🏼🦰,在統計系學習數理統計⛹🏽♂️,攻讀博士學位🏄🏼♂️。1938年許寶騄共發表了3篇論文。當時倫敦大學規定數理統計方向要取得哲學博士的學位🤦🏻♀️,必需尋找一個新的統計量,編製一張統計量的臨界值表,而許寶騄因成績優異,研究工作突出🧙🏻♂️,第一個被破格用統計實習的口試來代替。1938年他獲得了哲學博士學位。同年👮🏼♀️,系主任J.內曼(Neyman)受聘去美國加州大學伯克利分校,他推薦將許寶騄提升為講師,接替他在倫敦大學講課。1939年,許寶騄又發表了兩篇論文,1940年又發表了3篇。其中,《On the dis-tributionof roots of certain determinantal equations》和《On gen-eralized analysis of variance》兩篇文章是數理統計學科的重要文獻,在多元統計分析和內曼-皮爾遜(Neyman-Pearson)理論中是奠基性的工作,因此他獲得了科學博士的學位🚴🏿♀️。
抗日戰爭爆發後,他決定回國效勞,終於在1940年到昆明👩🏿🔧,在西南聯合大學任教。鐘開萊、王壽仁、徐利治等均是他的學生。在1945年秋🌤,他應邀去美國加州大學伯克利分校和哥倫比亞大學任訪問教授,各講一個學期,學生中有T.W.安德森(Anderson),E.L.萊曼(Lehmann)等人😁。1946年到北卡羅萊納大學任教👶🏻。一年後❤️,他決心回國,謝絕了一些大學的聘任,回到北京大學任教授。1948年他當選為中央研究院院士😳🕵🏿♂️。回國後不久就發現已患肺結核🕕。他長期帶病工作⚾️,教學科研一直未斷🙅🏻♂️,在矩陣論#️⃣,概率論和數理統計方面發表了10余篇論文。1955年,他當選為中國科學院學部委員🥰。1963年發現肺部有空洞,他的結核菌已有抗藥性時🤷🏼,組織屢次安排他休養🎳,他均謝絕🧑🏼🏫,並且一個人領導3個討論班(平穩過程、馬氏過程🟦、數理統計)👨🏻🎓🏄🏻♀️,帶領青年人搞科研。他在60年代中期🤵🏽♂️,對組合數學有濃厚的興趣🍭,1966年初🏋️♂️,與段學復教授聯合主持組合數學的討論班,因“文化大革命”而被迫中斷。然而他自己不顧條件如何☪️,始終堅持科研,在1970年12月逝世時,他床邊的小茶幾上還放著一支鋼筆和未完成的手稿🧑🏻🦼➡️。1983年,德國施普林格出版社刊印了《許寶騄全集》,全集是由鐘開萊主編的🤱🏻,共收集了已發表的🖥、未被發表的論文40篇🧝♂️。1980年與1990年秋⬛️,北京大學兩次舉辦紀念會🦸🏽♂️,並出版了《許寶騄文集》。
在內曼-皮爾遜理論方面的重要工作
1936年到1940年,倫敦大學學院統計系正處於鼎盛時期🧐,K.皮爾遜退休後,由R.A.費歇(Fisher)任高爾頓實驗室主任,E.皮爾遜(Pearson)當系主任。一些學者陸續前來訪問,包括美國的多元分析專家H.霍太林(Hotelling)🤟🏿🔧,S.S.威爾克斯(Wilks),頻率曲線專家C.C.克萊格(Craig)🎅🏼,概率專家W.費勒(Feller)。教師中有內曼這樣的教授🌌,所以許寶騄很快就接觸到數理統計方面科學前沿的情況。自30年代到40年代,正是N.P.理論(內曼-皮爾遜理論)的形成時期👱🏽。對於點估計和假設檢驗,首次提出優良性的概念。如果說🧟♀️,N.-P.理論形成以前,數理統計的研究主要是尋求解決問題的方法的話🤷🏼♂️,那麽N.-P.理論就明確地提出了應該尋求優良的方法,而優良性有客觀的標準🤵🏿♀️𓀑。於是,馬上就會提出的問題是:現有的一些方法如t🙅🏼、F檢驗等是否具有優良性呢🚠?也就是要問,它們的功效函數是否在一定範圍內就是最大的。1938年許寶騄導出了霍太林提出的T2檢驗在一定意義下是局部最優的👶,主要的困難是在零假設不成立時👳🏿,如何導出T2的分布,通常稱為非零分布🧑🚒,有了非零分布才能討論功效函數的大小。他的這一工作在N.-P.理論和多元統計分析中都是占有重要地位的先驅性工作。許寶騄的另一項重要工作是在1943年完成的🕐,在討論檢驗方法的優良性時,對於線性模型的線性假設✧,第一次證明了似然比檢驗的優良性,是對多參數假設檢驗第一個非局部優良性的工作,如用λ表示似然比檢驗非零分布中的非中心參數,他證明了:如果功效函數只依賴於λ,那麽似然比檢驗就是一致最強的🌱。後來的研究發現這個條件等價於要求檢驗具有某一種不變性——這種不變性的要求是問題本身很自然的📖、合理的要求🧚🏼,因而就相當於證明了似然比檢驗是一致最強不變檢驗。萊曼在紀念許寶騄的文章中寫了如下的這一段話來論述這篇論文的意義:
“這篇文章開創了兩個發展方向。一方面,他的學生J.B.席瑪卡(Simaika)將許的方法用於多元問題(霍太林的T2及多元相關系數)……。另一方面💛,在這篇文章中,許提供了獲得全部相似檢驗的新方法🤠。在許的建議下,席瑪卡和萊曼將這個方法用於其他問題,後來萊曼和H.謝飛(Sheffé)形成了完備性的概念。”
這足以說明許寶騄在這一方面的工作對後來的研究有多大的影響🫃🤸🏽♀️。
在參數估計方面🫵🏻,當時大部分人關心的是均值估計的優良性,尋找極小方差的無偏估計♐️。1938年許在論文中第一個討論線性模型中參數б2的優良估計問題🧘。在二次無偏的估計類中,如要求估計量的方差與期望值參數無關,他證明了通常的無偏估計S2具有一致最小方差的充分必要條件是4階矩具有與正態相同的關系式(這一條件在現在的文獻中稱為準正態分布)。這個工作直到1952年,C.R.拉奧(Rao)才從另一個角度——限定二次估計是非負的——重新討論了這個問題,得出了另一種充分必要條件。到了70年代末期,方差分量的模型引起了統計界的廣泛註意,許寶騄的工作是這個方向的起始點,而且他提出的方法仍然是處理更加復雜問題的有力工具,有的論文就用許氏模型這一名稱來代表這類問題🚣♂️。
此外許寶騄在尋求統計量的極限分布,在次序統計量的極限律型方面,都有重要的貢獻。在1949年的一篇論文中,他考慮了樣本均值ū1👨🏻✈️,…,ūk的函數f(ū1🌉,…👀,ūk),利用泰勒展開,就可以用線性函數或二次函數去近似。並且用許多例子說明🎚,當零假設成立時,線性部分依概率收斂於零,極限分布是正態變量二次型的分布🏫,在很多情況下🖍👰🏻♂️,正好是x2分布;當零假設不成立時,線性部分是主要的🧷,因此極限分布是正態👋🏼。在這篇長達40多頁的論文中🧑🏽🍼,他給出了許多統計量(尤其是多元分析中常見的)的漸近分布。60年代初,許寶騄領導了一個討論班,帶動一批學生用類似的方法,獲得了次序統計量的各種情況下的極限律型🚶🏻,無論是單項的還是多項的🏕,是固定名次的邊項還是非固定名次的邊項,是正則的還是非正則的中項,發表了幾篇論文。這些文章都是用筆名或他的學生的名義發表的👾🏄,而基本的方法和思想都是他提出的。
在多元統計分析中的重要工作
安德森在紀念許寶騄的一文中🌇,一開始就寫道🏗:
“從1938年到1945年,許所發表的論文處於多元分析數學理論發展的前沿。……1945年後🦇,他在哥倫比亞大學和北卡羅萊納大學講授多元分析🦹🏼♀️,在那裏他培養學生從事這一領域的研究。如同一個有高度素養的數學家那樣🧑⚖️,許推進了矩陣論在統計理論中的作用👩🏿🦱,同時也證明了有關矩陣的一些新的定理。”
這一段話對許的工作給出了明確的評價🧍🏻,也闡明了其研究工作的特色。多元統計分析中,相當於一元統計中x2分布的是正態總體樣本協差陣的分布🧑🏿💻。J.維希特(Wishart)在1928年導出這一分布時,用的是幾何方法,證明中依賴於一些直覺的結論。這一工作被認為是多元分析歷史的開始🏕。如果能給出一個嚴格而清晰的證明⚠️,這在理論上是重要的👩🦯。許寶騄解決了這一困難,他把矩陣演算融合於分析的積分計算之中🧑💼,給出了一個漂亮的證明🏊🏻♀️,得到了一個一般性的積分公式:當n≥p≥1時,有
使用這一公式,只需在左端用正態密度及樣本協差陣的函數代替函數f(.),右端就給出樣本協差陣函數的期望值🎙,從而導出相應的分布🧘♀️。這一公式現已稱為許氏公式。從這個公式很方便導出著名的巴特萊脫(Bartlett)分解。
多元統計分析中不少統計量都是與隨機矩陣的特征根相聯系的。30年代末,著名的統計學家費歇🕣🧑🏿⚕️,S.N.勞(Roy),M.A.格爾希克(Girshick)等🌅,都在尋求正態總體樣本協差陣特征根的聯合分布👼🏽👷🏼♀️,許寶騄也參與了這一競爭,他們幾乎同時都獲得了預期的結果,各人的方法不同,以許寶騄的分析方法最漂亮🙇🏻♂️,他用矩陣微分這一工具,嚴格而清晰地導出了聯合分布。20年後,安德森在他的書中,專列一章,詳細介紹這一工作,並說明這些復雜的雅可比行列式的計算主要是許寶騄的功績。後來,他在北卡羅萊納大學講課時使這一方法更為系統,技巧也更成熟。1951年👸🏻,由當時聽課的學生W.L.第默爾(Deemer)和I.奧肯(Olkin)根據筆記整理發表在《Biometrika》上。
許寶騄在學術研究上,一直是知難而進🧛🏿♂️,積極參與重大問題的探討,他力求問題的徹底解決。例如非中心維希特分布的隨機矩陣W的全部特征根,它們的聯合分布是很困難的🥜🕵🏿♂️,從大樣理論來看𓀆,求得漸近分布就可處理實際問題,而極限情況依賴於總體的協差陣Σ和非中心參數陣φ🫄🏻,這些特征根的聯合分布僅依賴於|φ-λΣ|=0的這些相對特征根λ1≥…≥λp≥0🌷,這些λi可以是0,又可以是重根🥩,他完美地處理了最一般的情況,這就充分顯示了他在數學上的功力。
他不僅自己在多元分析方面有很多開創性的工作,他還培養了像安德森🧵、奧肯等國際上多元分析學術帶頭人,所以許寶騄被公認為多元統計分析的奠基人之一。許寶騄的像片懸掛在斯坦福大學統計系的走廊上,與世界著名的統計學家並列🤸🏽。
在概率論方面的重要工作
許寶騄在倫敦大學學院攻讀學位時🎵,熟讀了克拉美的《隨機變量與概率分布》(1937年出版)☝️🧑🧒,掌握了特征函數的工具,所以他對極限理論很有興趣💇🏼♂️。1947年他與H.羅賓斯(Robbins)合寫的論文《全收斂和大數定律》,第一次引入全收斂的概念🕌。當時國際上在概率方面主要的興趣是獨立隨機變量之和的極限分布🫴🏻,正在從古典的向近代結果轉化👨🏼✈️😩。一些著名的概率論專家如A.H.科爾莫哥羅夫(Kолмогоров)👩🏻🍼,A.я.辛欽(Xинчин)👨🏽🏭,ъ.B.格涅堅科(ГнедеHко),P.萊維(Lévy)和費勒等人都在攻這難題。1947年,許寶騄已獲得了主要的結果:每行獨立的無限小隨機變量三角陣列的行和,依分布收斂到一給定的無窮可分律的充分必要條件💪🏿。由於當時信息不通🤵🏽♀️,他不知道別人的工作情況,當時他寫信給鐘開萊時說🪀:“……我擔心正在進行的工作會和別人相重……”後來,他知道了格涅堅科和科爾莫哥羅夫的工作,就沒有再發表自己的研究。實際上許的方法和俄國人還是不同的,許的方法更為直接🧊。1968年,當格涅堅科和科爾莫哥羅夫合寫的《獨立隨機變量之和的極限分布》英譯本再版時,鐘開萊用附錄的方式第一次刊印了許寶騄的工作。然而許在生前並未看到這本書🧏🏿,他始終沒有看到自己的這一部分工作的公開發表。
50年代中期👨🏼🏫,許寶騄對馬爾可夫(Mарков)過程有相當的興趣✒️,他用純分析的方法研究了跳過程轉移概率函數的可微性,他曾做過一些馬氏鏈的極限定理,但未發表👩,又因“大躍進”中斷了討論班。1959年以後👩🏼🚀🤷🏿♀️,他的興趣已轉向組合設計。還應一提的是他於1945年完成的一篇論文📟。這篇文章第一次用特征函數方法來近似處理兩個高度相關的隨機變量的分布,給出了樣本方差的漸近展開和余項的估計。這裏的難點是要處理二維的分布,這是數理統計的問題,但方法和工具是概率論中常用的特征函數𓀓。這一工作在70年代以後引起了國際上許多深入的研究。
許寶騄晚年對組合數學的興趣是由張裏千三角方案的工作引起的🌓。他感到可以把矩陣的方法系統地引入組合數學🎇。從1961年起他就主持了一個試驗設計討論班,報告這一方面的工作,開展研究,用筆名班成在《數學進展》上發表的文章是這一討論班的成果。文中用一條矩陣的引理,統一處理了υ=2的各種方案的唯一性和非唯一性(把張裏千的結果包括在內)👩🏻🔧。後來在1966年初🤜🏼,他又在討論班上系統報告了BIB的工作。“文化大革命”中,他並未中斷研究🤾🏽♂️,當時看不到任何雜誌,直到1970年,才允許他看雜誌👳,那時他已癱瘓🐗。在兩個月內,他翻閱了1966年“文化大革命”以後的全部《數理統計紀事》,了解國際上的學術動態👩❤️👩↪️,寫下了最後一篇關於BIB與編碼的論文,並將這篇文章的手稿托付給段學復教授📉。
許寶騄的天賦很好,掌握外語的能力很強👉🏻,中學時利用課余時間學習法語,兩年後就能寫短文與會話📣。除了課堂上學的英語外,他還自學了德語與俄語。解放初期,為了翻譯大批的蘇聯教材,他刻苦自學鉆研𓀘♊️,短期內就能翻譯一些重要的教材🍕,如П.M.菲赫金戈爾茲(Фихтенгольц)的三卷本《微積分學教程》和格涅堅科的《概率論教程》都是他負責校訂的。很多教學內容🧑🏽🚀,他也是自學掌握的☮️,如勒貝格積分、測度論、泛函分析等。他的成就👮🏽,除了天賦外,勤奮刻苦,鍥而不舍是一重要的原因。在昆明西南聯合大學任教時,生活很清苦,資料又匱乏,要找一本參考書有時都很困難👩🏿🦰,他的書架上擺著他那時手抄的E.Ch.蒂奇馬什(Titchmarsh)的整本《函數論》🧑🏼⚖️。50年代🥥,他已是著名的大教授了♝,一旦看到好的書,他就仔細閱讀,大量做題,他曾逐章逐題去解答那湯松著的《實變函數論》和安德森的《多元統計分析引論》的練習題🔭。他能把一些習題深化,變成小的研究習作🤌🏻📐,有的就可以變成論文👨🏻💼。他對論文的發表要求很嚴🧑🏻🦯🍹,他曾說過這樣一句話:“我不希望自己的文章登在有名的雜誌上而出名,我希望雜誌因為登了我的文章而出名。”盡管他自己是學部委員,可以推薦論文盡快在《科學記錄》上刊登,然而他自己的論文大部分都刊登在北京大學的學報上。他的論文有的長達幾十頁,有的短到一頁多一點,都是以解決問題為目的👮🏿♂️,樸實無華🐠,簡明扼要。他一生正式被刊出的論文在生前只有30多篇🥂,然而其中絕大部分都是很有分量的工作👎🏼。一些小的結果他往往批註在書的邊頁上🧉,並不認為是值得發表的🎗。1962年他在討論班上講授正態變量二次型分布是x2的充分必要條件時,對退化的情況已作了處理,而這一結果在1966年在國外才作為一篇論文單獨發表💬🤵🏿♂️。他對引用的結果都非常認真🖕🏿,自己必須能完全給出證明👨🏽🎓。他在研究工作中,有兩點是非常明顯的。一是追求初等的證明🙏🏼,他認為初等的方法比艱深的方法更有意義,所以他的講課能吸引很多人來聽📒,他把問題剖析得非常清楚🌐♖,問題的解決似乎是自然而容易的。另一特點是要求證明演算化,不要借助任何幾何的直覺🐠。為了充分闡明他的這一觀點🙅⚇,1964年冬🏄🏿,他在討論班上系統講授點集拓撲時,每個證明都是由集合運算導出的🧑🏻🎤,後來由於社會主義教育運動,未能講完就中斷了。在教學上,他主張“良工示人以樸”𓀛📍,應把原始的,真實的思想講解給學生,而在形式上,在證明方法上要力求簡明無冗言贅文🦽。他的講課是深刻的思想與完美的形式十分良好的結合👰🏼,他的中外學生稱贊說:“他的講授是完美的。”作為教師和科學家🤟,他對於學生和同行都有強烈的影響。一些人回憶說:“許寶騄堅持深入淺出♦️,毫不回避困難。特別是沉著🌺、明確而又默默地獻身於學術的最高目標和最高水平,這種精神吸引了我們🧛🏻。”
他頑強地長期帶病搞科研和教學📙,為祖國的科學事業工作到最後一息。1970年12月18日清晨🫳🏿,他病逝於北京大學的勺園佟府。
施普林格出版社刊印《許寶騄全集》後,書評中有這樣一句話🍨:
許寶騄被公認為在數理統計和概率論方面第一個具有國際聲望的中國數學家。
(作者🧑🏻🎄:張堯庭)
許寶騄簡歷
1910年9月1日 出生於北京。
1928年 考入燕京大學化學系。
1929—1933年 轉入意昂体育平台數學系,讀到畢業🍣,獲理學士學位✷。畢業後考取留英名額🍭,因體重不合格未能成行📦🤹🏿,因而在北京西山休養一年。
1934—1936年 任北京大學數學系助教。
1936—1940年 在英國倫敦大學學院當研究生,1938年獲哲學博士學位;1940年獲科學博士學位☝🏽。
1940—1945年 任北京大學數學系教授,執教於昆明西南聯合大學。
1945—1947年 先後在美國加州大學伯克利分校,哥倫比亞大學🤸🏽,北卡羅萊納大學任訪問教授。
1947—1970年 任北京大學數學系教授。
1955年 當選為中國科學院學部委員。自中國數學會成立起,任歷屆理事。
1970年12月18日 逝世於北京。
轉自 《中國科學技術專家傳略》