丘成桐對人工智慧、大數據、量子計算的權威點評



丘成桐對人工智慧、大數據、量子計算的權威點評

丘成桐:我在這邊再次來呼籲政府,也呼籲我們中國的管科學的領導,能夠重視基礎科學跟數學的發展。

因為大家都知道,我舉個例子來講,我們在中國的一個家庭裡邊,父母在外面工作維持生活,住房,吃飯穿衣都是你日常必需的。但是有個事,不是一下子看得到的,就是每一個家庭都很用心的去做一件事,就是小孩子的教育。小孩子的健康成長是我們父母都很關心的,明明曉得要差不多20年才能夠見到成果,也是甘心情願的去做。

其實基礎科學的發展也是同樣的事情,我們不斷地投資在工業上,國家希望有純粹的回報,因為我們是要生存,社會需要它。

但是,也應當有可觀的經費投資在基本科學上,因為國家的獨立自主,長治久安,強大的基本科學是必須要的。沒有基本科學的發展,就應用科學也發展不來。

我記得在四年前,我在Princeton高等研究所做教授,這也是楊志林教授做過事的一個地方,也是愛因斯坦在那邊做過教授的地方。當時的所長就很自豪的說,他講我們在高等研究院研究的是無用之學,這些無用之學在未來將成為社會的磐石,是國家的棟樑。現在的高等研究所的所長也寫了一本書,就講這個事情。

高等研究所第一所長叫Flexner,他1939年時候寫過一篇很出名的文章,他的文章的名字叫做《無為之事的無所不為》。這篇文章指出,在19世紀的時候,法拉第跟麥克斯韋爾研究電磁學,不過是出於科學上的好奇心。接著,赫茲就發現了電磁波,但是科學家並不重視電磁在人類社會的應用,可他們的工作卻成為人類社會上最重要的貢獻,也是近代文明的一個最主要的貢獻。

現在我來舉幾個例子,因為應用科研體制有很多,因為主辦單位很關心幾個方向,所以我這邊就指出這幾個方向,就是基本科學跟數學的應用。

我們曉得當今社會裡邊互聯網跟計算機的能力,無遠弗屆,能力大得不得了。無論人員的分配,大數據的處理,道路的交通,模擬的神經元,蛋白質結構等種種問題,都要大量的提升計算的能力,沒有計算能力,單從理論上是不夠用的,因為理論還不能夠有這個能力去了解。

但是這個能力有相當大的部分跟晶元有關。電子計算機的計算能力不斷的增長,這30年來我們有所謂摩爾定理,講每一年半計算機能力要增倍,這點是很值得佩服的,當年莫爾是英特爾的創辦人,他曉得有能力。

但是你可能曉得,這個莫爾定律已經到了極限了,不可能再增長。所以未來的計算機的硬體的設計,要面臨很大的問題。對付的方法一般來講有兩個,一個是利用基礎物理的原理跟基本數學來大力的改革這個命題;另一方面是大力的改善軟體,以及我們最好找到最好的演算法,繞過硬體的速度跟儲藏的能力來解決它。

我們來看第一個方法。

其實30年前,偉大的物理學家Richard Feynman,就提出來,他提出量子力學應用在計算方面的一個重大的想法。而當時其實Richard Feynman大概也沒有很仔細的曉得要怎麼做法,但是他曉得量子力學的基本原理是可以幫助計算的儲存能力的。

但是一直到了20多年前,MIT有個應用數學家叫Peter Shor,他提出了一個演算法,量子計算假如成功的話,利用Feynman的提議,做一個大整數的因子分解,這個很大的整數要怎麼做因子分解。當然,我們在小學都學過因子分解,但是大數做因子分解是很困難的事情。我們現在基本上大部分的保密系統都是利用大數據分解困難這個問題來做的。

我們在大概1978年的時候,有個很出名的方法叫RSA的方法,RSA是由3個安全方面的專家發明的。他這個方法就是現在所有系統都用的一個方法。

但是Peter Shor發覺,假如量子計算成功的話,RSA的所有加密都可以被破解,因為量子計算是一個能力呈指數增長的的一個方法。所以量子計算嚴重的威脅到現在通用的保密方法。所以很多國家的政府官員,軍事主管跟銀行監控部門都在擔心,所以他們投入了大量的資源來發展量子計算研究。

這個研究需要大量的數學家,物理學家跟工程師的合作。剛才我講Richard Feynman是著名的物理學家,Peter Shor是一個數學家,當然還有很多工程師要將它完成。

美國名校裡邊有很多教授都在做這方面的研究,MIT也有,Stanford也有,哈佛也有。在實驗方面每個公司投入的量是很大。包括IBM,google,微軟這些公司。

IBM在這邊投入了幾十年了,現在有1300個工程師在做這方面的研究。今年google最近前幾個月就宣布他們發展成功一個很重要的事情。

所以去年美國通過National Quantum Initiatives(NQI)的方案,很多智庫跟政府官員都認為量子計算機,就像第二次世界大戰的曼哈頓計劃一樣,關係到國家的安全,一定要發動整個政府去全力的支持。所以也是個很重要的一個發展的方向。今年IBM,剛才講的,就提出了五十個qubit(註:qubit是量子計算中最小的存儲單位,相當於普通計算機中的bit的概念。)的計算機,可以通過雲端使用。

最近NASA宣布,google可以通過量子計算站200秒內解決世界最快的超級計算機1萬年才能夠解決的問題。就是講它可以兩秒內解決一些(通常)要計算很久很久的問題。

中國學者跟中國的公司也在做這方面的工作。但是,在物理在基本物理跟基本數學上,我們的水平比不上美國。所以估計,(中國在)量子計算在這方面的研發要落後(於美國)。我們需要大量的投資,而大量投資要包括很多基礎科學家,數學家,物理學家跟種種不同的學科聯合在一起。

這是個很重要的啟發,就是講我們投資不能夠看四年,五年,甚至要20年,因為美國IBM投資在量子計算至今至少20多年,我跟他們蠻熟的。

第二個方案的解決方法,就是利用數學發展出來方法。現在我們在這方面研究,重要的有人工智慧跟大數據,大都曉得的事情。

人工智慧已經從剛開始的理念,30年前大家都不看好人工智慧的發展,現在慢慢轉化成認為可應用的技術。這個領域近期的蓬勃的發展,基於有好幾個因素。一個是互聯網技術帶來的大數據,利用深度學習的標準演算法來處理數據。同時,超級計算機跟雲計算的強大計算力,其中原來的數學理論沒有什麼很大的突破,最基本的方面。所以人工智慧的成功還沒有好好地這個了解清楚。這也是這個領域裡邊存在著很多樽頸(註:丘成桐先生習慣用樽頸表示瓶頸)的一個本源。

我們中國的人口規模是發展人工智慧的優勢,在應用人工智慧技術方面積累了有很多很優秀的工作,發表的論文甚至比美國還要多,所以講是在世界前沿的水平。但是,在基礎理論跟演算法創新方面,跟美國,跟英國行業一段的距離,所以我們要在人工智慧核心技術上國際上領先,基礎學問一定要突破,一定要將我們的數學跟有關的學問一同地發展,才能夠真真正正的領先突破。

因為人工智慧對大數據的處理,本質上是數學中的統計學,原來目前還沒有完備的數學理論,用來支持大數據分析的結果。很多覺得很奇妙,但是我們不曉得為什麼這麼奇妙。很多數學方法還是相當原始,過度依賴於經驗的總結,而非真正來自數學的結構,這是人工智慧裡邊的。

這也導致了當下人工智慧的處理大數據問題,還需要大量的人力跟算力,甚至需要超級計算機的協作。由於缺乏數學理論的支持,很多大數據分析的結果只適用於特定環境,缺乏遷移性。大數據還缺乏有效的演算法,經典計算機的演算法還不能夠直接用到大數據中。所以這是很重要的一個問題,我們要了解的。

廣為流傳的深度學習有很多不足的地方,大樣品的依賴,依賴很多大樣品,同時解釋性很差,同時容易受到欺騙。當前沒有很好的演算法來代替它。

要解決這些問題,是要對相關數學理論進行深入的研究,了解大數據裡邊的數學結構跟原理。

目前的人工智慧由於計算機速度的限制,只能夠採取多層狀結構解決問題。這些問題,基於簡單數學分析,而非真正的Boltzman Machine(註:玻爾茲曼機,隨機神經網路和遞歸神經網路的一種),無法有效地找出最優解。

所以在可見的將來,如何提升量子計算機的硬體,發展更有效的數學演算法,讓量子人工智慧與量子深度學習變成實用的工具,實在有賴於基礎科學跟數學的深度合作。

我們在國外跟國內都在努力,將基本數學放進去。我自己幾年來跟我的學生顧險峰,跟幾個朋友,也發現有很多我們從前沒有想到的基本科學,可以用在這個方面去。有些是我十多年前在微分幾何上的工作,可以運用到人工智慧的理論研究下。

從這個方面可以看看得出來,基礎數學在工程上確實是很重要的。機器學習和人工智慧這種先進的計算方法,即使在零售業跟娛樂領域帶來了顯著的突破。解決方法也應當對醫學,衛生保健業等產生深遠的影響。

全球的衛生保健條件,包括美國,中國,都著手在臨床信息數字化。可是對於和分析跟應用這些信息卻還沒有很好的策略。

未來十年,數據科學跟人工智慧對醫學的貢獻可能超過其他所有技術的總和。人工智慧跟數據數學的醫學研究會變成醫學跟衛生保健一個新的領域。哈佛大學醫學院院長跟我談,他們期望在未來這幾年投入10億到5億美金的科研(資金),研究人工智慧在醫學的研究,所以全世界都很重視的一個領域。所以在嶄新的領域裡邊,數學跟計算數學將成為更廣泛的醫療決策提供支持。目前很多醫療系統研究人員還沒有意識到這一點,或者低估了這個影響。

我們希望將最先進的計算技術應用大型的醫學相關的資料庫,得到有效的形式,並將之應用到醫療服務,臨床手段跟相關的醫學研究裡邊。這將是一個很大規模的不同學科的聯合起來的一種研究。我們要不同的學科一同共同的努力才能夠完成,不是一個學科的科學家家就能夠完成的。所以我覺得這是個很有意義的一個突破,整個世界的高科技的一個很重要的關鍵實踐。

以人工智慧臨床診斷來做例子,中國擁有全世界最大的臨床醫療資料庫,這是很重要的事情,我們需要學習如何管理跟應用解釋數據,通過計算科學跟人工智慧,我們用全新的方法,利用解釋數據,推動整個領域的發展。

我們可以利用機器學習模型,消化更大、更豐富的數據集,同時通過機器學習的結果,更重新審視傳統的預測模型的準確性。同時我們還可以嘗試在自然的狀態下,改變額外的變數去提高模型的準確性。這種設置還允許進一步分析如何去對付新的技術的方法,讓它做得更好。這都是需要很多數學的改進和應用。

所以目前人工智慧跟數據科學的技術進行廣泛地利用到臨床診斷,手術指導,風險預測的不同的領域。在某些領域計算機診斷的準確甚至比醫生還要高明,這是一個很大的進步,對臨床影響深遠。因為這個緣故,我們更要激發我們的科研人員,跟種種不同的基礎科學家一同的合作。

我剛才講了人工智慧跟量子計算的重要性。其實,數學的應用多姿多彩,有很多不同的領域,走不同的方向。我這邊大致上講講不同的方向有多少種。你在這邊可以看得出來。基礎數學要應用到不同的地方,各個不同的領域是很多,數據科學,張量大數據,人工智慧,機器學習是剛才講過的。數字優化,運籌學跟大規模的機器學習的應用。量子計算,剛才講過的,量子演算法在機器學習的應用。數值線性代數,矩陣計算都是很重要的事情。大規模的科學計算跟高性能的計算都是很重要的,在材料力學,在量子化學種種都是需要數學的發展。還有偏微分方程,用數字技術來找到它的解是一個很重要的事情。

這種種問題至少我可以找到20個不同的重要的方向,都對現在國家高科技的發展有很重要的支持的,這都是要基本科學來幫忙。後邊還有數值逼近論,反問題的數值解決,一大堆,有二三十個不同的方向,我希望國內都能夠發點功夫去支持。

但是坦白講,我現在這邊講了20多個,後面還有一頁,20多個不同的方向。中國在這些方面能夠很有效的成功的只有幾個。但是這些方向都是整個高科技社會裡邊最重要的要發展的事情。 .

2 comments
  1. 一種想法是使用類似Xbox的傳感器和便攜式攝錄機將物理環境轉換為虛擬現實。 目標將是探索環境,例如帶有傳感器的商店,該傳感器具有這兩個原理以及該介面的軟體。 將數據轉換為虛擬現實環境。 這有利於虛擬環境的生產,以用於將虛擬眼鏡或增強現實眼鏡用於將來的購買以及與虛擬環境的交互。 將Xbox傳感器與便攜式攝像機的顏色結合在一起的想法得以傳播。 我不知道是否可以將其放入手機配件中。 人工智慧可以幫助我們產生虛擬現實。 也許將來,對於自學成才的人來說,學校用品將僅僅是增強眼鏡或虛擬現實眼鏡。 我一直在考慮為每種環境簡單地購買一些傳感器,並且我們將處於虛擬現實中,它具有許多功能,從付款到配件服裝畫畫定製環境到我自己的滿意。

  2. 通過連接工廠並將其產品提供給訪問虛擬世界的每個人,人工智慧將對開發虛擬現實平台大有幫助。 好處是擁有一個新平台並提供所有產品以及更多更好的服務。 想像一下一個虛擬平台,上面有來自所有工廠的促銷活動隨時可以與您聯繫。 您可以在該平台上提供所有語言的同步機器翻譯視頻。 我們將能夠使用人工智慧實時觀看所有國籍的視頻。 人工智慧可以通過顯示其錯誤的特定練習來促進單個課程的發展,並通過在虛擬現實(3D)的所有知識領域中指導其命中率來促進他們的學習。 未來無時無刻不在。 我正在寫您管,這是一個具有人工智慧的Google平台。 我還將在另一個Facebook平台instagram上寫,兩家公司都有人工智慧,但是我不知道人工智慧可以吸收內容的程度。 同時向人們傳播了一個誕生一個知道的未來創業公司的機會。 相信我會改變很多。 (由谷歌翻譯)

Comments are closed.