丘成桐对人工智能、大数据、量子计算的权威点评



丘成桐对人工智能、大数据、量子计算的权威点评

丘成桐:我在这边再次来呼吁政府,也呼吁我们中国的管科学的领导,能够重视基础科学跟数学的发展。

因为大家都知道,我举个例子来讲,我们在中国的一个家庭里边,父母在外面工作维持生活,住房,吃饭穿衣都是你日常必需的。但是有个事,不是一下子看得到的,就是每一个家庭都很用心的去做一件事,就是小孩子的教育。小孩子的健康成长是我们父母都很关心的,明明晓得要差不多20年才能够见到成果,也是甘心情愿的去做。

其实基础科学的发展也是同样的事情,我们不断地投资在工业上,国家希望有纯粹的回报,因为我们是要生存,社会需要它。

但是,也应当有可观的经费投资在基本科学上,因为国家的独立自主,长治久安,强大的基本科学是必须要的。没有基本科学的发展,就应用科学也发展不来。

我记得在四年前,我在Princeton高等研究所做教授,这也是杨志林教授做过事的一个地方,也是爱因斯坦在那边做过教授的地方。当时的所长就很自豪的说,他讲我们在高等研究院研究的是无用之学,这些无用之学在未来将成为社会的磐石,是国家的栋梁。现在的高等研究所的所长也写了一本书,就讲这个事情。

高等研究所第一所长叫Flexner,他1939年时候写过一篇很出名的文章,他的文章的名字叫做《无为之事的无所不为》。这篇文章指出,在19世纪的时候,法拉第跟麦克斯韦尔研究电磁学,不过是出于科学上的好奇心。接着,赫兹就发现了电磁波,但是科学家并不重视电磁在人类社会的应用,可他们的工作却成为人类社会上最重要的贡献,也是近代文明的一个最主要的贡献。

现在我来举几个例子,因为应用科研体制有很多,因为主办单位很关心几个方向,所以我这边就指出这几个方向,就是基本科学跟数学的应用。

我们晓得当今社会里边互联网跟计算机的能力,无远弗届,能力大得不得了。无论人员的分配,大数据的处理,道路的交通,仿真的神经元,蛋白质结构等种种问题,都要大量的提升计算的能力,没有计算能力,单从理论上是不够用的,因为理论还不能够有这个能力去了解。

但是这个能力有相当大的部分跟芯片有关。电子计算机的计算能力不断的增长,这30年来我们有所谓摩尔定理,讲每一年半计算机能力要增倍,这点是很值得佩服的,当年莫尔是英特尔的创办人,他晓得有能力。

但是你可能晓得,这个莫尔定律已经到了极限了,不可能再增长。所以未来的计算机的硬件的设计,要面临很大的问题。对付的方法一般来讲有两个,一个是利用基础物理的原理跟基本数学来大力的改革这个命题;另一方面是大力的改善软件,以及我们最好找到最好的算法,绕过硬件的速度跟储藏的能力来解决它。

我们来看第一个方法。

其实30年前,伟大的物理学家Richard Feynman,就提出来,他提出量子力学应用在计算方面的一个重大的想法。而当时其实Richard Feynman大概也没有很仔细的晓得要怎么做法,但是他晓得量子力学的基本原理是可以帮助计算的储存能力的。

但是一直到了20多年前,MIT有个应用数学家叫Peter Shor,他提出了一个算法,量子计算假如成功的话,利用Feynman的提议,做一个大整数的因子分解,这个很大的整数要怎么做因子分解。当然,我们在小学都学过因子分解,但是大数做因子分解是很困难的事情。我们现在基本上大部分的保密系统都是利用大数据分解困难这个问题来做的。

我们在大概1978年的时候,有个很出名的方法叫RSA的方法,RSA是由3个安全方面的专家发明的。他这个方法就是现在所有系统都用的一个方法。

但是Peter Shor发觉,假如量子计算成功的话,RSA的所有加密都可以被破解,因为量子计算是一个能力呈指数增长的的一个方法。所以量子计算严重的威胁到现在通用的保密方法。所以很多国家的政府官员,军事主管跟银行监控部门都在担心,所以他们投入了大量的资源来发展量子计算研究。

这个研究需要大量的数学家,物理学家跟工程师的合作。刚才我讲Richard Feynman是著名的物理学家,Peter Shor是一个数学家,当然还有很多工程师要将它完成。

美国名校里边有很多教授都在做这方面的研究,MIT也有,Stanford也有,哈佛也有。在实验方面每个公司投入的量是很大。包括IBM,google,微软这些公司。

IBM在这边投入了几十年了,现在有1300个工程师在做这方面的研究。今年google最近前几个月就宣布他们发展成功一个很重要的事情。

所以去年美国通过National Quantum Initiatives(NQI)的方案,很多智库跟政府官员都认为量子计算机,就像第二次世界大战的曼哈顿计划一样,关系到国家的安全,一定要发动整个政府去全力的支持。所以也是个很重要的一个发展的方向。今年IBM,刚才讲的,就提出了五十个qubit(注:qubit是量子计算中最小的存储单位,相当于普通计算机中的bit的概念。)的计算机,可以通过云端使用。

最近NASA宣布,google可以通过量子计算站200秒内解决世界最快的超级计算机1万年才能够解决的问题。就是讲它可以两秒内解决一些(通常)要计算很久很久的问题。

中国学者跟中国的公司也在做这方面的工作。但是,在物理在基本物理跟基本数学上,我们的水平比不上美国。所以估计,(中国在)量子计算在这方面的研发要落后(于美国)。我们需要大量的投资,而大量投资要包括很多基础科学家,数学家,物理学家跟种种不同的学科联合在一起。

这是个很重要的启发,就是讲我们投资不能够看四年,五年,甚至要20年,因为美国IBM投资在量子计算至今至少20多年,我跟他们蛮熟的。

第二个方案的解决方法,就是利用数学发展出来方法。现在我们在这方面研究,重要的有人工智能跟大数据,大都晓得的事情。

人工智能已经从刚开始的理念,30年前大家都不看好人工智能的发展,现在慢慢转化成认为可应用的技术。这个领域近期的蓬勃的发展,基于有好几个因素。一个是互联网技术带来的大数据,利用深度学习的标准算法来处理数据。同时,超级计算机跟云计算的强大计算力,其中原来的数学理论没有什么很大的突破,最基本的方面。所以人工智能的成功还没有好好地这个了解清楚。这也是这个领域里边存在着很多樽颈(注:丘成桐先生习惯用樽颈表示瓶颈)的一个本源。

我们中国的人口规模是发展人工智能的优势,在应用人工智能技术方面积累了有很多很优秀的工作,发表的论文甚至比美国还要多,所以讲是在世界前沿的水平。但是,在基础理论跟算法创新方面,跟美国,跟英国行业一段的距离,所以我们要在人工智能核心技术上国际上领先,基础学问一定要突破,一定要将我们的数学跟有关的学问一同地发展,才能够真真正正的领先突破。

因为人工智能对大数据的处理,本质上是数学中的统计学,原来目前还没有完备的数学理论,用来支持大数据分析的结果。很多觉得很奇妙,但是我们不晓得为什么这么奇妙。很多数学方法还是相当原始,过度依赖于经验的总结,而非真正来自数学的结构,这是人工智能里边的。

这也导致了当下人工智能的处理大数据问题,还需要大量的人力跟算力,甚至需要超级计算机的协作。由于缺乏数学理论的支持,很多大数据分析的结果只适用于特定环境,缺乏迁移性。大数据还缺乏有效的算法,经典计算机的算法还不能够直接用到大数据中。所以这是很重要的一个问题,我们要了解的。

广为流传的深度学习有很多不足的地方,大样品的依赖,依赖很多大样品,同时解释性很差,同时容易受到欺骗。当前没有很好的算法来代替它。

要解决这些问题,是要对相关数学理论进行深入的研究,了解大数据里边的数学结构跟原理。

目前的人工智能由于计算机速度的限制,只能够采取多层状结构解决问题。这些问题,基于简单数学分析,而非真正的Boltzman Machine(注:玻尔兹曼机,随机神经网络和递归神经网络的一种),无法有效地找出最优解。

所以在可见的将来,如何提升量子计算机的硬件,发展更有效的数学算法,让量子人工智能与量子深度学习变成实用的工具,实在有赖于基础科学跟数学的深度合作。

我们在国外跟国内都在努力,将基本数学放进去。我自己几年来跟我的学生顾险峰,跟几个朋友,也发现有很多我们从前没有想到的基本科学,可以用在这个方面去。有些是我十多年前在微分几何上的工作,可以运用到人工智能的理论研究下。

从这个方面可以看看得出来,基础数学在工程上确实是很重要的。机器学习和人工智能这种先进的计算方法,即使在零售业跟娱乐领域带来了显着的突破。解决方法也应当对医学,卫生保健业等产生深远的影响。

全球的卫生保健条件,包括美国,中国,都着手在临床信息数字化。可是对于和分析跟应用这些信息却还没有很好的策略。

未来十年,数据科学跟人工智能对医学的贡献可能超过其他所有技术的总和。人工智能跟数据数学的医学研究会变成医学跟卫生保健一个新的领域。哈佛大学医学院院长跟我谈,他们期望在未来这几年投入10亿到5亿美金的科研(资金),研究人工智能在医学的研究,所以全世界都很重视的一个领域。所以在崭新的领域里边,数学跟计算数学将成为更广泛的医疗决策提供支持。目前很多医疗系统研究人员还没有意识到这一点,或者低估了这个影响。

我们希望将最先进的计算技术应用大型的医学相关的数据库,得到有效的形式,并将之应用到医疗服务,临床手段跟相关的医学研究里边。这将是一个很大规模的不同学科的联合起来的一种研究。我们要不同的学科一同共同的努力才能够完成,不是一个学科的科学家家就能够完成的。所以我觉得这是个很有意义的一个突破,整个世界的高科技的一个很重要的关键实践。

以人工智能临床诊断来做例子,中国拥有全世界最大的临床医疗数据库,这是很重要的事情,我们需要学习如何管理跟应用解释数据,通过计算科学跟人工智能,我们用全新的方法,利用解释数据,推动整个领域的发展。

我们可以利用机器学习模型,消化更大、更丰富的数据集,同时通过机器学习的结果,更重新审视传统的预测模型的准确性。同时我们还可以尝试在自然的状态下,改变额外的变量去提高模型的准确性。这种设置还允许进一步分析如何去对付新的技术的方法,让它做得更好。这都是需要很多数学的改进和应用。

所以目前人工智能跟数据科学的技术进行广泛地利用到临床诊断,手术指导,风险预测的不同的领域。在某些领域计算机诊断的准确甚至比医生还要高明,这是一个很大的进步,对临床影响深远。因为这个缘故,我们更要激发我们的科研人员,跟种种不同的基础科学家一同的合作。

我刚才讲了人工智能跟量子计算的重要性。其实,数学的应用多姿多彩,有很多不同的领域,走不同的方向。我这边大致上讲讲不同的方向有多少种。你在这边可以看得出来。基础数学要应用到不同的地方,各个不同的领域是很多,数据科学,张量大数据,人工智能,机器学习是刚才讲过的。数字优化,运筹学跟大规模的机器学习的应用。量子计算,刚才讲过的,量子算法在机器学习的应用。数值线性代数,矩阵计算都是很重要的事情。大规模的科学计算跟高性能的计算都是很重要的,在材料力学,在量子化学种种都是需要数学的发展。还有偏微分方程,用数字技术来找到它的解是一个很重要的事情。

这种种问题至少我可以找到20个不同的重要的方向,都对现在国家高科技的发展有很重要的支持的,这都是要基本科学来帮忙。后边还有数值逼近论,反问题的数值解决,一大堆,有二三十个不同的方向,我希望国内都能够发点功夫去支持。

但是坦白讲,我现在这边讲了20多个,后面还有一页,20多个不同的方向。中国在这些方面能够很有效的成功的只有几个。但是这些方向都是整个高科技社会里边最重要的要发展的事情。 .

2 comments
  1. 一種想法是使用類似Xbox的傳感器和便攜式攝錄機將物理環境轉換為虛擬現實。 目標將是探索環境,例如帶有傳感器的商店,該傳感器具有這兩個原理以及該接口的軟件。 將數據轉換為虛擬現實環境。 這有利於虛擬環境的生產,以用於將虛擬眼鏡或增強現實眼鏡用於將來的購買以及與虛擬環境的交互。 將Xbox傳感器與便攜式攝像機的顏色結合在一起的想法得以傳播。 我不知道是否可以將其放入手機配件中。 人工智能可以幫助我們產生虛擬現實。 也許將來,對於自學成才的人來說,學校用品將僅僅是增強眼鏡或虛擬現實眼鏡。 我一直在考慮為每種環境簡單地購買一些傳感器,並且我們將處於虛擬現實中,它具有許多功能,從付款到配件服裝畫畫定制環境到我自己的滿意。

  2. 通過連接工廠並將其產品提供給訪問虛擬世界的每個人,人工智能將對開發虛擬現實平台大有幫助。 好處是擁有一個新平台並提供所有產品以及更多更好的服務。 想像一下一個虛擬平台,上面有來自所有工廠的促銷活動隨時可以與您聯繫。 您可以在該平台上提供所有語言的同步機器翻譯視頻。 我們將能夠使用人工智能實時觀看所有國籍的視頻。 人工智能可以通過顯示其錯誤的特定練習來促進單個課程的發展,並通過在虛擬現實(3D)的所有知識領域中指導其命中率來促進他們的學習。 未來無時無刻不在。 我正在寫您管,這是一個具有人工智能的Google平台。 我還將在另一個Facebook平台instagram上寫,兩家公司都有人工智能,但是我不知道人工智能可以吸收內容的程度。 同時向人們傳播了一個誕生一個知道的未來創業公司的機會。 相信我會改變很多。 (由谷歌翻譯)

Comments are closed.