沈岙村 首页
胡晓明:计算,探索未知的价值


10月13日至16日,2016杭州云栖大会将在云栖小镇国际会议中心举行。10月13日上午,阿里云总裁胡晓明在主会的演讲全文如下。


胡晓明:感谢严台长,我特别感谢国家天文台对阿里云的信任。

1b9a08233d3c4a8e531c811ca662306598cd51db

从人类诞生开始,我们一直没有停止对于太空以及生命起源的探索,来看一组资料,在1969年,当阿波罗11号登月的时候,人类首次在月球行走和实地研究,1986年,当“挑战者”航天飞机爆炸,升空37秒爆炸,7名航天飞行员遇难的时候,这是人类宇航史上的一次悲剧,但这次悲剧也没有停止我们对于天空和人类生命起源的探索。1993年,以美国和俄罗斯为代表的共16个国家参与了研制国际空间站。

我们再来看,2009年正式开始探索火星计划,计划把人送上火星,去寻求另外一个星球的幸福。2014年,旅行者二号正式带来一张向宇宙致敬的一个唱片,向宇宙发出了人类的致意;同样也回收到了太空的信息,但这一段信息至今没有被解读,我们也很期待马总下一次能解读它。

2016年,中国国家的实力又进一步能够得到凸显,所以,载人航天的天宫二号发射成功,每一次成功的背后,我们看到的是科技的进步,但更重要的是看科技背后有大量的数据以及需要对计算能力的依赖,来看一下,自从人类开始探索星空以后,我们所有的对于计算能力的依赖。

这是我们在“二弹一星”的时候,对于所有计算能力的依赖是靠手摇式计算机,他们在如此的条件下创造了让中国美好的一个未来。

同样再看,每个人都有一部手机,当阿波罗登月的时候,我们用到的本身的计算能力是2.04兆,但今天任何人拿出一部手机来,我们主屏可以达到当阿波罗登月时候的1100倍,我们现在每一个人的手机拥有的计算量是2.2GHz,今天的计算能力是国家的能力,是一个行业得到突破的能力,我们在想,如果再过十年、二十年、三十年,当每个人所拥有的计算能力在被进一步释放的时候,人类的文明,我们的产业,我们的社会会发生什么样的变化。

我们再来看天文。这是国家天文台郭守敬望远镜,我们称为LOMOST,这也是国家天文台与阿里云一起合作的,在这个合作当中,我们LOMOST每一年产生的数据量是10TB,一个天文望远镜不断将数据采集下来,并存在服务器。但随着时间的推移,这是南极巡天的望远镜,我们看到所有的星空的照片,是由国家天文台从南极传输过来的,现在在南极巡天的望远镜是第一个全天候无人值守的望远镜,原来我们希望把南极的寻天望远镜的实时视频能够采集过来,但是很抱歉,我们试了很多次,这个望远镜现在被大雪盖住了镜头,所以我们不得不启用另外的望远镜,昨天通过天文望远镜拍下了星空的照片传输过来。南极巡天望远镜每个月产生的数据是10TB。

02382cd462dc0066f87c5d87573e0894265763a4

这是国家大口径全天巡视望远镜,每一天产生的数据量是10TB,背后依靠的是存储能力和计算能力。我们再来看,大家看到刚才的视频,FAST,也是全球目前唯一的一个500米口径的射电望远镜,足够领先到在太空可以探测137亿光年的声音,越弱小的东西它越能接收,它能够感受到地球以外的外星人的信息,甚至在宇航飞行器上任何一个小的芯片,在天空翱翔的时候就能够被感探到。现在整个FAST如果投产以后,意味着4小时将产生10TB的数据,是郭守敬望远镜一年的总量。背后我们可以得到今天对于天文本身的探测背后的数据,所有相关的数据采集,我们预计到2025年是250亿个TB。

fed66294814ecee5d3706017a5e54f695e712fd2

我给大家举一个例子,全世界现在每一天所产生的数据是250PB,如果将所有PB的数据刻在一个光盘上,大概有多少光盘?从月球到地球的量,正好是光盘的量,也就是说到2025年,一年所产生的本身的星球宇宙相关的数据量,如果用光盘刻起来,我们可以累到从地球到月球10万次,用这样的量才能去覆盖250亿TB,谁能解决这些数据的计算?单靠原来独立本身的服务器根本不够,必须要用到云计算,甚至未来用到量子计算,我们必须要用到更大量的本身的分布式计算的存储。

阿里云现在对于数据密集型的产业,我们对它进行了很多的科研,比如我们跟国家天文台的合作,比如跟地震局,我们也是第一次跟地震局合作,对于地震局本身的数据进行噪声关联性的定量的本身的分析,通过本身的数据分析,我们可以将原来单纯需要一个量的本身的计算量需要一年,我们可以将它缩短到几天。

同样,我们对于生命科学的数据也在产生计算,华大基因产生的数据原来需要几个月的计算,由于今天有阿里云,由于我们的计算量,我们可以在一天到两天到23对碱基因的基因测序完成。同样在浙江,我们跟浙江大学的数据研究院,浙江大学第一附属医院对甲状腺癌进行计算,从甲状腺癌判断的准确率可以从64%提升到84%,这是非常大的突破。

同样,去年跟中国科学院发布了量子计算研究项目,通过硅晶体本身的计算已经不能满足未来的本身十年、二十年本身的计算,需要通过量子科学。今天的计算不单纯是一个企业的事情,更是一个国家的事情,更是一个行业的事情,更是一个人类的事情。

这一次我们跟国家天文台,我非常感谢跟严俊台长的合作,志同道合,走到一起。我们希望把银河系结构的LAMOST的数据和今天去探测宇宙深处声音的FAST以及探月工程以及深空的探测对太阳系本身数据本身的研究,共同构建网上的天文台。

对于这些数据进行全生命周期的数据管理,同时要打造这些数据的共享和开放平台。我们希望将阿里云的海量存储、计算能力、人工智能能力跟天文技术合在一起,去解决人类有可能20年、30年,甚至50年以后,我们跟宇宙的关系,我们去解决和探求生命的起源。

所以,这一次我们不仅仅是一次合作,我们更把它看成是共享经济,所以这一次关于国家天文台的中国的望远镜加上阿里云所代表的中国的计算能力,再加上我们对互联网的信仰,这三个结合起来,我们希望把中国的能力、中国的科技能力变成全世界的能力,变成全世界本身的科技能力,共同去造福人类。

同时,我们也希望这一次跟国家天文台将这一些数据通过互联网,能够分享给全世界本身的天文爱好者,我们也希望未来全世界的中小学生都能够通过互联网去使用大家可以看到的FAST的,可以使用刚才在内蒙古的这些望远镜,他们可以近距离地去感受宇宙,近距离地去“触摸”到银河系。

今天是第七届云栖大会,我也为云栖大会做一个广告,今天晚上有我们的音乐节,明天我们有云栖夜跑,我希望给所有的在线的开发者,科技开发者,包括在场的人讲,今天我们不仅仅有代码,我们更希望让我们的开发者有音乐,有生活,我们更希望我们的开发者,今天不仅仅有了代码,有了音乐,我们更希望这些开发者能关注自己的健康,关注自己的家庭,关注自己的生命,所以云栖大会希望“三位一体”,有代码,有音乐,也有健康。