会议时间:2017年6月30日,9:30 - 17:00
会议地点:嘉里中心大酒店大宴会厅
【大会介绍】:2017联想全球超算峰会(2017 Lenovo HPC Summit)将于6月30日在北京嘉里中心大酒店隆重召开。在此,我们诚邀您参与此次盛会。届时,联想将发布高性能计算解决方案白皮书,全新的HPC集群深腾8810,以及LiCO+AI智能超算平台。同时,基于在HPC领域的深厚积累,联想还将与您分享人工智能时代技术创新蓝图,以及联想在人工智能领域的布局。
【嘉宾】:童夫尧
【观点】:老童:联想以91套的份额,在2017 TOP 500榜单中继续保持中国市场第一、全球第二的位置,而在中国,有超过100家客户选择了联想,联想HPC的实力有目共睹。目前,人工智能是热点话题,全球和中国市场的潜力巨大。计算、算法和数据是人工智能的三大基础,而HPC,恰恰是提供强大计算力的最佳平台。作为中国第一、全球第二的HPC厂商,联想不断加大对人工智能的研发和投资,帮助客户实现智慧化转型。联想发挥自身产品、团队和生态优势,集合性能优异的x86服务器产品和今天新发布的深腾8810及HPC+AI智能超算平台LiCO,依托美国莫里斯维尔、德国斯图加特以及中国北京的三大AI创新中心和专业的AI专家团队,加上不断完善的囊括硬件、软件和应用的HPC+AI产业联盟,为客户打造符合AI发展趋势和智能业务发展需求的HPC基础设施和业务场景。
【嘉宾】:孙凝晖
【观点】:童总、陈院士,各位嘉宾上午好!非常高兴能够参加联想一年一度的超算峰会,我连续几年都来参加这个峰会,一个原因是联想无论是跟计算所还是高性能计算的专业委员会都是长期的合作关系,童总介绍联想一年取得的成绩,我也为联想取得的成绩感到由衷高兴。联想也成为在国际上第一梯队的超算企业,也在很多新的应用,包括AI和互联网新的应用取得了非常好的进展。
       我刚才在底下看到我这20多年在高性能计算领域的老朋友,也代表着超算发展的几个步伐吧。刚才跟朱老师握手的时候,我们大概20多年前就是要把并行计算引到超算里,解决科技计算重要的问题,一晃20多年过去了。又碰到赖总,我们好多年都没见了,石油领域著名的赖总,他告诉我现在在BGP领域,数据存储投资已经超过了计算的投资,跟赖总过去的合作是把国产超算带到了我们国家重要的行业领域,这是第二个非常重要的阶段。陈院士跟我说他现在做的生物领域的工作,陈院士把我们超算带到了数据的领域,以前我们只是用来计算解决问题,现在更多的是要通过数据来解决这个问题,所以我想我们跟这些老朋友见面也反映了超算高性能计算发展的深度和广度。
       我自己从事的高性能计算一直觉得怎么把高性能计算做得更加通用,应用地更广,是我努力奋斗的目标,也只有应用更广才有从传统的阳春白雪的超算变成今天的产业,能支持我们很多的企业发展,甚至走向了世界。
       我自己有一点不成熟的看法,就是高性能计算可能在未来会向三个纬度发展,我把它叫算得快、算得多和算得稳。
       我们超算传统就是要算得快,现在国家高性能计算的发展,从P到100P到1000,1个亿的发展,计算的算力要求是无止境的,对计算力的要求还会发展。所以我们国家才会研制1000P高性能计算,这是永远的纬度。
       第二个是经常说的,现在最热的还是算得多的纬度,这个多首先是因为数据多,我刚才也说了我就很吃惊,以前知道互联网的数据非常大,主要靠数据的采集和处理来获得收益的,现在连传统计算密集的石油勘探领域数据量已经达到几十P的量,对数据的投资和对数据的运算也超过了对传统计算的收益。最近科学院在制定新的发展规划的时候,国家建设三个科学中心,上海、合肥和怀柔科学中心。这三个科学中心非常重要的一点就是要有大型的科学装置,不仅是传统的天文望远镜,还有生物领域观察的设备,我们对地球观察的设备,我们的物质科学的观察设备。这些大的科学装置都会产生大量的数据,让我们现在科学院最传统以科学发现为主都要转到数据驱动的科学发现。这里从计算机的设计来说,怎么解决数据的传输、移动和高效计算的问题,变得比纯粹的计算更加重要。所以,我理解AI虽然需要GPU很强的计算能力,它核心还是要解决数据处理的问题,把数据处理好才能产生更大的智能。所以让计算机如何算得多,算得更加好是第二个非常重要的发展方向。
       第三个算得稳,这个很少大家会听到计算机算得快,高性能就完了,为什么要算得稳。现在云计算和物联网发展应用特征需要计算用户质量要更好保障,就像云计算需要更好的资源利用率,需要有更好的用户体验,对资源的可靠的服务要求更高。物联网应用,智能车等等这些对延迟的要求更加苛刻。所以计算的负载保证用户任务完成时间上要求更稳定的供给,就跟电力一样,不能用电多电灯就忽明忽暗了。所以如何在计算在负载剧烈变化的情况下,负载的类型多样的情况下,能够保证资源利用率,保证用户体验的稳定,算得稳也是高性能计算非常重要的发展方向。
       所以可以看出,这三个纬度把超算和高性能计算空间撑得很大,我们无论做科学研究还是做企业都会有更大的发展空间,所以我也期待着高性能计算机明天更好,也祝愿联想在未来能有更大的成就,有更好的发展空间。
       谢谢大家!
【嘉宾】:陈润生
【观点】:尊敬的各位专家,各位领导,我非常荣幸能够参加这次联想的全球峰会,让我非常激动的是,我见过很多跟刚才孙所长说的一样,能够有机会看到很多老朋友。刚才我们坐在一起的时候,一起回忆过当年我们当年带着一团纸袋去做读入程序,用自行车推着一大堆的卡片的时代。短短的30多年,目前是万亿计算机的发展,让我特别感慨。今天我来参加这个峰会,重新提起人工智能,我记得80年代我们就在祝明发博士的机器里用神经网络数学模型计算过生物学问题,在新的计算机快速发展的时候,包括一些方法的改进,我们的AI又重新为我们提出更好的有用的工具。
       我今天想跟大家介绍的是我从事的另外一个,也是发展非常快的领域,就是精准医学领域。占用大家一点时间,我的想法是当一个快速发展的领域和另外一个快速发展领域,如果能够结合、融合,碰撞出一些火花的时候,也许它所创造的价值是不一样的,我今天利用这个机会来介绍大数据和精准医学方面的情况,既希望得到关于计算机发展提供的技术方法,另外也希望能够找到一些快速发展领域当中的融合。
       我今天要讲的是“大数据和精准医学”。大家知道,在2015年1月20号美国总统奥巴马第一次提到了作为国家的规划,美国要在2015年开展精准医学研究。从此,精准医学就成为当前生物医学领域当中的一个非常重要的事件。我们在当代的生物学中出现了一个非常重要的,划时代的变革,就是人。在我们这个年代,能够精确的测量自己的遗传密码,我相信是人类科学史上的重大事件。在我们的先辈们不可能用技术测量自己的遗传密码,而我们的后代已经非常容易的事了。测量自己的遗传密码之后,就可以在分子水平上认识生长发育跟疾病的关系,使得我们对于生物医学引导出划时代的,前所未有的变化。
       精准医学的核心是什么?精准医学的核心,我们可以用一句话,就是以遗传密码为代表的这些大数据应用到医学,特别是临床医学当中来。所以,在当前整个生物医学研究进入了大数据时代,它将充分依赖于智能计算的发展。随着精准医学的发展,我们可以看到为什么精准医学可以引起各国领导人,很多企业家的重视,精准医学不仅仅是字面上的含义,能够提高临床医学的诊断治疗的某些疗效,提高几个百分点,而更重要的是精准医学能够在本质上带来一些概念上的变化。我们认为精准医学可以使整个医疗体系的概念发生变化,也就是说使得医疗体系从当前以诊断治疗为主,过渡到未来的以健康保证为主。现在的医疗面对的是病人,而治疗的核心是医院和医生。那么也就是说它是面对病人的,而随着精准医学的发展,随着大数据的出现和解析,未来的医疗体系将是面对全民的,是面对每一个人的整个生命过程的,从他出生一直到死亡,整个过程的每一个人,都可以通过测量和监控组学数据,包括遗传密码,能够评估健康状况。在评估的基础上,提出合适的干预方案,使得有些疾病不发生或者延缓发生,保证非常好的生活质量。这样一个状态,精准医学的状态和现在治疗的状态是完全不同的,所以精准医学之所以引起人们的重视,它带有根本性的意义,是使得整个医疗体系发生根本变化,使得从现在的诊断治疗过渡到未来的健康保证。
       在这样的概念变化下,一定会推动以精准医学概念推动的新的产业的出现和发展。有人估计,到2018年,以精准医学所带动的新的产业的规模可以到2000亿美金。我们知道中国科学院最近又做了一个评估,估计到2020年相应的产业规模可以到1.89万亿美金,这样一个产业由大数据所推动的,当然是一个值得重视的。
        很多评论认为精准医学的研究已经是新一轮国家科技竞争和引领国际潮流的战略制高点。美国也在推动精准医学计划,核心是要测100万自然人的遗传密码,这个数据的量是非常大的。欧盟也在推动精准医学计划,准备要测10万个肿瘤和罕见病的病人,对肿瘤的分子水平的病因提供前所未有的新的发现。 日本也在推动自己的精准医学计划。
       我们认为精准医学至少在如下四个方面会引领新的产业发展:
       第一,促进海量的生物样本库和数据库的发展,会推动百万量级的组学数据的数据库的产生和出现。
       第二,以基因组测序为龙头的,包括其他遗传密码的测量的发展。在上世纪90年代,测量一个人的遗传密码需要30亿美金,15年的时间。而现在测量一个人的遗传密码只用三天的时间,5000块人民币,估计两三年之内只需要3-5小时就可以,花费600-700人民币。所以,大家可以想象在未来的两三年之内,每个人都可以拿着自己的遗传密码,到那个时候,医院医生的压力,计算科学家的压力就大了,每个人都让我们来看看他哪点健康,哪点不健康。我在这个领域工作,你们大家很快就会看到这个情景,每个人都拿着自己的遗传密码去找答案,这会成为两三年内就出现的情景。既是一个很好的创新的机会,既是一个很好的产业,也是迫于眉睫,必须解决大数据处理的问题。这个问题关乎到人类的健康,关系到整个医疗产业的发展。当然,新的产业还包括新的疾病诊断的分子标记,包括新的药物设计靶点的发现,也涉及到精准医学相关的产业发展。我们国家的精准医学发展的目标和国际是一样的,国家正在投资,经过两期的国家级项目的招标,大约目前已经投资了20亿人民币,设立了70几个项目,这个东西还在不断推进过程当中。
       第三,实现精准医学,要有哪些基础?这两个基础大大依赖于计算科学的发展,依赖于人工智能的介入。第一个,我们是依赖于组学数据的发展,这个组学数据的发展实际上主要困难不是组学数据的获取,而是组学数据的挖掘。一个人就3X10的9次方,怎么挖掘出生物学医学的含义,其实是计算科学领域,是大规模计算所面临的必须要帮助我们来解决的问题。只有大规模的组学数据的挖掘,才能获取跟疾病相关的知识。有了这样的知识,才能微观上掌握和疾病相关的信息。第二个,我们就需要把微观上发现跟疾病相关的变异和宏观疾病之间发生关联,同样需要大规模的,包括生物信息学,生物网络,系统生物学的很多方法。而这些方法,大家离不开整个智能计算所发展的方法,技术,理论和工具。
       第四,既然精准医学是一个很新的,发展非常快的,关系到每个人健康的领域,现在发展到什么样的阶段?我们还有多少机会?现在精准医学才刚刚上路,为什么?因为要实现健康保证,从组学出发,目前看来,还面临着重大挑战,还面临着重大的困难。由于时间关系,我只举一两点。
       我想介绍一下在组学数据本身所面临的困难和挑战。我们的遗传密码3X10的9次方,每个人都有一份,未来很容易测,大约几个小时,几百块钱就测完了。但是要想做到精准,就必须解读这个密码,这个密码目前为止我们解读到什么程度?在座的可能不太了解,我告诉大家,目前全世界生命科学家的智慧,这个密码能够从规律上解读的部分不超过3%,这3%就是所谓编码蛋白质部分的遗传密码,这也是我们从中学就了解的,遵守所谓中心法则的部分。而另外的遗传密码,就是97%的部分,迄今为止,我们并没有解读。没有解读的情况下,当然,它跟生长发育疾病的关系就无从谈起,它有了变化不知道怎么用。今天看到了肿瘤,治也治不好,很大原因是我们的分子基础大部分其实并不了解。下面举一两个例子说明,很多重要疾病,包括肿瘤是来自我们没有解读的部分。那个时候如果由于它的变化而导致肿瘤,即使找不到病因,也无从下手去治疗。
       2017年7月17号有资料显示,可以充分阐述刚才的命题。人类遗传密码中,说得更加具有严酷性,只有1.5%的遗传密码是能解读的,但是我们说的范围宽广一点,也不超过3%。第二部分是大数据带来的挑战,一个人的遗传密码就有3X10的9次方,大数据的挑战是非常严酷的。从数据源来看,它是大数据,毫无疑问,但是这个数据源还有一些特点。一个是增速非常快,因为由于测量技术的发展,现在每时每刻都有T,甚至P数量级的组学数据涌入到这个平台上。我们还没有来得及处理这个数据,而下一个比它量更多的数据就已经来了。同时,这个数据从数据源来讲,它是一个信噪比不是很好的,往往带有缺失值。我们的遗传密码,由于各种原因总是测不全。从样品端来讲,虽然我们要了解的体系自由度如此多,数量如此之大,但是当你要解决肿瘤问题的时候,你所获得的真实样品却很小。在这种情况下,我们面临着大变量,小样本的问题,这依然是给我们如何去解决这样一个问题,如何去做数学处理,如何建模,提出了非常严酷的问题。比如解决肿瘤问题,心脑血管问题,变异位点是非常多的。在这种情况下,需要我们发挥智能计算的特点,在小样本的情况下挖掘出足够有用的知识。同时,我们知道由于病人本身位点是离散的,所以还出现了和疾病相关的位点离散分布的特点,使得有效样本更加不均匀。如何解决在分子水平上共同的疾病,找到共同的变化,带来一些科学哲学性的讨论,依然是非常困难的。
       不仅仅是在孤立基因的水平上,我们知道要解决生命疾病的问题,每一个基因不是孤立的,是相互以网络来联系的。这就是复杂的跟疾病相关的网络,这些网络本身是动态的,因为生命是活的,而所有相互作用不像物理当中的标量,同时原件不仅仅是蛋白,还有核算,至少这个网络的节点是双色的。而且,所有的节点之间的相互作用,很大程度上是非线性。对于动态,有向,多色,非线性的网络,如何来定量的解读,也是我们亟待需要解决的数据处理问题。当然,在下一个层次上,遇到的将是高度异质化数据的整合问题,还要做核磁,CT等等。如何能够在同一个平台上进行整合,依然是非常复杂的问题。
       最后数据共享的问题,在整个医疗系统当中,每一个医院,每一个医疗单位,每个大学都有自己的数据,但是迄今为止,所有数据没有实现共享。在这样一个背景下,我们在大数据时代,研究小数据的生物医学问题,当然这就会大大的抑制了大量资源的共享和利用。所以,目前来看,虽然精准医学提供了非常美好的前景,将对人类的健康产生变革性的影响,但是到目前为止,我们还是刚刚开始,我们遇到了大量的有关大数据处理的计算问题,这些计算问题我们希望能够在智能计算发展的情况下,能够得到答案,为人类的健康的服务。
【嘉宾】:黄莹
【观点】:各位上午好!很高兴有机会在这里跟大家讲讲我们对于AI的一些看法和理解,但更专注要分享的是AI除了讲很多应用以外,还有很重要的一点就是AI计算基础架构到底怎么回事儿,有没有一个更好的,因为今天是超算的峰会,所以希望能够让大家一起探讨这样的问题,就是在AI计算架构上有没有什么可以做的事情。这块我们也会把联想做的工作跟大家分享一下。
       在上个月柯洁和AlphaGo有比赛,0:3失败了,这个事情去年韩国李世石已经败了,而且中间的差距是很大的,这只是去年开始AI现象被大家认识到不仅仅是下围棋,我们生活、社会各个方面可能都会有很大的影响,由此引出了AI所有的又一次所谓的高潮。
       看一下最近麦肯锡一次报告,罗列了2016年全球对AI这方面投资达到了260-390亿美金,而这里投资的分布机器学习、深度学习或者其它形式的机器学习占到了接近于60%,其它的应用,包括自然语言理解、计算机视觉等等占的比例相对比较少。也就说明,在这次AI的兴起是直接和深度学习的发展有很大的关系。
       还有一个现象在这个报告里提到的,除了一些领先的科技企业以外,真正的AI还是处于早期的试验阶段,也就是说大部分的企业还在摸索,还想知道AI到底该做什么,能够做什么。
       所以,在AI早期采用者和大部分的企业和研究单位,中间还有比较大的鸿沟。这样的话,就给了我们做计算行业的研究人员或者说我们的从业者,就有这样一个挑战,就是怎样能够把这个鸿沟缩小,所以我们就真正要找到一些好的AI的应用场景、商业价值,最后能够把这个计算方面资源很好地提供给我们的用户,最后让我们的用户能够真正把AI、深度学习这样的东西使用起来,在他们各自行业里找到真正有价值的应用。
       回过来再看AlphaGo是什么样的故事,在《自然》杂志,这是国际上很有名的,学术地位很高的杂志,DeepMind在《自然》上把AlphaGo做了表述,算法上有很大的创新,这里的创新主要还在于怎么样用好,不仅仅把深度学习直接用进去,而是针对围棋这样一个计算是很难的问题,怎么样能够用计算机不仅仅靠搜索、和它强大的计算资源,而是怎么样把它的算法变成所谓的策略网络,这个策略网络是基于全局特征加上深度的卷积网络实现的,第二步对它进行所谓的增强学习,增强学习是跟深度学习不一样的一种算法,而增强学习主要的能力就能够从一些蛛丝马迹里,计算机自己能够找到一些特征点,而且能够找到增强的策略网络,最后还可以进行价值网络的判断,说下一个棋子下去以后到底赢的概率是什么样。这样三步在离线的时候计算机已经做了很多的计算,在线的时候用一个搜索数进行减少搜索的空间,这也是很关键的,这在算法上AlphaGo、DeepMind和谷歌已经做了很多的创新。仅仅棋谱算的时候用了过去三万很成功的案例,过程当中让计算机和左脑、右脑进行相互的比拼。第三点强大的计算力,谷歌专门为AlphaGo设计了一个TPU(Tensor Process Unit) + GPU组成集群,只有这样才能最后打拼的时候跟上节奏。除了刚才说算法的创新,还有计算量怎么样能够处理这样的大数据,还有计算力上面也做了很大的创新。
       AlphaGo算了以后,DeepMind就把这个算法用到了很有价值的应用里,第一,谷歌的计算中心。谷歌的计算中心很大的,全球都有,而计算中心里的最大挑战就是用电量很多,所以用深度学习、增强学习算法在一些实验室里面表明能达到省电40%的效果,这是很大的成果。计算中心里面很大的挑战就是用电,如果能够省40%就意味着很大的花费就能省掉了。
       第二,医疗领域里AlphaGo也做了很大胆的尝试,在糖尿病人,很多糖尿病人最后会失盲,这件事是可以被预测的,预测在过去的有经验的医生预测的能力最多就能达到10%左右,而这是很低的,10人里1人可以预测出来,如果早期做治疗的话这些是可以被治疗的。通过AlphaGo的算法可以达到90%以上的准确率,这也是很大的成果。如果看AI或者AlphaGo这样的案例来看,它不仅有算法的创新,也有大数据量很好的处理,很强的计算力,最后很好的成果。
       AI不仅仅是下围棋,而是商业上、计算上有很大很大的奥秘。AI要成功有四大要素,我们称之为ABCD。A就是算法上的创新。B就是商业方面要有定向,在AI怎么样能够应用好。C就是计算力,后面要跟着GPU、CPU、TPU,怎么样更好结合起来进行AI。D就是数据,怎么样把数据更好处理好,真正做好。AI成功要素就是这四方面。
       我们来看一下AI成因,算法是很重要的一个方面,从AlphaGo也看到算法的重要。计算engine上,Nividia走在前面。TensorFlow、Caffe、Torch等比较领先。
       第二个,数据要很好进行处理。因为现在的数据,刚才几位也提到了,数据是一个大数据,因为它是从我们的传感器、终端设备各个方面传来的,数据上要进行很好的处理。
       最后是算力,怎么样能够在TPU、GPU和FPGA等加速器上很好进行组合。如果我们来看算法,现在在业界已经有不少的所谓开源学习的框架,但是如果作为算法工程师讲起来并不能完全拿算法直接来用,还要进行并行化处理。HPC专家很清楚了,算法拿来以后怎么样能够并行化处理之后,才能把一些模型真正在GPU上算好。数据也是一样的,大数据来了以后怎么样进行很好的存储,怎么样把数据调用出来,而且用统一的方式在TPU或者GPU集群里算好。
       到了计算力这块问题就更大了,因为我们的GPU或者TPU或者FPGA不完全跟上面的算法完全匹配,要靠人做很多的调优才能把GPU集群真正用好,这也是我们必须面对的挑战。
       在不同的算力,像GPU已经有多种,而且不断发展,目前主流的计算都是用GPU来算的。CPU这块,特别是因特尔也很着急,它也在奋起直追,它下一代想做得更好,包括Phi计算芯片。FPGA也有它的优势,因为它比较省电,而且比较专业,在某一个方面上可以做的更加专业。最后是ASIC,业界还有不少TPU的尝试,中科院计算所做的寒武纪、地平线做的地平线等等的。这四方面的计算力最终对于整个AI计算都会有很大的帮助。
       如果来看GPU进行深度学习训练,很重要就是怎么做并行化。谷歌做翻译训练的时候,一般的训练要在12台带8个GPU机器上算一周,但如果我没有这么好的集群,如果只有在一台8个GPU上就要算三个月。但是如果只有一个GPU的机器就要算两年,这是基本不可能的事情。我们来看一下如果一个GPU上算,一个AI专家一般就能搞定,但是算的时间会很长。但是如果我们是单个机器上多个GPU来算,做小规模的尝试是可以的,这个时候就需要AI再加上分布式计算专家,就是HPC专家,怎么样能够把一个模型并行化处理。如果我们要做集群出来,所谓多GPU、多服务器的情况,就可以做大型、中型的计算。这时候既需要AI专家、分布式计算专家、网络、存储工程师,这就变成一群专家在一起工作了,不是简简单单单独的事情了。
       所以深度学习的训练对于计算和系统专业人员就导致了AI产生刚才说的鸿沟,因为一般的企业和一般的研究所没有这么多专家在一起做这样的事情。
       童总刚才提到了联想这块已经开始做一些尝试了,我们也有很多AI专家,但是同时我们也把业界合作伙伴的,包括GPU、CPU、Phi各种硬件放在一起,然后上面做了软件一层,这一层做什么事情呢?就能够可以比较快地让各种各样不同的计算框架做并行化处理,能够在这些硬件上很有效地跑起来。我们也有一个很好的大数据平台,就可以对各种各样不同AI应用做很好的处理,这时候就不需要很多的专家自己发觉怎么样进行这样大规模的运算,怎么样进行GPU分布式运算等等。所以联想的AI训练平台就能够帮助很多的企业也好,或者说大学也好,研究所也好,人工给它做一个处理。
       我们也把刚才讲的框架架在联想一套服务器上,做成一体的系统就是软硬结合,真正给用户带来很快速进入到AI深度学习的环境里,而不需要从头开始摸索做自己的工作。
       这里一些加速比也是业界比较领先的,大概达到90%左右,联想我们现在能够达到已经达到97%,而且是可以支持大规模集群,不是一两台服务器上,而是在几十太服务器带很多GPU情况下可以做这样的。这相当于是可以快速让大家很快进入到进行AI的环境里。
       我们所做的事情刚才提到很多的难点,能够让它变成比较简单化的,把一个多机分布式的训练变成单机GPU简单的环境里,这样的机器相当于能够把一个复杂的问题简单化,或者是把一个专业的问题变成相对比较普通的问题。
       联想在AI方面已经做了一些尝试,包括联想门店里采到很多图像数据,有了这些数据以后,用了深度学习的一体系统的环境,能够看到有多少人进来,访问的区域在哪个区域,店里路线怎么样的,今后还会来判断性别、年龄,可以把门店做更好安排,更好服务我们的客户。
       智慧医疗方面也跟国内的北京和其它的一些大型医院做尝试,比如说拿到CT的图像以后怎么样对它进行深度学习判断出哪些地方可能会是早期癌症病人,我们要做什么样的事情。所有事情也是图像识别,但是同时也是深度学习一体系统里做,最后能够更快帮助医生判断出来。
       如果回到AI的ABCD来讲,这四个方面联想都做了不少尝试,包括算法上还有自然语言处理方面也做了很大规模尝试,所有外面能够看到的网页上的评论,我们都采回来。包括国内京东、淘宝、微博等等的评论采回来,国际上亚马逊全球英文都采回来,准确率已经达到90%以上。
        第二,行业方面也做了不少尝试。联想本身就是很大的行业,因为我们的设备有上亿台出去了,怎么把这些智能化。在垂直行业里,医疗、教育等等很多合作项目进行各方面的尝试。
       计算方面联想作为超算领先的有很好的设备,同时加上刚才提到软件的平台,可以算力提高,我们不仅是GPU,对FPGA、Phi等等的也会对它进行支持。
       最后是数据,我们自己的大数据的平台也在业界有很好的尝试,不仅联想自己用,也在个业界其它伙伴做。
        希望我们有更多跟不管是专家、业界其它企业也好,有更多的合作。
       谢谢大家!
【嘉宾】:Luigi Brochard
【观点】:诸位上午好,非常高兴能够来到北京,我已经看到了一些熟悉的面孔,这也说明我是一个北京的老朋友。今天为大家介绍一下联想在高性能计算和人工智能方面所做的一些事情。我是联想在高性能计算和人工智能方面的高级总监,我们在人工智能方面做了很多研究,接下来我会为大家介绍一下我们都做了哪些工作。
       首先,第一部分内容主要是联想在高性能计算方面的地位,主要包括过去两年所做的工作。第二部分是上周我们刚刚发布的ThinkSystem产品。第三部分将介绍一下人工智能,以及我们如何帮助大家解决人工智能的问题。
       首先来看一下高性能计算。我们在全球安装了很多套高性能系统,美国一些知名大学,如麻省理工、加州理工、哈佛等,都安装了我们这套系统。在英国,全球最大的天体物理计算机也使用我们的机器。还有德国,在德国莱布尼斯超级计算中心我们做了全球第一个温水冷却系统。去年我们发布了AI系统,同时我们还在澳大利亚也做最大的AI研究与训练系统。在马来西亚我们做了亚洲最大的水冷系统。在中国,我们也是最大高性能计算系统的提供者,我们为中国的大学提供技术供他们研究。北京大学是我们所做的第一个系统,我们对此感到非常骄傲。我刚才谈到了澳大利亚的研究系统,我们在全球已经有非常广泛的HPC的装机基础。巴塞罗那超算系统在全球TOP 500排名首位,我们能够在3450个SD530节点装配48个机架。Skylake8160使用的是下一代Xeon处理器,展现了联想卓越的技术和交付能力。
       上周我们在纽约发布了全新的产品,也就是ThinkSystem。它是一个全新设计的,基于至强处理器,可以实现服务器存储网络的全功能解决方案,它是面向未来的数据中心解决方案。SD530在巴塞罗那交付,是我们ThinkSystem家族成员。ThinkAgile是面向软件定义的基础架构,能够简化基础架构,系统安装方面也更加简便。除了有硬件之外,我们还有联想服务,帮助我们和客户在 IT 生命周期的每一个阶段建立信任关系。行业分析师对我们最新的机器评价都非常好,福布斯的新闻记者写到:“我认为这些变化是亮点,相信它将能够在未来为联想带来巨大的红利”。
       下面我们来谈一下人工智能。正如刚才我们谈到的,在人工智能方面一个巨大的进步,就是机器学习。机器学习分三步,也就是ABC。从数据开始,用数据去训练神经网络,我们有不同的技术和硬件,刚才王总已经解释过了,它是计算密集型任务。我们需要人工智能的专家来进行机器的培训。同时,也要选择不同的技术,可以是简单的CPU,GPU,或者是其他的系统,这是第二步,也是计算最密集型的。最后一部分是推理演绎部分。大家可以看到机器学习本身是非常复杂的,关键的问题是我们如何帮助企业更好地采用人工智能技术。
       我们看到在人工智能的应用方面,主要有这三个方面的障碍。第一就是数据,大量的数据,数据又分为结构化和非结构化。从存储的角度来说,我们可以在一个机架里存五个派字节的数据,还有大数据分析平台,我们相信可以用技术去解决大数据的问题。人工智能是一个全新的科学领域,有很多大学正在开始设立这个学科,人才的短缺是第二个障碍。还有第三个障碍,就是资源的问题,存储、计算等硬件需要各种各样的架构,执行起来非常复杂,还有一些软件用起来也很困难,这就是我们谈到的人工智能采用起来的三个障碍。
       我们将会在三个地方,美国莫里斯维尔、德国斯图加特和中国的北京,开放三个全球AI创新中心,我们会把最佳的基础设施放在这些创新中心,并且与我们的合作伙伴共同在这些中心开发新的解决方案。我们对于人工智能是一种合作的态度,我们将在这些创新中心提供基于ThinkSystem最好的硬件,以及我们刚才介绍的框架。我们也会为人工智能领域开发人员提供我们的工具,在这些创新中心,我们会提供很好的资源,比如联系人工智能方面的专家,还有最好的AI基础设施,以及快速入门工具。我们知道人工智能是一个非常复杂的过程,所以我们希望帮助大家来解决其中的困难。这些创新中心将在今年年底完成建设,正式启用。
       下面为大家介绍一下硬件软件的解决方面我们人工智能都做了哪些工作。首先来看一下硬件,我们使用不同的硬件,基于英伟达的GPU,还有Intel的至强,有SD530,SR650等等这些产品。可以加上GPU,同时针对下一代的架构,我们会有一个服务器来用于做训练。同时,我们还有使用GPU-FPGA,做视觉影像方面的处理。还有重要的一点,就是要把AI做得更加简单,我们几年之前在高性能计算方面也有同样的问题,LiCO是在中国开发出来的,针对的也是中国市场,我们把它做了全球化。LiCO能够帮助你去安装不同的组件,比如说Intel的Workflow GUI。目前,我们想在LiCO里面集成我们AI的框架,怎么做呢?第一步,我们要选择用哪一个框架,Caffe,Tensorflow等,然后对神经网络进行配置,可以通过简单的图形界面来实现。然后进行监视训练,最后进行准确性的验证。所有的界面都是图形的,去指导用户完成AI训练的流程。还有一部分是解决方案,我们要提供这样的一个AI参考架构,它是一个集成的系统,进行全面整合。当然也有硬件,比如网络、管理节点、推断节点、训练节点以及大数据节点。把LiCO放在上面,从而使得我们这个拼图变得完整。今年我们会有一些具体的行业实践,比如生命科学,医疗,教育,制造。在制造业,我们能够进行预测性故障的检测并提供维保服务,可以更好地知道哪些方面能够运用人工智能。
       最后说一下我们未来的展望。首先,要扩展我们的合作伙伴生态系统,联想不能单枪匹马低解决所有的问题,我们必须要和生态系统合作伙伴共同工作。新的AI研究中心,就是一个办法。同时,我们正在开展各种各样的工程投资和技术创新。最后,希望交付给客户端到端的AI特定解决方案和服务。谢谢!
【嘉宾】:Anders
【观点】:大家早上好!我叫Anders,我负责高性能计算、大数据解决方法,主要是在这个公司,我的公司叫维斯塔斯。刚才前面这位嘉宾谈到了ACD,我想更多讲B,也就是商业应用方面。首先讲讲过去十年我们走过的历程,我们的业务从HPC、大数据方面走过的路程。介绍一下我工作的公司,在座多少熟悉Vestas风力系统?谁都不知道,好吧。Vestas是最大的风机可再生能源,通过世界上最大的生产厂商,我们大概占世界全球市场份额20%,我们有差不多2万员工。目前安装世界各国安装了6万的风机,这些方面不断由Vestas监控这些风机的表现。
       下一个问题是我们为什么要做这些,为什么一个公司必须投资于巨大的HPC和大数据呢?先看看我们公司的价值链,我们如何在Vestas创造价值。有四步组成:第一步是项目的规划和设计,我们给客户输送我们的风机,等下还要详细讲讲,告诉你们如何转型业务,通过我们的高性能计算和大数据,特别是在这方面。我们怎么做呢?我们帮助得到一些洞察力,到底给客户带来什么价值,下一步是采购和生产阶段。我们使用我们的高性能计算,大数据的存储来优化风机的生产制造。再下一步实际的安装风机,使用我们的系统来保证把一些真正做到必要的时候,比如说合适的天气。最后是运营和维护,目前为止这是我们伸展最远的价值链地方,最少有20-30年了,我们风机生命周期大概20-30年,我们使用大量的数据和我们的计算能力来保证主动积极为客户保证客户风机能够正常运转。
       我们整个价值链的第一步,我们希望帮助我们的客户,帮助我们自己更好地理解在哪建风机,我们的投资收益能够从我们的风机上有多大的投资收益,因为逻辑上表明我们卖我们的产品,为我们客户,主要是把风能转成电的经济收益,这样客户就能有利润。为了让我们的客户更好地洞察对于投资的潜力,我们必须要知道天气的情况,天气的条件情况,怎么办呢?在我们这个行当里当客户提出问题了,潜在的把一个风机某一个具体的位置,第三方到实地看看这方面的安装。花两年的时间收集数据,天气怎么样,这种做法有一些缺点。首先你先安装直接成本比较高,这样的话是20万欧元。第二个问题机会成本,花两年时间什么也不干,闲置着设备,等着你的结果出来,因为你在这两年不断收集数据,这样才能保证你得到季节的变化,天气到时候,具体的位置要花两年时间,世界很多地方天气的情况,有时候某一个具体的时候风很大,所以要想保证你是安装正确的地点,花两年时间才能知道。客户问你这个问题了,每次客户问这样问题的时候,客户就得花20万欧元、两年时间真正解决他的问题。我们怎么办呢?我们Vestas决定不同的做法。我们投资于一个超级计算机任何一个地方,我们都可以渲染一下看看这样的空气穿流进行动态的仿真,大规模这么做这样是很大的,但是更加棒的一点是我们对整个地球上天气都做了渲染。跟一般空气研究相反,天气预报关注未来,未来不确定性越大。我们完全相反的路,成百上千万,地球上各个方面的情况,我们把天气渲染。通过仿真,对整个地球,从今天回到2000年过去17年的仿真天气系统,从这点就可以到几公里的情况看看成百上千的我们的特点,每一公里的地面都要了解,当然这会变成P级的数据。大数据计算方面挑战巨大的,但想象一下为公司能带来什么样的情况,我们和客户交流。
       客户有一个问题,投资收益多大,必须要走第三方、付20万欧元、等两年时间,才能得到一个回答。突然他们和我们的工程师坐在一起,问一个问题,几分钟就可以得到非常深的洞察,对他们项目的可决定性,过去17年的数据都能获得,各种各样的高分辨率的数据,这样就更加有确定性,这个确定性非常高了。这是完全一个新的做法,如何来出售风机,办法也不同,客户获得了洞察,需要投资的时候他们能知道。
       对Vestas呢?对我们公司的帮助是使得我们更好理解了到底我们产品应该在什么样的情况,什么样的地点环境下运作,这具体地点应该怎么办。我们是如何在供应链的某一步,整个今天供应链都是这样做的。我们如何管理呢?在我们公司如何具体操作的呢?当然了,我们需要计算能力、数据能力,这是C计算,D是数据。C和D两条了。我们开始让我们的产品,我们的风机装备各种各样的传感器,从1991年,我们有很长历史了,我们不断收集我们风机数据。结果大概10年之前开始看高性能计算,也可以看出来从那时以来我们都经历了什么,取得什么样的进展。蓝色的柱是计算能力,灰色的是数据处理能力和存储能力,这时候有个巨大的变化。我们大量投资于这些,因为通过这办法能够改进我们的业务,我们有这样的技术能力。
       我们需要有很好的组织架构来提供这些解决方案,为大家展示的是我们Vestas公司的组织架构,公司有两个部门,有IT,有财务部,很多公司有这样的,他们能够为公报私提供各种各样的IT服务。
       与其相补充的还有研发部门,保证我们能够提供正确的产品,在正确的时候,按照正确的价格为客户提供正确的产品。这两个部门相互补充,相得益彰。
       另外一点,我们也要想到如果有这样的一种能力,如果你能够保证你的公司两万多同事真正能够从中得到帮助,和你同事进行互动。因为你公司的同事依靠他们开发新的解决方法,最重要的是给他们尽可能容易获得洞察。技术人员各种数据的价值取向。
        我们看一下右手边,发觉业务具体情况之后给他们一个工具,通过简单的操作,但是我们之需要它专注于把一件事做好,大家请注意这点。
       最后要回答的一个问题就是,在可预见的未来我们对业务的期望是什么。我刚才谈到了整个价值链,最后就是风机的运营,这是我们一个产品20多年的周期,我们希望为客户提供积极的服务。一开始我也谈到目前为止,我们在全球风机安装的数量最大,所以我们企业有责任保证这些风力发电机能够以最佳的效果实现运营。我们的风力发电机内装了1000多个传感器,我们全球安装了1000多个风力发电机,意味着我们有成百万的传感器为我们传送数据。
       要达到什么样的目标呢?首先我们建了风机传感器传过来的原始数据库,我们希望能够根据数据测度找到样式,挑出有意思的样式、规律,然后我们再把实时传过来的风力传感器传来的信号放入到发现的这些规律中,如果发现了一些情况我们就可以主动采取行动。这确实与以前不一样,比如说在风力发动机行业数据以前主要用来做报表的,比如说风力发电机在上一周、上个月发了多少电等等。
       所以,我们在不远的未来做的这种转型,我想用这张图打一个比喻,就像一个人在高速公路上开着快车,从历史上来说数据只是为了做报表的,这是事后所做的报表。就像我们开快车,我们看着后视镜开车,那是已经发生的事实。我们要做什么转变呢?有如此大量的风机传来的数据,我们要增强可以看到的景象,就像这个车的后视镜,我们应该能够预测到未来,比如说能够采取行动,就像有一头鹿如果从车前跑过来采取什么样的行动。所以先通过高性能计算加入了仿真的能力,比如说当我们开着这个车往山上开的时候,我想强调这种转型是从原来的对静态数据的被动的获取,也就是我们看后视镜的一种数据。我们还要补充上看到了数据采取什么样的行动,现在我们还要有能力对不远的未来进行预测。
        我就讲到这里,感谢诸位的聆听。
【嘉宾】:李炜
【观点】:各位嘉宾,大家上午好,我相信每个人还沉浸在刚才深腾8810惊艳出场的一瞬间。过去一年我们推出了8810,我今天汇报的题目是“锲而不舍,金石可镂”。
       从去年7月1号的第一次高性能峰会以来,联想用自己的实际行动给各位嘉宾和客户奉献了什么?联想的文化是说到做到,尽心尽力。我们在计算节点上推出了模块化的服务器,它的好处是可以灵活自由的组合,统一管理,集中部署。同时为了应对即将到来的人工智能的高潮,我们也及时推出了多款基于GPU服务器,我们已经有五千台GPU服务器已经从事人工智能的计算。在存储节点上,我们又创新导入了分布式存储产品,能够让数据的开放性,多样性和可靠性得到很大提高。最后,我要强调一下LiCO,LiCO中文意思是联想智能超算智慧家,或者演奏家,把复杂的高性能管理集中于一个简单的页面。在我们去年LiCO产品上市以来,不到一年的时间里面,我们更新了报警功能,监控功能,报表功能,同时也集成人工智能功能,从不到500个节点到1000个节点。未来有非常多的专家和顾客聚到LiCO的体验中心,去尝试一个简单的显示器能够管理一个巨大的数据中心的所有的超算中心。
       联想过去一年专注在高性能计算架构上,取得了可喜的成就。联想的努力得到了全球各个客户,各个领域的信任和支持,在这里罗列了一年的时间在全球拿到的标志性的客户的信任。我们在教育领域,除了中国的北京大学,南京大学,还获得了英国牛津大学,伯明翰大学,美国芝加哥大学,澳大利亚的阿德莱德大学,我们也得到了欧洲科学计算中心,以及德国各科研机构的支持。刚才还请到了我们的客户代表维斯塔斯,给大家讲了一下我们在高性能集群是如何服务的。我们在中国还有瑞生科技???,法国的生物医药公司,生命科学公司,服务于教育、科研企业,服务于全球的各个客户领域,体现联想在高性能计算领域的实力和水平。
       大家都知道随着数据的大规模发展,数据中心可以简单分为服务器和存储的,数据中心、中型数据中心、大型数据中心,还有超大型数据中心,联想的高性能集群已经服务于全球,在全球7个最大的数据中心里面服务于其中的6个,这些成就的取得都是联想20年来持之以恒,持续不断投入的体现,也是广大客户对联想的信任和支持。
        在广泛服务于全球客户的同时,我们在过去的三年持续保持着全球增速最快的超算世界500强的供应链的排名,在中国连续三年是TOP100的第一名。这些业绩的取得,正是多年来联想对客户和行业的深刻的领悟和深刻的理解。
       现在是一个伟大的时代,过去一年的时间,特别多的术语涌入到了我们的脑子里面,刚才谈的人工智能、AI、VR等等,一瞬间涌入我们大脑中,我们在思考哪些是我们主要的领域和发展方向呢?经过细致的分析,我们认为人工智能是技术领域的主要方向,高性能能够很好带动这些领域的发展。什么是人工智能?刚才陈院士和孙所长都谈到,1956年我们人工智能的早期科学专家在达特茅斯提出了人工智能的概念,希望开发出具备人类智慧思维、能够像人类思考、比人类更理智的人工智能,那是广义的人工智能。现在人类所能实现的人工智能叫狭义的人工智能,现在的人工智能可以更好的给人类执行固定的算法和方案。比如说我们在Facebook上实现了人脸识别,还有Face++,还有科大讯飞,都是人工智能的成就。什么是机器学习?这是实现人工智能的手段。刚才黄莹博士和各位专家都谈到了,机器学习的基本理论是用优化的算法处理海量数据,对未来现实进行预判和决策支持。深度学习具备一个条件,机器学习需要不断优化的算法、海量计算、不断优化的工具。机器学习在日常生活中最大的体现,就是大家在上学的时候能得到的决策数模型,以及经营决策中的预测推断的模型。我们又谈到深度学习,在早期要谈到人工智能网络,人工智能网络就是要模拟受人脑神经原的影响,去做交叉的人脑思考。即便是最简单的深度学习,需要海量的计算和海量的数据,这些都是高性能领域可以给大家发挥重大实力水平的体现,即便是为简单的深度学习,都需要快速的计算和海量的数据。随着深度学习的发展,我们能够帮助机器学习快速的解决问题,从而极大扩展人工智能的领域。
        刚才老童谈到了,接下来的三年里,全球仅在人工智能的硬件领域,我们就会发生超过200亿美金的生意,在中国超过100亿人民币的生意。昨天我看到一个预测,2017-2030年中,会给全球GDP带来14.7万亿美金的增量,相当于现有中国和印度两个最大的发展中国家GDP的总和,这是未来15年乃至更长的时间,全球一个最大的商机,这些都是联想高性能优势的体现和施展的舞台。
       高性能怎么跟人工智能结合?我们看一下高性能的优势,密集型的计算模式,超大的数据结合,加速集散技术。刚才我简单介绍了人工智能跟机器学习,和深度学习的关系,我们发现几乎是百分之百吻合的,这三种基础完全是运行在HPC上,通过不同的算法来实现人工智能的领域。联想过去20年在高性能领域不断成功的实践经验,可以有效的支持和引领人工智能的发展方向。联想做人工智能的优势是什么?我们20年的丰富的经验,对于全球各个行业和客户的深刻理解,我们的创新中心,创新能力,更加专注,除了联想自主研发以外,我们通过联想的创投公司,对于很多领先的人工智能公司进行投资,用弯道超车的方式快速发展人工智能领域。和我们现有高性能业务所具备的超大的数据结合,复杂的计算方法,不断学习的能力,有机结合,我们就会发现有优秀的产品与专家,能够共同挑战目前人类所面对的最复杂的新兴挑战。1946年计算机诞生到现在,整整71年,我们在中国来说,“人到七十古来稀”,我们迎来了新的业务发展方向由HPC来推动。数学是所有自然科学的基础,高性能计算是IT的数学,任何突破都能够有效带动和推动人工智能在各个领域的突破和发展。
       联想要想做好高性能和人工智能,我们有哪几大优势?首先,我们有全球顶尖的专家,有核心的研发团队,有6月20号在纽约新发布的ThinkSystem结算节点、网络节点,我们有资本的方式,能够有效跟所有主流算法,无论是TensorFlow,Caffe等等相结合的计算平台,以及即将和在美国、德国和中国北京的研发中心和体验中心,这些基础架构的建设确保联想有信心,而且也有实力,能够在人工智能领域处于第一阵营和领先者。
       我们看一下8810到底具备什么功能?首先要具备几大特点,有各种形态的计算节点,还有存储节点,还有传统网络节点,以及服务软件和智能超算LiCO平台的管理,这些能够让我们的客户和科研工作者在操控中心就能够很好的管理超算中心所有的计算能力,可以像AlphaGO一样,把其中若干节点提取出来,瞬间聚焦于某一个数字方案和数学模型的推理,有效分配原有的产品线,让我们的计算能力能够得到最大能力的释放。同时,我们创新的水冷技术,现在讲究节能减排和绿色数据中心,能够让多年的运维成本得到有效的改善。
       这些都是联想8810这款产品所具备的实力,现在8810的产品线,我们已经获得了46项国家发明专利,还有40多项发明专利正在受理过程中。为什么叫深腾?深腾不仅给联想带来的志高的荣誉,1800和6800两次拿到了国家科技进步奖,北京市科技进步奖等奖项,更是中国第一台万亿次,十万亿次,百万亿次的创新,是联想高性能传统和技术实力最好的结合。我们充分有信心,相信8810一定能够在原有基础上更好的适应人工智能技术的发展。
       联想的高性能业务已经走过了20年,我们在各位的支持下,征服了一座又一座高山,我们有充分的信心相信联想有能力、有实力、有信心,能够不断给全球的消费者和客户贡献出最新、最好的人工智能的产品,在人工智能这座人类IT所面临的最伟大的挑战面前,把中国高性能计算的红旗永远的插在最高峰。
       谢谢大家!