12月20日,由赛迪网、《互联网经济》杂志社、数创汇主办,赛迪智库互联网研究所、中国大数据产业生态联盟、中国信息化推进联盟以及国家信息产业公共服务平台协办的“2016中国大数据大会暨大数据年度盛典”在新世纪日航酒店隆重举办。

随着国务院印发《促进大数据发展行动纲要》和推行实施大数据国家战略,预示着我国将进入大数据时代。大数据在我国也快速兴起普及,引领着第三次信息技术革命的浪潮。当前,我国经济发展迈入"新常态",各行业均进入创新转型、优化升级的发展轨道。在此背景下,大数据成为国家新型战略资源,大数据带来的巨大价值和创新思维,成为各行业稳增长促转型的的重要支撑和部署[了解详情]

在全面深化改革的大背景下,推动我国经济创新发展和产业转型升级具有重要作用。为了使社会各界深刻领会大数据创新的产业布局,共同促进大数据以及相关行业的健康发展,探讨大数据在互联网金融、智慧城市、工业、双创、人工智能等行业的创新应用,表彰在各自领域有突出竞争力优势的人物、企业及产品技术平台,营造产业创新氛围,激发创新创业活力,2016中国大数据大会暨大数据年度盛典将于2016年12月20日在北京新世纪日航酒店举办。
主办单位
赛迪网、《互联网经济》杂志社、数创汇
协办单位
赛迪智库互联网研究所
支持单位
中国信息化推进联盟、国家信息产业服务平台

时间:2016年12月20日 地点:北京新世纪日航饭店三层 主题:2016中国大数据大会暨大数据年度盛典 主持人:今天能冒着雾霾来的,我想都是真爱。所以在座的各位专家、学者、大数据领域的朋友们,欢迎大家参加2016中国大数据大会暨大数据年度盛典活动,一年一度的颁奖典礼。今天主办方安排了丰富多彩,各种高大上,各种干货的演讲,各种颁奖典礼。大家知道大数据是国家新型战略资源,大数据带来的巨大价值和创新思维成为各个行业促进发展转型的重要支撑和部署,得到了正产学研的高度重视。
大数据正在深刻的改变了我们的思维方式、方法,掀起了新一轮的产业和技术革命,相信今天的又一次的交流跟探讨能够激起大家对于大数据的热情和经验的分享。今天在这个大数据信息爆炸的时代,海量的信息商业价值的发掘,数据的积累挖掘整理利用是现代企业基本的素养,没有它企业将无力面对未来,马云说过未来企业都是数据企业,促进大数据的发展。所以面对大数据,企业我们想胜者为王。今天我来的时候看到那边有很多牌子,我一看原来搞信息化的企业也摇身一变都是大数据企业了。不管概念怎么忽悠,产业怎么发展,但是我坚信走到最后的一定是王者。
今天这个大会,我们是由赛迪网、《互联网杂志社》携手数创汇共同主办的,今天这个会议赛迪网将发布2016年度大数据十大热词,我们也将颁布各种大数据的奖项,所以我们在座的朋友把掌声送给自己,为了大数据的会议,你们能够冒着雾霾前来开会,我相信真爱就在此体现了,我们用掌声感谢自己。闲话少絮,会议马上开始。首先请允许我介绍今天出席大会的各位嘉宾:他们是:赛迪网总裁、《互联网经济》杂志总编刘兴波; 中国工程院院士倪光南; 国家信息化咨询专家委员会委员、中国人民银行科技司原司长陈静;国家信息中心信息化研究部主任张新红;工业和信息化部软件与集成电路促进中心云计算中心主任杨东日;IBM中国开发中心大数据与分析业务拓展总经理顾世山;中国电信北京研究院副总工程师、中国电信科学技术委员会委员杨明川;赛迪网副总裁/常务副总编梁媛。欢迎各位专家的到来,我们大会正式开始。让我们用热烈的掌声有请赛迪网总裁、《互联网经济》总编刘兴波为我们大会致辞,掌声有请。
刘兴波:主持人非常热情也非常充满激情,比我们的激情都强,感谢主持人。尊敬的倪院士、陈司长、张主任,各位领导、各位来宾,女士们、先生们还有一些来自媒体界的朋友们大家上午好。欢迎各位在百忙之中莅临2016中国大数据大会暨大数据年度盛典,在此我谨代表大会的主办方向各位参会的领导、专家、朋友们表示热烈欢迎。
我国即将进入大数据时代,2015年国务院印发《促进大数据发展行动纲要》,十三五纲要提出实施大数据战略,目前大数据产业,作为国家的新型战略资源正在成为全面深化改革背景下稳增长,调结构,强创新促转型的重要支撑。大数据也正在引领第三次信息技术的大潮,目前全世界范围内的第三次技术革命正在兴起。从去年的云计算方兴未艾,到今年的大数据风起云涌,这两项技术和方向无疑是当之无愧的引领者。如今大数据已经得到了正产研用各个领域的各界的高度重视,尤其是在互联网金融,智慧城市,工业,人工智能等等一些行业的创新应用,也释放出了巨大的价值。
未来大数据还将日益深刻的改变人们的思维方式,对各类企业的生产方式和我们普通老百姓,在座每一位的生活方式都将起到一些改变的作用。新一轮的产业和技术革命也必然在大数据的兴起背景下铺面而来。为了实施促进大数据的发展行动,加快推动数据资源共享开放和开发应用,助力产业转型升级。刚才主持人也介绍了工信部和赛迪网、《互联网经济》、数创汇携手赛迪智库互联网研究所共同举办这次大会。我们这次大会将包括几个内容,一个是今天上午举行的高峰论坛还有下午的两场分论坛。高峰论坛一会儿有几位专家为我们解读国家大数据的行动纲要,大数据产业十三五整体规划整体思路和发展重点以及大数据新的产业布局。包括促进大数据相关行业的健康发展一些重要的抓手和重要的动作。来探讨大数据和各行业的创新结合。上午还有一项要表彰竞争力突出的人物、企业和平台,通过主办方的几个专业机构包括我们聘请的十几位行业专家,经过综合性的评定我们对一些产品、人物、技术、平台进行一些评选,以借此激发创新和创业的活力。
下午我们还有两个分论坛也会非常精彩,一个是大数据和金融还有一个是大数据助力智慧城市发展,两场分论坛。我们将总结大数据在金融和智慧城市领域的应用成果、发展趋势并深入探讨大数据与行业结合的落地经验。
上午我们还会发布年度的大数据十大热词,这个也是非常重要的内容。从媒体的角度去解读今年有哪些热点的事件、现象、技术。也希望各位到场的嘉宾和听众都把它记录下来传播出去。大数据是我国基础性的战略资源,这个我不再罗索了,我们会坚持创新驱动的策略,以大数据激发社会的经济活力推动产业和技术的变革。最后我作为主办方预祝我们今天的活动顺利进行,圆满成功,并再次感谢各位莅临,谢谢。
主持人:谢谢刘总的致辞,接下来有请倪光南院士为我们做大会主题演讲,大家掌声欢迎。
倪光南:各位专家,有机会来参加大数据大会,大数据年度盛典,很高兴。我这里讲的大数据是按照今年习主席的讲话,实现安全发现的统一推进。这个大家都很清楚,具体对大数据来讲,我们要注意几个方面,一个是我们的基础设施,云计算、大数据,此外我们希望保护好数据,不要流到境外去。另外保护用户隐私等等。
因为最近我们在做的工作是搞政府智能终端产业联盟,智能终端对于大数据来讲是产生者,是大数据很重要的来源,是多种形式的大数据通过终端产业而来。另外终端安全和大数据安全有关系,我们讲终端的操作系统应该怎么做?这个我们主要是感到对操作系统来讲,我们觉得在操作系统上,目前来讲世界上所有的垄断性,最强的还是在智能终端操作系统。比如波音、空客,全世界飞机加在一起不知道数量多少,可能数十万级的,但是是几十个亿终端,有三种操作系统,有苹果、安卓、windows,这个垄断在全世界找不到第二个。但是终端,全世界只剩一个终端有被三者垄断,这个对我们来讲具有很好的思考,我们要解决好这个问题,否则你没办法。你的终端解决不了就被人家控制。
要解决这个问题,我们要发扬两弹一星和载人航天的精神,我们觉得我们在北斗有很好的例子。中国的芯片超过了欧洲和俄罗斯,这个说明我们可以做的很好。大家说怎么看操作系统?我们把操作系统分为云、管、端。“云”是指云计算,服务器、数据中心和高性能计算机的操作系统,这类操作系统向用户提供各种服务。“管”是面向SDN的ODL和ONOS。“端”至少分两类,第一类是智能终端,桌面和手机很清楚,刚才说三大类操作系统垄断了,还有嵌入式操作系统,那个也是比较多的垄断,但没有智能终端垄断的多,也具有垄断性。
智能终端,我们说高度垄断是三大类,我们看整个全球ICT排行头三家是苹果、谷歌、微软,这三家是老大、老二、老三垄断的,我们知道要做终端,操作性不简单,反过来看没到这个份上你做不起来。所以我们认为可能我们中国现在还有像华为等这样的企业还少,总体实力还差一些,这个问题我们需要尽快的解决。
我们大数据来源离不开终端,大数据服务离不开终端。作为操作系统很容易控制你的电脑,我们认为如果操作系统你没掌握,大数据安全就没法保障。我们从网络安全角落,中国要成为网络强国角度,都要解决智能终端操作系统。简单讲几句话,为什么我们做不起来?我们总体实力还是比美国这样领头国家差一点,像华为这样的公司还很少。我们习惯了中国最大的问题是各自为政,谁都不想跟人合作。像北斗那样的少有,大部分是分散各自为政的。很多原因,我们不详细讲了。
很多人在安卓上做终端操作系统,这个行不行?我认为这个不行。我们要发展自主可控的,这不是你的,说到底还是别人控制的,大部分是开源的,也有一部分不开源,但是开源以后控制权不在你这了。中国在安全上做的本地化或者定制化操作系统。这就说明了,我们从游戏规则来讲我们没法做这个操作系统。
下面我们还是要考虑自己自主创新来做,刚才难的方面我已经说了。像windows Phone的情况表明,在IOS和安卓生态已经形成垄断的情况下,新的移动OS很难发展起来。我们中国是不是有可能呢?中国自己的目标是做网络强国,我们不会满足于做网络大国,我们还要集中力量办大事,像做北斗这种经验。此外我们中国有安全需要,一些行业可能愿意做自己特殊的系统是可以的。另外现在软硬件发展使得我们双系统很流行,不要付出任何代价可以用两个系统。一个是安卓OS,一个是安全OS,随时可以切换,不需要时间,这种方式我们认为可以支撑我们的系统。
下面我们讲信息安全要素和自主可控评估。传统来讲,传统信息安全三要素,保密性、安全性、可控性。网络安全比传统信息安全要求更多,需要有可控性。此外可认证性也极为重要,所以这个情况下,我们认为网络安全角度要加上可认证性,还有可审计性,不可抵赖性。所以这样我们归纳为五点,保密性、完整性、可用性、可控性、可认证性。我们完全说要自主可控,安全可信,安全可控,这都有了。安全可控就是自主可控,安全可控都在里面了。自主可控讲的是可控性,可控性比较重要。此外我们不讲可控,安全可信、安全可靠包括保密性、完整性、可用性、可认证性。可信性包括保密性、完整性、可认证性。可靠性包括完整性、可用性。 我们比较倾向于对自主可控首先提出评估,我们主张知识产权、技术能力、发展主动权、供应链、满足国产资质和本土增值方面发展评估。从信息安全、网络安全角度讲,我们对于选择我们的方案,产品可以有鉴定。
今天时间已经到了,我这个观点不一样正确,供大家参考,谢谢大家。
主持人:感谢倪院士精彩的致辞。国家吸收了自主创新安全可控,我们在大数据操作系统这一块云管端这种模式是有天然的生态优势,我们国家的大数据数据量还有数据的格局、技术包括现在创业的氛围都很好。所以我相信倪光南院士为我们产业界提出新的要求,我们一定会把这个大数据操作系统做的更好。接下来我们有请国家信息化咨询专家委员会委员、中国人民银行科技司原司长陈静老师为我们带来精彩的分享,他分享的主题是《积极推动大数据在经营领域的创新与应用》,大家掌声欢迎。
陈静:在座的各位同仁,各位代表,女士们、先生们,大家上午好。很高兴参加今天的2016大数据数据年度大会,今天我的发言题目是《积极推动大数据在我国经营领域的应用》。随着我国互联网+和大数据战略推进,伴随云计算的发展,大数据逐步深化在各领域应用,我国正在加快为大数据基础资源和创新要求的产业,对经济社会的发展和服务。 金融行业大数据应用是重要的领域之一,以云计算、大数据为代表的新兴技术不断申述到金融行业,对数据价值的有效挖掘和充分利用将带动整个金融行业的发展,对金融行业创新带来转型升级的契机。
作为银监会在中国银行业十三五发展战略咨询意见稿中明确指出,全面提出数据治理与数据服务能力,制定数据战略夯实基础,建立大数据服务体系加强大数据应用,监管部门明确对大数据做出了很好的规划。国内不少银行已经积极尝试通过大数据来创新业务发展,主要集中在精准营销,风险管控,优化运维等方面,开始取得良好的成效。中国金融IT大数据解决方案厂商也纷纷研发提供大数据应用的产品解决方案,助力金融行业的改革与发展。
我国银行业,金融业数据增速快有发展大数据产业的基础,大数据应用受到银行经济的高度重视,有一定规模的部署,发展前景广阔。下面我讲发展情况,第一数据存量大,增长快。当前工、农、中、建、交、招等家银行数据约为120PB,与其三年后,数据增长170%。 第二,大数据应用处于初期发展阶段,前景广阔。当前和预期未来三年,结构化数据能够满足银行和“一行三会”的业务需要,但仍处于起步阶段。当前应用重点是金融产品营销和金融风险防空。 金融监管部门认识到大数据应用对未来监管的应用,开始系统研究和测试大数据相关技术,建立了各自的业务级的数据处理平台,对监管着如何应用大数据正在积极的探索。这个事情在发展过程之中了。
第三,银行业对外部数据的需求量大,交换交易和查询是获得外部数据的主要方式。未来银行业全是数据,企业内的数据+企业外部数据的支撑,在未来三年,刚才我提到的六家银行要从外部获得的数据由当前的115TB增长到4.43PB,将增长37.5倍,其中通过购买获得的数据比重由当前99.5%下降到42.3%,购买开销由当前的2.79亿加到7.76亿元,增长1.8倍及银行主要通过交换、交易和查询方式从政府部门、公共事业单位和其他企业取得业务所需要的补充数据。例如所有的商业银行都与人民银行政策中心建立数据机制,并且与公安部门身份中心建立验证关系,部分商业银行与当地的工商局、质监局和电信运营商建立了数据交叉认证和数据的买卖关系。
第四,数据价格采用市场定价和协商定价两种方式。数据交易在数据产权明确的前提下首先涉及定价问题。当前,银行金融机构接受两种定价方式:对于存在市场价格的数据,在覆盖成本的情况下,考通过市场需求定价,对于无市场价格的数据,采用双方协商的方式确定数据价格。
第五,金融监管机构开始制定大数据产业相关发展规划。时间关系,我不多说了。
第二方面,我先讲一下,银行金融业大数据发展存在的问题。第一问题,数据产权、数据及隐私保护法规体系不完善。银行业对个人和企业数据的需求广度和深度迅速增加,但是目前我国缺乏数据产权归属的明确规定,缺少企业、个人数据和隐私保护方面的专门性和基础性立法。相关法律法规散见于不同位阶的法律、法规和部门规章中。导致银行在开展业务时面临很大的不确定性,不得不采取严格的数据使用限制标准,妨碍了业务发展。这是银行金融业务创新落后于互联网企业的原因之一。同时,法律法规的不完善还造成数据泄露的民事赔偿责任不清、数据滥用情况突出以及衍生数据黑市等问题。
第二个问题,数据交易和交换的基础环境薄弱,数据割裂难以交换和共享。不同企业和行业之间的数据难以交换和流通,主要原因如下:一是在国家和行业两个层面都缺乏相关的数据标准,不同企业和部门的信息系统数据难以对接。二是政府数据公开推进缓慢,社保、税务的政府部门和水电的公共事业部门,大量有价值的数据无法使用。由于数据公开和部门间共享法规不明确,导致政府部门无法把握在哪个范围和程度上公开数据,甚至存在政府公开条例与七大法规相矛盾的情况。同时数据公开和共享的责权划分以及共享程序不明确。三是企业倾向于获取而不是给出数据,如银行和互联网企业将数据视为核心资产,不会轻易同意交换或出售数据。
第三个问题,没有形成完备的国家和行业数据安全保障体系,难以保障数据安全。保障数据安全是行业面临的巨大挑战。金融业高度重视数据安全,并投入大量资源从技术和管理两个方面持续完善自身的信息安全保障体系。但是,数据安全是一个系统工程,需要法律体系、制度、管理体系和技术标准等多方面支持。当前仅靠各单位各自为战,难以保证数据安全,尤其是难以保证数据交换中的安全。我国的《网络安全法》刚刚公布,如何维护网络安全和数据安全还有待进一步规范和加强。法定责任范围不明确和安全标准缺乏不仅增加了企业安全投入,降低了效率,甚至导致与有些第三方企业的合作无法展开。银行在大数据里就面临很大的问题,有很大的顾虑。
第四个方面,大数据基础研究不足,专业人才缺乏。国内金融业的大数据技术还处于初期发展阶段,成熟可靠技术少,银行应加强与IT产业合作。我国银行金融大数据的基础研究严重不足,懂业务又懂大数据技术的专业人才严重缺乏,导致银行在自主研发和部署大数据系统和应用时遇到大量的技术问题难以得到及时有效的解决。
最后我想讲三个方面,发展银行金融业大数据应用的相关建议。第一个,银行金融业应用大数据是一个渐进的过程,坚持应用推动,讲求实效大数据应用银行核心业务数据的补充,其应用是一渐进的过程,我国银行业要积极推动大数据的应用,是在搞好数据库、数据仓库应用的基础之上。要积极推进云计算的应用,要确保金融信息系统的安全和稳定运行。银行金融业是数据的应用者,应坚持应用推动,讲求实效。大数据应用的价值在于满足银行金融业的实际业务需要,支持和推动业务创新、商业模式创新及价值创造。
第二,切实加强大数据应用的基础环境建设,加快制定产权、定价和交易等规则和相关的标准,规则立法先行。定义个人数据、个人数据权利主体和数据产权的概念。制定数据采集、交换和交易以及此过程中数据产权界定的规则。明确数据市场相关方的权利、义务和责任。制定金融行业数据存储、处理和交换的相关标准。规范数据收集、使用和管理,降低交易成本。加快隐私和个人数据保护的高层级立法,保护用户权益,为企业活动提供法律依据。制定公平、公正和有效的监管规则,公平监管银行和互联网金融企业,吸引更多数据市场的参与者。制定数据跨境流动的基本规则,明确外资机构在境内收集和存储中国公民数据、国内企业向境外机构提供机构、个人数据的相关要求。
第三,坚持政府指导和协调,市场化运作。要发挥政府的指导和协调作用,推动金融数据市场的供给侧改革,促进有关金融服务的数据交换和交易。在金融监管层面做好金融大数据比较指导,设立专门的大数据规划、协调和监管部门或职位,及时发现、协调和解决数据产业发展中出现的各项问题。根据银行业的业务特点和大数据的发展阶段特点,制定以应用为中心的银行金融业大数据发展政策,鼓励数据业务和商业模式创新,鼓励数据市场机制和制度创新。鼓励在金融业内以及金融业与其他行业间的数据交换,引导银行金融机构成为积极的数据交换、数据和参与供给者。
第四,切实加强大数据应用的信息安全和隐私保护工作。明确参与者的责权利划分,建立相应的安全认证体系和安全威胁信息共享机制。切实保障金融数据交换的安全,解决好数据流动中的安全保障,防范相关的安全风险。降低相关方的数据安全保障成本。明确隐私保护范围,区分企业、个人的可交换数据与隐私,界定数据使用权限明确企业在采集、使用数据过程中保护消费者权益的民事、法律责任。
我们于是中国金融行业大数据应用就提出这么多建议,供在座的各位代表,各个单位,各个相关企业在发展大数据应用的时候做参考,不对的地方请大家批评指正,谢谢大家。
主持人:感谢陈老师精彩的致辞。下面有请国家信息中心信息化研究部张新红主任为我们带来他的分享。
张新红:大家上午好,非常高兴能够参加今天这个盛会。我讲一下数据经济与智慧城市发展。来的路上,我一直在反思,今天这个会,今天这个天气情况下谈智慧城市多少有点尴尬。我不知道这么多年智慧城市喊的这么响,到底解决了什么问题?应该说像刚才陈老师说金融业大数据应用还处在初级阶段,但是对于智慧城市的大数据应用处在什么阶段?我觉得还没有开始。因为我还没有看到它切切实实的解决很多问题,而且很多问题还在日益的恶化。但是我反过来想,从积极的一面去想,这正好也是为我们下一步智慧城市发展提出了新的任务,也为大数据在城市发展过程中提出了更紧迫的需求。
因为刚才我说了,现在城市发展的大数据应用还没有真正的开始。那么我今天给大家交流的问题就不是给城市大数据应用直接出招,而且谈一些在研究问题过程中的初步思考判断。我觉得要想做好大数据在城市发展中的应用,需要转变思维。什么叫转变思维?就是要用大数据的眼光看城市发展。讲几个基本判断,供大家参考。第一个基本判断,数据是人类智慧的原始宝藏,人类发展到今天是靠我们的智慧一步步走过来的。这个智慧来自于何方?它最基本的东西就是数据。我们说数据是描述事务及其变化的原始材料,所以它是最原始的保障,对数据加工变成有一定意义的东西的时候这就叫信息。拥有了这些信息总结出一定的发展规律,这个时候我们说这就是知识。利用这些知识去认识和改造这个世界,这种能力的不断增强,反应的是什么?是人类的智慧。后来我也在想在智慧之上是什么?后来我就在金字塔的塔尖上加了一滴水那是理念,形成一种发展理念上升到理性高度的智慧,这就称之为理念。我们反过来可以说如果没有最基础的数据,人类的智慧将不复存在,所以数据的重要性可见。
第二个基本判断,大数据就在那里,数据资源无限。这里我推荐大家认识一下美国的物理学家叫约翰.惠勒,我非常喜欢这老头,他曾经有一句名言叫“黑洞无毛”,任何东西放在黑洞里毛都没有了。他在去世前又说了一句“万物源于比特”!它的含义应该是说任何事物存在,积极发展变化都是可以用数据来反应的,都是数据在流动,在变化。比如1+1=2,比如3×3=9,这些知识,这些数据早就存在,但是人类发现它的时候,实际上已经过去了好几万年。那么数据一直都在那里,就像网络语言说的,“不管你知道不知道,数据就在那里,不多也不少”。它真正的伟大或者进步之处在于是因为有了大数据技术,我们可以把这些早就在那里的数据把它找出来,这就是我们所熟悉的大数据。
那么大数据与小数据是不一样的,它是全样本的,是机器自动采集的,它可以进行无线分割,而且是非结构化的是实时进行的,这与小数据或者统计数据、结构数据有根本不同。那么大数据包括小数据,但是不仅仅是小数据,更多的它是交易数据,行为数据,传感数据等等,其基本特点就是多、杂、碎、快,有了这些大数据我们今天面临的世界就不一样。
接着说第三个基本判断是关于数据化的。所有能数据化的都将数据化,那么什么是数据化?狭义的数据化指的是我们通过各种技术把这个数据能够捕捉到,提取出来,这是狭义的数据,简单说就是找出来。更广义的数据化,不仅要把数据找出来,而且要利用好这些数据去改变数据。比如城市建设过程中如何利用大数据解决我们的难点、痛点?这是广义的数据化,这才是我们真正应该追求的目标。更重要的是,现在这种数据化的进程正在大大的加快,我们已经知道的是每两年的数据总量要翻一番,但是我们不知道的是继续翻下去的结果是什么。整个大数据的发展,整个信息技术革命的发展,今天也才是第一天,我非常认同。
第四个判断,关于数据价值,所有的规律终将被发现。我刚才说的数据是干什么的?如果说是堆在那里的原始宝藏没有人开发,没有人利用,数据就变成了数据垃圾。它也会造成污染、浪费。数据的价值,为什么它与小数据不一样?就是因为它存在一些小数据所不能应用的价值与功能。我这里把它分为五个方面,第一个方面是识别效应,它可以识别身份、位置、状态、真假。第二个它具有重现的效应,它可以让过去发生的一切再现出来,产生追溯。第三,关联效应。它可以让我们发现一些以前你无法找到的内在的规律。第四,它的议价效应,大数据的应用会不断的产生新的大数据,新的需求,同时发现新的规律。第四,大数据具有很强的预测性效应,它可以预测经济、天气、灾害、疾病甚至预测人的行为。星期天的时候就在马路的对面在国家气象局这边参加了大数据的会议,当时我开玩笑说,如果两个星期前你们发邀请函时告诉我今天有雾霾,我今天还能不能来参加这个会,我表示很怀疑,大家就乐了,这就是预测。大数据真正含义它可以使过去不可计量、存储、分析都被数据化的,也标志人类社会在认识和改造数据过程中前进了,能帮助我们消除痛点,解决问题。
在互联网刚刚开始的时候,这张图片告诉我们说,在互联网上没有人知道你是一条狗,现在有了大数据不一样了,在互联网上没有人不知道你是一条狗,而且你的出生地,你的性别,你的爱好都能搞的很清楚,这是不一样的地方。
第五个地方关于数据功能,它与城市发展有什么样的真正作用?我觉得很重要的一点,它会成为城市发展的新动力或者叫新动能。由于大数据的出现,城市发展的方方面面可能都会有了新的动力,它能够帮助我们更好的找到城市存在的问题,城市问题存在的深层次的原因以及解决的路径和方法。包括经济发展,数据动能也是非常明显的。
第六个基本判断关于数据经济,无数据不应该。大家知道在信息社会里主要经济是信息经济,信息经济靠什么?由于大数据的发展,现在信息经济越来越可以与数据经济划等号。现在我们谈到数据经济、网络经济、数字经济等等在大数据的环境下基本上都是一致的,是一回事儿。狭义的数据经济,我们可以说是直接的以数据生产交易加工为主要对象的组成,广义的数据经济是以数据为基础的经济活动总和。但是在认识和发展数据的过程中,有一个观念是必须要强调的,单一数据价值和有限的,不管你的数据量有多大,比如银行业的大数据也是一样的,银行业的大数据一旦与其他的大数据结合起来可就不一样了。就像那天我所在的气象会议时说的,简单的气象信息它的价值也是有限的,但是当它与旅游、城市管理、海洋发展甚至军事结合,那么气象大数据作用就非常之大了。现在你叫一辆车,这个活动本身它实际上使用了很多方面的大数据。包括地理大数据、交通大数据、服务大数据、用户大数据、交易大数据、信用大数据等等,前天我看一个资料说你每叫一次车,滴滴大脑运行了很多次。
第七个基本判断,是关于数据应用的。数据应用对于城市来讲会怎么样?效果会如何?我的判断是它会促使城市转型。从工业化城市向数据化城市转型。为什么是数据化城市?就是指建立在数据基础上的,用数据驱动城市一切活动的这样的新型城市,你所有的活动将来可能都要用数据说话,靠数据决策,依数据行动。我举个最简单的例子,这么大的雾霾天,咱们都是准时来到这个会场,你看到了这方面的信息或者会议邀请函,这是数据。我接到之后,我就看了一下我的时间表,这也是数据。数据内容很好,我也有时间我就答应了,他们就发过来日程表和邀请函,我就开始制作我今天演讲的PPT,这些都是数据。今天早晨来之前我先看看雾霾的情况,然后再用地图查一下到这儿需要多长时间,最终我又叫了一辆车,大家想想这都是数据驱动的,数据驱动一切已经不是理论问题,已经是时常发生在我们身边的事情。
对于城市来讲,将来城市的规划,城市的管理,城市的运营甚至每一项决策,可能都是要在大数据的指引下来进行。大家可以看一下前不久发的关于大数据相关的政策里提到四个方面的数据化应用、领域,包括社会治理其中包括企业监管、环境治理、食品安全、应用体系等等。在服务体系方面包括健康医疗、社保就业、就业文化、交通旅游等等。在产业发展方面由工业制造,新型材料、航空航天、生物工程、金融服务、商贸物流。在创新创业领域提出要实施大数据开放行动计划,要鼓励开展大数据创业竞赛,这些方面一起的往前走,我相信用不了多久可能咱们所有的城市都将是真正的建立在数据基础上的城市,也就是数据化的城市。
第八个基本判断,谈一下数据政策。从战略到行动,咱们去年五中全会和今年的政府工作报告都提出要实施大数据战略,围绕着这个大数据战略的实施从去年到今年实际上已经出台了若干与大数据发展相关的政策。我相信可能还没有哪个国家像中国出台这么多关于大数据发展的政策,可见咱们的需求之强烈,决心之大,希望之高。不仅中央政府出了,而且各地各部门也在出。从地方上来看,我现在能够看到的是就有20多个地区和城市都专门制定了大数据发展规划和战略行动,下一步越来越多。这几天如果我不是参加今天的会,我今天可能是在外地帮助评审另外一个大数据的规划。 从行业的领域来看,已经有像林业、农业、国土、银监会、煤炭、电力行业也都出台了相应的大数据的规划。
第九个数据开放。我认为数据开放才是数据化未来的突破。大家知道现在各地规划里我看到最多的是比较热衷的要发展大数据产业,这未必是一件坏事儿,但是目前来看也确确实实存在把路子走歪的现象。一谈发展大数据产业就是建数据中心,数据产业园,这是没有真正抓住大数据的本质,大数据真正核心是应用,不是建立在有型的机房,这也不是真正的发展。数据开放比数据公开是更重要的事情,信息公开已经提了十好几年了,信息是指加工过的数据,把那些信息放到网上当然很重要,但是现在我们要讲有了大数据把最底层实时发生的最基础的数据把它开放出来,是比那些你加工后的信息放到网上更为重要。为什么很多人不愿意开放数据?刚才陈老师提到几个原因,很重要的一点是观念没转变过来。这个数据如果是不流动的话,放在你自己的机器里边,我们过去有个词叫“敝帚自珍”,显得你很有价值,实际恰恰相反,你只有把这些数据开放出来,越来越多的人使用它才能体现出价值。当所有人都使用你的数据,离不开你的时候,你的价值才能真正的放大,这很容易理解吧。
对于各地政府的政策而言,我觉得与其说下工夫用招商引资办法,还不如踏踏实实把已经有的数据能公开的尽量公开。这里边我特别欣赏《大数据时代》的作者,他讲过一句观点,非常重要,他说“政府根本没有必要去建立新兴企业,只要把数据开放,这个产业、服务业自然而然的就发挥价值”。比如现在的PM2.5数据一旦公开出来之后,现在你查查手机里的有很多这方面的应用,放在过去那些部门里这些作用根本发挥不出来。我这几年也接触到了大数据实用的案例。上海交大把学生校园一卡通的消费数据进行了公开,说请大家找一些方案,能不能让智慧校园变的更好一些。最后这些数据计算出学霸指数和学渣指数出来,数据开放是最重要的出口,它比标准、立法制定更重要。 最后做一个简单的小结,现在的行动决定未来。三句话,所有能数据化的都将数据化,城市发展需要大数据,数据开放是数据化城市的突破口。个人的一些研究心得、体会,如果不对的地方欢迎大家批评指正,我上面所有的观点与我所在的单位没有关系,谢谢。
主持人:感谢杨主任入目三分的真知灼见。我们把热烈的掌声再次送给杨主任,杨主任给我们提的观点非常、非常好。接下来我们要有请IBM中国开发中心大数据与分析业务拓展总经理顾世山先生为我们带来分享《认知型制造》,大家掌声欢迎。
顾世山:各位领导,各位嘉宾,大家早上好。我每年也是参加非常多的大会,我今天非常的受鼓舞。因为我觉得这个演讲嘉宾的内容非常的深刻。从理论高度到实践,从深度宽度方面都给我留下非常深刻的印象。在接到这个邀请的时候,我在想讲大数据从哪儿讲起?它有好多纬度。比如我们要谈数据获起,这个地方就可以谈很多。获取完之后,怎么去治理它?包括我们今天谈到的存储,谈到的安全都是在这个领域。还有些领域比如数据分析和洞察,刚才杨主任提到的无数据不经济,IBM在研究经济的时候也有很多新经济的词,比如洞察经济、API经济、互联经济、平台经济,大量的新经济概念,这些概念之间有关联和重叠
我今天跟大家分享的内容实际上是在数据分析和洞察这个领域里头。这个领域我们把它分成四个层次,第一个层次它是英文叫描述型,第二个层次预测型,第三个层次处方型,还有一种叫认知型。大致的分类因为时间关系,我就不深入展开。描述型是说我把这个数据拿过来,对一个事物,对一个人进行描述,这是比较死,比较没有太多行为在里头的描述。到了第二种我要对这个事物进行未来的预测,不光是看过去、现在还要看未来,这时候大数据分析能力就逐渐强大了。处方型的实际上是在后面要跟着动作、行为、指令,这样是叫处方型的。再一种就是IBM现在比较倡导的叫认知型。
大家比较熟悉的IBM在全球推进的是Watson它根本就是认知型的。这个是从一个技术发展有一个曲线,这个曲线是有普遍性的。从这个曲线上你可以看得到认知计算它还处于非常初期的阶段,它晚于物联网,晚于现在先进的大数据分析的技术,甚至都晚于我们提了很多年的云计算的技术。这个报告是IBM有一个研究机构研究出来的结果。 很多的人都在关心IBM的 Watson到底是什么?它背后用到的技术叫做认知计算,认知计算又是什么?URL,U是要理解各种数据,因为数据本身它是放在那个地方,但是你要把它理解了,比如说我的数据有很多种类,很多类型,有的数据它是文本类的,有的数据是波形,有的数据是图形,有的数据是表单,它有一定的结构,你对这些数据到底能不能理解,能不能读懂,这是第一步要做的事情。
第二步要做的事情是要学习,所谓学习历史上成功、失败的大量的经验能不能从里面找出规律?找出一种模式,把这个东西沉淀出来之后就变成了知识,变成了智慧,变成了理念。在去年的时候,大家比较震撼的是阿法狗,它更多的技术来自于这个领域,是把几千万台围棋的经验进行归纳、总结、推演出一个模式出来,然后让计算机给予指导进行下一步的对弈。
第三领域叫推理和决策。我们通常在做一件事情进行分析的时候,我们不会只用一种模型,我也不会只用一种方式,我会用多种方式。这个时候最后就需要一个折中、推理。大家可以认知分析的时候,你就想到URL这三个字母就可以了。
Watson在全球领域已经进入了非常吸引业界注意的领域了,尤其IBM在医疗,在健康这个领域的推进工作非常的快速。在国内因为有这样那样的原因,我们在国内的推进工作不如美国快,甚至不如新加坡、印度那么快,原因大家能想象的出来。
在下一个领域是金融行业的理财,还有一个行业是教育。其实我们今天谈到的是制造。在制造里边到底怎么来用认知分析?在Watson没有进入到中国之前,我想剖析一下Watson,让在座更多同行理解IBM怎么用Watson做这个业务?你可以把它分成三个阶段。第一个阶段最左边IBM有三个跟大数据分析,尤其是跟非结构化相关的产品和技术,我们都把它叫WEX,这个技术主要是帮助我们的企业,帮助我们不管是提供IT服务的还是终端企业,做大数据分析的时候,它是一个起步工作,它是混合云起步阶段是在企业内的,首先要把这个能力培养起来。这一方面其实我们国内的很多公司,按照自主可控、安全可信的原则已经开发了很多的产品,IBM在这方面也比较强。
第二个大量的数据在后台,这个数据本身我不可能把原数据丢了,我必须开发大量的API,API怎么归类?到现在为止IBM已经开发了几十个跟大数据相关分析的API级叫QA API级,还有一个推进的过程,它实际上是做一个折中,做一个中间的最佳的答案。我讲一个例子,当初IBM拿网球名将李娜打网球分析,我们用到了8000多场比赛数据,我们拿了2000多个模型,最后我们只拿出36个模型作为最适用李娜的,这样的分析都是长期的过程,不是说我一天,几天我就能拿出来的。所以最后你到了具体跟进行比赛的时候,这里就会有一个过程,当场比赛我要拿实时数据出来进行折中和融合的过程。下面两个容易理解,语音怎么变成文本,下面是文本变成语音。还有一个是讲的个性化,因为我今天做精准营销的时候,如果我只是知道华东地区的30到40岁之间的男性白领这不够,如果我对这个人的很多个性有更多的了解,那么我这个时候分析就更精准,比如我对他理财行为,我要对他治疗或者养老的护理方方面面的信息拿过来更精准,IBM在这方面都提供了很多API级,现在这个级有几十个。
第三到了行业,在行业里IBM有很多的行业层面。比如我们讲财富管理,时间关系就快一点。这里面就讲到IBM认知分析的API级,我举了一些例子,在人机交互方面、分析方面的API,在推理方面像策略方面API级也非常丰富。
谈到制造,我们没有时间谈国家战略。从中国制造2025之后,20多个省都有对应的行动计划,我们今天在这儿不阐述。更多的看一下中间这张图,这张图也是IBM价值研究院研究出来的成果,它把过去的我们经常讲的价值链的链条式的制造,现在看成是一个平台式的。这个就是它的另外纬度,底层是围绕大数据、云计算、物联网等等这些技术,上面是转型。从过去的传统的价值链往新价值网络进行转型和升级。在谈到典型的制造业场景的时候,我这边举了几个例子,第一个我们谈智能资产和设备,我们用IUT技术和认知能力来感知环境,这里有一个数据,我们在某一个具体的项目上能够对信息提供进一步的实时分析之后,它的宕机率降低了47%,这是对设备的宕机率。第二个在认知流程和运营方面,IBM跟全球非常超级的家具生产企业,在认知方面提升它的流程和运营效率,使得它的缺陷率降低48%。再一个是资源优化,主要是人和资源搭配,这里有很多优化工作要做,这里增加的利益要达到百亿级的,这都是IBM在制造行业的业务成果,都很数字化的东西。
刚才我们讲到的都是IBM在制造,怎么去应用认知分析?可能讲的这些东西比较抽象,我们具体讲一讲IBM在中国的实验室和中国的研究院正在做的几个研究就比较直观和具体了。我们在帮助一个企业拿它的设备,它的振动波形来进行分析进行预测它所在的生产装备线它的可用性,每一个设备运营的时候都会有振动,拿它的声波进行分析,国内一些企业在用。同样我们可以拿咖啡机振动波形来分析你现在是在磨哪种类型的咖啡?这个是具体的一些应用,这个应用大家听起来好像是说意义不大,但是从研究的角度,从将来应用前景的角度上是蛮有试探性,蛮有研究价值的,所以这些东西都是我们目前正在应用和推广的阶段。
还有一些工作也契合到前面几位领导讲到的,我们正在目前正在研究和推进的,当然我们在其他的像欧洲市场已经有应用的,我们怎么在工业中建物联网的生态?这里我们用到很多的技术。比如在左下角我们会有大量的数据采集工作要做,物联网的采集,传感器、通讯标准的研究,数据的治理,数据怎么收上来怎么存怎么用?这是这个领域的事情。这个领域我们目前在国内已经跟央企具体的合作已经在一个省里实施了,9月份已经上线,这是我们真正做到的事情。
我们下一步要做什么?我们希望把区块链的技术用到制造里面去。大家知道我们在制造业已经有龙头企业在华东地区成立了区块链研究院已经在制造行业如何把区块链应用到制造产业里去做一些研究。IBM在欧洲这方面研究更多,因为它的制造总部放在德国慕尼黑,我们把这些经验拿到中国来。它的应用在哪里?比如说我们做了比较小的应用,但是它是未来会影响到我们在物流领域蛮大的尝试。因为欧洲的国家都比较小,如果你要定一束鲜花它需要经过陆路水运空运怎么保障新鲜?我用了区块链,强调了不可抵赖性,这个我们在欧洲已经有了真正的应用。还有一个我们在国内正在试探探讨冷链行业的应用,也是用到了区块链的技术,这是左上角。右下角今天我们有专家谈到数据的交易,因为你数据一旦有了宿主就可以确权,就可以谈下一步数据定价包括价值的进一步发现,这个我们也是在跟国内的有关企业正在探讨它的功能,它的业务模块怎么分类,这个我们也做了很多的探索。
再下一步我们怎么去跟产业,跟政策跟我们的双创整个大的生态打造起来?这里也是我们正在思考和正在研究之中的事情。很多人说,制造业好像是S公司的,是某S公司,是两个S公司的强项,IBM在制造行业没有太多东西,这个误解是偏差的。如果我们从制造行业生命周期来看,从产品研发、生产、后续服务,IBM有很多理念可以跟踪,我们也在这个行业打造很多的合作伙伴进入这个生态。比如在产品研发,IBM打造的是持续性工程,而且在国内我们有一个超级大的央企合作,已经有十年的合作,这个领域相对比较成熟。 下一步我们讲数字化工厂,我们首先把工厂里很多设备数字化,把数据先拿到,拿到以后进行分析它的可用性,它的预测包括我们有一些闲置资产怎么把它进行分享经济?这方面都是在探索。比如像企业数据总线的集成,国内有一家公司都非常成熟,我们不讲名字了。
还有物联网,IBM有个最成熟的产品,现在已经在国内部署了IOTP,现在国内很多企业已经在用这个平台,我们也在国内寻找更多企业使用这个产品的技术,这完全是大数据的,而且是实时分析的。
下面是数字化营销,关于这个词实际上IBM已经做了演进,数字化运营是前年提出来的,今年提出更深的词。这里提到的词包括2015年年底财政部提出来的企业要大力做财务共享,我们这里讲费用管理、财务共享中心、认识共享中心、合同管理、电商平台、供应链金融、协同办公、动态库存管理等等。还有一个概念是服务型制造,怎么变成一个智能化的产品?智能化的产品怎么反哺到研究阶段对产品进行新一代改造和升级等等,也都是这个领域的事情。怎么做维保?到底是生产环节问题还是供应商产品质量问题还是我的组装问题,还是我产品的本身结构设计问题?等等它整个是一条链子会进行追溯。
产品的预测性行为,如果这个产品到了生产环境上,我怎么预测它未来什么时候有可能会出现必须要换的诉求?这个你需要做一个长期的跟踪和预测。还有一些产品的溯源,尤其我们现在在跟石油石化方面探讨这方面的需求时非常迫切。还有客户自身零售、消费也很重要。还有投诉管理,我们的投诉很多,今天用手机明天用微信后天用搜索网络在上面吐槽,我们这里有很多的应用都是成型的,国内有成熟的合作伙伴,我们需要在制造行业基于IBM大数据分析能力构建一个更加丰富的应用生态。 最后一张片子,从制造行业一个比较底层的像芯片的层面到物联网的设备层面一直到最右边的解决方案层面,IBM都需要大量的合作伙伴来把IBM所提出的理念在我们的企业里头,制造行业里头实实在在的应用起来。好,谢谢大家。
主持人:感谢顾总精彩的演讲。在大数据领域如果排榜单,IBM是排第一位的。企业的人财物,产中销,特别是在制造业大国,IBM的Watson系统已经在中国制造企业里能够生根发芽做出更好的大数据的精彩应用案例。我们再次把热烈的掌声送给我们的顾总,感谢他为我们带来的精彩演讲。
接下来我们要有请工业和信息化部软件与集成电路促进中心云计算中心主任杨东日,为我们带来《工业大数据认知与思考》,大家欢迎。
杨东日:尊敬的各位领导、各位专家、各位朋友大家上午好。非常高兴有这样一个机会向大家汇报一下我们在工业大数据认知与思考。所有的观点就像今天的张主任所说的都只代表我个人的观点。
首先我们来看一下,全球工业大数据有几个重要的来源,这是个工业化社会,工业化世界。提出工业大数据的也主要有这样几个概念,第一个是德国的工业4.0,为什么德国提出这个概念?事实上德国工业遇到了巨大的问题。德国工业4.0重点是整合了工厂、物流和生产三个关键要素。特别在物流上,它把互联网、物联网、物流网统筹起来,通过数据的方式进行描述和刻划,来整合它现在已经显得有些疲惫的工业现状。美国提出了互联网工业,我们看美国事实上在互联网领域是最强势的国家。美国2001年10月26日颁布了爱国者法案,我们认为它具有里程碑事件。爱国者法案重点是什么?它解决数据的所有权问题,以及解决了美国的企业如何与美国国家政府进行紧密的关联,企业如何服务于政府和社会?它定义了企业的责任。十年之后,奥巴马政府在2011年12月31日在新国权授权法上重申了美国作为互联网大国的核心利益,它把互联网作为它的领土空间,作为国家政权空间重要组成部分,任何侵犯美国互联网空间的它都认为是侵犯了美国国家领土,它为此成立了网络森林部进行国家领土的维护。由此可见,美国掌握了互联网资源的分布权,技术垄断权,人才汇聚权包括资源分配权。所有美国提出互联网工业它希望通过它来拉动工业发展。日本提出社会5.0,它认为从狩猎社会、工业社会到信息化社会或者未来它将向超智能社会发展,它认为这是5.0阶段。在这个过程中,其实日本重复了工业和社会关系,企业和人类的关系。所以从哲学层面日本提出了最高大上的概念。这个社会也是由数据所构造的社会。中国提出了《中国制造2025》,我们知道我们在工业上我们不如德国,我们在互联网上跟美国没法比。《中国制造2025》,我们国家到2025年要迈入制造强国,2035年整体达到中等水平。
我们说智能工业包括两个层面的问题,一个是智,智就是信息化,一个是能,能就是工业化。中国制造2025是信息化与工业化的深度融合。智能工业的本质是人机易数。解释起来是未来人和机器间的沟通已经不是手动去操作了,为此,人品、机品与数构筑了未来新兴工业经济发展空间。
我们由几个时间卡口来大体的勾勒一下未来数据几个方面,第一我们认为它的需求处在青春期,有点懵懂,旺盛,探索,叛逆的阶段。为什么说旺盛?自从大数据概念提出之后,我们重新看到了曾经云计算概念提出来的状况,就是一夜之间大大小小的大数据公司应运而生。以前所有搞互联网的产业、企业或者搞信息化的企业它都要说自己是大数据的企业。为什么探索?到现在为止在全球工业大数据领域没有任何一家公司是做的成功的或者是它能够足以示范这个产业,带领一个产业发展方向。美国、日本、德国都没有在工业大数据领域做出突出贡献使我们可以参考,现在是全世界都在探索的阶段。最后说叛逆,现在我们来说搞互联网的,包括最近我也参加了一些项目的评审,所有的项目只要谈到大数据,谈到互联网,谈到互联网+,谈到智慧城市,谈到物联网都是要颠覆什么,革命什么,要把谁谁干掉,实际上你干掉了谁,颠覆了谁?都不一定。我认为未来是传统产业和信息产业融合共生的阶段。我们认为工业大数据处于跨界期,年怜效应促进产业链上下游加强合作。
未来你能接触到的信息技术名词都跟工业大数据有关,我们谈云计算、物联网、智能制造等等我们能谈到的所有数据包括智慧城市都是跟工业大数据有紧密的关联。工业大数据的投资,我们认为当前处于焦灼期,因为我们也在积极推进项目和资金的衔接。我们发现现在的投资有点高冷、狂躁、落寞,英雄气短,束手无措。为什么这样说?现在都说投资互联网可能是你无奈之中的唯一选择,因为地产你现在很难投了,贵金属很难投了,汽车产业也不好投。现在能投的创新创业项目,创新创业大部分都是互联网项目,都是大数据项目,它到底能给你带来什么?你根本不知道。资金不过山海关,说到现在为止到东北三省到老工业投资互联网项目寥寥无几,为什么?因此大家找不到方向和投资项目。 大数据产业发展我认为处于战国期,其实国内的企业并没有意识到它所面临的巨大的危机,它的危机不是国内的企业之间吵吵闹闹,而是国外列强已经在潜移默化的瓜分你的市场。我们有个数据这是2013年数据可能有点老,但有一定的说明性。2013年云计算的市场是怎么被瓜分掉的?说全球云计算市场60%被美国拿走了,23%被欧盟拿走了,10%的市场被日本拿走了,中国只占全球市场的3%,中国也是全球市场的重要组成部分,但它只占3%。我们国内的企业在这种产业竞争之中其实是有极其的劣势,当务之急是什么?我们必须要合作,不能够固步自封,也不能自娱自乐,一定全面合作共同开放我们的新兴领域市场。
刚才有几个专家提出了产权问题,真正制约大数据的不是技术问题,真正制约大数据发展是产权问题,产权不清晰就无法把有意义的事情变成有价值的事情,你也更不能把有价值的事情变成有价值的事情,也就是说你不能用大数据来交易,因为你没有产权,你所有的大数据的交易都是非法的。所以我认为当前解决数据的产权问题是尤为重要的。 工业大数据安全处于敏感期,大家都知道刚才倪光南院士也跟大家深刻的分析了大数据存在的问题。习主席说,安全和发展是一题两议,不能够因为安全问题不发展产业,也不能盲目发展产业而忽视安全。刚才我们说了很多专家提到了,现在政策出台非常紧密。刚刚我们十三五的战略规划里,我们也看到了未来的工业里面也跟工业大数据有紧密的关联。v 建设处于窗口期,我们发现任何一个信息技术,一个名词的产生都有历史时间,一个段,一个卡口,从产生到炒热最后一定跌到谷底,未来工业大数据也是这样,一定会冷下来,建设一定要抓住这个时间点,要加紧加快推动,否则大数据领域也会转瞬即逝。
最后一点,我提一下工业大数据必须加强比较优势,积极开拓一带一路的市场。因为我们发现我们国家在一带一路沿线67个国家里输出的绝对不应该是我们的落后产业,而是应该对我们国家先进产业,很大一部分是不发达国家或者欠发达国家,我们必须发挥我们的比较优势,把先进的工业和工业大数据推向这些市场。一带一路来说,其实我们做了很多工作,下面我向大家汇报一下。
这是在去年,我们跟百斯坦进行了访问和调研,在这里我们重点谈了信息走廊建设,信息走廊要把中国中小企业带出去。中国有6000万家企业,99%是中小企业,当前我们看一带一路大部分是国字头的或者中字头的,大型的央企,他们只占我们企业总数的1%不到。但是我们国家6000万中小企业它的产能才是我们正需要释放的产能,它解决了60%的GDP,我们重点要打造信息的通道,使我们国家中小企业在信息通道上与国外对接,当然我们也希望把国外质优价廉的商品输送到国内。新疆前书记对我们给予了大量的支持和帮助,我们跟立陶宛政府共同探讨了我们如何进行产业的合作。在今年的8月份我们在新疆克拉玛依举行了一带一路的论坛,这次论坛我们签署了625亿的项目,其中工业项目占领大部分,工业大数据这里也会占有巨大的比重,这也是我们信息走廊重点关注的项目。
主持人:感谢杨主任热情洋溢的报告,杨主任说工业大数据处于青春期,在青春期要沉住气,使劲干。杨主任为我们工业大数据在国内的推广工作也做了大量的贡献,所以我们再次把热烈的掌声送给杨主任,感谢他。
接下来为我们演讲的是中国电信北京研究院副总工程师杨明川先生为我们带来主题演讲《运营商大数据发展与展望》。 杨明川:大家上午好,非常容幸有这个机会能在这里分享一下运营商在大数据方面的探索和实践。我们原来定的题目是《运营商大数据发展与展望》,后来我想一想更加聚焦一点,更加面向未来一点,所以我把题目进行了调整。我这次想跟大家分享的题目是《运营商大数据的六个关键词》。 首先我们中国电信做大数据也有挺长时间了,应该有四五年的时间,从刚开始接触大数据到怎么样能够把大数据用在行业,用在内部的生产经营中,我们也经历了很多的探索。在这过程当中,我们也遇到了不少的困惑和一些问题,今天在这里我特别想跟大家分析的是,我们在大数据探索的路径上我们的一些思考,我们的一些困惑以及我们对未来的一些判断和展望。
首先来看,这是2016年大数据产业地图。传统意义上来讲,大家都认为电信运营商应该是拥有数量非常众多的数据,拥有大量的数据金矿,但是不知道怎么用。从运营商的角度来讲,当然我们的角色,一方面我们是数据的提供商,我们希望一方面把自身的数据能够有效的利用起来,同时我们还希望在另外一个方面能够做出一些事情,一个比较重要的方面,比如我们希望基于我们的数据打造能力平台。第二希望行业应用方面运用大数据创新,这是我们的基础想法。实事求是的讲可能在某些方面我们做的还不错,但是在另外一方面离我们的期望还有一点距离。
首先来看,我觉得说到大数据前面有很多专家也都讲了,大数据已经火了好几年了。但是真正有意义的大数据的成功的案例,我个人觉得可能还是处于局部的。真正能够在大数据对产业的发展,大数据本身作为一个行业到底现在进展到什么程度?我个人来讲还是有一些怀疑态度。为什么这么说?其实这个大数据行业还存在很多问题,对运营商来讲可能问题也更多。比如说我们在做大数据的时候,其实大数据和小数据不一样,小数据更多的是依赖质量比较高,结构化比较强的数据,但是大数据其实它的特性更像洪水猛兽,数量非常大,数据非常庞杂,但是同时数据质量非常差。在这样的数据里面,我们去做一些有意义的事情就会遇到很多困难,这些困难是我们之前在做大数据应用研发和行业方面一直不断遇到的问题。比如说数据质量的问题,比如持续性的问题,以及造声的问题以及数据关联性问题,等等很多这样的问题,可能我们原来做小数据的时候不会遇到的,我们现在都遇到了。
现在从运营商角度来讲,做大数据可能还会面临更多的挑战。比如Https以前我们会对网络数据进行分析,现在我们遇到很大的挑战。第二,现在大家都知道数据的隐私保护越来越重要,从国家政府到普通网民大家都越来越重视自己的隐私。大数据本身我觉得就是一个找平衡,走纲丝的事儿。你把这个平衡点设置在哪儿?既能够运用大数据做出有价值的事情,同时又避免能够侵犯用户的隐私,这里要找到很好的平衡点是不太容易的。还有一个问题,我觉得也是我们做大数据经常会思考的问题,大数据的产业炒的很火,大家认真想一想,我们的大数据到底为我们的生产,比如基于大数据做精准营销,大数据提升我们的产品生产环节更有效率。大数据在里面到底发挥了多少作用?这些作用是否可以量化?这个作用在自身的产品演进过程当中取得的作用有多大,特别针对传统行业而言,可能针对互联网行业来讲这个比较明显,但是针对传统行业来讲,很多问题很难量化。所以这样的一些问题就导致我们不断的思考,未来我们大数据的空间在哪儿?
我想从三个层面说一下这个事情,从全局来看,我想从宏观、中观、微观三个角度来看这个问题。宏观层面,现在大家都知道我们十三五规划供给侧改革,这个跟我们大数据相关的行业和产业带来三个空间,包括创新的政府治理,产业转型特别是传统行业的转型以及消费升级。在中观层面,我们来看产业发展趋势。现在我们正在面临新的产业革命,这个产业革命包括云计算、大数据、软件化、人工智能、物联网、区块链等等这样新技术他们共同构成新技术的网络,他们共同来推动下一次变革的发生。这样的变革发生过程当中,也会给大数据的应用带来新的机会。从运营商自己来讲,中国电信发布转型3.0战略,从我们自身来讲,大数据在未来我们转型中扮演什么角色,这也是我们思考的问题。 我想我后面的观点会沿着这几个方向展开,提出大数据未来发展三个视角,这三个视角是三个纬度。第一个纬度是技术的纬度,这个纬度我们下一步发展的关键词是融合和平台。从行业的纬度,发展的关键词是互联网+和生态。从转型的纬度,就是看我们自己这个关键词可能是运营。所有这些纬度之上,我们要拥抱人工智能时代,人工智能是作为大数据更高的阶段,它在这些所有的纬度里面可能会起到更加关键的作用。在这些方向之下,我们现在做的很多事情,包括网络优化,智能网络,各种行业大数据,包括客户的洞察都是在这几个纬度之中。
具体来讲是这六个关键词,智能、平台、生态、行业、融合和运营。后面我会稍微展开一点。首先是智能,大数据发展到现在,有时候我自己在想大数据本身不是目的,我们站在更加长的时间来看,从更长远的来看,大数据的时代出现有可能它只是为我们智能时代的出现奠定了基础。所以说真正迎来产业发展和产业爆发的有可能是智能的时代到来。所以说我们现在在做大数据相关的研究和开发的时候,我们现在也把这个眼光投向了智能。这里面我想人工智能这个技术整个在行业也是在今年巨热的技术,运营商怎么从大数据和智能的结合点找到我们的机会?这里面比如说我们现在聚焦的几个点上,比如说语言的处理,数据的处理,语音的处理和知识的处理,这里我们尤其看重知识的处理。因为从运营商大数据里面,我们可以提炼出很多相关的文本的信息,比如说公众平台的这些文本的信息,而且更重要的是我们不断的可以去从公众平台信息里面去发现相关的知识,而且每一个公众平台文章的信息它背后关联是用户的行为,也就是说把用户行为,我们从大量的文章挖掘得到的知识我们进行更有价值的关联,就能得到更多有意义的事情。 这个图我们通过上亿篇公共平台上的文章去构建的知识图。这里我们用了开源的深度学习平台,比如说人工智能,这个关键词我们通过大量的文章关联发现,关联挖掘我们可以构建这个词关联关系,以及所有这些关联关系和背后的阅读者就是用户和背后的公司和背后的行业之间的关联关系。基于这种关联关系我想我们接下来可以探索更多的更有价值的大数据的场景。所以说在大数据再往前走一定要和人工智能技术做紧密结合。
第二个关键词是平台,一个是大数据平台,另外一个是云计算平台。云计算和大数据在技术上就是一题两列,大数据平台和云计算平台是两个方向,这两个方向会融合在一起。在平台里有几个关键词,首先要构建能力,我们希望这个平台我们提供的不是数据,而是数据能力。其次这个平台要开放,我后面也会专门再展开这个事儿。我们怎么样用最新的云计算的能力架构去重构我们的大数据平台?这里面包括云计算的技术,包括微服务的体系。下面这个图是我们现在正在构建融合的东西,这里面除了云计算的基础设施,我们把云计算的技术能力和大数据的处理框架以及其他微服务的架构把它整合在一起,未来为我们打造下一代新型的大数据的处理能力打下基础。基于这上面,我们现在也开发了探索的应用,比如说灯塔,深度探索和云眼监控。
这个图是我们构建的大数据灯塔平台的能力开放图,时间关系不再细讲。这里我想表达的核心观点,我们怎么样把数据资源变成数据能力?特别是这个数据的能力未来和行业应用和智慧运营能够有更好的结合去实现在数据和应用之间的鸿沟能够去建起这座桥梁是最关键的。
第三个关键词是生态,为什么提生态?我们运营商大数据价值在哪儿?大家都说运营商的大数据多、广,我们不断的思考运营商大数据真正价值在哪儿?我个人有个观点,云计算的大数据主要不在于它的深度,而在于它的广度,这种广度的价值也不在于我覆盖的人群数量多,而在于运营商的大数据更像一个地毯,这个地毯能够把不同来源的数据穿起来,在于它是大数据的连接器,利用这个连接器能够实现不同来源数据的整合,这是它真正的价值。基于这种理解,我们认为大数据运营发展方向要朝生态发展去做。我们怎样把数据整合之后实现1+1>2的效应?具体来讲我们把不同来源的数据进行整合、处理、叠加、补全之后就能够为真正的构建更好的大数据生态,为支撑上面更好的大数据应用起到作用。
第四个关键词是行业,前面我们讲了也有从宏观来看。现在大数据用的比较多的,大家也都知道。比如运营商大数据用的多,金融用的多,互联网广告用的多。在行业里真正大数据发挥价值的空间是在三个方向,一个是政府大数据,前面讲了未来政府转型治理,新型的智慧城市,国家对大数据更重视,为我们创造了更大的机会。政府大数据里有很多可以做的,包括治安维稳等,还有我们聚焦在行业转型有很多新的空间,特别是传统行业,大数据一定是在传统行业向新型的以互联网+甚至智能+的行业去转型的时候,大数据一定可以发挥作用。当然我们现在来看这种作用还没有真正体现出来,我们相信在这里蕴藏巨大的空间。
第三个面向用户的核心关键词是消费升级。我们国家经济发展到现在的阶段,简单的初级的消费已经不能满足我们的需求。在消费升级的过程中,大数据是大有可为的。当然同样这个领域空间也刚刚在开始。
举几个例子,在政府大数据方面我们也做了政府的项目。这里运营商最关键的能力在于位置的能力,怎么样把位置的能力和对用户的洞察结合起来,再结合政府方面的需求,我们能够做很多事情,包括城市的热力图,包括区域的洞察,我们可以指定通过我们的算法可以划定任何一片区域,分析这片区域里用户的行为情况等等各种因素。特别是说能够去洞察这片区域里的不安全因素,这个是非常重要的。还有比如说外来人口的管理,特别是在城市人口流动性不断增加的情况下,怎么样能够对外来人口进行管理,这也是政府治理城市管理头疼的问题。
再举个例子是用户层面,我们刚才讲了消费升级是一个核心。我们现在怎么样能够通过大数据的能力和算法构建一个多纬度、多层次的商业价值指数,比如说我们做了一个案例。比如说我们对影视的节目做了多纬的价值分析,以前可能我们对这些隐私节目只有一个评价指标就是收视率,这个节目被多少人看过,其实在很多领域都是一样的。在微信公众平台里面大家评论这篇公众号被看和转发了多少次,这是相对粗矿的东西。我们怎么样综合利用大数据的能力,我不仅仅去看这个节目被看了多少次,我们更进一步分析看这个节目的都是什么样的,它的年龄结构、消费收购、收入结构。更进一步看我们这部分人感性化的话题和购物偏好等,我们就可以打造整体的全视角商业指数,这就可以为很多行业提供更准确的判断。我们可以影视剧这个行业里,网络收视排名和商业价值排名不一样。还有很多其他的例子,比如说品牌,比如说公众号等等场景下,我们也能找到很多应用的场景。
再有一个融合。融合这块其实是各个技术的融合,这里可能之前大家讲的比较多,云计算、大数据、人工智能、物联网、区块链、移动互联网,怎么把他们合力起来?包括前面的专家讲工业自动化,讲其他的领域也都提到了这里面核心的关键词是把不同行业的技术汇聚起来。比如我们现在正在做的线上线下的洞察,就是把线上来自基站的位置数据和线下来自于wifi的数据或者说其他的蓝牙的数据等等这些数据进行打通,把线上和线下的行为,把天上和地下的行为,把室内和户外行为做一个贯通,我们就能发现很多更有价值的事情。
最后一个关键词是运营。这个关键词更多的是我们不但要把大数据用到外面也要用在自己。比如中国电信在讲怎么叫商化?运营智慧化,怎么利用大数据的技术,特别是涉及到网络要向未来智能网络演进过程中起到更大的作用。比如我们针对中国电信云计算做了基于大数据的分析和诊断。我们做了公有云的评测,做了服务质量的监测等等,其实这些东西也是一个大数据的应用。这个大数据怎么用到内部?这里也有巨大的利用空间。
因为时间关系,可能讲的就比较概略。以上是我个人对运营商大数据我们未来发展方向的思考,也是个人意见,希望以后有机会能跟大家多沟通,多交流,谢谢。 主持人:大家知道我们这个大数据行业有三大数据源,运营商、政府和金融。运营商大数据刚才杨总讲了他已经支持到各个行业,各个政府包括我们个人的用户体验的优化。所以运营商的大数据是一个金矿,数据金山。所有运营商提出对内业务支撑,对外数据变现新的战略,希望通过数据能够去驱动运营商的转型升级。所以我相信刚才杨总讲的这些电信的大数据的应用案例实际上是对我们各行各业去驱动数据的开放,数据价值的变现具有一定的参考价值。
前段时间我们去广东移动,他们在搞大数据创新创业大赛,就是把数据开放出来,能够支持到创业者,做很好的数据创新应用。所以我们再次把掌声送给杨总感谢他为我们做的精彩报告。
接下来是我们赛迪网副总裁/常务副总编梁媛女士,她为我们带来大数据十大热词,我个人非常期待,我们用热烈掌声欢迎她,欢迎。 梁媛:谢谢主持人。顾名思义热词是热度、关键词,我们盘点了2016年整个一年大数据产业相关的词汇。我先简单介绍一下我们这个词汇的背景介绍。因为赛迪网作为一个媒体来说,它一直在关注大数据这个产业同时也对这个行业有一些自己的认识。另外我们赛迪网也是希望通过自己的平台能够为大数据产业献计献策。我们主要是通过以下几个纬度来评定,其中包括行业的发展趋势,媒体暴光率,移动社交,搜索指数,编辑推荐以及专家评审。专家评审方面,我们之前专门请了相关专家和媒体人士对行业热度词进行评定,这些热度词里,我们之前大概有几十个热度词,我们分政策层面、产业层面、个人用户层面。
我为大家先揭晓我们第一个热度词,大数据产业“十三五”。在上午演讲中很明确的听到“十三五”词。我们刚才听倪院士说我们今年以来有很多关于大数据的计划、纲要、指导意见,对于“十三五”来说,大数据是很好的支撑。
第二个热度词,AR和VR大数据。应该说AR和VR在今年一年来说非常的火热,相关的产业包括我们熟悉的互联网公司,创业公司还有一些硬件的企业都在计划、设计和制造相关的硬件产品。其中Pokemon Go为AR、VR达到巅峰时段。这个游戏是一种角色扮演,是通过我们手机里简单的游戏去发现精灵包括捕获它,我们很多用户在短短几周内达到一亿人,这个游戏在AR、VR里得到很好的体现。
下面一个词是“区块链”。这个“区块链”是比特币重要的概念也是底层技术。刚才IBM嘉宾演讲里提到目前“区块链”在欧洲得到应用,主要解决交易信任和安全问题。目前在法律行业、房地产行业得到应用。目前主要分为公有区块链和行业区块链以及私有区块链。
下一个是“天气指数”。我们日常看到的一个是北京市环境保护监测中心舭部的环境指数,还有北京美国大使馆有一个实时污染PM2.5指数。我记得国家信息中心张主任谈到大数据和小数据之分。若干年前在北京出现了降水概率的词,这个词出现,当时的天气预报除了温度它还有一个降水概率,这个词在当时行业环境下属于小数据。什么是小数据?是小样本,人工,有限,结构化,滞后的。造成当时这个词出现之后,降水概率并不准确,在实行一段时间之后就取消了。 今天我们发现关于雾霾指数和雾霾的进京时间段,这一次准确率比较高。前两天下午时段霾就进京,我们有非常切身的体会。
下面是“创投机器人(阿尔妮塔)”,它是作为创业项目类似于评委一样进行深度分析,我们有一些创投项目进行评定,并且让它的指数获得下一轮投资的可能性,并且有成功案例出现。在今年我们关于机器人话题非常多,从年初的阿尔法狗还有认知学习,学习深度包括人工智能,对于机器人来说今年非常火热。我们今年有一个非常热的节目叫“蒙面唱将”,我发现对它里面的机器人讨论非常多,我个人感觉它并不是真正的人工智能,可能也就是人肉智能大玩具或者品牌的宣传。在人工智能方面,包括苹果、微软小兵也都有非常好的应用。但是人工智能这一块未来走的路还很长,在小V里有一个场景,有很多机器人在若干年后可以真正作为评委,我相信未来机器人产业也可以真正融入进生活。 下一个词是数据主权,前面是数据后面是主权。应该说在前面嘉宾演讲中提到我们在操作系统、互联网行业,我们的时机不太好,但是在大数据目前状况来说,我们应该加快我们对于网络的安全管理水平,增强网络空间防御能力,提高我们的认知度在国际的话语权和规则制定上朝着非常健康的方向去发展。
再一个关键词是地球大数据。杨主任演讲里到“一带一路”,这是国家近两年非常重要的方向。包括数字和思路的方面我们大数据有非常重要的作用,能够帮助地球科学、数据合作,符合我们未来可持续性发展目标。
下面一个词汇是智慧城市3.0。智慧城市3.0经历了智慧城市1.0到2.0到3.0的阶段,它经历了数字城市到现在的新兴驱动。目前我们主要是以大数据为技术的基础,以人为本提高公共效率方式,能够达到我们目前可以用智慧作为支撑的服务。这里的服务包括智慧医疗、智慧交通、智慧养老非常细分的行业。
下一个词汇国家大数据综合试验区。以10月21日,国家发改委、工业和信息化部、中央网信办联合印发《关于统一在部分区域推进国家大数据综合试验区建设的函》为例。 最后一个词是金融风险评估。我记得刚才在陈司长的讲话里谈到目前我们在金融行业尤其在金融交易行业里出现了问题,包括法律法规体系建设的不完善,包括我们对数据资源的难共享,难交换,另外是数据安全难保障。我们现在最恼人的电话是一个未知的手机号打过来,他会问你,银行贷款有需要吗?其实我们发现这种信贷行业的确是大数据的核心领域,目前我们会发现由于这种传统银行的网上交易业务以及这种新兴的互联网金融业务像B2B金融,在监管在行业准则方面还有很多方面有待提高。
以上十个热词是我们在2016年整个年度大数据的热词。不难发现这些热词反复出现在今天我们所有的嘉宾演讲中,也进一步作证了我们对于十大热词的关注度和热度。对于十大热词来说赛迪网不遗余力的去关注这个产业,在未来也希望我们所有企业能跟我们一起共同发展,共同创造,共同为大数据行业献计献策。以上是我们赛迪网对于今年所有大数据产业的热点关注的关键词的汇报,谢谢大家。
主持人:感谢梁总的精彩分享,总结2016展望2017,我相信明年大数据机会都在这些热词里面。我刚才听刘总说他们花了很大力度做这个热词,说明它是一个群众智慧,它集很多专家智慧在里面。每一个方向都有很深刻的大数据的应用,我们再次把热烈的掌声送给梁总,感谢她。
我们接下来要进入激动人心的时刻也是我们大会的主办方,也是今天的重头戏,是我们大数据颁奖典礼。我们要有请数创汇的总经理,大会的颁奖典礼分为了五个类型的奖项,这个奖项由数创汇主办的。我们欢迎这个叶鹏来主持,他对这些奖项非常熟悉,我们掌声欢迎。
叶鹏:谢谢大家,非常容幸主持最后压轴的环节。经过近两个月的筹备,本次大会的奖项将在今天揭晓,我们通过前期的企业自主申报还有我们的网络投票以及专家评议等环节评选出本次大会各个奖项的归属,今天稍后为大家一一揭晓我们的获奖单位。本次评选共从三个纬度评选,我们分别揭晓大数据、产业人物还有企业技术产品三个奖项。…
感谢各位嘉宾上午的分享,上午的大会到此结束。
评奖名单详见链接http://www.ccidnet.com/2016/1216/10223797.shtml

北京赛迪网信息技术有限公司
公司地址:北京市海淀区紫竹院路66号赛迪大厦
联系电话:010-88558907
邮政编码:100048
电子邮箱:webmaster@taff.ccidnet.com