第8期 | 谢国忠:大数据及其在各个行业的应用与实践(一)

核心提示:企业里边有交易数据,但是怎样获取大交互数据呢?大交互数据怎么和大交易数据进行对接?怎么进行关联?如果大交易数据和大交互数据对接并且关联上之后,怎么去推动业务创新?

10月19日,第8期“清华·照澜书院”在清华大学照澜院15号举办,清华管理评论邀请了IBM大中华区全球企业咨询服务部副合伙人谢国忠先生以“大数据及其在各个行业的应用与实践”为主题进行分享交流,谢国忠从大数据概述、大数据基本原理与应用模式、大数据在各行业的创新应用与实践、大数据演示等内容进行了阐述。以下是本次活动实录的第一部分。

 

今天我给大家介绍的是大数据及其在各行业的应用与实践,主要分为四个部分。首先,对大数据做一个概述,第二是大数据的基本原理及应用模式,第三重点介绍大数据在各行业的利用,最后,我希望有一些演示环节,在我们IBM实验室里边有很多大数据的演示。

回到第一个议题,大数据的概述。首先让我们简单回顾一下计算机发展的历程。从IBM的概念来看,我们可以把计算机的发展历程可以归为3个阶段。第一个阶段叫制表系统,最早、最原始的制表系统,是穿孔机的系统。当前我们所处于第二个阶段,叫作可编程系统,我们通过COBOL语言、JAVA语言、C语言等实现一个系统,这个系统叫可编程系统。那么第三个阶段,或者说未来的方向是什么呢?叫认知系统。所谓认知系统,就是人和机器可以对话,它可以理解自然语言,可以和机器进行交互。现在IBM、百度等很多公司都在进行这个领域的研究,这也是未来计算机发展的一个方向。

传统的制表系统和可编程系统,是以产品为中心、流程驱动的。而认知系统则是以客户为中心、数据驱动的。所以这里面有很多种转变,就是怎么从一个可编程系统到认知系统。

从可编程系统到认知系统的转变,主要包括:信息检索方式从“搜索模式”到“发现模式”的改变;求解问题思路从“确定性”到“概率性”的转变;数据处理范围从“企业数据”到“大数据”的转变;计算机语言从“机器语言”到“自然语言”的转变;最后是输出结果从“简单输出”到“最佳结果”的转变。

认知系统目前最典型的案例主要是IBM的沃森机器。大概四年前,IBM推出沃森机器。这个沃森机器把大百科全书、纽约时报和华盛顿邮报等大约50多年的文本信息存储在那里,把所有市场、上市公司等经济信息也存储在那里,通过存储大量非结构化和结构化数据,经过自然语言处理、机器学习和推理算法,当年在人机智力竞赛中,沃森获胜。

现在沃森机器正在做什么呢?在美国的医疗行业,沃森正在推动其商业应用,比如你生病了,你可以和这个机器对话。你可以告诉机器你体温是多少,体重是多少, 做了哪些体验,把体检结果告诉机器,通过与机器的一系列对话。这个机器会自动判断你得了什么病,应该用什么药,它会把这个建议提供给医生。

同样的这个沃森系统,现在也开始应用于金融行业,主要是帮助银行实现客户的财富管理。现在新加坡发展银行正在用这个机器,他们用这个机器做什么呢?理财经理戴一个耳机,当有一个客户来之后,这个机器会告诉客户经理给这个客户说什么,话术怎么说,他需要什么。全是人机的交互方式。这个就是未来认知系统对自然语言的理解,人机交互给出一个最佳的答案给你。

这种系统除了IBM有之外,百度也是要做这种系统。苹果也有,即大家熟悉的Siri系统,你讲话,它可以理解,这是一个相对简单的人机对话模式应用。另外在国内也有相似的应用,比如招商银行的小i机器人客服,现在微信上使用招商银行的客服,90%都是由机器人来回答的。它能够理解上下文,它的查询式回答准确率能达到98.5%。

所以未来的Call Center大部分功能可由这种机器来替代,而不需要人去做了。如果我们要看未来计算机发展的应用方向是什么,那就是“可编程系统 + 认知系统”,可编程系统和认知系统两种模式都需要,可编程系统用来实现业务系统,认知系统用来实现决策分析、客户交互和客户体验,这就是未来计算机的趋势。

现在很多创业公司看好认知系统这一领域,许多公司在从事人机交互、自然语言处理等方面的研发工作。综上所述,就是我在讲大数据之前,先介绍的计算机未来发展的趋势。

另外一个方面,我们也来看看新的技术浪潮对企业的影响。新的技术浪潮包括CAMS和IoT。大家都知道,C是云,A是大数据分析,M是移动,S是社交,IoT是物联网的简写。这五个方面对我们业界的影响是什么?实际上这五个都跟大数据有关系。

首先我来介绍云计算。从我的理解,所谓的云计算就是远程获得计算资源、计算能力,或者获得远程服务的这么一种能力。用一个很形象的比喻,就是用“井水”和“自来水”的关系来比较云计算。在没有自来水之前,我们用井水,需要用水的时候,去自己的井里打水。云计算则像自来水,我需要水,打开水龙头就有,并且我用多少水,就付多少钱,这个就是云的方式。目前在国内,四大银行都已经实现了私有云,就是把它们不同年代购买的、各种异构的存储和计算资源,放在一起形成资源池,然后虚拟化,虚拟化以后,如果大家需要资源,可以到这里来申请。目前在国有四大银行里面,它们的开发云和测试云都很成熟了。

谈谈公用云,现在阿里的公用云做得很火。它的需求在哪?一些创业公司,刚起步的公司,比如游戏网络公司、中小企业等,这些公司刚刚创业,往往资金不够,人才储备不足。他们要买计算机设备,要买存储,要组织一帮技术人员,在资金有限的情况下这个投入不合算,所以还不如租用阿里的公用云,既便宜,又方便。

IBM现在也有公用云,我们在全球有四十多个数据中心。有一些外贸型的企业,比如宁波有一家企业,它在全球25个国家都有业务来往,但它不可能到25个国家都去部署它计算机系统和网络资源,太费劲了。所以,它租用IBM在香港的公有云,用了这个云之后,借助IBM全球的网络资源和计算资源,它可以快速地去部署它的业务。这个就是公用云的好处。

总结一下,我理解的云就是远程去获取计算资源、计算能力或者获取计算服务的这么一种能力。它的趋势是许多企业级应用都部署到云端了,比如CRM系统、ERP系统,都放到云端上去。ERP系统到云端,你省去不断升级、补丁的烦恼。应用到云端,是未来的一个趋势。

另外一个很重要的技术趋势,是移动互联。原来我们很多的系统和应用都在PC端,现在我们有了智能手机,很多应用会从PC端挪到手机端来了,并且这种趋势会越来越迅猛。所以,移动互联的四大应用,第一个是移动交易,第二个是移动支付,另外一个是移动营销,未来很多营销都在这个手机上做,还有一个方面就是移动员工。未来,业务员要办业务就拿一个iPAD,不需要柜台了。未来移动应用是这四大领域,移动交易,移动支付,移动营销,移动员工。

我们讲到移动,讲到移动应用的未来趋势,这里面有几个基本概念很重要。移动应用更注重用户参与,更讲究用户体验。现在的做法是什么呢? 我们设计一个产品的同时,还要对这个产品进行运营,产品通过平台化运营,让用户参与,并形成闭环。这就是我们常说的敏捷开发,迭代创新。产品及其运营通过一个平台组成闭环,实现迭代创新,移动端应用的这种套路和做法会越来越广泛。

第三个技术浪潮,就是大家经常提到的物联网。物联网很多是跟传感相关的。物联网有两种模式,一是对物的感知和识别,二是对人的感知和识别。识别物有很多种方法了,比如通过传感设备、RFID、二维码等,可以对物进行识别。现在很多创业公司再做商品溯源、食品溯源的应用。可以通过二维码,RFID,跟踪商品的轨迹。

物联网对人的识别,主要是通过手机。手机是人的数字化标签。物联网要识别一个人,现在有很多手段。通过WIFI来跟踪识别你的轨迹。现在很多零售企业正在做WIFI方面的应用,你在用他们免费WIFI的时候,他们通过WIFI的Mac地址来跟踪到你的行为轨迹。除WIFI外,另外一种方法是通过苹果的蓝牙和iBeacon技术,可以对人在室内进行定位,跟踪和身份识别。我们知道GPS可以在室外对你进行跟踪,但是到了室内就不行了。当你在室内的话,可以通过WIFI,苹果蓝牙,这种技术对你的轨迹进行跟踪。所以,物联网是通过传感设备对人和物进行识别。

第四个技术浪潮是社交。社交的发展,企业需要重新思考并定义跟客户的关系,实现从“交易”到“交互”的关系过渡。原来,企业跟客户的关系只是简单的交易关系,交易做完了就完了。现在需要思考,如何把交易慢慢引渡到交互,通过交互来增加客户的粘度。所以,我们讲社交,就是怎么把交易变成交互。

国内已有企业开始这方面的尝试,比如说泰康人寿。他们原来有一个叫做求关爱的产品。1块钱可以买一个抗癌的保险,1块钱的保额是100块钱,客户可以通过社交网络,让他的朋友来帮忙增加投保份额,比如我买了之后,我可以叫我的朋友给我投2块钱,我有了3块钱之后,我的保额就变成300块钱了。它保额的上限是10万块钱。

它设计这个产品的目的是什么?企图通过社交这种模式去推广产品。但是这里面有一些问题,比如说,它对人的心理可能考虑得不周,客户体验,交易环节也许太多,它做得不是很成功。但是它们的想法很不错,就是通过社交这种方式来扩大传播和规模。

另外,泰康还做了一个产品叫e路泰康,是一个旅游保险的产品。在这个产品里边,他们加入了很多游戏的成分,也有很多分享的成分。为什么要这样做?金融机构不简单是一个交易平台,通过交互去占有客户更多的时间,增加客户的粘度。

上面我讲到了云计算,也讲到移动互联、物联网和社交,在这些新兴的技术浪潮当中,大数据是核心。因为不管是云计算、物联网、移动,还是社交,都会产生很多数据,这些数据就像血液一样,在这四种技术里边流动。

几年以前我们给企业讲,你们要重视数据。数据是你企业的资产,你要把数据当做资产来管理和利用。我们传递给客户这种理念。最近两年来,这个说法好像有些改变,现在说,数据是当今世界的一种自然资源,原来我们叫资产,现在叫资源。从资产到资源,这个概念就已经完全不一样了。资产是静态的,滞后的;资源是动态的,它更加靠前了。现在我们把数据叫做新的自然资源。谁拥有资源,谁就拥有更强的竞争优势。数据不光是资产,它还是一种资源,我们可以加以利用。

总结一下,刚才我就讲了CAMS和IoT对企业的影响,大数据是一个核心。

什么是大数据?我们先看一些案例。

第一个案例是沃尔玛。我们知道沃尔玛是一个零售企业,它现在已经把天气数据加入到它的“物流预测模型”里边去了,确保在天气模式没有改变之前,它的所有商品能够运送到它的各个商店里去。沃尔玛把天气数据用起来了。

第二个案例是美国的一个能源公司,它对对智能电表实时传感数据进行采集和分析,帮助居民用户和商业用户管理电能,以降低能耗。这个案例通过传感数据实时抓取、实时分析客户的用电行为,实时设备故障分析,优化运营并改善用户体验。这个案例利用了实时传感数据。

第三个案例是纽约市政府,他们用到了摄像数据。纽约的大街小巷有很多的摄像头,当你的汽车经过的时候,摄像头把汽车牌照扫进去。目前,国内的摄像头只做到监控的目的。但是,纽约市不一样,他们把扫描到的汽车牌照的信息实时地传到后台的车管所登记系统里边去。因为所有的车辆信息都登记在车管所登记系统里边。如果你这个车子被盗了,第一时间登记也是在车管所系统里。所以,当这辆车经过这里,它把你扫描之后,车牌信息直接和后边的数据库对接。如果这辆车是被盗的,它马上会通知路边执勤的警察,让警察在路口将车拦下。在美国,90%的犯罪都是用偷来的车来做案的。通过这条途径,可以减少犯罪。

我刚刚讲的三个案例分别讲了三种不同的数据。沃尔玛用到的是天气数据,能源公司用到的是实时传感数据,纽约市政府用的是影像资料。这三类数据,在传统的企业理念中,它们是一种边缘数据。在我们的企业中,交易数据是最重要的。而这种数据,因为技术手段不成熟,没办法去抓取它,也没有工具去分析它,所以往往会被当作是一种边缘的数据。但是大数据来了之后,这种数据慢慢会成为企业核心数据的一部分来加以利用。未来,企业除了交易数据之外,这些数据也会产生很多业务价值。

上面所讲的,其实说的是大数据的一个背景。结构化、半结构化、非结构化的数据,影像的、传感的数据等,都可以加以利用。这里就引出大数据的定义。什么是大数据?我们所处的世界的数据可以分成三类:结构化、半结构化和非结构化数据,这个我就不多讲了。大数据是什么呢?它首先是一个数据集合,这个数据集合可能包括结构化、半结构化和非结构化数据。因为在这个数据集合中,已经包含了半结构化、非结构化这种新的数据类型,所以它的规模越来越大,它的数据种类也越来越多,数据的移动和变化的速度也越来越快。另外一方面,数据带有不确定性。比如说网络水军发布的那些言论,质量没有问题,但是它的可靠性和确切性有问题。所以这四个方面是大数据的四个特征,也是大数据的四个维度。

所以大数据是一种新型的信息处理方式,用来改进分析发现、决策制定以及流程自动化。

大数据的目的是什么?我们可以将企业数据分成两类,一个是大交易数据,包括企业核心系统,产品系统,外围系统,客户关系管理系统等,这都是交易数据。另外一部分数据,我们叫大交互数据,比如社交网络,传感器,社交媒体数据等。大数据的目的是怎么把大交易数据和大交互数据集成起来,在此基础上进行数据分析和处理,做一些新的业务发现,这是大数据的目的。

但是这里边就有几个问题了。第一个问题,企业里边有交易数据,但是怎样获取大交互数据呢?第二个问题,大交互数据怎么和大交易数据进行对接?怎么进行关联?第三问题,如果大交易数据和大交互数据对接并且关联上之后,怎么去推动业务创新?这三个问题是我们做大数据永远需要思考和解决的问题。

 

书院活动

【每期主题】
当下商界热议的管理问题或其它值得分享的管理话题
【主讲嘉宾】
优秀公司主要负责人或某领域资深专家
【活动地点】
清华大学照澜院15号(或其他特别指定地点)
【参与对象】
企业家、企业中高层管理者、创业者、清华校友
【报名方式】
在《清华管理评论》微信公众平台(tbr2013)回复“照澜书院报名+姓名+公司+职务+手机号码+邮箱”