大数据读后感

涂子沛先生《大数据》读后感

2014级经济管理专业 李学堂 学号20140238

短短几天把涂子沛先生的《大数据》这本书浏览一遍,结合去年北大继续教育学院进行现代管理学科学习时,老师介绍这本书时的精髓、内涵时的情景,写这篇心得体会。现将浅薄体会与老师同学们一起交流,部分内容参考了书内容和涂子沛先生的观点,希望老师同学给予批评指正。

“一个真正的信息社会,首先是一个公民社会”,这是全书的一个出发点,这个出发点就是说,“信息社会最大的特点就是,信息的自由流动。”涂子沛在书中的观点是:如果没有人的平等,没有人的自由,信息能够自由流动吗?如果没有人的平等,我们这个社会彼此另外压抑另外一个人,我们的创造力怎么迸发出来?我们每个人都面临大数据时代思维变革的挑战。

涂先生在书中说出 “大数据时代的公民生活”,题目他在书中来演绎公民生活的时候,它的背景是“大数据”时代。首先他讲了“什么是大数据时代”,在研究一个现象的时候,首先要研究它的定义,研究它的内涵,咱们就先把数据给它抽走,看看代表是什么。数据不是数字,数据是有跟列的数字,当他在书中谈到数据的时候,我们想到的是它代表计算,代表精确,代表理性,代表科学,代表事实。大家说姚明很高,到底有多高,你最后说两米多左右,这就是一个精确的事实。数据的出现也是人类认识这个世界,不断地向前推进的需要,人类发现需要精确的数字,就好像回到刚才的例子,你说很高很高,到底有多高,我们看,人类历史上很多重大的文明推进和演进都跟数据离不开,比如说度量衡的发明,货币的发明,再比如二进制的发明最后导致计算机的发明,最背后就是数据。

他在书中有一个新的词叫Database--数据库。这个词完全是一个外来的词,

1

计算机最早是计算数字和处理数字,那时候就存在Database,后来随着计算机能力的不断增强,它可以处理文字、图片、视频、声音等等,但所有这些都放在Database,所以他在书中把这所有的一切都称为数据,这时候数据的内涵扩大了。其实大家要知道数据的内涵在扩大,还有一些其他的事情也在发生变化,就是说数据的容量在增大。八十年代的时候就有人提出Big data这个概念,那时候的“大数据”的还不是现在“大数据”的概念。“大数据”这个概念不断的演变,最早有人就预见到说有一天数据会比程序更加重要,比软件更加重要,它是指重要性。所以我们往大了说,可以说这是一个大的机器,一个大的房子,也可以说是一个大容物。书中说的:到20xx年的时候,宾夕法尼亚大学有一个教授出来定义,那时候企业的数据已经到泰了,他说200泰的数据就是大数据了,那泰到底是什么样的单位呢?比如全世界最大的图书馆是美国国会图书馆,美国国会图书印刷品的含量,不包括电子图书加起来是15泰,北师大应该是2个泰或者更少,这个数据就叫“泰”。

我的感受现在国内也有很多人说“大”,到底多大才是“大数据”?他在书中说大数据的时候应该从大价值来理解,因为我们数据已经很多了,人类利用分析数据的能力很强了,我们能从数据当中发现以前不能发现的价值这个角度来理解。他在书中谈把数据的现象抽离出来谈,来理解什么是数据。接下来我们再把数据放回到物力事件当中,从它和其他现象的联系当中来把握和考察它的因果关系,大数据究竟是怎么产生的?其中书中说“大数据”的产生有五个因素:第一个是摩尔定律,第二个是组织计算,第三个是普适计算,第四个是数据挖掘,第五个是社交媒体。我们现在一一对这五个因素进行解读,这五个因素里面有四个因素是认为影响到了我们公民生活的,我们来看看它怎么来影响在“大数据”时

2

代公民的生活。data在五年的时候,应该有一个创始人,他发现一个东西:同一个计算机芯片,同一个面积上晶体管的数量每一到两年就要增加一倍,这意味着什么?意味着计算机处理的能力越来越强,存储的能力也越来越强,同一个面积上东西越来越多,越来越密,一到两年就增加一倍,物力存在器的性能不断上升,价值不断的下降。有一个考证说,从五十年代起最早的存储器发明到现在,存储器的价格下降了300万倍,大家可以想想,历史上还有什么商品它的价格能在半个世纪下降300万倍?而摩尔定律也成为了一个代名词,呈指数形发展的变化,急剧变化的状态,剧变的变化。我们可以看看,这个图代表摩尔定律,是条直线,为什么是直线呢?因为没办法画,如果严格按刻度来画的话应该是一条横轴的曲线。涂先生在书中分析了:“19xx年一个科学家提出了普适计算,普适计算提的不多,大家都提物联网。物联网是普适计算一个子概念,人家计算机的浪潮是分阶段的:第一个阶段是主机阶段,到80年代由于微软、苹果一直到个人电脑的阶段,88年互联网之后,科学家说这不是结果”。

结合我在北京学习时老师也讲过同样一个创新例子:20xx年的时候出现了一个新的现象,就是facebook。facebook是不是创新?那肯定是创新。前一段时间我看国内有很多制度来鼓励创新,我当时也跟几个朋友讨论了,说可不可行呢?马克?扎克伯格为什么要建facebook?他建facebook的理由很简单,就是想多认识一些漂亮的女孩子,后来他就是想帮助别人多认识一些漂亮的女孩子。

facebook开始就是一个大学交流平台,就这么简单,后来他就去见硅谷的投资商,人家给了他1000万,觉得这个东西有前途。创新不是一个制度化的东西可以鼓励出来的,它是真正源于一种在自由的情况下的一种内在的能量的爆发。

facebook给人类社会大数据的现象是一个“一锤定音”。为什么这么说呢?我们

3

说以前是信息系统在收集数据,这时候是每个人都在贡献数据,你也发微博,他也发微博,而且你发了一条微博可能有视频,有图像。原来的信息系统收集恐怕就是数据,记录一个商业过程,这时候全世界的人开始贡献数据,而且这种数据有一个不同的名字叫“非结构保持性”,跟以前的数据不一样。大家想想什么叫非结构化?就是格式大小不一定一致。你发了一条微博大小肯定跟他发的不一致,你可能有三张图片,他可能没图片,你可能140个字,他可能只有20个字,这种数据的挖掘也很难,这时候人类的数据一下子就开始爆炸了,大数据已经成为一个不可挽回的现象,为什么呢?

“一个主动你就能改变的时代,因为资源就在那里,你不能去等其他的人”这是涂先生的观点。他说说影响公民的第一点:公民最主要的精神是什么?是积极地介入,积极地改变。影响我们公民的第二点,书里面有很多关于“大数据”时代的隐私文化,有的专家说87%都不能定位,只要通过“大数据”挖掘就会定位,这是影响我们公民生活的一个巨大的挑战,就是隐私权的挑战,而隐私权是一个非常重要的问题,是对个人自由的凭照。他为什么用这么大的篇幅来写隐私权利呢?也是因为我觉得,我们中国社会特别需要隐私权利,不仅是政府在侵犯公民的隐私权利,我们公民彼此之间也在不停地侵犯隐私权,而且大家习以为常。但是隐私权是一个文明社会的标志,越文明的社会,越注重隐私权,个人才越有自由,隐私权是把自己跟公共生活划分开的一条界线,保障个人的自由。社交媒体让我们进入一个前所未有人文相连的时代,这影不影响我们的公民生活?这是最大的隐患,为什么?它把我们人跟人连接起来,我们知道人跟人一旦连接起来,1+1大于2的作用。

总之,使我感受到当前我们正生活在,每天都不同、都高速度发展、激烈竞

4

争和大数据时代。我们每个人都必须面对大数据时代、结合实际面对挑战,要相信“想不到事情会发生,想不到的速度会发生”。要及时更新知识、广纳信息、梳理思维及时做出正确判断、做好工作学习生活中的精准决策。

5

 

第二篇:大数据读后感吕文德

《大数据时代》读后感

松崮完小 吕文德

首先,本书大体上都是在讲美国政府在各社会团体不断“争取”权利、三权分立制度的制衡下,一步步将信息公开的历程。以及数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。其实真正涉及到企业如何变得更加“智能”,唯有第四章讲得非常详细。先来看一下完整的商务智能流程:1、通过各种来源的关系型数据库,使用ELT(提取、转换、加载)工具,对来自不同系统的数据以统一格式进行清洗、转换、集成进入到数据仓库。2、锁定目标数据后进行联机分析。通过不同的分析角度进行多维分析,这样用户可以随时创建自己需要的报表,开发人员只要在后台为用户创建构建多维的数据立方体模型,用户就可以直接在前端的各个维度之间进行切换,从不同的维度对数据进行分析。从而获得更加全面的、动态的的分析结果。3、进行数据挖掘。就是从海量数据中,挖掘出具有价值的数据。通过对数据的挖掘其一、可以发现数据的历史规律,对过去进行总结。其二、可以根据数据对未来进行预测。企业可以根据预测对未来行情趋势做出预判,并作出相关决策。4、数据可视化,我想任何人看到一推数据,就会感到很头疼。当然也很不直观,到底企业的各项指标相比往年是好是坏去做对比也会很麻烦。使用各种图表、三维地图、动态模拟以及相关的动画技术是原本枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,使人们对相关数据做到一目了然。5、通过上面几步我们就把原先毫无价值的数据,变成了信息,最后演变为知识。

本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。

引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20xx年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与20xx年、20xx年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事

长马云通过大量数据分析得出20xx年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用, Farecast公司是一个成功的典型范例。该公司由奥伦·埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。Farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用Farecast票价预测工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。

也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。

文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。

关于不是随机样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的Xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。

其次,我们微动天下应该考虑的:1、是否有必要建立数据仓库?当然我这个问题我也在线上向IBM数据仓库的人员询问过。要考虑的有两个因素:其一、数据量的级别,其二、对数据挖掘的程度。一、数据量。采集器实时都对新闻、论坛、博客、微博在进行采集,当然如果说一年的数据量不算大的话,亦或者宁波本地的数据量也没那么大的话。公司假设几年后、几十年后业务量增大了,做到了浙江省乃至全国的时候。那个时候的数据量我想应该是非常的庞大了。二、对数据挖掘的程度,当然有关公司涉及的更多。不过有时候那些公司做得仅仅是

从采集的数据那里通过筛选,将相关信息发送给相关的客户。个人觉得这个价值应该被放大,通过对相关数据的挖掘对过去的规律进行总结,对未来的趋势做出预测。如固特异轮胎,根据往年的数据总结出某款轮胎某地以及在哪个时间段销量最大,然后第二年可以根据这个数据,制造商可以提前对该型号轮胎进行大量备货以备不时之需。通过挖掘在特定的时间段,哪几种商品捆绑销售会得到更好的销量等等。当然数据仓库是面向主题的数据集合,用于支持管理中的决策制定。个人觉得对公司领导层做出正确决策有很大的指导作用。2、公司应该加大数据挖掘能力。公司在招聘往里面招聘的所谓数据分析师,只不过是用来数据监测的。真正意义上面的数据分析师很是匮乏。现在客户大多希望的是能够给本企业决策有指导性意义的报告、或者建议。这就需要我们通过数据挖掘预测出未来趋势,即预测性分析。这样无论在产品推广,以及在本品牌忠诚度上都会有一定的保障。

3、是否能通过联机分析处理将数据从各个角度、不同纬度展现出来。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析。4、数据可视化设计上需要强化。相关系统是直接给客户进行操作使用的,但我们所生成报告里面的统计图、走势图还不能很直观的展现给客户。这个对于客户体验来说是非常致命的,因为一旦不能直观的体现数据所呈现出来的状态,客户就不能对其决策做出准确的判断。进一步导致客户对我们忠诚度的降低。

作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(其语库来自于未经过滤的网页内容,会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误)

在不是因果关系,而是相关关系的篇章中。作者指出在大数据时代往往知道是什么要比知道为什么来的更实在。作者列举了林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案

例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的预测是大数据的核心。Aviva保险公司利用几百种生活方式的数据,如爱好、长浏览网页等间接的预测出哪些人更可能患高血压、糖尿病和抑郁症。UPS国家快递公司通过使用预测性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在预测方面的优势。

这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。皮特.华登,Jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。

大数据成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的

大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交网站,购物网站等都掌握了用户的大量的数据信息。在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。

相关推荐