大数据时代读后感

《大数据时代》读后感

看完“《大数据时代》——生活、工作与思维的大变革”,颇为感慨,这世界变化真的快!农业化、工业化、信息化时代的相继经历,使得世界天翻地覆。 我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。这个命题是我读这本书最大的感触。个人认为也是这本书最核心的思想。首先,书提出一个颠覆我以前认知的命题--“并非原子而是信息才是一切的本源”,将世界看做信息,看做可以理解的数据的海洋,为我们提供了一个从未有过的审视下的视角。它是一种可以渗透到所有生活领域的世界观。这个命题是在书的最后一部分中的某一段中描写的。我之所以把它放在最前面来讲,因为我觉得,这是谈数据化世界的前提,自然也是谈论大数据的前提。书的中间部分有一节讲到数据化和数字化的区别。经过我自己脑子的整理,把数据化世界这个命题列为大数据思维的第二步。写到这里,我不由得反省下,我是不是有领悟到书的精髓所在,就是第一句话。书中另一个吸引我的地方就是,有很多观点的论述,会从哲学的高度论述。虽然,自己肚子没多少墨水,但是读这些描述的时候,就会发现自己会更好的理解作者提出的命题。比如书中有一段文字

当我们说人类是通过因果关系了解世界时,我们指的是我们再理解和解释世界各种现象时使用的两种基本方法:一种是通过快速、虚幻的因果关系,还有一种就是通过缓慢、有条不紊的因果关系。大数据会改变这两种基本方法在我们认识世界时所扮演的角色。 在附上一些事例的时候,用作者提供的“本质”去看待时,很容易理解,确实是这么回事。好了,那么大数据到底改变了我们什么呢,作者给出3点,

大数据的精髓在于我们分析信息时的三个转变,这些转变讲改变我们理解和组建社会的方法。

第一个转变就是,在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样(样本=总体)

第二个转变就是,研究数据如此之多,以至于我们不再热衷于追求精确度

第三个转变因前两个转变而促成,即我们不再热衷于寻找因果关系,而应该寻找事物之间的相关关系。大数据告诉我们“是什么”而不是“为什么”。在大数据时代,我们不必知道现象背后的原因,我们只要让数据自己发声。

正如大家所知道的那样,人类的大脑具备这样的功能,它会把新输入的刺激或信息与“过去的经验或积累的部分知识”相对照,然后进行调整并接受下来。如果眼前新的现实与大脑中储存的固有信息无法协调,便会在无意识中拒绝接受新的现实;或者通过自己一知半解的知识任意推测,使自己认识到的情况偏离实际。这是人的一种本能,目的在于使自己保持冷静。所以作者称之为revolution。

讲了这么多,那么大数据到底给我们带来什么。在这里,我只想谈我感触最深的,其他的有兴趣的可以自己去了解。当然,书中提了很多,最多的就是,XXX公司或者个人利用大数据创造了多大的财富了,抛开这些表面的不说,最让我动心亦或者是害怕的是---预测。 大数据的核心就是预测。它通常被视为人工智能的一部分,或者更确切地说,

被视为一种机器学习。但是这种定义是有误导性的。大数据不是要教机器像人一样思考。相反,它是把数学算法运用到海量的数据上来预测事情发生的可能性。一封邮件被作为垃圾邮件过滤掉的可能性,输入的“teh”应该是“the”的可能性,从一个人乱穿马路时行进的轨迹和速度来看他能及时穿过马路的可能性,都是大数据可以预测的范围。当然,如果一个人能及时穿过马路,那么他乱穿马路时,车子就只需要稍稍减速就好。但是这些预测系统之所以能够成功,关键在于它们是建立在海量数据的基础之上的。此外,随着系统接收到的数据越来越多,通过记录找到的最好的预测与模式,可以对系统进行改进。

在不久的将来,世界许多现在单纯依靠人类判断力的领域都会被计算机系统所改变甚至取代。计算机系统可以发挥作用的领域远远不止驾驶和交友,还有更多更复杂的任务。别忘了,亚马逊可以帮我们推荐想要的书,谷歌可以为关联网站排序,facebook知道我们的喜好,而linkedin可以猜出我们认识谁。当然,同样的技术也可以运用到疾病诊断、推荐治疗措施,甚至是识别潜在犯罪分子上。

就像互联网通过给计算机添加通信功能而改变了世界,大数据也将改变我们生活中最重要的方面,因为它为我们的生活创造了前所未有的可量化的维度。大数据已经成为了新发明和新服务的源泉,而更多的改变正蓄势待发。

这是大数据带来最核心的东西,动心的理由无须赘述,计算机会告诉你什么时候买什么双色球可以中头奖,想想心里是不是有一点小激动咧。当然这只是我打的一个比较夸张的比喻。至于害怕呢,书中有段话我很喜欢

公平正义的基础是人只有做了某事才需要对它负责,毕竟,想做而未做不是犯罪,社会关系于个人责任的基本信条是,人为其选择的行为承担责任。如果大数据分析完全准确,那么我们的未来会被精准的预测,因此在未来,我们不仅会失去选择的权利,而且会按照预测去行动。如果精准的预测成为现实的话,我们也就失去了自由意志,失去了自由选择的权利。既然我们别无选择,那么我们也就不需要承担责任。这不是很讽刺吗。

扯到这里,顺便扯一下,书中另一段关于自由意志的描述

在哲学界,关于因果关系是否存在的争论已经持续了几个世纪。毕竟,如果凡事皆有因果的话,那么我们就没有决定任何事的自由了。如果说我们做的每一个决定或者每一个想法都是其他事情的结果。而这个结果又是由其他原因导致的。以此循环往复,那么就不存在人的自由意志这一说了。----所有的生命轨迹都只是受因果关系的控制了。因此,对于因果关系在世间所扮演的角色,哲学家们争论不休,有时他们认为,这是与自由意志相对立。

书中举了个例子,举了部电影《少数派报告》,当我看到这里的时候,“哎哟,我居然看过这部电影,想想心里还是有点小激动”,有兴趣的可以去看下,大概就是讲警察通过预测来提前抓捕犯人,不过不是通过大数据,是通过超人类的方式。当你什么举动都可以被预测,相当于你完全暴露在太阳光下,换成你,你害怕不。

最后,附上两段结语,一段是书中的一段话,另一段是我自己瞎编的

大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在

不久的未来。

大数据终将会影响到我们,也像其他技术一样会是一把双刃剑,用得好,动心,滥用,害怕。如同核技术一样,用的话,造福地球,滥用,给个金刚石地球你,照样爆。我相信,未来的大数据的发展会如作者所说的,是一场生活、工作与思维的革命。

无论如何,大家看到这四个是不是有种,不管我上面扯得有没有道理,通不通顺,下面的话,会很有道理的样子的错觉(抄袭于《栋笃笑》)OK,无论如何,日子还是得照过。施主,我看你骨骼惊奇,是个练武奇才,最后送上《九阳神功》心法,以后维护世界和平的重任就交给你了。

他强由他强,清风抚山冈。

他横由他横,明月照大江。

他自狠来他自恶,我自一口真气足。

无处不在的大数据:各种云计算,谷歌的神通,亚马逊的推送,天涯人肉,微博万能等等等等,我们掌握了新的工具,也获取了以前从未有过的各种信息。大数据拉近了我们与现实的距离,“地球村”变成了“地球屋”,仿佛所有人所有事物都触手可及,而这些牛逼哄哄的互联网巨头就在客厅展示着世界的每一寸光景。

然而,事实真的是这样吗?首先,从应用角度出发,低廉的运算能力和存储空间,让以前的样本分析显得非常简陋——一些从全体数据挖掘出来,忽略精确而从大量数据的简单算法得出来的结论颠覆了常识。但个人觉得,这只是统计学的终极目标——并没有非常大的跨越,可能终结了回归分析,有效性验证等手段,但依旧还是统计。而革命性在于关注相关关系而非因果关系。现场讨论从神学角度挑战了因果关系的不可能——或者说人类用简单思考的逻辑来定义因果,以及用之前小数据演绎出大概率事件来推导因果,都是不正确的。真正的因果关系应该属于上帝的范畴,人类如果真的完全掌握之后,会统治整个宇宙。但我觉得,无需从神学观点来讨论,而可以借鉴量子力学对经典力学的颠覆——在原子层面上,经典力学会失效——那么在大数据层面上,普通的抽样调查直观反映会失效。而且从量子力学角度是很难推导经典力学的公式,那么从现在的惯有思维,也难以推导出大数据的因果关系。同时现场有讨论,是否计算机可以精确地模拟每个原子,然后完整地展现微观到宏观的化学反应细节?我觉得首先是计算能力不足,其次即便设定原子的运动条件真的正确,计算结果未知但宏观结果我们却已经知道——牛顿的经典力学足以应付日常绝大部分情况了。好比切西瓜,究竟刀头的铁原子和西瓜的有机分子如何作用,真的重要吗?回归到商业领域,如果我们可以提高相关性的准确度,从而提高投入效率,那就已经足够了。本来一个产品受到一半客户喜欢,但如果通过大数据挖掘到更好的定位,有百分之八十的客户喜欢,那么价值已经非常可观了。

大数据帮助我们把未来的迷雾拨开了一点,但好比《沉重的肉身》当中讨论的,更多的选择权并不能带给人幸福——因为知道自己不能做不能得到的也更多了。解决工作模式,生存意义,幸福之道等问题,关键还是看自己如何看待和使用这些新式工具以及新结论。引用《神探伽利略》里面的台词:可被重复的,一定有道理存在。那么现在重复的越来越多,更需要保持探索

和敬畏之心,人才不会迷路。

 

第二篇:大数据读后感吕文德

《大数据时代》读后感

松崮完小 吕文德

首先,本书大体上都是在讲美国政府在各社会团体不断“争取”权利、三权分立制度的制衡下,一步步将信息公开的历程。以及数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。其实真正涉及到企业如何变得更加“智能”,唯有第四章讲得非常详细。先来看一下完整的商务智能流程:1、通过各种来源的关系型数据库,使用ELT(提取、转换、加载)工具,对来自不同系统的数据以统一格式进行清洗、转换、集成进入到数据仓库。2、锁定目标数据后进行联机分析。通过不同的分析角度进行多维分析,这样用户可以随时创建自己需要的报表,开发人员只要在后台为用户创建构建多维的数据立方体模型,用户就可以直接在前端的各个维度之间进行切换,从不同的维度对数据进行分析。从而获得更加全面的、动态的的分析结果。3、进行数据挖掘。就是从海量数据中,挖掘出具有价值的数据。通过对数据的挖掘其一、可以发现数据的历史规律,对过去进行总结。其二、可以根据数据对未来进行预测。企业可以根据预测对未来行情趋势做出预判,并作出相关决策。4、数据可视化,我想任何人看到一推数据,就会感到很头疼。当然也很不直观,到底企业的各项指标相比往年是好是坏去做对比也会很麻烦。使用各种图表、三维地图、动态模拟以及相关的动画技术是原本枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,使人们对相关数据做到一目了然。5、通过上面几步我们就把原先毫无价值的数据,变成了信息,最后演变为知识。

本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。

引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20xx年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与20xx年、20xx年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事

长马云通过大量数据分析得出20xx年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用, Farecast公司是一个成功的典型范例。该公司由奥伦·埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。Farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用Farecast票价预测工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。

也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。

文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。

关于不是随机样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的Xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。

其次,我们微动天下应该考虑的:1、是否有必要建立数据仓库?当然我这个问题我也在线上向IBM数据仓库的人员询问过。要考虑的有两个因素:其一、数据量的级别,其二、对数据挖掘的程度。一、数据量。采集器实时都对新闻、论坛、博客、微博在进行采集,当然如果说一年的数据量不算大的话,亦或者宁波本地的数据量也没那么大的话。公司假设几年后、几十年后业务量增大了,做到了浙江省乃至全国的时候。那个时候的数据量我想应该是非常的庞大了。二、对数据挖掘的程度,当然有关公司涉及的更多。不过有时候那些公司做得仅仅是

从采集的数据那里通过筛选,将相关信息发送给相关的客户。个人觉得这个价值应该被放大,通过对相关数据的挖掘对过去的规律进行总结,对未来的趋势做出预测。如固特异轮胎,根据往年的数据总结出某款轮胎某地以及在哪个时间段销量最大,然后第二年可以根据这个数据,制造商可以提前对该型号轮胎进行大量备货以备不时之需。通过挖掘在特定的时间段,哪几种商品捆绑销售会得到更好的销量等等。当然数据仓库是面向主题的数据集合,用于支持管理中的决策制定。个人觉得对公司领导层做出正确决策有很大的指导作用。2、公司应该加大数据挖掘能力。公司在招聘往里面招聘的所谓数据分析师,只不过是用来数据监测的。真正意义上面的数据分析师很是匮乏。现在客户大多希望的是能够给本企业决策有指导性意义的报告、或者建议。这就需要我们通过数据挖掘预测出未来趋势,即预测性分析。这样无论在产品推广,以及在本品牌忠诚度上都会有一定的保障。

3、是否能通过联机分析处理将数据从各个角度、不同纬度展现出来。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析。4、数据可视化设计上需要强化。相关系统是直接给客户进行操作使用的,但我们所生成报告里面的统计图、走势图还不能很直观的展现给客户。这个对于客户体验来说是非常致命的,因为一旦不能直观的体现数据所呈现出来的状态,客户就不能对其决策做出准确的判断。进一步导致客户对我们忠诚度的降低。

作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制。和微软的班科和布里尔一样,谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(其语库来自于未经过滤的网页内容,会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误)

在不是因果关系,而是相关关系的篇章中。作者指出在大数据时代往往知道是什么要比知道为什么来的更实在。作者列举了林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案

例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的预测是大数据的核心。Aviva保险公司利用几百种生活方式的数据,如爱好、长浏览网页等间接的预测出哪些人更可能患高血压、糖尿病和抑郁症。UPS国家快递公司通过使用预测性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在预测方面的优势。

这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。皮特.华登,Jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。

大数据成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的

大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交网站,购物网站等都掌握了用户的大量的数据信息。在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。

相关推荐