《大数据时代》读后感 (大学作业)

大数据的商业化应用与现实思考

———读《大数据时代》

今年5月,马云在卸任阿里巴巴CEO的演讲上说“很多人还没搞清楚什么是PC互联网,移动互联网来了,我们还没搞清楚移动互联的时候,大数据时代又来了。”

最近几年是历史上创业环境最好的时期,时势造英雄,大数据也登上了风口浪尖,不仅出现在阿里巴巴、谷歌等互联网公司的战略规划中,同时在国务院和政府报告中多次提及,无疑成为互联网世界中的明星。《大数据时代》这本书,举出了很多现实案例,提出的精炼理论,让我受益匪浅,引发了很多思考。

本书从思维、商业、管理三个方面阐述了在大数据时代在下的变革。其主要观点这里我就不再赘述,主要结合自己的思考谈谈想法。

一、未来的商业化应用

可以预见的是未来数据和内容将取代技术成为互联网的核心标志,大数据的价值在于基于对数据和内容的分析,继而极大的优化资源配置。大数据行业属于互联网的一个重要部分,赢者通吃的规律也同样适用,未来在大数据的商业化应用中会产生体量巨大的跨国公司。

数据本身不产生价值,如何分析和利用大数据对业务产生帮助才是关键。大数据就像地球上难以计数的土壤,正真有价值的信息就像金矿一样埋藏在地下,挖出并利用“金矿”才 是关键。随着未来的趋势,大数据将进入更务实的发展阶段,我认为大数据挖掘商业价值的方法有以下几个方面:

1.大数据交易,数据就是未来的石油、煤炭。

原始数据蕴含着巨大商业价值,获取原始数据就像开采出来的矿石,需要进一步的加工冶炼,才能发掘其价值。目前,出现了中关村数海大数据交易平台、贵阳大数据交易等企业级交易平台。20xx年5月,在贵阳国际大数据产业博览会暨全球大数据时代贵阳峰会上,贵阳大数据交易所推出《20xx年中国大数据交易白皮书》和《贵阳大数据交易所702公约》,为大数据交易所的性质、目的、交易标的、信息隐私保护等指明了方向,奠定了大数据金矿变现的产业基础。

历史上无数的风险投资会为科技公司捧场,越来越多的资金会进入大数据交易市场,随着市场交易的活跃,规模的扩大;必然会产生大数据期货,主题基金债券等金融衍生品。市场的发展会进一步带动下游和上游产业的繁荣,最终形成系统化、规模化的商业体系。

2.提供商业信息,为企业经营、行业发展提供指导服务。

大数据的商业应用越来越广泛,作用也越来越明显,书中举出了一些例子,我这里再做以补充:

滴滴打车利用大数据分析实时综合调度“快车”、“专车”、“出租车”、“顺风车”甚至是滴滴巴士的资源,实现全局的交通资源优化。全局的资源配置避免了资源浪费和过度竞争,大大提高了交通资源的使用效率。

美国的一家跨国农业生物技术公司孟山都,让农民不用懂“高科技”也能享受大数据的成果。建立了农业数据联盟来统一数据标准,并通过对数据的分析为农民提供“决策服务”,农民只需在驾驶室里拿出手机,收集种子监视器传来的数据,然后将其上传

给服务器,最终服务器将返回化肥的配方到农场拖拉机上,完成对农作物的精确施肥。仅仅这一项技术,每年就为美国农民节省出数亿美元的化肥支出。

未来社会中,信息就是金钱,大数据提供出来的大量有价值的信息会创造出极大的商业价值。庞大的市场需求会催生出专门利用大数据分析来提供商业咨询服务的公司,在企业级客户中将扮演举足轻重的角色。

3.政府决策智库,提高决策效率和科学性。

我在今天的今日头条qpp中看到了这样的新闻:《安徽省人民政府办公厅关于印发安徽省运用大数据加强对市场主体服务和监管实施方案的通知》。继而联想到本书中作者概况出大数据的四大特征:大量(Volume)、多样(Variety)、价值 (Value)、高速(Velocity)。政府作为大型公众管理机构其信息需求与大数据一拍即合。

例如“911”事件之后,美国政府在反思中发现,多个安全部门之间协调不到位、不能及时分享情报资源,是其虽然掌握了诸多线索却没能预防恐怖事件发生的重要原因之

一。通过建立“棱镜”等大数据平台,运用大数据技术和分析手段,美国的国家安全部门能够以更高效率完成对多种来源数据的分析,并揭示出不同行为间的互动关系,进而能够运用分析算法预测危险分子的行动趋势。这为安全部门预防恐怖主义等威胁国家利益的行为提供了前所未有的可能。

另外,以大数据为手段,能够提高从各种情报中“大海捞针”的水平,通过提取人们行为的时空规律性和关联性,进行犯罪预测。加利福尼亚州桑塔克鲁兹市使用犯罪预测系统,对可能出现犯罪的重点区域、重要时段进行预测,并安排巡警巡逻。在所预测的犯罪事件中,有三分之二真的发生。系统投入使用一年后,该市入室行窃减少了11%,偷车减少了8%,抓捕率上升了56%。

这样的例子有很多,大数据对政府的决策带来的改变是革命性的,但作为政府部门,其基因决定它不会直接参与对大数据的分析,但刚性需求会创造巨大的市场,将会出现类似兰德公司模式但利用大数据进行分析的决策智库,政府将会为其信息服务买单。

4.金融投资工具

传统的金融投资机构也越来越多的引用大数据来帮助决策,人在投资交易过程中无法避免的受到个人情绪,个人偏好的影响,带有主观因素;另一方面,市场瞬息万变,每时每刻都产生数以万计的交易信息,很大程度已经超出人脑的计算处理能力。未来的趋势是要让数据“说话”。

证券市场行为、各类指数与投资者的分析、判断以及情绪都有很大关系,而后者都可以从数据中获取,现实生活中拥有大量用户数据的互联网公司将其论坛、博客、新闻报道、文章、网民用户情绪、投资行为与市场行情对接,研究的是互联网的行为数据,关注热点及市场情绪,动态调整投资组合,开发出大数据投资工具,比如大数据类基金等,这些投资工具直接将大数据转化为投资理财产品。

随着技术的发展,基于大数据的金融投资工具将越来越普及,也将成为大数据商业化应用中的重要组成部分。

5.健康与医疗

书中提到的一个例子,20xx年,谷歌推出“流感趋势预测“项目,在甲型H1N1流感暴发的几周前,“谷歌流感趋势”成功预测了流感在美国境内的传播,其分析结果甚至具体到特定的地区和州,并且非常及时。谷歌的判断基于人们的搜索行为,而现在

在苹果iwatch的模范效应下,可穿戴设备大行其道,利用传感器收集大量的人类行为和生理运动数据,比如健身腕带可以收集有关我们走路或者慢跑的数据,行走步数、卡路里消耗、睡眠时长等;床垫监测传感器可以自动监测和记录心脏速率、呼吸速率、运动和睡眠活动??通过计算机的分析处理,这些数据与健康记录可以用来监测我们的健康状况,并提出对应的建议和风险预警。

整个链条从采集、传输、处理、分析都离不开大数据的支持,最终构成以大数据为基础的产业系统,作为最基础的数据将具有极高的商业价值。

二、现实思考

1.大数据是否存在泡沫?

Michael Jordan教授是机器学习和大数据应用世界范围内最被尊敬的专家之一,这里引用他的他观点:

(1)目前的大数据给出的结果可靠性不够,如果急于应用到实际中,就好比是土木工程都没学好就开始造桥,结果只能造出“豆腐渣工程”

(2)作为一个科学,不够严谨(原文是“没有error bar”)。不像造桥的土木工程,经过多年的积累,明确地能告诉我们什么样的情况可以造,什么不可以,而大数据没有。

(3)有些媒体为了让公众容易理解打了些比方,但是这种比方造成了太多误解,进而造成了太多夸张的宣传。大数据还是一个没有足够严谨程度的科学。

很多时候过早对一个技术爆发热情,寄希望它可以改变世界,如果短时间没有成果,有可能热情一下子转冷又觉得这是个错误,加速抽离给这个技术的资源。显然Michael教授很担心现在公众对这个技术的热情,并不是基于对这个技术的理解,而是出于对概念的追捧,从而有可能会经历这样的态度转变。但是他认为这个领域是现实存在的,很多重要的应用,假以时日,是会创造价值的。但是现在很多媒体宣传和投资行为,存在泡沫。

原文:Machine-Learning Maestro Michael Jordan on the Delusions of Big Data and Other Huge Engineering Efforts

2.关于本书作者提出的“不是因果关系,而是相关关系”。

本书译者周涛教授在序言里表示有待商榷,他甚至认为如果放弃对因果关系的分析,是人类的堕落。

人类在不断的问“为什么”的时候成长进步,对世界万物规律性的理解是人类发展进

步的原动力。一个普遍的共识是,科学的精神就是质疑,从早期的“唯上帝论”到改革开放初期风行的“超能力”,再到近期的“气功大师”;在历史发展中违背科学精神的反面案例不胜枚举;对自己不了解的事物,不能单纯的用想象力去填补。另一方面,由于自身眼界和知识的局限性,对事物的认识不够深入,要通过不断地学习来提高自己。

依照作者的观点,大数据会告诉我们,会怎么样,但是却很难说清楚为什么这样。(可能也可以解释清楚,但是我们会难以理解,就像虫洞和多维空间的概念。)

但细细想来,我认为因果关系是存在的,大数据之间的关系并不能用简单的因果关系,或者相关关系来解释;它类似于立体化的点线面之间的关系,单独数据(事件)之间必然存在因果关系,而大数据体量巨大,关系错综复杂,可以理解为众多单独数据(事件)点,点与点之间的关系构成一条线,线与线之间构成面,最终构成多个面的大数据关系,它是无数因果关系的有机立体化组合,看似错综复杂,但是其中也有规律可循。

3.大数据时代如何保护个人隐私?

我们经常用个人信息来交换服务:我们使用百度地图,交换出去现在的位置信息;我们使用QQ,交换出去自己的个人关系;我们使用天猫,交换出去联系方式甚至家庭住址。这些交换难以用价格衡量,往往也不会让人觉得心疼或不安,因为是为了得到服务。

就像走路不能抹去自己留下的脚印一样,大数据时代,你无法抹去的“数据脚印”也让你的隐私暴露风险增大。事实上,不仅包括互联网,一个人的”数据脚印”还散落于各个信息系统里面,包括手机、PC、信用卡、交通卡、视频监控等各种业务系统,这些分散在各个系统中的数据乍一看价值不大,但如果把它们深入整合、挖掘,就能发现这个消费者的性格、爱好以及消费习惯等信息,这些信息对商家非常有价值。但对消费者来说,宁静生活却往往由此被打破。

作者在书中在最后一部分分析大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。用麦克纳马拉的例子来说明对数据过度依赖所带来的后果。书中提出了几种解决方法,一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。但是这些措施会起到多大作用值得商榷。

我认为在未来个人的隐私实在是难以遁形,技术是一把双刃剑,我们应用技术提高生活水平,同时也用我们的隐私做出了交换。每个人都不是独立的,未来作为一个“社会人”, 一方面在保证知情权的前提下,我们可以放弃一部分非核心的隐私,来交换更

好的服务,同时要形成对自我隐私保护的习惯,另一方面要加强立法监督。

结语:

“近一百年来,总有一些公司很幸运地、有意识或无意识地站在技术革命的浪尖之上。对于一个弄潮的年轻人来讲,最幸运的,莫过于赶上一波大潮。” 这是清华大学博士、前谷歌工程师吴军写在其代表作《浪潮之巅》扉页上的话。

大数据的浪潮正在酝酿,我们必须以知识和能力武装自己,做一个冷静而又技艺精深的“冲浪者”。

学号:110150405 姓名:魏阳班级:13级广告1班

 

第二篇:大数据时代读后感(全)

《大数据时代》读后感

《大数据时代》是由英国作者维克托麦尔〃舍恩伯格等所著,由胜杨燕和周涛翻译。这本书主要描述的是大数据时代到临人们生活、工作与思维各方面所遇到的重大变革。本书作者舍恩伯格在大数据领域是最受人尊敬的权威发言人之一。他二十多年来一直致力于网络经济、信息与创新、信息监管、网络规范与战略管理方面的研究,从维也纳大学到哈佛大学,从新加坡国立大学到牛津大学,世界上最著名的互联网研究学府都留下了他的足迹。开阔的学术视野与系统的学术造诣,更让他不断为企业与商业应用提供强大的理论支持。他的咨询客户包括微软、惠普、IBM、亚马逊、facebook、twitter、VISA等大数据先锋们,所以在《大数据时代》一书中,他将掌握的最前沿的大数据应用案例给予充分的分析,并对大数据的价值链与角色定位给予清晰的预见。

文中作者清晰的阐述了大数据的基本概念和特点,并列出明确的观点。不管对于产业实践者,还是对于政府和公众机构,都非常具有价值。作者将本书分为3个部分。第一部分提出了大数据时代处理数据理念上的三大转变:抽样=全体;要效率不要绝对精确;要相关不要因果;第二部分作者从万事万物数据化和数据交叉复用的巨大价值两个方面,讲述驱动大数据战车在材质和智力方面向前滚动的最根本动力;最后一部分,作者描绘了大数据帝国前夜的脆弱和不安,包括产业生态环境、数据安全隐私、信息公正公开等问题。

本书观点掷地有声,作者观念高屋建瓴,从很多实例和经验中萃取普适性观念。例子详实丰富,囊括了进百个学术和商业实例。

引言提出了大数据将给生活、工作于思维带来重大的变革。一个例子是20xx年H1N1流行病毒背景下谷歌通过检测检索词条,处理了4.5亿个不同的数据模型,通过预测并与20xx年、20xx年美国疾控中心记录的实际流感病例进行对比后,确定了45条检索词条组合,并将其用于一个特定的数学模型后,预测的结果与官方数据的相关系数高达97%。按照传统的信息返回流程,通告新流感病毒病例将有一到两周的延迟。对于飞速传播的疾病,信息滞后两周是致命的。而谷歌运用大数据技术,以前所未有的方式,通过海量数据分析得出流感所传播的范围,为世界预测流感提供了一种更快捷的预测工具。此外,我联想到原淘宝董事

长马云通过大量数据分析得出20xx年经济疲弱,为其商家提前做好迎接经济危机提供了时间缓冲。(补充并清晰描述详细)关于大数据在商业领域的应用, Farecast公司是一个成功的典型范例。该公司由奥伦〃埃齐奥尼创办,利用机票的销售数据来预测未来的机票价格,旨在帮助用户在购买机票方面做出预测,并对机票价格走势预测的可信度标示出来供消费者查考。Farecast系统利用近十万亿条价格记录预测的准确度达75%,使得使用Farecast票价预测工具购买机票的旅客,平均每张机票节约50美元。而处理如此多的数据离开了大数据技术将无法进行。

也正是由于我们进入了一个前所未有的信息化时代,人们拥有了如此多的数据,才提供给我们利用大数据的分析处理手段,创造新的价值。也许有人以为我们大数据时代的还未来临。其实大数据技术早已渗透到我们中间,它被应用在垃圾邮件的过滤,新浪微博技术平台,谷歌翻译以及输入文字的自动纠错等。

文中提出的一个观点是,预测是大数据的核心。其实从过去的时代人们就利用掌握的数据进行各种分析,从而对经济等各方面进行预测、矫正。只是进入了大数据时代人们掌握的数据爆炸性的速度在增长,从而数据的存储和分析数据分方法成了释放大数据能量的关键。

关于不是随机样本而是整体数据中。作者指出了随机取样是小数据时代用最少的数据获取最大价值的做法。作者用大数据与乔布斯的癌症治疗例子说明了使用全部数据而非样本的意义。乔布斯成为世界上第一个对自身所有DNA和肿瘤DNA进行排序的人。乔布斯曾开玩笑说“我要么是第一个通过这种方式战胜癌症的人,要么就是最后一个因为这种方式死于癌症的人”。虽然最后难免死于癌症但这种获得所有数据而不是仅样本的方法将他的生命延长了几年。同样,从事跨境汇款业务的Xoom公司侦破一起犯罪集团的诈骗也是由于使用了整体数据。初此之外,他还列举了日本“相扑”等来证明使用全体数据的重要性。

作者同时也指出随着数据使用的越来越多,其得出的结果并一定能越来越精确,毕竟数据不能保证百分之百的正确,特别是大数据时代各种结构化与非结构化类型的数据聚集在一起难免导致结果的不太精确。大数据时代要求我们重新审视精确性的优劣。作者特别举了谷歌翻译成功的例子。谷歌翻译之所以优于IBM的Candide系统并不是因为它拥有更好的算法机制。和微软的班科和布里尔一样,

谷歌翻译增加了各种各样的数据,并且接受了有错误的数据。(其语库来自于未经过滤的网页内容,会包含一些不完整的句子、拼写错误、语法错误以及其他各种错误)

在不是因果关系,而是相关关系的篇章中。作者指出在大数据时代往往知道是什么要比知道为什么来的更实在。作者列举了林登的亚马逊推荐系统的成功,证实了大数据在分析相关性方面的优势以及在销售中获得的成功。沃尔玛也是充分利用并挖掘各类数据信息的先锋和代表,从以前广为人事的啤酒和尿布的案例,以及作者举的有关蛋挞和飓风天气的案例,都说明了掌握了相关关系对于其策略的帮助。建立在相关关系分析法基础上的预测是大数据的核心。Aviva保险公司利用几百种生活方式的数据,如爱好、长浏览网页等间接的预测出哪些人更可能患高血压、糖尿病和抑郁症。UPS国家快递公司通过使用预测性分析检测其全美6万辆车队。进行防御性的修理,节约巨大得的成本。这些都充分显示了大数据在预测方面的优势。

本书第二部分讲的是大数据时代的商业变革。

作者用莫里绘制导航图的例子告诉我们,远在信息数字化之前,对数据的运用就已经开始了。莫里利用大量的人力去分析多年保存的航海记录,他从这些大量的数据中获取到新的利用价值。绘制的图表帮助商人节约一大笔钱,使年轻的海员们间接获取了成千上万名经验丰富的航海家的指导。日本先进工业技术研究所越水重臣教授通过安装压力传感器将人屁股特征数据化,进而形成对乘客身份的特征识别。这项技术为汽车防盗系统提供了方案。Decide.com公司,致力于为顾客预测商品的价格,通过收集处理海量的价格信息,预测准确率高达77%,帮助顾客在购买一个产品时节约了大约100美元。MasterCardd.Advisor部门通过分析来自210个国家的15亿信用卡用户的650亿条交易记录,分析得出商业发展和客户消费趋势,如通过分析发现如果一个人下午四点左右给汽车加油的话,他很可能在接下来的一个小时内去购物或者去餐馆吃饭 ,且在这一小时里大约花费35到40美元。商家正可以利用这个分析结果,在加油的#4@p背面附加上附近商店的优惠券。

这些例子都证明了大数据蕴藏着巨大的商业价值。根据提供价值的不同来源,大数据价值链包括三大构成部分。包括第一种是基于数据本身的公司。这些公司

拥有大量数据或者至少可以收集到大量数据,却不一定有从数据中提取价值或者用数据催生创新思想的技能。第二种是基于技能的公司。它们通常是咨询公司、技术供应商或者分析公司。它们掌握了专业技能但并不一定拥有数据或者提出数据创性用途的才能。比如说,沃尔玛和Pop-Tarts这两个零售商就是借助天睿公司的分析来获得营销点子,天睿就是一家大数据分析公司。第三种是基于思维的公司。皮特.华登,Jetpac的联合创始人,就是通过想法获得价值的一个例子,他通过用户分享到网上的旅行照片来为人们推荐下一次旅行目的地。对于某些公司来说,数据和技能并不是成功的关键。挖掘数据的新价值的创新思维才是这些公司脱颖而出的优势所在。

大数据成为许多公司竞争力的来源,未来可能整个行业的结构会发生改变,大公司和小公司最有可能成为赢家。如今的核心竞争力在于快速而廉价地进行大量的数据存储和处理。当然公司要根据自己的情况进行调整。大数据向小数据时代的赢家以及那些线下大公司(如沃尔玛、联邦快递、宝洁公司、雀巢公司、波音公司)提出了挑战。同时,大数据也为小公司带来了机遇。大数据也将会影响国家竞争力。当制造业已经大幅转向发展中国家,而大家都争相发展创新行业的时候,工业化国家因为掌握了数据以及大数据技术,所以仍然在全球竞争中占据优势,但这个优势很难持续。随着技术的发展,西方世界在大数据技术的优势将会慢慢消失。对于大公司而言,好消息是大数据技术可以加剧优胜劣汰。一旦公司掌握了大数据,它不但可能超过对手还可能遥遥领先。

文章第三部分讲了大数据带来无数好处的同时带来的不良影响以及如何面对这些影响。包括如数据的收益的处理问题以及数据中用户资料的隐私和决策过程带来的影响。作者在保护个人隐私方面提出了几种想法。一种是使用数据时征询数据所有个人的知晓和授权。第二个技术途径就是匿名化。作者同时也指出了这两种方式的难度。一方面收集到的数据可能会被后续的多次利用。另一方面,匿名化会在数据收集越来越多和数据的相互结合关联使用时变得无效。作者列列举电影《少数派报告》的情节说明越来越依赖数据时,大数据可能将我们禁锢在可能性之中。当然通过分析犯罪的常发地与常发时间,合理安排警力会对治安防范提供不小的帮助。作者还指出不能尽信数据的分析结果,因为不能保证获取分析结果来源的数据准确性。大数据在给我们生活提供便利的同时,也让隐私保护

的法律手段失去了作用。我们必须杜绝对数据的过分依赖。

在高速迈进大数据时代的同时,人类信息管理准则需要重新定位,这将带动社会核心价值观的转变。大数据时代,对原有规范的修修补补已经不足以抑制大数据带来的风险。保护个人隐私就需要对个人数据处理器对其政策和行为承担更多责任。同时必须重新定义公正的概念,以确保人类行为的自由。作者提出了解决这些问题的方向。如个人隐私保护方面,可以让使用者承担更多的社会责任。将责任从民众转移到数据使用者有很多意义,也有充分的理由。因为他们更清楚将如何使用数据且是数据应用最大的受益者。关于公正方面简单的讲就是个人可以并应为他们的行为而非倾向负责。就像公司有内部会计和外部审计人员一样,大数据时代,公司将设臵专门的人员--内部和外部算法师对大数据活动进行监督。还有可能出现第三方的机构对大数据行为进行监督和衡量。作者甚至考虑到对大数据存在的垄断情况进行分析并在反垄断反面给了建议。最后结语中作者提出大数据提供给人们的只是参考答案,提醒我们在利用这个工具时要铭记人类的作用是无法完全替代的。

大数据时代是信息化社会发展必然趋势,我们只有紧紧跟随时代发展的潮流,在技术上、制度上、价值观念上做出迅速调整并牢牢跟进,才能在接下来新一轮的国际竞争中摆脱受制于人的弱势境地,才能把握发展的方向,冲破与西方国家的差距。对于一个国家如此,对于一个企业亦是如此。在如此快速的到来的大数据时代,我们还有很多知识需要学习,许多思维需要转变,许多技术需要研究。公司的规划中,也需充分考虑到大数据对于公司的未来发展所带来的机遇和挑战。对于掌握大量数据的公司,需要考虑有多少数字化的数据,又有哪些可以通过大数据的分析处理而带来有价值的用途?比如国内目前的社交网站,购物网站等都掌握了用户的大量的数据信息。对于没有掌握数据的小公司来说,在大数据时代制胜的良药也许是创新的点子,也许可以利用外部的数据,通过多维化、多层面的分析给其他企业或个人带来价值。从国家层面来讲,要做好各方面的规划和政策调整的准备。如对隐私的保护等需新的法律法规进行规范。

相关推荐