大数据时代读后感

《大数据时代》读后感

《大数据时代》读后感

随着网络技术的发展成熟,传统行业不断感受到来自大数据、云计算等新技术的冲击,这些新技术意味着游戏规则的改变,大数据技术对各行各业的发展的影响尤为显著。人们对大数据的探讨越来越深入,兴趣越来浓厚,我亦如此。带着无比好奇的心情,我读了舍恩伯格的《大数据时代》,以增进对大数据技术的了解。

舍恩伯格分三部分来讨论大数据,即思维变革、商业变革和管理变革。

在第一部分“大数据时代的思维变革”中,舍恩伯格旗帜鲜明的亮出他的三个观点:一、更多:不是随机样本,而是全体数据;二、更杂:不是精确性,而是混杂性;三、更好:不是因果关系,而是相关关系。

维基百科说大数据由巨型数据集组成,这些数据集大小常超出常用软件在可接受时间下的收集、运用、管理和处理能力,或称巨量数据、海量数据、大资料,大数据的常见特点是3V:Volume、Velocity、Variety。但是通过阅读,我了解到规模巨大的数据未必就是大数据。比如伯努利实验,随着实验次数的无限增加,频率将趋近去概率,但这只能说是统计学或者是概率学,而不是大数据。将这一概率引入金融学、天文学、地理学等等领域,进而进行关联研究,但是传统的分析方法的时间是不允许这样做的,这需要搞笑计算资源与能力,将处理结果迅速呈现出来。

大数据并不是指数据本身,而是一种思维方式。

“大数据不是要教机器像人一样思考。相反,把数学算法运用到海量的数据上来预期事情发生的可能性。”大数据令人着迷之处还在于,它正在尝试着引导人们用科学的办法对“预测”挑战。作者引用了安德森的观点“现在已经是一个有海量数据的时代,应用数学已经取代了其他的所有学科工具,而且只要数据足够,就能说明问题”。

大数据研究的一大驱动力就是商用,舍恩伯格在第二部分里讨论了大数据时代的商业变革。而要为商业所用,第一从原始数据采集、数据清洗整合到构建模型分析、形成可显示化结果,整个流程必须连贯起来;第二,大数据产业化,技术成熟。

而国内目前的情况是,传统企业的流程分割化现象严重,就数据采集方面来说,因内部是各个孤立的系统而产生信息孤岛现象,又或者是数据采集过于片面。

所以传统行业能够运用大数据技术创造更大的商业价值的前提是实现信息化、数字化,并且要有新的思维,不论是公司高层还是底层(这就涉及到第三部分——管理变革)。此外,大叔级技术在国内的发展不能说顺利。首先国内的大数据技术缺乏数据准备阶段,这就使得发展大数据成为空话或者是说只是一种概念炒作,对比国外,没有媒体刻意推进和炒作,只是在脚踏实地地研究, 这样出来的技术才可能是完美的成熟的。

要发展好大数据,要利用大数据创造的价值,就要改变管理的思维方式,变革管理模式。运用大数据的企业要改变,研究开发大数据的企业也要改变。

“大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。”

 

第二篇:大数据之感想

《大数据》读后感想:

首先,本书大体上都是在讲美国政府在各社会团体不断“争取”权利、三权分立制度的制衡下,一步步将信息公开的历程。以及数据对美国政治所产生的影响,美国政府如何保护公民隐私等等。其实真正涉及到企业如何变得更加“智能”,唯有第四章讲得非常详细。先来看一下完整的商务智能流程:1、通过各种来源的关系型数据库,使用ELT(提取、转换、加载)工具,对来自不同系统的数据以统一格式进行清洗、转换、集成进入到数据仓库。2、锁定目标数据后进行联机分析。通过不同的分析角度进行多维分析,这样用户可以随时创建自己需要的报表,开发人员只要在后台为用户创建构建多维的数据立方体模型,用户就可以直接在前端的各个维度之间进行切换,从不同的维度对数据进行分析。从而获得更加全面的、动态的的分析结果。3、进行数据挖掘。就是从海量数据中,挖掘出具有价值的数据。通过对数据的挖掘其一、可以发现数据的历史规律,对过去进行总结。其二、可以根据数据对未来进行预测。企业可以根据预测对未来行情趋势做出预判,并作出相关决策。4、数据可视化,我想任何人看到一推数据,就会感到很头疼。当然也很不直观,到底企业的各项指标相比往年是好是坏去做对比也会很麻烦。使用各种图表、三维地图、动态模拟以及相关的动画技术是原本枯燥乏味的数据,变得生动起来。数据可视化把数据以更加直观的形态展现出来,使人们对相关数据做到一目了然。5、通过上面几步我们就把原先毫无价值的数据,变成了信息,最后演变为知识。

其次,我们微动天下应该考虑的:1、是否有必要建立数据仓库?当然我这个问题我也在线上向IBM数据仓库的人员询问过。要考虑的有两个因素:其一、数据量的级别,其二、对数据挖掘的程度。一、数据量。采集器实时都对新闻、论坛、博客、微博在进行采集,当然如果说一年的数据量不算大的话,亦或者宁波本地的数据量也没那么大的话。公司假设几年后、几十年后业务量增大了,做到了浙江省乃至全国的时候。那个时候的数据量我想应该

是非常的庞大了。二、对数据挖掘的程度,当然有关公司涉及的更多。不过有时候那些公司做得仅仅是从采集的数据那里通过筛选,将相关信息发送给相关的客户。个人觉得这个价值应该被放大,通过对相关数据的挖掘对过去的规律进行总结,对未来的趋势做出预测。如固特异轮胎,根据往年的数据总结出某款轮胎某地以及在哪个时间段销量最大,然后第二年可以根据这个数据,制造商可以提前对该型号轮胎进行大量备货以备不时之需。通过挖掘在特定的时间段,哪几种商品捆绑销售会得到更好的销量等等。当然数据仓库是面向主题的数据集合,用于支持管理中的决策制定。个人觉得对公司领导层做出正确决策有很大的指导作用。

2、公司应该加大数据挖掘能力。公司在招聘往里面招聘的所谓数据分析师,只不过是用来数据监测的。真正意义上面的数据分析师很是匮乏。现在客户大多希望的是能够给本企业决策有指导性意义的报告、或者建议。这就需要我们通过数据挖掘预测出未来趋势,即预测性分析。这样无论在产品推广,以及在本品牌忠诚度上都会有一定的保障。3、是否能通过联机分析处理将数据从各个角度、不同纬度展现出来。例如对销售数据的分析,时间周期是一个维度,产品类别、分销渠道、地理分布、客户群类也分别是一个维度。一旦多维数据模型建立完成,用户可以快速地从各个分析角度获取数据,也能动态的在各个角度之间切换或者进行多角度综合分析。4、数据可视化设计上需要强化。相关系统是直接给客户进行操作使用的,但我们所生成报告里面的统计图、走势图还不能很直观的展现给客户。这个对于客户体验来说是非常致命的,因为一旦不能直观的体现数据所呈现出来的状态,客户就不能对其决策做出准确的判断。进一步导致客户对我们忠诚度的降低。

相关推荐