作业一:
一、所选题目: 居民储蓄问卷调查
1、您认为现在买东西合算还是存钱合算? (1)买东西合算 (2)存钱合算 4、您的月收入水平属于?
(1)300元以下 (2) 300-800元 (3) 800-1500元 (4) 1500元以上
二、频数分析
表一:
买东西合算还是存钱合算
Valid “买东西合算”
存钱合算 Total
Cumulative
Frequency 1254 1350 2604
Percent 48.2 51.8 100.0
Valid Percent Percent 48.2 51.8 100.0
48.2 100.0
表明2604名学生中:
(1)有1254人认为买东西合算,占总人数的48.2% (2)有1350人认为存钱合算,占总人数的51.8%
表二:
月收入水平
Cumulat
Frequency
Valid 300元以下 585 300—800
1140
Percent 22.5 43.8 26.4 7.3
22.5 43.8 26.4 7.3
ive
Valid Percent 22.5 66.2 92.7 100.0
800—1500 688 1500元以191 上 Total
2604
100.0 100.0
表明调查的2604人中:
(1)有585人的月收入在300元以下,占总人数的22.5%;有1140人的月收入在300-800元,占总人数的43.8%;有191人的月收入在1500元以上,占总人数的7.3%
(2)月收入在300-800的较多,占总数的43.8%, (3)1500以上的最少,只占7.3%。
表三:
Statistics
N
Valid
买东西合算还是存钱合算 2604
月收入水平 2604 0 2.19 2.00 2 2.00 2.00 3.00
Missing 0
Mean Median Mode
Percentiles 25
50 75
1.52 2.00 2 1.00 2.00 2.00
(1)认为存钱合算的人数比例大于认为买东西合算的
(2)人数比例,不同月收入水平对买东西还是存钱的观念有影响。
三、列联分析
总体情况:表明2604名人中有1254人认为买东西合算,占总人数的48.2%;有1350人认为存钱合算占总人数的51.8%。 具体情况:
(1)认为买东西合算的人共有1254人,对月收入水平的分析如下:
月收入水平在300元以下的585人中有47.5%的人认为买东西合算占总的人数的10.7%; 月收入水平在300—800元的1140人中有47.4%的人认为买东西合算占总人数的20.7%; 月收入水平在800—1500元的688人中有49.1%的人认为买东西合算占总人数的13%; 月收入水平在1500元以上的191人中有51.3%的人认为买东西合算占总人数的3.8%; (2)认为存钱合算的人共有1350人,对月收入水平的分析如下:
月收入水平在300元以下的585人中有52.5%的人认为买东西合算占总的人数的11.8%; 月收入水平在300—800元的1140人中有52.6%的人认为存钱合算占总人数的23%;
月收入水平在800—1500元的688人中有50.9%的人认为存钱合算占总人数的13.4%; 月收入水平在1500元以上的191人中有48.7%的人认为存钱合算占总人数的3.6%;
由此可见:认为买东西合算的人所占比例远远大于认为存钱合算的人数比例,但两者比例相差不大,说明大多数人对存钱愿望较高。
(1)从总体上看,持“买东西合算”、“存钱合算”观点的学生人数比例为48.2:51.8
若仍按照这个总体比例,不同收入人群中持两种观点的人数比例仍应是48.2:51.8
① 月收入在300元以下的人中应分别约有281人、304人持两种不同观点 ② 月收入在300-800元以下的人中应分别约有549人、591人持两种不同观点 ③ 月收入在800-1500元以下的人中应分别有331人、357人持两种不同观点 ④ 月收入在1500元以上的人中应分别有92人、99人
(2)以上数据即为各个单元格中的期望频数,实际观察频数与期望频数之差就是剩余,对剩余进行标准化处理便得到标准化剩余
(3)不同收入水平中的期望频数所构成的分布是和总体分布相一致的分布,体现出收入水平对该问题的回答没有产生影响
①若列联表所有单元的实际观察频数整体上与期望频数之间的差距较小,说明不同收入水平对回答该问题确实没有产生影响,即行、列变量是相互独立的
② 反之,则说明行、列变量之间存在明显的相关关系
(4)从输出结果看:卡方的概率p值小于显著性水平(0.05或0.01),拒绝零假设,认为不同收入水平对该问题的回答有显著影响
作业二:
一、所选题目:
为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业、航空和公司、家电制造业分别抽取了不同的企业作为样本。其中,零售业7家,旅游业6家,航空公司5家,家电制造业5家,然后统计出最近一年中消费者对总共23家企业投诉的次数。
本列中,行业是分子,共有三个行业。
检验的零假设:各个行业的投诉次数之间没有差异。
二、单因素方差分析
表一:
由以上前提检验的结果可知:
(1)检验的p值为0.898,大于显著性水平0.05
(2)则应接受原假设
①即各水平下的总体方差没有显著差异 ②满足方差分析的前提
表二:
由方差分析的结果可知
(1)F检验的p值为0.039,小于显著性水平0.05 (2)则应拒绝原假设
即不同行业的投诉次数之间存在显著差异
表三:
由多重比较的结果可知
(1)零售业与航空公司间存在显著差异
(2)旅游业只与航空公司存在显著差异
(3)航空公司与其他各行业间不存在显著差异
(4)家电制造业只与零售业、旅游业、航空公司三个行业间都存在显著差异
旅游业次数持平。
作业三:
一、所选题目:
一家电器销售公司的管理人员认为,月销售收入是广告费用的函数,并想通过广告费用对月销售收入做出估计。
二、相关分析
表一:
由表一可看出:月销售收入与报纸费用之间相关性不显著
表二:
一、多元线性回归分析
(1)本次多元回归分析采用的是逐步筛选法
①回归系数显著性F检验的相伴概率值小于0.05的自变量引入了回归方程,大于0.1的自变量剔除出了回归方程 (2)自变量进入回归方程的顺序
①首先,电视广告费用进入回归方程,形成模型1
②其次,在模型1的基础上引入第二个自变量—报纸广告费用,形成最终的回归模型2
表四:
表四表明:
①随着自变量的不断引入回归方程 ②调整的R2在不断提高
③回归方程的估计标准误差在不断减小
a. Predictors: (Constant), 电视广告费用
b. Predictors: (Constant), 电视广告费用, 报纸广告费用 c. Dependent Variable: 月销售收入
(1)第二列的三行分别列出了:
回归平方和、剩余平方和、因变量的总平方和
(2)第四列是第二列除以第三列自由度的结果
分别为平均的回归平方和、平均的剩余平方和
(3)第五列是用于回归方程显著性检验的F统计量
由平均的回归平方和除以平均的剩余平方和得到
(4)第六列是F统计量对应的相伴概率值
系数:
(1)第一列:是回归分析过程中形成的两个模型的代码和引入自变量的情况 模型2是最终的回归模型
(2)第二列:回归模型各自变量的回归系数
依据该回归系数,案例最终的回归方程为:
月销售收入=83.23+2.29*电视广告费用+1.301*报纸广告费用
(3)第三列:回归系数的标准误差 (4)第四列:①标准化回归系数
②可以衡量自变量对因变量的贡献程度依据标准化回归系数,案例最终
的标准化回归方程为:月销售收入=83.23+1.153*电视广告费用+0.621*报纸广告费用。
③可见,在其他变量保持一定的条件下电视广告费用增加一个单位,将引起月销售收入平均增加1.153个单位。
④报纸广告费用增加一个单位,将引起不良贷款平均增加0.621个单位
(5)第五、六列:
①各回归系数显著性检验的t统计量和其相应的相伴概率值
②回归系数的P值均小于显著性水平0.05,应拒绝回归系数显著性检验的零假设,认为这些回归系数与零有显著差异,相应的自变量能够较好的解释说明因变量的变化,应该保留在回归方程中
该表是回归分析过程中,尚未被引入方程的自变量的情况已排除的变量: (1)第二、三、四列
模型1第二列表示如果下一步引入固定资产投资额,那么它的标准化系数应该是-0.355,这个数据与输出结果4中的模型2是相吻合的;第三、四列表示如果下一步引入某自变量进入回归方程,它的回归系数显著性检验的t值和对应的相伴概率值;由于报纸广告费用有最大的t值,因此,可以判定:下一步它应引入方程,输出结果4中的模型2证实了这个判断
(2)第二、三、四列
模型2由于两个自变量的t值的相伴概率都大于显著性水平0.05则可以判定它们都不能较好的解释说明因变量的变化,最终不能进入方程输出结果4的模型2证实了判断 第五列在控制了方程中已有自变量的前提下计算出的某自变量与因变量的偏相关系数: 模型1由于报纸广告费用有具有最高的偏相关系数则可以判定下一步它应进入方程,输出结果4中模型2证实了这个判断 (3)第六列
显示如果某自变量进入了回归方程,方程中所有自变量容忍度的最小值;通过比较最小容忍度和该自变量的容忍度,可以对目前方程中自变量共线性的大小程度有所把握。
表八:
残差统计量:
第一至第四行数据分别为 根据回归方程计算出的因变量预测值序列、残差序列、标准化预测值序列、标准化残差序列的最小值、最大值、均值、标准差和样本数
残差分析结果:
(1)标准化残差直方图由该图可知,标准化残差服从均值为0的正态分布
(2)标准化残差散点图标准化残差在0附近波动;残差的均值为0;随机的分布在一条
平行的带子内;方差为常数,且残差之间不相关;95%的点分布在-2~+2之间。
(3)综上所述,标准化残差服从标准正态分布即随机误差项服从基本假定。
总结:
在学习完统计学理论知识后,老师先带领我们来到了机房进行实习,老是先是模拟了一遍实习过程,并给我们了一些数据以便于展开我们的实习,本次实习是在SPSS软件上操作,把数据转变成图表,再根据图表进行分析得出结论。
这次实习包括:频数分析、单因素方差分析、列联分析、相关分析和多元线性回归分析。在实习过程中,我们接触到了之前没有接触过的操作软件,进一步的了解了统计学的统计分析方法,在同学和老师的共同讨论下增长了知识,对数据的起伏变化判断了原因,也得出了不同的分析方法下不同的结论,以及不同分析角度下不同的结论。
通过这次实习,我认为自己的比较分析能力得到了一定的提高。当然,在学习过程中也遇到了一些问题,于由于过程过于繁琐,时而会由于粗心出现错误,但最后检查后得以校正。通过这次实习,我明白了在发现研究过程中要不断的严格要求自己,提高自己细心程度,严肃了自己的工作态度当然。
附录;
单因素方差分析:数据来源:课本例10.1
序号
行业 被投诉次数
1 零售业 2 零售业 3 零售业 4 零售业 5 零售业 6 零售业 7 零售业 8 旅游业 9 旅游业 10 旅游业 11 旅游业 12 旅游业 13 旅游业 14 航空公司 15 航空公司 16 航空公司 17 航空公司 18 航空公司 19 家电制造业 20 家电制造业 21 家电制造业 22 家电制造业 23
家电制造业
相关分析:数据来源:课本习题12.4
序号
月销售收入(万元) 电视广告费用(万元)1 96 5 2 90 2 3 95 4 4 92 2.5 5 95 3 6 94 3.5 7 94 2.5 8
94 3
57 66 49 40 34 53 44 68 39 29 45 56 51 31 49 21 34 40 44 51 65 77 58
报纸广告费用(万元)1.5 2 1.5 2.5 3.3 2.3 4.2 2.5
实习报告内容
1、附件一和附件二是关于居民储蓄调查的问卷及其结果数据。本问卷涉及15个问题,请就你感兴趣的2-3个方面进行频数分析和列联表分析(即交叉分组下的频数分析);
2、自选数据进行单因素方差分析;
3、自选数据进行相关分析和多元线性回归分析。
实习报告要求
1、简介你的定量分析的研究题目、数据来源和定量分析方法;
2、分析SPSS软件给出的分析结果,需要分析的输出结果见相关章节的实习课件(分析SPSS软件给出的数据分析输出结果;尽量将你了解的“参数”和统计分析结果给出文字性的陈述和评价);
3、在书面报告的结尾部分,对照你的分析内容,评价一下你所完成的这个定量分析工作(你的研究达到了原先设计的目的了吗?你认为你的研究有哪些长处和不足?);
4、在书面报告的附录部分,请附上你在分析中用到的原始数据。
5、务必于实习结束的第二天将报告交至学习委员或班长处。
一、统计学课程介绍:统计学是一门实践性很强的方法论学科。19xx年国家技术监督局在GB/T14745—92《学科分类与代码》,把包…
主要内容及总结20xx年政府部门实习报告时间如流水般地飞逝,三个多月的实习生涯就此结束了,在这一段美好时光里,我从惶惑、忐忑,一步…
实习报告一暑期实习结束了在这短暂的日子里我作为一个到武汉市统计局的实习生真正体会到了实际工作与理论学习的差异学到了很多有关统计工作…
作业一一所选题目居民储蓄问卷调查1您认为现在买东西合算还是存钱合算1买东西合算2存钱合算4您的月收入水平属于1300元以下2300…
课程实习报告理学院统计学专业学号姓名指导教师:实习时间:20xx年x月x日——7月x日实习地点:秦皇岛市统计局本人是统计学专业经济…
一、统计学课程介绍:统计学是一门实践性很强的方法论学科。19xx年国家技术监督局在GB/T14745—92《学科分类与代码》,把包…
这学期我们开了统计学这门课程,为了使我们能更好的掌握这一门学科,我们进行了为期一周的统计学实训,通过一个周的努力奋斗,我们这次的统…
《浙江大学优秀实习总结汇编》统计学岗位工作实习期总结转眼之间,两个月的实习期即将结束,回顾这两个月的实习工作,感触很深,收获颇丰。…
统计学专业大学生实习个人总结本人系福州大学统计学专业的一名学生,于年月x日——月x日到省统计局科研所实习,在两周的时间里,我所做的…
统计学实验报告姓名:学号:班级:成绩:一、实验步骤总结成绩:(一)数据的搜集与整理1.实验一:数据的收集与整理实验步骤:一、统计数…
试验统计学实习报告报告人学号专业班级舒云康20xx3001041620xx级农业生物技术1班实习时间:20xx.11.10–20x…