-
SPSS常用功能介绍
普通类 -
- 支持
- 批判
- 提问
- 解释
- 补充
- 删除
-
-
一、SPSS软件简介
(一)概念:
SPSS是“社会科学统计软件包”(Statistical Package for the Social Science)的简称,是一种集成化的计算机数据处理应用软件。1968年,美国斯坦福大学H.Nie等三位大学生开发了最早的SPSS统计软件,并于1975年在芝加哥成立了SPSS公司,已有30余年的成长历史,全球约有25万家产品用户,广泛分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研、教育等多个领域和行业。SPSS是世界上公认的三大数据分析软件之一(SAS、SPSS和SYSTAT)。1994至1998年间,SPSS公司陆续购并了SYSTAT公司、BMDP公司等,由原来单一统计产品开发转向企业、教育科研及政府机构提供全面信息统计决策支持服务。伴随SPSS服务领域的扩大和深度的增加,SPSS公司已决定将其全称更改为Statistical Product and Service solutions(统计产品与服务解决方案)。
(二)窗口简介:
图1 界面介绍图
菜单栏介绍:
表1:各菜单栏介绍
菜单项
中文含义
包含的命令项
File
文件操作
简历5种窗口,文件的打开、保存、另存、读取数据库数据、显示数据文件信息打印等功能
Edit
文件编辑
撤销/恢复、剪切、复制、粘贴、清除、查找、定义系统参数
View
窗口外观控制
状态栏、工具栏、表格线的显示或隐藏,字体设置、值标签/变量值的显示切换
Data
数据文件的简历与编辑
定义日期、插入变量、观测值、转置、对管测量定位、排序、对数据文件的拆分、合并、汇总、选择观测量、对观测量加权、进行与显示正交实验设计等
Transform
数据转换
计算新变量、随机数种子设置、计数、重编码、变量等级化、排序、建立时间序列、重置缺失值等
Analyze
统计分析
概括描述、自定义表格,均值比较、一般线性模型(方差分析)、相关、回归、对数回归、聚类与判别、数据简化、多维标度、非残检验、时间序列、生存分析、多项相应、缺失值分析
Graphs
统计图表的建立与编辑
统计图概览、交互作用方式、统计地图及概览中所列的各种统计图的建立与编辑
Utilities
实用程序
变量列表、文件信息、定义域使用集合、自动到新观测量、运行稿本文件、菜单编辑器
Window
窗口控制
所有窗口最小化、激活窗口列表
Help
帮助
主体、培训、spss主页、语义指南、统计学指导、关于本软件协议
(三)特点:
1、操作简便
界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
2、编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计方法的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
3、功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
4、数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件,Excel的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt及html格式的文件。
5、模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
6、针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
(四)spss中的十三个功能模块:
1、SPSS Base:
SPSS的基本模块,管理整个软件平台,管理数据访问、数据处理和输出,并能进行很多种常见基本统计分析。其他模块必须挂接在此模块才能运行;
2、SPSS Advanced Models:
提供了一组成熟的单变量和多变量分析技术来解决现实问题,它能方便地建立更灵活、更成熟的模型,在处理嵌套数据时得 到更精确的预测模型。它可用于分析事件历史和持续时间数据,还可自定义工具,用内建的宏程序库进一步地定制工具组,以便扩展分析功能用于更专门的用途;
3、SPSS Regression:
大量的非线性建模工具、多维尺度分析帮助研究人员进行非线性回归分析。它将数据从数据约束中解放出来,方便地把数据分成两组,建立可控制的模型及表达式进行非线性模型的参数估计,能够建立比简单线性回归模型更好的预测模型;
4、SPSS Trends:
用强有力的时间序列分析工具做更好的预测。不论数据的大小或变量的多寡都能建立可靠的预测,自动选取适合模型及参数降低预测误差;更有效率的更新及管理预测模型,让您有更多时间比较和探索与其它模型的差异;产生专家级的经验预测值、预测模型类型、模型参数值及其它相关输出;提供可理解的有意义的信息给组织决策者,以利于企业进行正确预测;
5、SPSS Classification Trees:
可建立决策树来确认分组并预测结果,利用直觉式的树形图,颜色分类图,和表格协助研究人员轻松确认和评估区隔;
6、SPSS Categories:
用启发性的二维图和感知图让您清晰地洞察数据中的关系,使您可以更完整和方便地分析数据。通过类似传统的回归分析、主成份分析及典型相关分析的分析方法,帮您处理和了解分类数据及定序数据;
7、SPSS Tables:
提供35种单元和摘要统计量,能够更方便地显示多重序列数据,它能串接所有的维度,以在同一表格中显示包含不同统计量的各种变量。
Tables用更深入的分析,轻松地处理复选题与缺失值,用包括所有统计量、易于理解的表格来展现分析结果,通过完整的表格控制权,研究人员还可以自制表格,创造优美外观;
8、SPSS Data Validation:
该模块使您简单便捷地识别可疑或无效地观测,变量,以及数据值;了解数据缺失的模式,总结变量的分布;
9、SPSS Missing Value Analysis:
用六种灵活的诊断报告来评估缺失值是否会影响分析结论,更好地了解它们的特性。它通过快捷地诊断缺失值,得到更精确的摘要统计量,方便地用估计值替换缺失值,得到精确的结论;
10、SPSS Conjoint:
帮助市场研究人员和新产品开发部门了解在消费者心目中什么产品属性是重要的,了解最偏爱的属性水平是什么,进行定价研究,进行品牌价格研究。在产品投入大批量生产之前进行这些研究,以避免可能的失误;
11、SPSS Complex Samples:
该模块可以计算复杂样本的统计数据,拥有专门的规划工具和统计方法,提供各种向导来制定取样方案或详细定义样本,并提供专门的技术来解决样本设计以及相伴标准误差,能够减少得出错误或误导性推论的风险;
12、SPSS Exact Tests:
超过30个精确检验涵盖了小型或大型数据集所有的非参数和分类数据问题,包括独立或相关样本的单样本、两样本和K-样本检验,拟合度检验,RxC列联表独立性检验和联合测度检验等。无论您的数据结构为何,该模块都能给您正确的p-值,为您提供可信赖的结果;
13、SPSS Maps:
图表化呈现数据,帮助用户做更好的决策。
-
二、SPSS软件的功能介绍
SPSS软件主要功能就是数据管理和数据建模分析 。
图2 常用功能图
-
三、操作步骤
当我们的调查问卷在把调查数据拿回来后,我们该做的工作就是用相关的统计软件进行处理,在此,我们以spss为处理软件,来简要说明一下问卷的处理过程,它的过程大致可分为四个过程:定义变量﹑数据录入﹑统计分析和结果保存.下面将从这四个方面来对问卷的处理做详细的介绍.
Spss处理:
第一步:定义变量
大多数情况下我们需要从头定义变量,在打开SPSS后,我们可以看到和excel相似的界面,在界面的左下方可以看到Data View, Variable View两个标签,只需单击左下方的Variable View标签就可以切换到变量定义界面开始定义新变量。在表格上方可以看到一个变量要设置如下几项:name(变量名)、type(变量类型)、width(变量值的宽度)、decimals(小数位) 、label(变量标签) 、Values(定义具体变量值的标签)、Missing(定义变量缺失值)、Colomns(定义显示列宽)、Align(定义显示对齐方式)、Measure(定义变量类型是连续、有序分类还是无序分类).
我们知道在spss中,我们可以把一份问卷上面的每一个问题设为一个变量,这样一份问卷有多少个问题就要有多少个变量与之对应,每一个问题的答案即为变量的取值.现在我们以问卷第一个问题为例来说明变量的设置.为了便于说明,可假设此题为:
1.请问你的年龄属于下面哪一个年龄段( )?
A:20—29 B:30—39 C:40—49 D:50--59
那么我们的变量设置可如下: name即变量名为1,type即类型可根据答案的类型设置,答案我们可以用1、2、3、4来代替A、B、C、D,所以我们选择数字型的,即选择Numeric, width宽度为4,decimals即小数位数位为0(因为答案没有小数点),label即变量标签为“年龄段查询”。Values用于定义具体变量值的标签,单击Value框右半部的省略号,会弹出变量值标签对话框,在第一个文本框里输入1,第二个输入20—29,然后单击添加即可.同样道理我们可做如下设置,即1=20—29、2=30—39、3=40—49、4=50--59;Missing,用于定义变量缺失值, 单击missing框右侧的省略号,会弹出缺失值对话框, 界面上有一列三个单选钮,默认值为最上方的“无缺失值”;第二项为“不连续缺失值”,最多可以定义3个值;最后一项为“缺失值范围加可选的一个缺失值”,在此我们不设置缺省值,所以选中第一项如图;Colomns,定义显示列宽,可自己根据实际情况设置;Align,定义显示对齐方式,有居左、居右、居中三种方式;Measure,定义变量类型是连续、有序分类还是无序分类。
以上为问卷中常见的单项选择题型的变量设置,下面将对一些特殊情况的变量设置也作一下说明:
1.开放式题型的设置:诸如你所在的省份是_____这样的填空题即为开放题,设置这些变量的时候只需要将Value 、Missing两项不设置即可.
2.多选题的变量设置:这类题型的设置有两种方法即多重二分法和多重分类法,在这里我们只对多重二分法进行介绍.这种方法的基本思想是把该题每一个选项设置成一个变量,然后将每一个选项拆分为两个选项项,即选中该项和不选中该项.现在举例来说明在spss中的具体操作.比如如下一例:
请问您通常获取新闻的方式有哪些( )
1 报纸 2 杂志 3 电视 4 收音机 5 网络
在spss中设置变量时可为此题设置五个变量,假如此题为问卷第三题,那么变量名分别为3_1、3_2、3_3、3_4、3_5,然后每一个选项有两个选项选中和不选中,只需在Value一项中为每一个变量设置成1=选中此项、0=不选中此项即可。 使用该窗口,我们可以把一个问卷中的所有问题作为变量在这个窗口中一次定义。
到此,我们的定义变量的工作就基本上可以结束了.下面我们要作就是数据的录入了.首先,我们要回到数据录入窗口,这很简单,只要我们点击软件左下方的Data View标签就可以了.第二步:数据录入
Spss数据录入有很多方式,大致有一下几种:
1.读取SPSS格式的数据
2.读取Excel等格式的数据
3.读取文本数据(Fixed和Delimiter)
4.读取数据库格式数据(分如下两步)
(1)配置ODBC (2)在SPSS中通过ODBC和数据库进行
但是对于问卷的数据录入其实很简单,只要在spss的数据录入窗口中直接输入就可以了,只是在这里有几点注意的事项需要说明一下。
1. 在数据录入窗口,我们可以看到有一个表格,这个表格中的每一行代表一份问卷,我们也称为一个个案.
2. 在数据录入窗口中,我们可以看到表格上方出现了1、2、3、4、5…….的标签名,这其实是我们在第一步定义变量中,我们为问卷的每一个问题取的变量名,即1代表第一题,2代表第二题.以次类推.我们只需要在变量名下面输入对应问题的答案即可完成问卷的数据录入.比如上述年龄段查询的例题,如果问卷上勾选了A答案,我们在1下面输入1就行了(不要忘记我们通常是用1、2、3、4来代替A、B、C、D的).
3.我们知道一行代表一份问卷,所以有几分问卷,就要有几行的数据.
在数据录入完成后,我们要做的就是我们的关键部分,即问卷的统计分析了,因为这时我们已经把问卷中的数据录入我们的软件中了.
第三步:统计分析
有了数据,可以利用SPSS的各种分析方法进行分析,但选择何种统计分析方法,即调用哪个统计分析过程,是得到正确分析结果的关键。这要根据我们的问卷调查的目的和我们想要什么样的结果来选择.SPSS有数值分析和作图分析两类方法.
1.作图分析:
在SPSS中,除了生存分析所用的生存曲线图被整合到Analyze菜单中外,其他的统计绘图功能均放置在graph菜单中。该菜单具体分为以下几部分:
(1)Gallery:相当于一个自学向导,将统计绘图功能做了简单的介绍,初学者可以通过它对SPSS的绘图能力有一个大致的了解。
(2)Interactive:交互式统计图。
(3)Map:统计地图。
(4)下方的其他菜单项是我们最为常用的普通统计图,具体来说有:
条图、散点图、线图、直方图、饼图、面积图、箱式图、正态Q-Q图、正态P-P图、质量控制图、Pareto图、自回归曲线图、高低图、交互相关图、序列图、频谱图、误差线图。
作图分析简单易懂,一目了然,我们可根据需要来选择我们需要作的图形,一般来讲,我们较常用的有条图,直方图,正态图,散点图,饼图等等,具体操作很简单,大家可参阅相关书籍,作图分析更多情况下是和数值分析相结合来对试卷进行分析的,这样的效果更好.
2.数值分析:
SPSS 数值统计分析过程均在Analyze菜单中,包括:
(1)、Reports和Descriptive Statistics:又称为基本统计分析.基本统计分析是进行其他更深入的统计分析的前提,通过基本统计分析,用户可以对分析数据的总体特征有比较准确的把握,从而选择更为深入的分析方法对分析对象进行研究。Reports和Descriptive Statistics命令项中包括的功能是对单变量的描述统计分析。
Descriptive Statistics包括的统计功能有:
Frequencies(频数分析):作用:了解变量的取值分布情况
Descriptives(描述统计量分析):功能:了解数据的基本统计特征和对指定的变量值进行标准化处理
Explore(探索分析):功能:考察数据的奇异性和分布特征
Crosstabs(交叉分析):功能:分析事物(变量)之间的相互影响和关系
Reports包括的统计功能有:
OLAP Cubes(OLAP报告摘要表):功能: 以分组变量为基础,计算各组的总计、均值和其他统计量。而输出的报告摘要则是指每个组中所包含的各种变量的统计信息。
Case Summaries(观测量列表):察看或打印所需要的变量值
Report Summaries in Row:行形式输出报告
Report Summaries in Columns:列形式输出报告(2)、Compare Means(均值比较与检验):能否用样本均值估计总体均值?两个变量均值接近的样本是否来自均值相同的总体?换句话说,两组样本某变量均值不同,其差异是否具有统计意义?能否说明总体差异?这是各种研究工作中经常提出的问题。这就要进行均值比较。
以下是进行均值比较及检验的过程:
MEANS过程:不同水平下(不同组)的描述统计量,如男女的平均工资,各工种的平均工资。目的在于比较。术语:水平数(指分类变量的值数,如sex变量有2个值,称为有两个水平)、单元Cell(指因变量按分类变量值所分的组)、水平组合
T test 过程:对样本进行T检验的过程
单一样本的T检验:检验单个变量的均值是否与给定的常数之间存在差异。
独立样本的T检验:检验两组不相关的样本是否来自具有相同均值的总体(均值是否相同,如男女的平均收入是否相同,是否有显著性差异)
配对T检验:检验两组相关的样本是否来自具有相同均值的总体(前后比较,如训练效果,治疗效果)
one-Way ANOVA:一元(单因素)方差分析,用于检验几个(三个或三个以上)独立的组,是否来自均值相同的总体。(3)、ANOVA Models(方差分析):方差分析是检验多组样本均值间的差异是否具有统计意义的一种方法。例如:医学界研究几种药物对某种疾病的疗效;农业研究土壤、肥料、日照时间等因素对某种农作物产量的影响;不同饲料对牲畜体重增长的效果等,都可以使用方差分析方法去解决
(4)、Correlate(相关分析):它是研究变量间密切程度的一种常用统计方法,常用的相关分析有以下几种:
1、线性相关分析:研究两个变量间线性关系的程度。用相关系数r来描述。
2、偏相关分析:它描述的是当控制了一个或几个另外的变量的影响条件下两个变量间的相关性,如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系
3、相似性测度:两个或若干个变量、两个或两组观测量之间的关系有时也可以用相似性或不相似性来描述。相似性测度用大值表示很相似,而不相似性用距离或不相似性来描述,大值表示相差甚远(5)、Regression(回归分析):功能:寻求有关联(相关)的变量之间的关系在回归过程中包括:Liner:线性回归;Curve Estimation:曲线估计;Binary Logistic: 二分变量逻辑回归;Multinomial Logistic:多分变量逻辑回归;Ordinal 序回归;Probit:概率单位回归;Nonlinear:非线性回归;Weight Estimation:加权估计;2-Stage Least squares:二段最小平方法;Optimal Scaling 最优编码回归;其中最常用的为前面三个.
(6)、Nonparametric Tests(非参数检验):是指在总体不服从正态分布且分布情况不明时,用来检验数据资料是否来自同一个总体假设的一类检验方法。由于这些方法一般不涉及总体参数故得名。
非参数检验的过程有以下几个:
1.Chi-Square test 卡方检验
2.Binomial test 二项分布检验
3.Runs test 游程检验
4.1-Sample Kolmogorov-Smirnov test 一个样本柯尔莫哥洛夫-斯米诺夫检验
5.2 independent Samples Test 两个独立样本检验
6.K independent Samples Test K个独立样本检验
7.2 related Samples Test 两个相关样本检验
8.K related Samples Test 两个相关样本检验(7)、Data Reduction(因子分析)
(8)、Classify(聚类与判别)等等
以上就是数值统计分析Analyze菜单下几项用于分析的数值统计分析方法的简介,在我们的变量定义以及数据录入完成后,我们就可以根据我们的需要在以上几种分析方法中选择若干种对我们的问卷数据进行统计分析,来得到我们想要的结果.第四步:结果保存
我们的spss软件会把我们统计分析的多有结果保存在一个窗口中即结果输出窗口(output),由于spss软件支持复制和粘贴功能,这样我们就可以把我们想要的结果复制﹑粘贴到我们的报告中,当然我们也可以在菜单中执行file->save来保存我们的结果,一般情况下,我们建议保存我们的数据,结果可不保存.因为只要有了数据,如果我们想要结果的,我们可以随时利用数据得到结果.
总结:
以上便是spss处理问卷的四个步骤,四个步骤结束后,我们需要spss软件做的工作基本上也就结束了,接下来的任务就是写我们的统计报告了.值得一提的是.spss是一款在社会统计学应用非常广泛的统计类软件,学好它将对我们以后的工作学习产生很大的意义和作用.-
四、SPSS软件的应用实例介绍
-
五、常用分析方法
(一)方差分析
用来测试某一个控制变量的不同水平是否给观察变量造成显著差异和变动。方差分析前提:不同水平下,各总体均值服从方差相同的正态分布。所以方差分析就是研究不同水平下各个总体的均值是否有显著的差异。统计推断方法是计算F统计量,进行F检验,总的变异平方和 SST,控制变量引起的离差SSA(Between Group离差平方和),另一部分随机变量引起的SSE(组内Within Group离差平方和),SST=SSA+SSE
百度经验:(1)单因素方差分析:http://jingyan.baidu.com/article/375c8e19935a2a25f2a229cb.html
(2)多元方差分析:http://jingyan.baidu.com/article/4d58d541d77c819dd4e9c001.html
(二)协方差分析
协方差分析就是当研究中出现一个变量不是我们想要研究的变量,但是却会影响到我们的研究结果,我们不得不对其进行控制,这时候就可以用协方差分析的方法来控制,协方差分析一个最重要的假设是斜率同质假设,下面就要先检验斜率同质假设,然后才能进行协方差分析。
百度经验:http://jingyan.baidu.com/album/1709ad80d53fd24635c4f068.html?picindex=1
http://jingyan.baidu.com/article/09ea3ede0ddfe0c0aede3939.html
(三)配对t检验
t检验是计量资料的假设检验中最为简单常用的,当样本含量n较小时,比如n小于60。配对t检验又称成对t检验,适用于配对设计的计量资料。配对设计是将受试对象按照某些重要特征,如可疑混杂因素性别等配成对子,每对中的两个受试对象随机分配到两处理组。
百度经验:http://jingyan.baidu.com/article/6b182309b45da0ba58e159fa.html
(四)独立样本t检验
独立样本的t检验过程用于检验两个独立样本是否来自具有相同均值的总体。
百度经验:http://jingyan.baidu.com/article/a3f121e419311cfc9052bba9.html
(五)相关分析
相关分析(correlation analysis),相关分析是研究现象之间是否存在某种依存关系,并对具体有依存关系的现象探讨其相关方向以及相关程度,是研究随机变量之间的相关关系的一种统计方法。
百度经验:http://jingyan.baidu.com/article/b87fe19ebcdafd521935687e.html
-
六、拓展资源
[1]数据的导入和保存http://jingyan.baidu.com/article/1e5468f9280e06484961b7e3.html
[2]插入变量和个案http://jingyan.baidu.com/article/86f4a73e57ec3e37d65269e3.html
[3]替换缺失值http://jingyan.baidu.com/article/b2c186c8ebd713c46ef6ff82.html
[4]分类汇总http://jingyan.baidu.com/article/29697b9131932fab20de3c82.html
[5]固定格式文件导入http://jingyan.baidu.com/article/d713063500182c13fdf47582.html
[6]自由格式的文件导入http://jingyan.baidu.com/article/60ccbceb038b4364cab19783.html
[7]频率分析描述http://jingyan.baidu.com/article/ff42efa91bbdb6c19e220289.html
[8]探索分析描述http://jingyan.baidu.com/article/020278118c2de21bcc9ce58a.html
[9]交叉表分析描述http://jingyan.baidu.com/article/fd8044faf382a05031137a8a.html
[10]比率描述性分析http://jingyan.baidu.com/article/ca2d939dd773b9eb6c31ce8b.html
-
七、参考文献
[1]杜志渊.常用统计分析方法:SPSS应用[M].山东人民出版社,2006.
[2]李小胜,陈珍珍.如何正确应用SPSS做主成分分析[J].统计研究,2010.
[3]刘菊香,沈霄凤.用Spss统计软件对学生综合成绩的因子分析[J].统计教育,2006.
[4]蒋国珍,张伟远.远程教育研究中数据分析与SPSS的运用[J].远程教育杂志,2005.
[5]胡来林,安玉洁.近十年来我国教育技术学研究方法的回顾与反思[J].电化教育研究,2006.
[6]陈瑜林.我国教育技术主要研究领域的历史演进——基于CNKI“两刊”关键词、主题词的类团分析[J].电化教育研究,2012.
[7]张刚要.基于共词分析的教育技术学学科结构可视化研究[J].中国电化教育,2013.
[8]宁本涛.提升学校教育督导效能的校长满意度研究[J].教育研究,2015.
-
八、测试题
-
-
- 标签:
-
学习元评论 (0条)
聪明如你,不妨在这 发表你的看法与心得 ~