spss的聚类分析功能在试卷分析中的应用

发布时间：2024-04-26 18:37:27　影响了：人

下面是博文学习网小编为你分享的spss的聚类分析功能在试卷分析中的应用，希望能够为大家带来帮助，希望大家会喜欢。同时也希望给你们带来一些参考的作用，如果喜欢就请继续关注我们博文学习网（www.hnnscy.com）的后续更新吧！

spss的聚类分析功能在试卷分析中的应用篇一：浅谈SPSS软件在试卷分析中的应用

浅谈SPSS软件在试卷分析中的应用

摘要：应用SPSS对试卷进行定量统计分析和评价，提高教师独立分析试卷的水平。关键词：SPSS；难度分析；区分度分析；信度分析

考试是学校教学工作的重要环节，是衡量教学效果、选拔优秀人才的重要手段。通过试卷分析，能客观地反映“教”与“学”的水平与效果，并可以帮助教师发现教学活动中的薄弱环节，以利于不断提高教学成绩。

笔者在教学工作之余发现，用SPSS分析试卷，比用Excel还要全面，功能更多。SPSS是全球三大著名统计软件之一，由美国SPSS软件公司开发，其数据管理和分析功能强大，界面友好，操作简单，全部为Windows菜单式操作，是当前社会科学范围内应用最为广泛的统计软件。本文运用SPSS 15软件，通过难度、区分度、信度等指标，对我校2007年中考县三模化学试卷进行定量分析和评价，目的是让读者学会独立分析试卷。

试卷结构

2 试卷分析

2．1 创建数据文件

启用SPSS，软件将自动打开数据编辑窗口，该界面和Excel极为相似，由若干行和列组成，每一列对应一个变量；每一行为一个观

测量，每个学生代表一个观测量。窗口左下方有数据视图和变量视图的标签，可以随时进行切换。

2．1．1 创建变量

具体操作为：单击“Variable View”,切换到变量视图窗口，视

图的每一行代表一个变量的各种属性，如变量名（Name）、变量类型（Type）、变量长度(Width)等；在Name标题下输入变量名：姓名、性别、题号、总成绩，其中总成绩名定义为TOTAL（防止系统冲突）；在Type标题下定义各项目的类型，其中姓名、性别定义为String型，题号和总成绩定义成Numeric型，小数点后长度为1，其余项使用默认值。

2．1．2 输入数据

单击“Data View”，将窗口切换回数据视图，将103份试卷按

照各题得分情况输入SPSS，如下图一所示。

图一

SPSS软件也可以直接读取Excel等格式的文件，例如，导入Excel

文件需先执行【File】/【Open】/【Data?】操作，在“Open file”窗口中，选择＊.xls文件类型,选中所需打开的文件,单击【Open】,出现“Opening Excel Data Source”对话框,选择需要打开的工作单(Worksheet),就可以顺利导入Excel文件。

2．1．3 保存数据

选择菜单【File】/【Save As】，在弹出的“Save Data As”

对话框中，选择适当的保存地址，在文件名框中输入“建水九中2007年中考县三模化学成绩”，默认格式为SPSS（＊.sav），按回车键，系统便回到数据编辑窗口，其左上角已经由“Untitled”变为“建水九中2007年中考县三模化学成绩”，表明当前的编辑文件名称为“建水九中2007年中考县三模化学成绩.sav”。

2．2基本统计分析

2.2．1 计算均分、标准差、最低分、最高分

由图一中的原始数据，运行菜单:【Analyze】/【Descriptive

Statistics】/【Frequencies】得到频数表，如下表所示：

Statistics

总分

2．2．2计算各分数段人数

在SPSS软件中，各分数段人数可通过对原始数据进行重新编码

和利用已存在的变量建立新变量来达成目标，下面笔者谈一谈如何利用SPSS自带的函数建立新变量。具体操作为：单击【Transform】/

【Compute】,出现“Compute Variable”(计算新变量)对话框：

图二

在“Target Variable”下的文本框中输入目标变量名：分数段；

在图二的右边中部，“Function group”下的列表框中是一系列SPSS函数，可以拖动滑块选中“TRUNC”函数，然后单击向上箭头按钮，调入上面的“Numeric Expression”表达式文本框内，再利用图二中央的计算器板把“TRUNC”函数调整为：“TRUNC（total/10）*10”，此函数意思为：将各学生总分除以10取整再乘以10，如此操作可得到一个名为“分数段”的新变量，以新变量作频数分析：即可以得到各分数段学生人数分布，如下表所示：

Cumulative

Valid 20.00

30.00

40.00

50.00

60.00

70.00

80.00

90.00

Total Frequency 4 19 15 4 20 18 21 2 103 Percent 3.9 18.4 14.6

3.9 19.4 17.5 20.4 1.9 100.0 Valid Percent 3.9

18.4 14.6 3.9 19.4 17.5 20.4 1.9 100.0 Percent 2．3 难度分析

试题的难度是指全体被试对象对该题的失分率，计算公式为：

P=1-X,其中P为难度值, X为均分值,W为该题满分值。具体操作为：W

【Analyze】/【Descriptive Statistics】/【Descriptives】，将

除TOTAL和分数段以外的变量全部选入“Variable(s)”中，得到各

题的均值，如下表所示：

各题均分表

用前面创建数据文件的办法，建立一个包含均值Mean和各个题

满分值W的数据文件后，单击【Transform】/【Compute】，在“Numeric

Expression”表达式文本框内输入公式1-Mean，在“Target W

Variable”中输入难度系数P，得到各题的难度系数，见下表

2.4区分度分析

spss的聚类分析功能在试卷分析中的应用篇二：SPSS软件聚类分析过程的图文解释及结果的全面分析

SPSS聚类分析过程

聚类的主要过程一般可分为如下四个步骤：

1.数据预处理（标准化）

2.构造关系矩阵（亲疏关系的描述）

3.聚类（根据不同方法进行分类）

4.确定最佳分类（类别数）

SPSS软件聚类步骤

1. 数据预处理（标准化）

→Analyze →Classify →Hierachical Cluster Analysis →Method然后从对话框中进行如下选择

从Transform Values框中点击向下箭头，此为标准化方法，将出现如下可选项，从中选一即可：

标准化方法解释：None：不进行标准化，这是系统默认值；Z Scores：标准化变换；Range –1 to 1：极差标准化变换（作用：变换后的数据均值为0，极差为1，且|xij*|<1

，消去了量纲的影响；在

以后的分析计算中可以减少误差的产生。）；Range 0 to 1（极差正规化变换/ 规格化变换）；

2. 构造关系矩阵

在SPSS中如何选择测度（相似性统计量）:

→Analyze →Classify →Hierachical Cluster Analysis →Method然后从对话框中进行如下选择

常用测度（选项说明）：Euclidean distance：欧氏距离（二阶Minkowski距离），用途：聚类分析中用得最广泛的距离；Squared Eucidean distance：平方欧氏距离；Cosine：夹角余弦(相似性测度；Pearson correlation：皮尔逊相关系数；

3. 选择聚类方法

SPSS中如何选择系统聚类法

常用系统聚类方法

a）Between-groups linkage 组间平均距离连接法

方法简述：合并两类的结果使所有的两两项对之间的平均距离最小。（项对的两成员分属不同类）特点：非最大距离，也非最小距离

b）Within-groups linkage 组内平均连接法

方法简述：两类合并为一类后，合并后的类中所有项之间的平均距离最小

C）Nearest neighbor 最近邻法（最短距离法）

方法简述：用两类之间最远点的距离代表两类之间的距离，也称之为完全连接法

d）Furthest neighbor 最远邻法（最长距离法）

方法简述：用两类之间最远点的距离代表两类之间的距离，也称之为完全连接法 e）Centroid clustering 重心聚类法

方法简述：两类间的距离定义为两类重心之间的距离，对样品分类而言，每一类中心就是属于该类样品的均值

特点：该距离随聚类地进行不断缩小。该法的谱系树状图很难跟踪，且符号改变频繁，计算较烦。

f）Median clustering 中位数法

方法简述：两类间的距离既不采用两类间的最近距离，也不采用最远距离，而采用介于两者间的距离

特点：图形将出现递转，谱系树状图很难跟踪，因而这个方法几乎不被人们采用。 g）Ward’s method 离差平方和法

方法简述：基于方差分析思想，如果分类合理，则同类样品间离差平方和应当较小，类与类间离差平方和应当较大

特点：实际应用中分类效果较好，应用较广；要求样品间的距离必须是欧氏距离。

谱系分类的确定

经过系统聚类法处理后，得到聚类树状谱系图，Demirmen(1972)提出了应根据研究的目的来确定适当的分类方法，并提出了一些根据谱系图来分类的准则：

A. 任何类都必须在临近各类中是突出的，即各类重心间距离必须极大

B. 确定的类中，各类所包含的元素都不要过分地多

C. 分类的数目必须符合实用目的

D. 若采用几种不同的聚类方法处理，则在各自的聚类图中应发现相同的类实例分析

spss的聚类分析功能在试卷分析中的应用篇三：spss 聚类分析例题

1. 打开数据文件后，在数据编辑窗口中，从菜单栏中选择“分析”—“分类”—“k-均值

聚类”命令。

2. 在该对话框中选择变量城市进入“个案标记依据”文本框，作为标签变量。把聚类数标

记为4次。

3. 选择变量一至十二月份的日照时数进入“变量”列表框作为观测变量。 4. 单击“迭代”按钮，迭代次数为10次，收敛性标准为0. 5. 单击“保存”按钮，选择“聚类成员”。

6. 单击“选项”按钮，选择“初始聚类中心”和“ANOVA表”，要求输出方差分析表，单

击“继续”。

7. 单击“确定”按钮，执行快速聚类分析。

[数据集1] C:\Documents and Settings\Administrator\桌面\ch9\主要城市日照时数.sav

初始聚类中心

一月日照时数二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数十二月日照时数

聚类

1 2

3 4

聚类成员

案例号 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

spss的聚类分析功能在试卷分析中的应用

16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34

城市北京天津石家庄太原呼和浩特沈阳大连长春哈尔滨上海南京杭州合肥福州南昌济南青岛郑州武汉长沙广州南宁海口桂林重庆温江贵阳昆明拉萨西安兰州西宁银川乌鲁木齐

聚类

距离

二月日照时数三月日照时数四月日照时数五月日照时数六月日照时数七月日照时数八月日照时数九月日照时数十月日照时数十一月日照时数

十二月日照时数

每个聚类中的案例数

聚类 1 2 3 4

有效缺失

spss的聚类分析功能在试卷分析中的应用

相关文章

最新文章