岳麓做网站的公司,除了wordpress还有什么可以建站,昌图门户网站,做网站思想SPSS学习记录day6 写在前面#xff1a;前段时间学习SPSS的时候写了几篇文章#xff0c;没想到仅仅一两个星期就快涨到了一百粉#xff0c;还真让我有些受宠若惊#xff0c;继续坚持学习~~~~好#xff0c;废话不多说了#xff0c;今天我们讲解因子分析
分析降维因…SPSS学习记录day6 写在前面前段时间学习SPSS的时候写了几篇文章没想到仅仅一两个星期就快涨到了一百粉还真让我有些受宠若惊继续坚持学习~~~~好废话不多说了今天我们讲解因子分析
分析降维因子分析
首先关于因子分析factor analysis根据名称我们就可以直观推测这一操作是关于分析数据的内在因素的。因子你可以理解为公因子的感觉所以因子分析含义差不多是分析多个变量中是哪一些变量有着共同的因素或特征。 …这个因子分析可能确实有点点不好理解我搜查了一些相关的解释比如
因素分析是一种统计方法针对称为因素的潜在未观察变量的数量来描述观察到的相关变量之间的变异性。 例如六个观测变量的变化可能主要反映了两个未观测基础变量的变化。因素分析针对未观察到的潜在变量寻找此类共同变化从而将观察到的变量建模使之成为潜在因素以及误差项的线性组合。——维基百科因子分析是指研究从变量群中提取共性因子的统计技术。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子可减少变量的数目还可检验变量间关系的假设。——百度百科
但…果然还是不如举个例子来得跟简单这里是我觉得讲的最通俗简单易懂的一个【例子】我来稍微转换一下
现在我们要探究有学生成绩的好坏与哪些因素有关于是我们调查统计了一群学生的自觉性、平均自习时间、课外上课时间、课外辅导频率、课外作业量、平均游戏时间等等当我们通过一通分析之后得到了以上每一个因素与学生成绩的相关性关系但是当我们写结论却发现我们无法得出一个简洁的结论因为要描述的内容太多了足足有六个与学生成绩有关的因素要说明这时我们发现学生自觉性、平均自习时间、平均游戏时间似乎可以归纳为学生的内在动力而课外上课时间、课外辅导频率、课外作业量似乎可以归纳为学生的外在压力。这样我们的结论就变成了学生成绩主要与内在动力有关或是与外在压力有关。这样的结论简单明了也更有价值~~
上述案例中寻找多个变量之间可能具有的共同含义的过程就是因子分析这就好比在寻找多个变量之间的公因子通过因子分析我们可以得出个数更少且更具代表意义的因子这里将众多变量聚合为少数几个的公共因子的过程我们也称为降维降低了数据维度
1. 因子分析具体操作方法
点击分析(A)然后点击降维(D)再选择因子(F),打开因子分析窗口 在因子分析的窗口中我们将所有要进行分析的变量全部选入**变量(v)框内下面的选择变量©是用来筛选符合其他变量要求的案例例如之前的例子中我们可以将性别变量选入这个框并定义值(L)**为代表男生的数值这样我们就只分析所有男生的学习成绩的相关因素等关系点击确定SPSS就会自动进行因子分析了
在我们对因子分析的结果进行讲解前我再详细补充一下因子分析的一些其他可选择的设置操作如果只是想了解基础操作的话可以直接跳过去看结果分析
描述(D)这里主要是选择对原数据的一些基础统计分析。 如果选择了统计-单变量描述就会得到各个变量的平均值、标准偏差、分析个案数的表格选择统计-初始解就会得到各个变量的初始公因子方差下方的相关性矩阵主要计算各个变量之间的相关性效果和双变量相关性的相关分析差不多SPSS中有关相关性分析的介绍双变量相关分析、偏相关可以选择得到系数矩阵、显著性水平矩阵、决定因子矩阵等等这里我们主要选择KMO和巴特利特求信度检验具体含义下文讲解 提取(E)这里主要选择提取变量公因子的操作方法我们一般保持默认选项就好。提取决定如何选择公因子后续会介绍其意思 旋转(T) 当求得公共因子后对公因子要给出具有实际意义的合理解释。 如果公共因子难以和实际问题相对应可对公因子进行旋转使得旋转后的公因子具有实际意义。简单说这一操作可以帮助我们了解并赋予公因子的实际含义。 得分(s)、选项(o)主要用来保存结果变量、对缺失值的处理以及系数的显示格式不重要
2. 结果分析
上述我们选择了多个变量进行因子分析接下来一一介绍各个结果表格的含义
首先就是之前选择的KMO和巴特利特检验我们主要看第一行与最后一行结果数据 KMO检验变量间的偏相关性是否较大即变量是否适合归纳为几个公因子如果KMO值大于0.7则代表数据因子分析的效果较好适合进行因子分析若小于0.5则表明数据并不适合进行因子分析本例中0.7380.7表明数据十分适合因子分析故继续 巴特利特球形度检验的是各变量是否是独立的若变量之间均独立则表明各变量之间没有关系不适合因子分析本例中显著性为0.000小于0.05故拒绝各变量独立的原假设适合做因子分析 公因子方差表表明原有的每个变量有多大程度可以被提取的公因子解释 总方差解释体现被提取出来的各公因子对原数据的解释程度我们一般选择初始特征值大于1的公因子也可以在提取窗口选择只提取固定数目的因子通过右侧两列我们可以得知前七个公因子可以解释68.246%的原数据累积% 成分矩阵反映各因子对各变量的影响度例如由表可得 成绩不够理想0.139*F10.241*F2-0.405*F3-0.321*F40.466*F50.080*F60.022*F7特殊因子不准确仅供理解使用 旋转后的成分矩阵 类比成分矩阵。通过改变坐标轴位置重新分配各个因子所解释的方差比例使其数值载荷系数更接近1或0能更好地解释和命名变量。
3. 得出结论
在对结果进行详细的讲解之后大家可能还不知道如何得出我们的结论。对于结果中的旋转后的成分矩阵我们选择保留每一个成分每一列中较大的几个数值载荷系数这样我们就可以直观感受到每一个公因子主要代表了哪一些变量如图为筛选并重新排列后的矩阵这样就可以将16个变量用7个变量表示然后根据表格就可以很方便的得出结论了 Tips:筛选方法可以通过选项来设置如图我保留了表格中所有大于0.45的数值并按大小排序得到上图结果 以上就是因子分析的主要内容了若有错误欢迎指正~ 参考1.因子分析有啥用怎么使用SPSS做因子分析、2.如何通俗地解释因子分析、3.【探索性因素分析】因素分析的结果解读、4.因子分析系列文章、5.因子分析在SPSS中的操作过程及结果解读、6.SPSS做因子分析操作步骤、7.因子分析法之因子旋转 以上几篇都是非常好的因子分析的相关文章如果想要继续深入了解的话十分值得阅读学习