厦门双模网站,学做软件的网站有哪些内容,中国设计网官网首页,电子商务网站技术一、背景 以雨量数据为例#xff0c;当获得一个站点一年的日雨量数据后#xff0c;我们需要估计该站点的雨量的概率分布情况#xff0c;因此我们利用有参估计的方式如极大似然法估计得到了假定该随机变量服从某一分布的参数#xff0c;从而得到该站点的概率密度函数#x…一、背景 以雨量数据为例当获得一个站点一年的日雨量数据后我们需要估计该站点的雨量的概率分布情况因此我们利用有参估计的方式如极大似然法估计得到了假定该随机变量服从某一分布的参数从而得到该站点的概率密度函数连续型随机变量。但是我们并不知道这样的拟合是否准确因此需要进行检验我们称这个过程为假设检验
二、原理 假设检验的一般步骤1建立假设2寻找检验统计量3确定显著性水平或决定域4做出判断 在第一步中我们称做出的假设为原假设或零假设 H0 而对立的假设称为备择假设 H1。在做出了假设之后需要选择合适的检验统计量但无论是什么检验统计量其目的是为了衡量样本与假设的理论样本之间的偏差因此这个偏差越小则证明我们的假设越准确根据检验统计量的不同我们可以得到不同的假设检验方法如 t 检验主要用于检验样本均值与假设均值是否存在显著误差卡方检验用于离散型随机变量检验分类的频数差异... 当确立定检验统计量后进行计算得到样本与理论之间的检验统计量结果我们观察这个结果如果这个结果比较大我们就认为原假设不可靠拒接原假设如果这个结果比较小我们就接受这个假设。但是有一个问题不同的检验统计量有不同的形式和临界值表这在对比过程中无法进行统一所以我们引入了 p 值和显著性水平的概念个人理解... p 值为定义为假设检验中中假设原假设为真时观测到的至少与实际观察样本相同的样本的概率。说人话就是在 p 值就是概率在零假设成立的情况下观察到当前数据或更极端数据的可能性。而观察到当前数据或更极端数据是基于检验统计量的由于不同的检验方法都可以用 p 来判断人们在假设检验中预先设定的一个阈值用于决定是否拒绝零假设。决定拒绝零假设的标准显著性水平设定了一个标准帮助我们判断 p 值是否足够小从而决定是否拒绝零假设如果 p值 ≤ α我们拒绝零假设认为结果是显著的如果 p值 α我们不能拒绝零假设认为结果不显著。 这里蕴含的逻辑是p 表示的是在假设原假设成立条件下观察到的数据的可能性表示当前观察的是已经发生了计算它的概率如果很小小于某一显著性水平表示这个已经发生的事发生概率很小但它却发生了因此我们要拒绝个人理解... 为什么 p 是基于检验统计量的在假设检验中我们通过对样本数据的计算得到一个检验统计量根据检验统计量的值我们计算对应的 p值即在零假设成立的条件下观察到当前统计量或比当前统计量更极端的结果的概率而 p 值概念中的观察到当前数据就是指观察到当前样本结果而更极端结果就是值比计算出来的检验统计量还糟糕的概率
三、举例 现在我有一个站点从1980-2012年的日雨量数据假设其服从正态分布利用极大似然法得到参数后通过 KS 检验其是否符合正态分布。KS 的检验统计量如下 计算得到的检验统计量为 Dn 0.181假设服从正态分布那么 p 值就是 P(DDn)就是当前情况以及更糟的概率。设显著性水平 0.05如果 p 0.05 概率太低了却发生了拒绝反之接受。