当前位置: 首页 > news >正文

网站建设方案总结语wordpress 3.9.1下载

网站建设方案总结语,wordpress 3.9.1下载,wordpress修改图片地址,中国响应式网站有哪些20210419 https://www.zhihu.com/question/24801731/answer/251576717 置信区间和置信水平 当P不大于0.05,也就是不拒绝原假设的时候 置信区间是可以看 有用的 也就是 系数值有95%的信心在当前的 置信区间 当拒绝原假设的时候 置信区间就没意义了#xff1f; “置信区间”的…20210419 https://www.zhihu.com/question/24801731/answer/251576717 置信区间和置信水平 当P不大于0.05,也就是不拒绝原假设的时候 置信区间是可以看 有用的 也就是 系数值有95%的信心在当前的 置信区间 当拒绝原假设的时候 置信区间就没意义了 “置信区间”的英文是confidence interval也译为“可信区间”、“信赖区间”或“信心区间”。“confidence interval”这个术语跟“logit”类似没有既精确又易懂的译法translation我努力提供一个平易的“解释”interpretation。 先咬文嚼字。confidence interval由两个词组成主词是“interval”区间“confidence”置信是对“interval”的“界定”名词扮演形容词。“置信”这个译法比较“雅”但把问题复杂化了因为“置信”的通常联想是“难以置信”有否定意味老老实实译为“信心”较好。我追求简单明白但也愿意附庸风雅下文既用“信心区间”也用“置信区间”。这样做不是为了制造混乱而是提醒各位两个词同义可以交换使用。 “区间”指的是处在两个端点之间的范围。例如课间休息的十分钟就是两节课之间的区间两个端点分别是上节课结束和下节课开始。“信心区间”的区间是个由“下限”lower bound即较小的数和“上限”upper bound即较大的数界定的数值区间其中的每个值都是对于总体参数的一个估计。 做显著度检验时“信心”指的是我们放弃零假设时的信心度比如90%95%99%。这个信心度就是100减去p值p值是犯一类错误的风险。零假设指的是“总体参数是0”设立零假设的目的是为了放弃它。在这个语境下“信心”的对象是“犯一类错误”有95%的信心意思是“犯一类错误的风险是5%”。 “信心区间”的信心意思比较绕。在这个语境下“信心”的对象不是“这个区间”不是“这个区间中的任何一个数”也不是“这个区间的中间数”而是“得到这个区间的程序”即抽样程序。 说“我们有95%的信心认为眼前这个样本统计值可以是平均值、回归系数或净回归系数的置信区间包含总体参数”意思是如果我们采用同一个抽样程序从一个总体中抽到样本量相同的无数个样本每个样本中得到一个样本统计值每个样本统计值有一个置信区间假设这无数个置信区间是百分之百那么其中95%包括总体参数我们有95%的信心认为眼前这个置信区间包括总体参数也就是说我们有95%的信心认为眼前这个置信区间包括总体参数是那95%中的一个。 若有兴趣“更彻底地”理解“置信区间”请接着看。我的解释很长很繁琐但没有任何深奥的地方。 显著度检验是探索性研究是研究的第一步。 计算“置信区间”是应用性研究是做完显著度检验之后的跟进分析。 显著度检验告诉我们能在什么信心度上放弃零假设。零假设的内容是总体参数例如平均值、回归系数、净回归系数等于0或者与0没有值得关注的显著的差异。显著度检验中的“p值”是以正话反说的方式表示信心度。例如p0.05意思是信心度为95%亦即“放弃了零假设但只冒了5%的犯一类错误的风险”。 详细点说显著度检验的目的是判断一个观察到的“非零的”样本统计值是否“显著地”不同于0。检验的起点是假定零假设为真也就是假定总体参数为0然后预测如果零假设真那么有多大的概率观察到这个已经观察到的样本统计值亦即有多大的概率抽到我们已经抽到的这个样本。如果预测出的概率很小比如只有5%就脑筋急转弯反问一句我们不是已经抽到这个样本了吗抽到了意味着被预测发生概率只有5%的事件发生了这说明预测不准确进而说明预测所依据的零假设可能是假的。 显著度检验有两个可能的结果。 第一不能在选定的信心度上放弃零假设。 第二能在选定的信心度上放弃零假设。 第一种结果的后续有两个可能。一是中止研究二是直接或间接降低追求的信心度。直接方式是仍然做双边检验但选择较低的信心度例如把原定的99%降为95%。间接方式是把双边检验变成单边检验。例如在95%信心度上做双边检验结果显示犯一类错误的风险是10%超过了预期不能在95%信心度上放弃零假设。如果在相同信心度上做单边检验结果显示犯一类错误的风险是5%符合预期可以在95%信心度上放弃零假设。 在一定信心度上放弃零假设只是在该信心度上认定总体参数不是0或者显著地不同于0不意味着可以在该信心度上认为样本统计值就是总体参数。“显著的”样本统计值仍然只是样本统计值是对总体参数的一个估计术语是点估计point estimate不等于总体参数。我们写文章时经常有意无意地忽视这一点隐含地假设“显著的样本统计值就是总体参数”。写文章时这样想无伤大雅。但是如果想把研究成果应用到实践中不能这样想。这个时候需要计算“置信区间”。换言之显著度检验只告诉我们可以有多大的信心认为“总体参数不是0”是个否定答案置信区间告诉我们可以有多大的信心认为“总体参数大约是什么”是个肯定答案。否定也好肯定也好都是以“信心度”为标志的概率答案不是以“必然”、“绝对”为标志的确定答案。 总而言之计算“置信区间”是“显著度检验”的后续分析。“显著度检验”告诉了我们总体参数不是0我们还想知道总体参数大约是什么于是计算“置信区间”。只有当一个样本统计值“显著”不同于0时我们才会进而计算它作为总体参数之估计的“置信区间”。如果一个样本统计值等于0或者统计上不显著地不同于0我们就没有必要计算它作为总体参数之估计的“置信区间”。 例如我们分析雇员数据研究“少数族裔”对年薪的净影响控制教育程度与工作岗位。我们的研究目的首先是解决一个疑难在全体雇员中在教育程度相同而且工作岗位也相同的情况下相对于白人而言少数族裔的年薪有“显著”的区别吗温馨提示工作岗位实际上是定类变项我把它视为定序变项因为这个“歪曲的”分析结果最适合下面的讨论。 多元线性回归的结果如下 “是否少数族裔”的未标准化的净回归系数是“-1875.642”。意思是在教育程度相同而且工作岗位也相同的情况下相对于白人而言少数族裔的年薪少1875.642美元。 先做双边检验即研究预设认为“是否少数族裔”对于年薪有影响但不预设有正面影响还是有负面影响。犯一类错误的实际风险是7.5%。我们只能在92.5%的信心度上放弃零假设。也就是说我们愿意承担7.5%的犯一类错误的风险。由于我们通常只用90%95%99%作为信心度我们说我们在90%的信心度上放弃零假设。也就是说我们愿意承担10%的犯一类错误的风险。 如果我们希望达到95%的信心度也就是说我们只愿意承担5%的犯一类错误的风险那么我们需要修改研究假设。不是简单地假设“是否少数族裔”对于年薪有影响也就是假设影响可正可负而是假设有“负面影响”。这样净回归系数是负数双边检验犯一类错误的风险是7.5%单边检验犯一类的风险是双边检验的一半即3.75%。我们愿意承担5%的犯一类错误的风险实际风险是3.75%低于我们愿意冒的风险所以我们决定冒这个险放弃零假设。我们放弃零假设就是坚持研究假设就是认为“是否少数族裔”对于年薪有“显著的”非零的、非随机的负影响。 如果我们仅仅做探索性理论研究我们可以用三个净回归系数构建一个回归模型用来预测每个员工的年薪。回归模型如下 年薪-11575.393±1875.642少数族裔地位13120.868工作岗位2067.055*教育程度 我们这样做的时候很容易忽略一点即这里的截距与三个净回归系数都是样本统计值是对总体参数的可信估计但不等于总体参数。不等于意思是“可能是但不一定是”。 如果我们做应用研究就不能像上述那样隐含地假定显著的样本统计值就是总体参数。我们需要计算样本统计值作为“总体参数之估计”的“置信区间”。换言之计算“置信区间”的意义在于提醒我们“显著的”样本统计值仍然只是样本统计值是对总体参数的估计但不一定是总体参数。 我们只考虑少数族裔地位对于年薪的净回归系数的“置信区间”即“-1875.642”这个样本统计值作为对于总体参数的估计的可信度。总体参数就是雇员总体中教育程度相同并且工作岗位也相同的员工中少数族裔地位对于年薪的净影响。 计算“置信区间”时默认的信任度是“双边”显著度检验的信任度不是“单边”。前面看到了我们只能在90%的信心度上放弃零假设。所以我们只能在90%的信心度上计算“-1875.642”的“置信区间”。 SPSS计算线性回归系数的置信区间时默认信心度是95%但我们可以修改它让它计算信心度为90%时的置信区间结果如下。 在表格最右侧我们看到信心度是90%。在这个信心程度上估算出“置信区间”是下限是-3607.609上限是-143.676。温馨提示回归系数是负的我们分析自变项对因变项的影响幅度effect size时要看回归系数的绝对值这里的“下限”与“上限”理论上的与影响幅度意义上的“下限”与“上限”相反。 说“置信区间”下限是-3607.609上限是-143.676意思是下自-3607.609上至-143.676的所有数值都是对于总体参数的估计其中包括-1875.642这些估计构成一个“区间”。 我们有百分之九十的信心认为-3607.609至-143.676这个区间包括总体参数。 问题是虽然“我们有百分之九十的信心认为-3607.609至-143.676这个区间包括总体参数”是个正确的说法但这句话究竟是什么意思呢专家提供的“解释”照例很深奥而且还分两派辩论不休。作为用户我尊重专家的分歧旁观他们的争论。在他们分出胜负之前我的“用户解释”包括如下六个成分。 第一总体参数不是0我们这样说犯一类错误的风险是10%。 第二我们抽取雇员数据时采用了一个抽样程序设定了样本量即474。现在我们设想用相同的程序反复从雇员总体中抽取相同样本量即474人样本。每抽取一个样本就计算净回归系数并在90%的信心度上计算净回归系数的“置信区间”。抽取无数个样本算出无数个净回归系数算出无数个“置信区间”。为了简化我们把“无数”变成“有数”即把“无限”变成“有限的”“一万个”。温馨提示我们必须简化否则总数是“无数个”讨论百分比没有意义这是用非数学语言理解“抽样分布”必然遇到的困难。 说我们对眼前这个“区间”有90%的信心度意思就是根据那个明确的抽样程序抽一万个样本计算出一万个“净回归系数”计算出一万个“置信区间”这一万个“区间”的90%包括总体参数。我们眼前这个样本是根据那个抽样程序抽出来的我们有90%的信心认为这个样本中观察到的“置信区间”包括总体参数。也就是说我们有90%的信心认为已经抽取到的这个样本中观察到的“置信区间”属于那包含总体参数的90%。温馨提示专家的意见是我们只能说我们有很强的信心认为已经抽取到的这个样本中观察到的“置信区间”属于那包含总体参数的90%不属于那包含总体参数的10%我们不能肯定眼前这个置信区间究竟是否包含总体参数。 作为用户具体到雇员数据的例子我们可以这样说我们有90%的信心认为在教育程度与工作岗位相同的情况下-3607.609至-143.676这个区间包括了是否少数族裔是否以及如何影响雇员年薪的真相。 以下是常见的误解“已抽取到的这个样本中观察到的置信区间包含总体参数的概率是90%”“我们有90%的信心认为这个区间内的某个估计是总体参数”“我们有90%的信心认为这个区间的中间点即样本统计值是总体参数”。 据说有些专家也误解“置信区间”所以这些误解想必无伤大雅。 计算了“置信区间”我们还是不知道总体参数究竟是什么因为我们不可能知道。但是“置信区间”有应用价值。我们可以根据“区间”两个“端点”做大略的估算。以雇员数据为例我们“应用”置信区间得出的研究结论是我们有90%的信心认为在教育程度相同而且工作岗位也相同的情况下相对于白人而言少数族裔的年薪“显著地”较低差别幅度在1875.642至143.676美元。究竟低多少我们无法给出把握十足的回答但总比说“低的幅度不是0”准确多了。 下面两点虽然不那么关键但容易让人好奇但也容易令人迷惑。 第一这个例子里的“下限”与“上限”是怎样计算出来的 专家提供的计算方法很复杂。我提供一个简单的解释还是做思想实验。假设有个员工总体总体中的净回归系数恰好是-1875.642。但是因为抽样误差我们可能抽到净回归系数不是-1875.642的样本。例如我们可以抽到净回归系数是-1000的样本也可能抽到净回归系数是-2000的样本还可能能抽到净回归系数为0的样本甚至可能抽到净回归系数为正数的样本。假设我们抽一万个样本计算出一万个净回归系数。计算以后我们采用《戏说统计》第三章详细介绍的方法把这些净回归系数分别装进玻璃管里我们会看到它们的分布呈正态分布。然后我们看这些净回归系数的分布情况毫不奇怪我们发现频次最高的净回归系数是-1875.642因为-1875.642是一万个净回归系数的平均值净回归系数正态分布的标准差标准误是表中的1050.886std. error。根据正态分布的定义我们知道正态分布下90%的案例出现在平均值±1.645之间。在这里因为样本量只有474计算正态分布下90%的信心区间不是平均值±1.645而是平均值±1.648。于是我们看到在一万个净回归系数样本统计值中90%处于一个区间内区间的下限是 -1875.642 -1.648 * 1050.886 -3607.659上限是 -1875.642 -1.648 * 1050.886 -143.676。于是我们得到一个下限为-3607.659中间点-1875.642上限为-143.676的区间这个区间中的每个数值都是对总体参数的一个估计。这个区间不包括0也不包括正数。 温馨提示作为对总体参数的估计样本统计值一定不是0要么是负数要么是正数。如果样本统计值是负数那么因为它是对总体参数的估计总体参数必定是负数。因此对总体参数的估计的“置信区间”既不能出现0也不能出现正数否则它就不是个“可信的”区间。换言之如果被视为总体参数之估计的样本统计值是负数那么它的“置信区间”内出现的总体参数之估计必须都是负数。同理样本统计值是正数那么作为对总体参数的估计它的“置信区间”内既不能出现0也不能出现负数否则这个区间就不“可信”。换言之如果被设定为总体参数之估计的样本统计值是正数那么它的“置信区间”内出现的总体参数估计必须都是正数。总而言之不论被设定为总体参数之估计的样本统计值是正数还是负数它“置信区间”内都不能出现0。 第二“信心”的高度与“区间”的宽度是什么关系 简单的答案二者成反比信心度越高区间越宽信心度越低区间越窄。社会科学研究中常见的信心度有三个90%95%99%。 比较两个不同的信心度下计算出来的“置信区间”就可以直观地理解“信心”的高度与“区间”的宽度之间的关系。 先看少数族裔地位与年薪的净回归系数在信心度为90%时的置信区间。 区间的下限是-3607.659中间点是-1874.642上限是-143.676不包括0也不包括正数。 再看同一个样本统计值在信心度为95%时的置信区间。 区间的下限是-3940.658中间点是-1874.642上限是189点373包括0也包括正数。信心度高了区间宽度大了。可惜根据定义样本统计值是负数是对总体参数的一个可信估计单边检验下犯一类错误的概率是3.75%所以包括0和正数的总体参数之估计的“区间”不是个“可信的”区间。 95%信心度上的置信区间的上限与下限的计算如下。在上述思想实验中总体参数是-1875.642那么-1875.642必定是一万个净回归系数的平均值净回归系数正态分布的标准差是表中的1050.886std. error。根据正态分布的定义我们知道正态分布下95%的案例出现在平均值±1.96之间。在这里因为样本量只有474正态分布下95%的案例出现在平均值±1.965之间。这意味着在一万个净回归系数中95%处于一个区间内区间的下限是-3940.658上限是189。这个区间从负数到正数包括0包括正数不是一个可信的总体参数之估计的区间。 为了理解“信心”的高度与“置信区间”的宽度成反比我们还可以设计一个“撒网捕鱼”思想实验。这个思想实验的步数比较多但每一步都简单。 1我们把总体参数比作一条“真鱼”进而假定“真鱼”分黑白二色有重量。真鱼可能是无色无重的“空鱼”即“总体参数是0或不显著地有别于0”。“真鱼”可能是条“白鱼”即“总体参数显著地有别于0”并且是负数。“真鱼”也可能是条“黑鱼”即“总体参数显著地有别于0”并且是正数。“真鱼”的重量是“总体参数的绝对值”。 2我们按照精心设计的方法从总体中抽样然后分析样本得到一个样本统计值相当于遵照一个精心设计的程序、使用一根精心设计的鱼竿在随机选定的地方下竿钓到了一条鱼。出于对钓鱼程序的信心我们假定钓到的这条白鱼是“真鱼”的“忠实样品”或“忠实代表”。 3我们得到的样本统计值要么是正数要么是负数其绝对值可能极小但一般来说不会等于0。也就是说我们钓到的一般不是“空鱼”而是一条“鱼”要么是“白鱼”要么是“黑鱼”。检验一个样本统计值的显著度就是判断这条“白鱼”或“黑鱼”是否“显著地”有别于我们可以想象但看不见摸不着的“空鱼”。也就是说判断它的绝对值是否小得可以忽略不计。 4做双边显著度检验零假设是“总体参数不是空鱼”。做单边显著度检验零假设有两种可能。其一研究假设预设总体参数是负数则零假设是“总体参数不是空鱼也不是黑鱼”。其二研究假设预设总体参数是正数则零假设是“总体参数不是空鱼也不是白鱼”。 5显著度检验显示样本统计值是负数并且显著地有别于0标志着总体参数既不是“空鱼”也不是“黑鱼”很可能是条“白鱼”。相反如果显著度检验显示样本统计值是正数并且显著地有别于0那就标志着总体参数既不是“空鱼”也不是“白鱼”很可能是条“黑鱼”。 6不管钓到的是“白鱼”还是“黑鱼”都只是“真鱼”的一个样品、样本或代表。我们对“钓鱼程序”的科学性有多大的信心我们就可以在该信心度上认为钓到的鱼是“真鱼”的“忠实样品”或“忠实代表”。 7我们在一定信心度上认定钓到的这条鱼是“真鱼”的“代表”首先是肯定“真鱼”颜色与“代表”相同。但是我们还想根据“代表”估计“真鱼”的重量。真鱼的重量有两种可能。其一这条“鱼代表”就是“真鱼”它的重量就是“真鱼”的重量这个样本统计值就是总体参数。其二这条鱼不是“真鱼”而是真鱼若干“代表”中的一个“真鱼”的重量不等于它的重量要么比它重要么比它轻重或轻的程度可能很大。 8我们只有一个样本相当于手里只有一条“鱼代表”别无选择只能根据这个代表估计“真鱼”的重量。于是我们以手里这条“鱼”视为“真鱼”的忠实代表以它的重量为基准线假定它是正态分布中的平均值看一看在它两侧按正态方式分布的“鱼代表”的“重量”最大是多少最小是多少。从最小到最大的重量构成一个“重量区间”。温馨提示从事实角度看这个“重量区间”要么包括“真鱼”的重量要么不包括这里不存在概率问题。 9事实上我们是抽了一个概率样本在一个信心度上计算了一个置信区间。理论上我们可以抽很多样本相当于下很多竿钓鱼。理论上总体是无限的可以无限次抽样。实际上抽样次数是有限的。假定我们以钓到鱼的地方为中间点左右两侧分别划定50个下杆点也就是说原来的下竿点标记为0往0的左侧每隔10厘米设一个下竿点一共设50个标记为-1到-50往0的右侧每隔10厘米设一个下竿点一共设50个标记为1到50。这样最多能下一百竿。假定我们左右开弓先左后右实际下了九十竿每次钓到的都是一条白鱼只是重量不一。以最轻的哪条白鱼的重量为下限以钓到的那条白鱼的重量为中点以最重的哪条白鱼的重量为上限我们就得到了一个“重量区间”也就是“真鱼重量”的“置信区间”。我们有90%的信心认为“真鱼”的重量在这个置信区间。同理我们左右开弓实际下了九十五竿每次钓到的都是白鱼。以最轻的哪条白鱼的重量为下限以钓到的那条白鱼的重量为中点以最重的哪条白鱼的重量为上限我们就得到了一个“重量区间”也就是“真鱼重量”的“置信区间”我们有95%的信心认为“真鱼”的重量在这个置信区间。当然这里有个隐含假定就是最轻的白鱼的重量也“统计上显著地不等于0”。 10为了省时省力我们不下竿用鱼网。我们以“鱼代表”为圆心撒网。网的半径由三个要素决定一是样本统计值的标准差参见《戏说统计》第三章关于2.0 版正态分布的讨论二是我们放弃零假设的信心度三是样本量。根据正态分布的定义我们知道正态分布下90%的案例出现在平均值±1.645个标准差之间95%的案例出现在平均值±1.96个标准差之间99%的案例出现在平均值±2.58个标准差之间。给定信心度样本量与渔网半径成反比样本量越大渔网半径越小样本量越小渔网半径越大。这背后的逻辑是渔网半径是样本统计值1.645个标准差捞到的都是“白鱼”没有“空鱼”与“黑鱼”我们有信心认为“真鱼”是白的并且其重量在得到的“区间”内但我们的信心度只是90%渔网半径是样本统计值1.96个标准差捞到的都是“白鱼”没有“空鱼”与“黑鱼”我们有信心认为“真鱼”是白的并且其重量在得到的“区间”内我们的信心度是95%渔网半径是样本统计值2.58个标准差捞到的都是“白鱼”没有“空鱼”与“黑鱼”我们有信心认为“真鱼”是白的并且其重量在得到的“区间”内我们的信心度是99%。 11我们以白色的“鱼代表”为中心撒网但不是希望捞到“空鱼”和“黑鱼”。相反我们最担心捞到“空鱼”和“黑鱼”。如果我们在一个信心度上放弃了零假设那么我们肯定是在相同的信心度上计算置信区间。例如我们在90%的信心度上放弃了零假设也就是90%的信心度上断定不会捞到“空鱼”和“黑鱼”。我们扩大的网的半径目的是找到更强的证据反证“真鱼”为“空鱼”和“黑鱼”的概率小到我们可以有信心地忽略不计的程度。我们永远做不到信心十足但我们总是希望信心高一些。我们希望达到的信心度越高就越需要撒更大网。网越大捞到的“白鱼”越多捞到“真鱼”的概率越大但捞到“空鱼”与“黑鱼”的概率也随之增加。温馨提示捞到了“非鱼”或“黑鱼”并不断然证明“真鱼”不是白鱼。在概率世界上一切都可能无物是必然。 “置信区间”的理论意义是提醒我们不要简单地把样本统计值等同总体参数。我在《戏说统计》中解释过统计分析是“由此及彼”“此”是“样本”“彼”是“总体”“由此及彼”是根据“样本统计值”估计“总体参数”。统计分析这个“由此及彼”的过程是“惊险的一跃”原因是总体参数不仅是“未知的”而且是“不可知的”。统计分析的背后是概率思维概率思维的特点是不确定表现在语言上概率思维的特点是用“否定”简介表示“肯定”。例如我们用“放弃零假设”间接表示“接受研究假设”。需要留心的是日常的思维方式的特点是确定性非此即彼非黑即白所以在日常语言中“放弃A”等于“接受非A”“并非有罪”等于“无辜”但这种思维方式预设的是百分之百认识世界预设掌握绝对真理。要判断是否还持这种非黑即白的方式最简单明了的方法就是问问自己如果犯一类错误的风险是5%那么犯二类错误的风险是多少如果答95%就证明仍然没有建立概率思维方式如果说很大但说不清背后的逻辑就证明表面上建立的概率思维方式但仍然停留在语言上没有真正融入思维。 掌握研究方法固然要学很多技术但最重要的是培养方法意识。方法意识有三个要点。首先是意识到做事有门道、有窍门、有捷径、可以事半功倍。这是正面看负面看就是意识到有些做事方法是歧路、是傻功夫、是舍近求远、可能事倍功半。其次是意识到每个人有自己独特的方法没有普遍适用的方法。最后一点最重要就是为了找到最适合自己的方法要自觉地把自己一分为二一个自己做事另一个自己观察并分析如何可以做得更有效、更好同时比较自己的作法与他人的作法评估不同作法的效果。聂卫平棋圣小时学棋师父过惕生先生教导他棋是两个人下。树立“棋是两个人下”就是树立了“围棋意识”不树立这个意识不可能成为围棋高手。 理解抽象概念最有效的方式是“用实例思考”think with examples。例如要理解“信心”的高度与“置信区间”的宽度为什么成反比最直观的方法就是用同一个样本在不同的信心度上计算几个“置信区间”然后比较这几个“置信区间”的异同。 同理要理解为什么“信心”的对象是抽样程序而不是根据眼前这个样本计算的这个“置信区间”最直观的方法是走下列四步。 1我们用样本量为3909人的“中国调查”数据假定这个样本是个总体分析年龄与对中央政府官员的信任度之间的关系。结果显示年龄越大对中央的信任度越高。我们计算出的回归系数“0.008”我们假定它是总体参数因为是假定所以我们把它称为“准总体参数”。 2让SPSS从“中国调查”的数据中随机抽样每次抽样的样本量相同比如600人。抽一个600人的样本分析样本中年龄与对中央政府官员的信任度之间的关系。结果显示回归系数是“0.007”我们在95%信心度实际上信心度是99%上放弃零假设。我们想知道“真正的回归系数”大致是什么范围于是计算95%信心度的“置信区间”结果显示置信区间是“0.003-0.012”。这个区间包括0.008即“准总体参数”不包括0也不包括负数是个“可信的”区间。 3再抽一个600人的随机样本重复上述分析。结果显示回归系数是“0.010”正数我们可以在95%信心度准确说我们可以在0.004%信心度上放弃零假设。我们想知道“真正的回归系数”大致是什么范围于是计算95%信心度的“置信区间”结果显示置信区间是“0.005-0.014”。这个区间也包括0.008即“准总体参数”不包括0也不包括负数是个“可信的”区间。 4比较第二和第三步计算的两个“置信区间”我们会看到根据两个600人样本计算的“置信区间”都包括“准总体参数”0.008但这两个“置信区间”的上限与下限不同中间点也不同。这两个“置信区间”之间的差异反映的是抽样误差。 “顿悟”时刻终于来临对“置信区间”的“信心”的对象不是某一个“置信区间”而是获得这个“置信区间”的抽样程序。我们对一个抽样程序有多大的信心我们对根据这个抽样程序抽到的样本有相同的信心从而也就对样本统计值的置信区间有相同的信心。 补充计算置信区间是做完显示度检验的后续研究意思是计算置信区间有个前提条件就是在某个足够的信心度上认为总体参数不是0。如果只有10%的信心认为总体参数不是0显然“不足够”计算样本统计值作为总体参数之估计的置信区间没有意义。SPSS计算置信区间的默认设置是信心度等于或大于50%并且小于100%。信心度不能小于50%意思是必须有起码的信心五五开认为总体参数不是0否则计算“置信区间”没有意义。信心度必须小于100%意思是不能追求有十足信心认为置信区间包括总体参数否则就是想计算一个“无限宽”的区间。 不论在“等于或大于50%但小于100%”之间的哪个信心度上估算某个样本统计值作为总体参数之估计的置信区间目的都是要把眼前已经获得的这个样本统计值作为总体参数之估计的置信区间“用作”“可信的区间”亦即当成一个“可信的区间”使用。所以对于某个抽样程序有某个信心度蕴含着一个意思有某个信心度认为从依照该抽样程序抽出的眼前这个样本中获取的样本统计值的置信区间是总体参数之估计的诸多个可信的“置信区间”中的一个。 要体会这一点不妨重复对雇员数据的分析。我们在90%的信心度上认为控制教育程度与工作岗位是否少数族裔对于年薪的影响不是0。我们在90%的信心度上计算置信区间结果是“区间的下限是-1875.642中间点是-1874.642上限是-143.676”。这个区间不包括0也不包括正数是总体参数之估计的诸多个“可信区间”中的一个可用。 但是这个“区间”的宽度没有达到“极限”。显著度检验显示我们可以在92.5%的信心度上认为总体参数不是0也就是说我们选择在92.5%的信心度上计算置信区间。 现在我们“物尽其用”在92.5%的信心度上计算置信区间结果是“区间的下限是-3750.866中间点是-1874.642上限是-0.419”。这个“区间”宽了很多不包括0与正数仍然是个“可信的区间”。但是它的“上限”离高压线“0”已经非常接近十分危险。 如果我们“揠苗助长”盲目追求高信心度立刻就会碰钉子。例如我们在93%的信心度上计算置信区间结果是“区间的下限是-3784.101中间点是-1874.642上限是32.816”。这个“区间”更宽了但是既包括0也包括正数“上限”碰上了高压线“0”不是个“可信的区间”不可用。 相反如果我们“大材小用”在50%的信心度上计算置信区间结果是“区间的下限是-2585.003中间点是-1874.642上限是-1166.882”。这个“区间”不包括0也不包括正数但窄了很多“信心度”从90%降到了50%漏掉“真鱼”的概率随之增大很多也不可用 给定一个样本计算“置信区间”时设定的“信心度”越高“区间”越宽设定的“信心度”越低“区间”越窄。我在前面把总体参数比作“真鱼”。我们也可以换个比方把总体参数比作“真鸟”。我们不是神枪手枪法有限要提高“命中”“真鸟”的“信心度”必须牺牲弹着点的“精准度”用散弹。散弹出膛后爆成很多钢珠形成的不是一个“弹着点”而是一个“弹着区”。弹着区越大击中“真鸟”的概率越大。我们想打的“真鸟”非黑即白也就是总体参数非负即正。样本统计值是负数是“白鸟”它所“代表”的总体参数一定也是“白鸟”。如果我们想打“真白鸟”负数结果打中了“非鸟”0或“黑鸟”正数就输了错过了目标。 自然科学家是神枪手做实验“指哪儿打哪儿”精确度高信心度也高。哲学家是另一类神枪手“打哪儿指哪儿”精确度高信心度也高。可怜的社会科学家既没有自然科学家的实验条件也没有哲学家信口雌黄的特权只能做统计分析是普通射手做不到“指哪儿打哪儿”精准算出总体参数又不肯“打哪儿指哪儿”盲目乐观地认为样本统计值就是总体参数只能在“精确度”与“可信度”之间求“可以接受的妥协”求较高的“精确度”要牺牲一定的可信度求较高的“可信度”就要牺牲一定的精确度 。
http://www.dnsts.com.cn/news/179525.html

相关文章:

  • 小型营销企业网站建设策划网站建设存在风险
  • 手机访问跳转手机网站wordpress删除修订版
  • 建筑设计师专业网站山东网站建设推广
  • 广东网站建设微信商城运营wordpress解压
  • 手机网站域名m.那里网站建设好
  • 饮料网站建设规划书广州公司建设网站
  • 沧州网站优化公司asp网站怎么做
  • 大连开发区网站网站建设的设计思路
  • 网站建设公司网站模板下载飞卢盗版做的最好的网站
  • 建设用地规划公示在哪个网站查深圳知名网站建设平台
  • 怎么在网站上做404页面网片的重量计算公式
  • 如何做自己的网站百度推广wordpress安装微信聊天工具
  • 安全员怎么网站中做备案南宁seo排名外包
  • 做网站销售的技巧wordpress 热门标签
  • 怎么让网站无法自适应丢了么网站
  • 网站开发公司 logo网站建设郑州公司
  • 购物网站开发的业务需求分析营销方式都有哪些
  • 怎么不花钱建网站登陆不了建设银行网站
  • 手机端网站建设哪家好wordpress可以做网页吗
  • php 用什么做网站服务器中文在线中文资源
  • 张家界做网站dcwork沧州百度seo
  • 怎么在网站上做充话费业务合肥网站开发外包
  • 推广seo网站的公司域名备案和网站备案是一回事吗
  • 营销型网站和普通网站萝卜建站下载
  • 文昌网站建设手机在线app下载
  • python网站开发入门公司网站
  • 建设网站查询专业建设网站公司哪家好
  • 顺德做pc端网站国际国内时事新闻
  • 广州网站建设哪里有直播电商平台有哪些
  • 在线设计网站海报浏览器主页网址推荐