• 领导讲话
  • 自我介绍
  • 党会党课
  • 文秘知识
  • 转正申请
  • 问题清单
  • 动员大会
  • 年终总结
  • 工作总结
  • 思想汇报
  • 实践报告
  • 工作汇报
  • 心得体会
  • 研讨交流
  • 述职报告
  • 工作方案
  • 政府报告
  • 调研报告
  • 自查报告
  • 实验报告
  • 计划规划
  • 申报材料
  • 当前位置: 勤学考试网 > 公文文档 > 工作汇报 > 正文

    现代心理与教育统计学知识点

    时间:2021-04-04 21:12:37 来源:勤学考试网 本文已影响 勤学考试网手机站

    心理统计学 第一章概述 描述统计 定义:研究如何把心理与教育科学实验或调查得来的大量数据科学的科学的加以整理 概 括和表述 作用:使杂乱无章的数字更好的显示出事物的某些特征,有助于说明问题的实质。

    具体内容:1数据分组:采用图与表的形式。

    2计算数据的特征值:集中量数(平均数 中数) 离散量数(方差) 3计算量事物间的相关关系:积差相关(2列 3列 多列) 推断统计 定义:主要研究如何利用局部数据(样本数据)所提供的信息,依据数理统计提供的理 论和方法,推论总体情形。

    作用:用样本推论总体。

    具体内容:1如何对假设进行检验。

    2如何对总体参数特征值进行估计。

    3各种非参数的统计方法。

    心理与教育统计基础概念 数据类型 一 从数据来源来划分 1计数数据:计算个数或次数而获得的数据。(都是离散数据) 2测量数据:借助一定测量工具或测量标准而获得的数据。(连续数据) 二根据数据所反映的测量水平 1称名数据(分类) 定义:指用数字代表事物或数字对事物进行分类的数据。

    特点:数字只是事物的符号,而没有任何数量意义。

    统计方法:百分数 次数 众数 列联相关 卡方检验等。(非参检验) 2顺序数据(分类 排序) 定义:指代事物类别,能够表明不同食物的大小 等级或事物具有的某种特征的程度的数 据。(年级) 特点:没有相等单位没有绝对零点。不表示事物特征的真正数量。

    统计方法:中位数 百分位数 等级相关 肯德尔和谐系数以及常规的非参数检验方法。

    3等距数据(分类 排序 加减(相等单位))(真正应用最广泛的数据) 定义:不仅能够指代物体的类别 等级,而且具有相等的单位的数据。(成绩 温度) 特点:真正的数量,能进行加减运算,没有绝对零点 ,不能进行乘除计算。

    统计方法:平均数 标准差 积差相关 Z检验 t检验 F检验等。

    4比率数据(分类 排序 加减法 乘除法(绝对零点)) 定义:表明量的大小,也具有相等单位,同时具有绝对零点。(身高反应时) 特点:真正的数字,有绝对零点,可以进行加减乘除运算。

    在统计中处理的数据大多是顺序数据和等距数据。

    三 按照数据是否具有连续性 离散数据 连续数据 变量观测值随机变量 变量:指心理与教育实验观察调查种想要获得的数据。数据获得前用“x”表示,即为一 个可以取不同熟知的物体的属性或事件,其数值具有不确定性,因而称为变量。

    观测值:是研究中确定的某一变量的取值。

    随机变量:表示随机现象各种结果的变量称为随机变量 三 总体 样本 个体 总体 :具有某种共同特质的一类事物。(欲研究的研究范围) 样本 :构成总体的每个基本单元。

    个体:从总体重抽取的部分个体组成的群体。样本容量超过30为大样本反之为小样本。

    四 次数比率频率与概率 次数:某一事件在某一类别中的数目。

    比率:(比例 百分数)两个数相比。

    频率:(相对次数)某一事件发生的次数被总的事件数目出。常用比例 百分数表示。

    概率:用符号P表示,指某一事件在无限观测中所能预料的相对出现的次数。

    五统计量和参数 1参数:(总体参数)描述一个总体情况的统计指标用希腊字母表示。(小写)(大写 表示运算符) 总体平均数 总体标准差 总体相关系数 总体回归系数 2统计量:(特征值 样本统计量)描述一组数据的情况。

    样本统计量用英文表示 样本平均数 样本标准差 样本相关系数 样本回归系数 小结 描述统计 心理与教育统计学内容 推论统计 实验设计 计数数据 测量数据 数据类型 称名数据 顺序数据 等距数据 比率数据 离散数据 计数数据 变量 观测值 随机变量 心理与教育统计基础概念 总体 样本 个体 次数 频数 概率 参数 统计量 练习题 1等距量表的特点是() A 无绝对零点,无相同单位。

    B 无绝对零点,有相同单位。

    C 有绝对零点,无相同单位。

    D 有绝对零点,有相同单位。

    2下列量表中具有绝对零点的是() A 称名量表 B 顺序量表 C 等距量表 D 比率量表 3教师的职称和薪水这两个变量的数据类型分别属于() A 命名数据 等比数据 B 等距数据 等比数据 C 顺序数据 等距数据 D 顺序数据 等比数据 4下列数据类型属于比率数据的是() A 智商分数 B 反应时 C 年纪 D 数学成绩 练习题思路解析 1 B 见第一页 2 D 见第一页 3 D 职称:讲师 副教授 教授 这三个职称能排序,但不能做加减法。(顺序数据) 薪水:
    x y z 能排序能做加减法,也具有绝对零点(没工资)能做乘除法。

    (比率数据) 4 B 智商分数:加减法可做不能做乘除(智商测量表测量出来人为规定零)(等距数据) 反应时:有绝对零点(比率数据) 年级:只能大小排序(顺序数据) 数学成绩:人为规定零点(等距数据) 第二章统计图表(重要但不怎么考)(图表的特点) 第一节 数据的初步整理(将数据制成统计图表的第一步) 一 数据排序 排序就是按照某种标准,对收集到的杂乱无章的数据按照一定的顺序标准进行 排列。数据排序是正理数据最简单的方法。

    二 统计分组 统计分组只根据被研究对象的特征,将所得到的数据划分到各个分组中去。

    数据的取舍原则:三个标准差原则 三 统计表 统计表:用来表达统计指标与被说明的事物间关系的表格。

    特点:简洁 清晰 准确 表中数据易于比较分析。

    三线表 四 统计图 统计图:用来表达统计指标与被说明事物之间数量关系的图形,是统计数据资料的可 视化显示方式。

    第二节 次数分布表(最重要的一类统计表)(皮尔逊 次数分布表 次数分布图) 一 简单次数分布表(既可用于计数数据的整理,又可用于测量数据的整理) 简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统 计表。

    特点:对数据资料的来源没有过多要求,编制过程简单,应用广泛。

    二 分组次数分布表 当数据的取值过多时,不适合每个值记录一个频次。

    把所有数据先划分为若干个分组区间,然后将数据按其数值大小划归相应组内,分别计 算各个组别中的数据个数,再用列表的形式呈现出来,就构成了分组次数分布表。

    制作过程:
    1 求全距(离散量度) 全距=最大值-最小值(离散 2 决定组数 组数 (N为数据个数,K取近似整数)(经验公式) 3 决定组距(任意一组的起点和终点之间的距离) 组距是一个组的上限与下限之差 组距=全距/组数 4 列出分组区间(组限)(一个组起点值与终点值之间的距离) 组上限:一个组的终止点 组下限:一个组的起始点 表示方法:
    表述组限:10-19 20-29 30-39 精确组限:9.5-19.499 19.5-29.499 29.5-39.499 分组次数分布表的意义与缺点 意义:显示数据的分布状况,集中状况。

    假设:各区间的数据均匀分布,并用各组的组中值代表各原始数据。

    缺点:由于假设所造成的误差为归组效应。

    三 相对次数分布表 1 含义:相对次数是指各组次数f对数据总个数N的比值,用符号f/N表示。

    所有相对次数之和 ∑f/N等于1. 2 制作:将分组次数分布表的各组次数转化为相对次数,用f/N或f/N×100%作标 志来表示次数就制成了相对次数分布表。

    四 累加次数分布表 1 实际累加次数 把各组次数f由下而上或由上而下依次累加的和,用符号cf表示。

    2 相对累加次数 把各组的相对次数p由上而下或由下而上依次累加的和,累加之和为1. 五 双列次数分布表(相关次数分布表) 1 含义:对有联系的两列变量用一个表来表示次数分布。(体重与血压;
    智力与成 绩) 2 制作:先按照分组次数表的编制方法,分别列出各变量的分组区间,登记时,每 次同一对变量同时登记在相应的格内。

    第三节 次数分布图 一 直方图(又称等距直方图,用于等距变量) 用一系列宽度相等、高度不一的矩形表示数据分布的统计图。以矩形的面积表示连续性 随机变量次数分布的图形。

    一般用纵轴表示数据的频数,用数轴表示数据的等距分组点,也就是各组分组区间的 上限和下限,有时也使用组中值。

    二 次数多边图(变化趋势) 一种线形图,凡是等距分组的可以用直方图表示的数据,都可以用次数多边图表示。

    绘制时,横坐标是用各分组区间组中值表示的连续变量,纵坐标是数据的次数。以每个 分组区间的组中值为横坐标,一个组的次数为纵坐标标点,连接各点,就成为一条折线。

    三 累加次数分布图 在累加次数分布表的基础上绘制的,有直方图式和曲线式两种,最为常用的是累加曲线 图。

    累加次数分布曲线 横轴:原始分数 百分位数 纵轴:等级排名 百分等级 正偏态分布:小端的数据特别多,大端的数据不是很多,比较分散,表现在曲线就是上肢 长于下肢。(分数分布在低端) 负偏态分布:大端的数据比较多,小端的数据不是很多,但比较分散,表现在曲线就是下 肢长于上肢。(分数分布在高端) 正态分布 :中端的数据最多,两端的数据少,平均两侧的数据个数差不多,表现在曲线 是上肢和下肢长度相当。(中数众数平均数三合一、曲线上拐点50%) 第四节 其他类型的统计图表 一 条形图 表示的是离散型数据资料,宜用宽度相同的条形长短或高低来表示统计数据的大小或变 动情况的统计图。

    一个是分类轴(横轴),表示类别,描述的是计数的数据。(离散数据(类别)) 一个是数量轴(纵轴),表示大小多少,描述的是计量数据。(连续数据(测量数据)) 条形图与直方图的本质区别(选择 简答 多选) 条形图与直方图的本质区别 条形图 直观图 数据类型 离散数据(分类) 连续数据(分组区间) 数据表示方式 直条的长度 面积 坐标轴(横轴) 分类轴 刻度值 直观状态 有间隔 没有间隔 二 圆形图(饼图) 以整个圆的面积带鞭被研究对相的总体,按照组成部分占总体的比重大小,把圆面积分 成若干扇形,用来表示某一现象的部分对总体的比例关系。

    适用于离散性的数据。

    三 线形图 1 用来表示连续性资料,是以起伏的线条来说明事物因时间、条件推移而变迁的趋势。

    (考点) 2 表示的是两边两之间的函数关系或描述某种现象的发展趋势,或一种现象随着另一种 现象变化发展的情形。

    3 通常用横轴表示自变量,用纵轴表示因变量。

    四 散点图 1 用相同大小的圆点的多少或疏密表示统计资料数量的大小以及变化趋势等。

    2 还可以表示相关程度。

    (正相关、负相关、无相关、可能相关) 练习题 1 某考生最高分为81分,在下列次数分布表中,能直接判断有多少考生得分比他低的 是() A 简单次数分布表 B 分组次数分布表 C 累加次数分布表 D 相对次数分布表 2 运用相对累加次数分布曲线,可以快速计算出原始分数相对应的统计量是() A 百分等级 B Z分数 C T分数 D 频次 3 适用于描述某种心里属性在时间上的变化趋势的统计分析图() A 茎叶图 B箱形图 C 散点图 D 线形图 4 用于描述两个变量之间相关关系的统计图() A 直方图 B 线形图 C 条形图 D 散点图 答案及解析 1 C 见第5页 2 A 3 D 见第7页 4 D 前两章 没什么特别重要的知识但不要放松必拿分数。

    第三章集中量数(2-3选择) 数据的集中趋势就是指数据分布中大连数据朝向某个方向集中的程度,用于描述数据集中程度的统计量。

    第一节 算书平均数 一 概念及计算公式 1概念 算术平均数,是所有观测值(或变量)的总和除以总数所得得商。

    符号:或 2计算公式 公式一 (平均数的定义公式) 公式二 (平均数的估算公式) AM 估算值 例题 现有一组实验观测数据,25 27 28 27 25 29 30 34 32 33.计算他们的平均数。

    解法一:
    根据题意已知N=10,根据公式:
    解法二:
    先设定一个估计平均数AM=27,求x=Xi-A的值。

    Xi 25 27 28 27 25 29 30 34 32 X -2 0 1 0 -2 2 3 7 5 先估计 平均值为27(预估计)(大的数据用估计法好算 有利于简化 计算过程) 二 平均数的特点 1 一组变量值的和等于变量的个数与平均数的乘积, 2 一组变量值的离均差之和等于零,(说明了平均数是一组数据的重心 最能表达一 组数据的集中趋势) 3 在一组变量中,每个变量值加上或减去、乘以或除以常数c,所得的平均数等于 原平均数加上或减去、乘以或除以常数c。

    三 平均数的意义 1平均数是应用最普遍的一种集中量数。

    2 是真值渐进、最佳的估计值。(概率分布中心极限定理)(真值=μ总体平均数) 3 当观测次数无限增加时,算术平均数趋近于真值。

    (样本平均数量趋近于总体平均数) (观测次数较少时 样本统计量是总体参数的无偏估计) 四 平均数的优缺点(选择题的重要内容) 1 优点:反应灵敏;
    计算严密;
    计算简单;
    内容容易理解;
    适合进一步代数运算、 较少受抽样变动的影响。

    2 缺点:容易受极端数据的影响;
    如果出现模糊不清的数据,无法使用。

    第二节 中数与众数 一 中数 中数又称中位数,间称中数用Md表示,是按一定顺序排列的一组数中央位置的数值。

    中数是一种位置量数。

    中数的计算(主要考中数的计算方式) 1 中数附近无重复数时 若数据个数(N)奇数时,中数则为(N+1)/2位置的那个数。

    若数据个数(N)偶数时,中数则为居于中间两个数的平均数 2 中数附近有重复数时(难点 没考过 考很正常)采用画图法(王老师开创) 例:求11 11 11 11 13 13 13 17 17 分析:N=9 中间位置为5,第5个数为13。但数据中有3个13,意味着3个13占 了一个单位。(统计学上把13看为一个区间,三个13共享这个区间,把区 间划分为三段, 12.5+1/6 第一小段的组中值 二 众数 1 含义:
    众数(mode)是指一群数据中出现次数最多的那个数,不只有一个,用表 示。

    2计算方法:
    (1) 直接观察法 未分组数据---次数最多的数值 次数分布表---次数最多一组的组中值 (2) 公式计算法 皮尔逊经验公式:(牢记) 三 平均数 中数 众数三者间的关系(出小了计算形式为主的选择题 出大了简答题) 1 正态分布 2 偏态分布 左偏分布=负偏态 右偏分布=正偏态(比较三数大小直接画图即可直观看出) 第三节 其他集中数(往往没怎么考过)(统计中基本不考) 一 加权平均数 是观测数据()与相应的权数(W)乘积的和除以总权数 所得的商。用符号表示。

    权数是指各变量在构成总体重的相对重要性,权数的大小,由观测者依据一定的理论 或经验而定。

    每个数对总体的贡献不一样 权重不一样 二 几何平均数 三 调和平均数:先将各个数据取倒数平均,然后再取倒数,表述符号为,主要用于 描述速度方面的集中趋势。

    练习题 1 现有一列数据,4 4 5 3 5 5 2。这列数据的平均数、众数和全距依次是() A 4 4 2 B 4 5 3 C 5 4 4 D 5 5 1 2 有一组数据 3 6 2 7 32 4 8 要描述这组苏剧的特征,受极端数据之影响的统计 量是() A 平均数 B 中数 C 四分位数 D 众数 3 数据2 5 9 11 8 9 10 13 10 24的中位数是() 4 一组数据的分布曲线称双峰状态,据此可以推测改组数据中可能有两个() A 中数 B 众数 C 平均数 D 几何平均数 5 要比较几个不同性质的测验分数,比较恰当的是比较() A 原始分数 B 众数 C 百分等级 D 平均数 6 测验总分呈负偏态分布说明测验难度() A 偏难 B 偏易 C 适中 7 甲乙两图表示数据分布形态分别是() 8 描述甲乙靓图特征的集中量数中,数据最大的分别是() 答案及解析 1 B 选择题 用省时间的方式哪个好算先算那个 2 A 见第 3 9.5 4 B 5 C 百分等级是原始分数在所在团体中的位置 位置量数 6 B 7 正偏态 负偏态 框架小结 算术平均数 (定义公式 特点) 集中量数 中数(特点 计算方法) 众数 (计算 特点) 三者之间的关系(正态 偏态) 众数 最具代表性的最具优势的 中数 当个别数据偏大或偏小时用中数比较合适 平均数 第四章 差异量数 表示一组数据的差异情况或离散程度的量数;
    反应数据的分布的离中趋势;
    描述事物差 异性的表现。差异量越小,平均数的代表性越好。差异量越大,平均数的代表性越差。

    第一节 全距与百分位差(容易受极端数据影响 不怎么用) 一 全距(没用) 定义:一列数据中最大数与最小数之差 特点:不可靠不灵敏 二 百分位差 (一)百分位数(原始分数)--百分等级 量尺上的一个点,在此点以下包括数据分布中全部数据个数的一定百分比,符 号为。

    百分位数为90 (90为原始分数) 在90分以下的包含了整个数据的75% (二)百分位差 三 四分位差 1 四分位数可视为百分位数的特例,用来表示 。

    2 把数据分成四等份,所以称为四分位数。

    (第一个四分位,) (第二个四分位,) (第三个四分位,) 3 四分位差是百分位差的特例:
    实质:反映了中间50%数据的离散程度。

    四分位差越小中间50%数据越集中 四分位差越大中间50%数据越离散 四 百分等级 (表示) 1 含义:指某个数据在整个数据中所处的百分位置。

    2 作用:可以表示任何一个分数在该团体中的相对位置。

    第二节 平均差/方差与标准差(有单位不能比较不同事物的离散程度) 一 平均差 1 含义:原始数据与平均数绝对离差的平均值。

    2 符号:
    平均差 离均差 3 特点:
    较好反映了数据分布的离散程度;

    平均差是绝对值,使用受到了限制;
    (绝对值不容易进一步代数运算) 属于低效的差异量数。

    二 方差与标准差 1 含义:
    (1) 方差:离均差平方的算数平均数,表示一列数据平均差距的平方。

    符号:
    样本方差—— 总体方差—— (定义公式) (2)标准差:方差的算数平方根,表示一列数据的平均差距。

    符号:
    样本标准差—— 总体标准差—— 计算过程 1 先计算平均数 2 求离均差的平方和 3 代入方差和标准差的公式 完整表述一列数据:
    2 方差、标准差的性质和意义 (1)性质 每一个观测值加一个常数标准差不变。

    每一个观测值乘一个常数,新数据标准差为原标准差乘此常数。

    (2)意义 表述数据离散程度的最好指标。

    第三节 标准差的应用 一 变异系数()(相对离散程度 没有单位 可以比较不同类型数据的离散程度) 一组数据的标准差与其相应的均值之比。

    适应范围:
    (1)不同质的数据 (2)同质但是差距大 二 标准分数(没有单位有正负)(线性变换 变换完了保持相对位置) (一)概念和公式 标准分数:又称分数,是以标准差为单位的一种量数。表示的是一个原始分 数在团体中所处的相对位置。

    计算公式: 原始数据 原始数据的平均数 原始数据的标准差 用将转换为 (二) 性质:
    1 分数是一个相对量,以平均数为参照点,以标准差为单位。

    2 一组原始数据的分数分布:平均数为0,标准差为1。

    3 分数的均值为0。

    因为所以 因为 所以 因为所以 所以 即一组原始数据的分数分布:平均数为0,标准差为1 (三)标准分数的应用 1 观测值在数据分布中相对位置的高低 2 当已知各不同质的观测值的次数分布为正态时,可用Z分数求不同的观测值的总 和或平均值,以表明在总体中的位置。(可加性) 3 表示标准测验分数转换成正态标准分数,线性转换 4 异常值的取舍 标准:
    三个z就占了99.73。

    前四种 低效的用的不多 方差标准差表示离散程度最好的差异量数。

    百分等级无相等单位是顺序数据 分数有相等单位(标准差) 等距数据 框架小结 68.26% 95.44% 99.73% 分数只适合符合正态分布的的数据 网上资料 所有正态分布都可以通过Z分数公式转换成标准正态分布 将成正态分布的数据中的原始分数转换为z分数,我们就可以通过查阅z 分数在正态曲线下面积的表格来得知平均数与z分数之间的面积,进而得 知原始分数在数据集合中的百分等级。

    第五章相关量数 描述统计的重点(理解记忆) 两列或两列以上的的数据 第一节 相关系数与散点图 一 相关 (一)实物可能存在的关系 1 因果关系:A是引起B的原因,B是导致A的结果。

    2 共变关系:表面看似有关系的两个事物,实际上是因为两者都与第三个事物 有关的缘故。

    3 相关关系:A与B在发展变化方向与大小方面(关系密切程度)存在一定关 系。

    (二)相关类别 1 方向上 正相关 负相关 零相关 2 形状上 直线相关 曲线相关 3 相关程度上 完全相关 强相关 弱相关 零相关 二 相关系数 概念:相关系数是变量之间相关程度的指标,计算相关系数一般需要大样本。

    符号:样本相关系数:
    总体相关系数:
    取值:-1—+1 性质:顺序数据(没有单位) 第二节 积差相关 一 概念级适用范围 是计算两个变量线性相关的一种方法 适用范围:
    数据成对。

    两变量总体正态分布或接近正态分布。

    两变量是连续变量。

    两变量为线性关系。

    二 计算公式(定义公式) 为成对数据的数目 或 协方差:两个变量离均差乘积的平均数,协方差的绝对值越大之间的相关关系 越强这些点越接近一条直线。

    第三节 等级相关 一 等级相关的意义 等级相关是根据等级资料(顺序数据)来研究变量之间相互关系的方法。

    数据来源:一是等级评定的资料,二是等距或比率资料转化而成的等级评定资料。

    优点:适用范围比积差相关更广 缺点:没积差相关精确。

    二 斯皮尔曼等级相关 斯皮尔曼等级相关:是根据两列变量的成对等级差数计算计算相关系数,又叫等级差 数法。

    条件:成对;
    线性相关;
    无正态假设;
    无大样本设定。

    结论:比皮尔逊积差相关应用范围广。

    计算公式 一 无相同等级时:
    (1)利用等级差计算 为等级个数 指二列成对变量的等级差数 (2)利用等级直接计算 二 有相同等级的计算公式(不考) 三 肯德尔和谐系数(测量意义:多列等级数据评价一致性) 1 肯德尔系数又称和谐系数,是表示多列等级变量下个关程度的一种方法。

    2 适用范围:
    (1)采用等级评定的方法收集等级数据,让k个评委(被试)评定N个 事物,或一个评委(被试)先后k次评定N件事物。

    (2)每个评价者对N件事物排出一个等级顺序,最小的等级顺序为1, 最大为N,若并列等级时,则评分共同应该占据的等级。

    3 计算公式:
    代表评价对象获得的个等级之和 代表被等级评定的对象的数目 代表等级评定者的数目 有相同等级时分母减 为相同等级数(有几个相同的就加几次) 肯德尔系数与系数处理问题相同但评价者采用对偶比较法 第四节 质与量相关 一 点二列相关(应用较二列相关广) (一) 定义:研究一列等距数据或比率数据与一列“二分”名称变量之间相关的统计方 法称做点二列相关,符号:
    (二) 适用范围:
    (1)一列数据等比或等距,总体服从正态分布;

    (2)另一列变量按事物的性质划分为两类的变量(真正二分变量) (3)多用于测验中评价题目的区分度 (三)计算公式 是与二分称名变量的一个值对应的连续变量的平均数;

    是与二分称名变量的另一个值对应的连续变量的平均数;

    与是二分称名变量的两个值各自所占的比率,;

    是连续变量的标准差;

    取值在之间相关越高,绝对值越接近1。

    二 二列相关(不考) (一)定义:二列相关系数是研究一列正态的比率或等距变量和一列人为“二分”名称 变量之间的相互关系的统计方法,符号:
    (二) 适用范围:两个变量都是等距或等比数据,服从正态分布,其中一列被人为地划 分为两列。

    在测验中用于测验效度和试题区分度的分析。

    (三)计算公式:
    与分别是连续变量的标准差与平均数;

     为与二分变量中某一分类对偶的连续变量的平均数;

    为与二分变量中另一分类对偶的连续变量的平均数;

    为某一分类在所有二分变量中所占比的比率;

    为标准正态曲线中值对应的高度,查正态分布表能得到;

    二列相关系数的取值正-1.00~1.00之间。绝对值越接近1.00,其相关程度越高。

    第五节 品质相关 四分相关(不考) 两个都是人为二分的 相关两列数据都是真正二分 第六章概率分布(基础) 前三节每年都要出题选择理解简答多选 这一章才刚刚进入统计 第一节 概率的基本概念 一 概率 实验,事件:在相同条件下,对某事物或现象所进行的观察或实验叫试验,把观 察或试验的结果叫做事件。

    基本事件:如果某一随机实验可以分成有限的种可能结果,这种结果之间是 互不交叉的,而且这些结果出现的可能性相等,该结果就为基本事件。

    概率:事件在试验中出现的可能性大小,事件的概率用表示。

    (一)古典概率(先验概率) 在只含有有限个基本事件的试验中,任意事件发生的概率定义为 (二)统计概率(后验概率) 在相同条件下进行次试验,事件出现了次,如果试验次数充分大, 且事件出现的频率稳定在某一数值附近,则为事件的概率。由于 也是一抽象的值,常常用在充分大时的代替。

    二 概率的基本性质(选择) 1 加法定理(种情况,或) 两个互不相容事件,之和的概率,等于两个事件概率之和。

    2 乘法定理(个步骤,与) 两个独立事件同时出现的概率等于该两件事件概率的乘积, 三 概率分布 是用来描述随机变量取某些值时的概率的数学模型。

    类型:
    离散分布与连续分布 经验分布与理论分布 基本随机变量分布与抽样分布 分布三要素 形态平均数标准差 基本随机变量分布:
    基本随机变量分布是一个与随机变量的函数相对应的。随机变量的 函数,依然是随机变量。

    抽样分布:
    抽样是从总体中随机的,选取一个样本的过程,每一个样本都可以计、 算平均数,方差标准差,相关系数,等指标。这些指标的概率分布就 是抽样分布。

    第二节 正态分布 (一)正态分布定义 正态分布也呈常态分布,是连续随机变量概率分布的一种,中间量次数分布多,两端 量次数分布少,呈对称的概率分析。

    在正态分布中: 平均数决定着曲线在轴上的位置。

    标准数决定的曲线的形状。(离散程度宽窄) 当标准差相同而平均数不同时,曲线形状相同位置各异。

    当平均数相同而标准差不同时正态曲线有不同的形状,越大,曲线越是“低调”, 越小曲线越是“高窄”。

    (二)正态分布的特征(选择简答) 1.正态分布的形式是对称的,对称轴是经过平均数的垂线。

    2.正态分布的中央点最高,然后逐渐向两侧下降,曲线先向内弯,后向外弯,两 端靠近基线处无限延伸。(拐点在正负一个标准差处) 3.正态曲线下的面积为1,故对称轴正态曲线下的面积划分为相等的两部分。

    4.正态分布是一族分布 5.标准正态分布均值为0。标准差为1只有一条 三 正态分布表的编制与使用。

    标准正态分布函数的数值表:将一般正太分布化为标准正态分布,通过查表可解决 正态分布的概率计算问题。

    (1)正态分布曲线的面积,高度与标准分数。

    (2)标准正态分布曲线相应内容的求解方法。

    1.已知Z值,求面积p 1)求均数(Z=0)与某个Z之间p的值,可直接查正态曲线表 例如:求至Z=0~  Z=-1之间的面积 2)求任何两个z之间的p 例如:求z=1~z=2之间的面积 3)求每个z值以下或以上的面积。

    例如:z=-0.85以下和z=1.76以上的面积 (三)正态分布中的几个常用值。

    正态分布的特点(它有的标准正态都有) 1. 正态分布的形式是对称的,对称轴是经过平均数的垂线。

    2.正态分布的中央点最高,然后逐渐向两侧下降,曲线先向内弯,后向外弯,两端靠近基线 2. 处无限延伸。(拐点在正负一个标准差处) 3.正态曲线下的面积为1,故对称轴正态曲线下的面积划分为相等的两部分。

    4.正态分布是一族分布 5.标准正态分布均值为0。标准差为1只有一条 标准正态分布是正态分布的一种,平均数为0,标准差为1。

    区别:正态分布是一族分布,它随随机变量的平均数、标准差的大小与单位不同而有不同的分布形态。标准正态分布的平均数和标准差都是固定的。

    联系:标准正态分布是正态分布的一种,具有正态分布的所有特征。所有正态分布都可以通过Z分数公式转换成标准正态分布。

    第三节 二项分布 一 二项试验与二项分布 (一)二项试验(条件) 任何一次实验恰好有两个结果,成功与失败。

    共有n次试验,且n是预先给定的任一正整数。

    每次试验各自独立,各次实验之间无相互影响 某种结果出现的概率在任何一次实验中都是固定的。

    例如抛硬币实验 二项式 (二)二项式定理的特点 1.项数:二项式的展开式中共有n+1项。

    2,方次:二项式中,p的方次从n~0为降幂,则q  从0~n为升幂,且每项 的p,q方次之和等于n (三)二项式的概率分布及其二项分布曲线。

    1.二项式的概率分布 根据二项式的定理,若在n次实验中,求r次成功的概率分布函数。可由公式求 得, 上式也可写成 二项分布的优点在于它能迅速地确定各种可能结果的概率。

    2.二项分布曲线(离散分布) 当时,无论多大,二项分布曲线都总是对称的。

    当时,且当相当小,则图形显偏态。

    当n相当大时(),二项分布曲线逐渐接近正态分布。

    二 二项分布的平均数和标准差。

    *二项分布接近正太分布的条件:
    或 平均数 标准差 第四节 正态分布 一 正态分布及渐进正态分布 中心极限定理:总体服从正态分布 1. 总体呈正态,总体方差已知,则样本均数的分布也呈正态 根据中心极限定理则有:
    (1)样本均数的均数等于总体均数,即 (2)样本均数的标准差等于总体标准差除以样本容量的平方根。即 (标准误) (3)转为标准正态分布 2.总体呈非正态,总体方差,已知,样本容量足够大(),样本 平均数的分布为渐近正态分布(看作正太分布)。

    根据中心极限定理,亦有。

    (1)样本均数的均数等于总体均数。

    (2)样本均数的标准差等于总体标准差除以样本容量的平方根。

    (3)转为标准正态分布 二 分布 1.分布的定义(学生氏分布) 分布是由小样本统计量形成的概率分布。

    2.七分布的应用 (1)总体正态,未知,且,样本平均数的分布呈分布。

    分布的标准误为 检验值为 2)总体成非正太,未知,则样本均数的分布近似为t分布和渐近正 态分布 其样本均数的标准误为:
    检验值 或 t分布(选择简答)(标准差大于1)(0为均值) t分布是类似正态分布的一种对称分部,他通常要比正太分布平坦和分散。一个特 定的分布依赖于称之为自由度()的参数,随着自由度的增大(N>45)分布 也逐渐趋于正态分布。

    标准正态分布不管n的大小,曲线只有一条,而t分布是一族曲线 一个服从正态的整体 的平方分布检验值为 (二)分布的特点(合成分布)(选择简答) 1.分部是一个正偏态分布,越小x平方分布越偏斜。随着参数n的增大,分 布趋近于正态分布。

    2.值都是正值。

    3.平方分布具有可加性。

    4.如果大于2,分布的平均数等于,方差等于2(特殊情况) 四,F分布 (一)F分布 F分布是由两个卡方分布构成而成的一个新的分布。

    若随机变量随机变量的函数的分布规律称为F分布 其中参数n1,n2是两个自由度。任意一个自由度不同就是另一个f分布。

    正如正态分布中均值或方差不同就是另一个正太分布一样 (二)F分布的特点(多选) 1.F分布是正偏态分布,随着两个自由度的增大。趋近于正态分布 2.F总为正值 3.当分子自由度为1,分母的自由度为任意值时,F分布与分母自由度 相同概率的t值。(双侧概率)的平方相等,这一点说明当组间自由度 为1时,f检验与t检验的结果相同。

    第七章 参数估计 第一节 点估计、区间估计与标准误 一 点估计的定义 以样本的统计量(数轴上的一个点)作为总体参数的估计值称为点估计。如:用样本平均数作为总体参数的估计值,样本标准差作为总体标准差 例如:知样本的语文成绩的平均数是75分,我们便推论这个样本的总体参数(字母)也是75分。

    二 良好估计量的标准 1.无偏性:(多选简答) 即用多个样本的统计量作为总体参数的估计值,其偏差的平均数为0。

    例如:用样本平均数作为总体的估计值就是无偏估计,因为无数个样本平均数的平均值既为。

    如果多个样本的统计量作为总体参数的估计值,其偏差的平均数大于或者小于零,则为偏估计,例如:样本方差就不是无偏估计 而是 2.有效性 当总体参数的无偏估计不止一个统计时,无偏估计变异小的有效性高,反之则有效性低。

    即样本统计量的方差越小越好。(考虑)(平均数方差最小) 例如:判断下列两个平均数的样本哪个有效。

    3.一致性 当样本容量无限增大时,估计值应能够越来越接近他所估计的总体参数,估计值越来越精确,逐渐趋于真值。

    如:当 4.充分性 指一个容量为的样本统计量,是否充分的反应了全部个数据所反应总体的信息。

    例如 平均数m就能充分反映各个数据的信息。

    中数Md和Mo只能反映部分数据信息。

    三,区间估计与标准误 一,区间估计的定义(名词解释) 区间估计是一个统计量的区间来估计相应的总体参数,它要求按照一定的概率要求,根据样本统计量来估计总体参数可能落入的数值范围。

    特点,用数轴上的一段距离来表示未知参数可能落入的范围。

    例如:当已知样本的平均数是60时可以用区间(55.65)来估计总体参数的范围。

    二,置信区间与显著性水平。(名词解释选择题) 1.置信区间 也叫置信间距:是指在特定的可靠性(即置信系数)要求下估计总体参数所落的区间范围。

    例如:在95%的可靠下,总体的参数落在(90 100)5%以下为小概率事件 2.置信系数 是指被估计的总体参数落在置信区间内的概率,又叫置信水平,置信度。

    例如:置信系数为95%时是指总体参数落在某个区间时的可靠性为95%,意味着可靠性能提高。

    3.显著性水平 一个置信系数同时反映了在做出一个估计时所犯错误的小概率(),即可靠性为95%时 意味着犯错误的概率为5%,可靠性为99%时,意味着犯错误的概率为1%。

    这种犯错误的小概率也叫做显著性水平,用a表示。

    1-置信系数=显著性水平。()如:1-95%=5% 4.置信系数和置信区间的关系。(选择) 观察:100%的可能性你的考试分数在(0,100)分 95%的可能性,你的考数分数在(50,90)分 置信系数越高,区间越大,估计越模糊。

    置信系数越小 ,区间越小,估计越精确。

    最佳的估计要置信区间适度,又要置信系数较高 置信区间长度与显著性水平是反比的关系。(判断谁增大谁减小的问题) 三 区间估计的原理与标准误 1.如何确定估计的区间? 回想一下生活中的例子。

    某个食品包装袋上会告诉你被食品的重量是100+减3克,你们能否猜出这种食品的实际重量的区间是多少? (97.103)我们把3叫做误差 在统计学中也是用误差来估计参数区间的长度的,解释总体参数落入这个置信区间的概率水平,这个误差有时候也叫样本统计量的标准差,为了区别总体的标准差,把它叫做标准误(SE)  即:误差      =样本统计量的标准差      =标准误(SE) 2.样本分布---区间估计的原理与依据。

    第二节   总体平均数的估计 一.估计总体平均数的步骤 1.根据实得样本的数据,计算样本的平均数与标准差。

    2.计算标准误(最关键) 3.确定置信水平或显著性水平。

    4.根据样本平均数抽样分布,确定查何种统计表 5.计算置信区间 6.解释总体平均数的置信区间。

    估计标准误 1. 当总体方差已知时,使用总体标准差来计算标准误。

    2. 当总体方差未知时 使用样本方差计算标准误。

    二,总体方差已知时,估计参数 正态估计法: 一是总体正态时,不论样本容量的大小,样本均数的分布都呈正态分布。

    二是总体成非正态时,只要样本容量大于30,样本均数的分布呈渐进(近似)正态分布。

    三,总体方差(字母)未知时,估计参数(字母) t分布估计法 1.总体正态,方差(字母)未知,样本容量无论大小都可以采用t分布系法。

    2.总体呈非正态,方差((字母))未知,若(n30)时,可用t分布法。

    若(n<30)时,不能推论。

    分析:总体分布为正态,总体方差未知,但样本标准差已知,无论样本容量大小,都可以采用t分布估计法。

    t分布中,在相同置信系数下,t值会随样本容量n和自由度(字母)的变化而不同。

    为此,根据自由度 查“t分布显著性临界值表”,确定t值 第三节 :标准差和方差的区间估计。(基本不会考) 一,标准差的区间估计 当n大于30样本标准差的分布渐进正态。

    标准差分布平均数为 标准差分布的标准误为 区间估计公式为(公式) 1.因为总体未知,用样本标准差估计标准误。

    二,方差的区间估计 从正态分布总体中抽取容量为n的样本。

    样本方差与总体方差比值为卡方分布,即(公式) 和推论其置信区间为:(公式) 框架小结 参数估计的基本内容: 点估计 区间估计 标准误 总体平均数的估计: 总体方差已知,对总体平均数的估计。

    总体方差未知,对总体平均数的估计。

    标准差异方差的区间估计: 标准差的区间估计 方差的区间估计 二总体方差之间的区间估计。

    相关系数的区间估计:  积差相关系数的区间估计。

    等级相关系数的区间估计。

    比率与比率差异的区间估计: 比率的区间估计 比率差异区间估计 第八章 假设检验 第一节假设检验的原理(名词解释 选择 简答) 在统计学中,通过样本统计量得出的差异做出一般性结论,判断总体参数之间是否存在差异,这种推论过程叫做假设检验。

    假设检验分为参数检验和非参数检验,前者指的是总体分布已知,需要对总体的未知参数作假设检验,后者指的是总体分布知之甚少,对总体的函数形式和特征进行假设检验 假设检验是推论统计中最重要的内容。(差异是由抽样误差导致的还是由于参数间有真正的差异存在) 一. 备则假设与虚无假设 (一)备择假设 1.就是实验人员希望证实的假设,也称研究假设 2.性质:假设两个样本统计(或两个总体参数)之间,又或者是样本统计量与总体参数之间存在真实的差异是一种有差假设,用表示。

    3.表达方式 (二)虚无假设 1.研究人员为了证实研究假设是真的而利用概率论的反正法所进行的假设,即从研究假设的反面进行假设。

    2.性质:虚无假设是假设两个总体参数之间或样本统计量以总体参数之间不存在真正的差异,其现存的表面儿差异是由抽样所造成的误差,是一种无差假设,又称零假设,或原假设用符号表示 表达方式 (三)备责假设和虚无假设的关系。

    是想要的结果,但是无法直接验证。

    只能通过证明,反证的正确与否。

    结论:找到证据正确与否的依据就是假设检验的关键! 假设检验就是为了找一个驳斥的机会。

    (四)假设检验的依据----抽样分布理论 (五) 小概率事件 统计学上小概率事件是指在指在一次试验中几乎不可能发生的,如果发生了则该事件被认为是不合理的 传统上将不超过0.05的事件当做“小概率事件”,有时也定0.01和0.001 二,显著性水平 1.含义:指为拒绝虚无假设(零假设)而设定的小概率值 2.零假设与显著性水平的关系: 如果零假设正确的可能性只有5%,我们就排除零假设,还可以把这临界值设置在1%或者0.1%,这种临界概率就称为显著性水平。

    显然通过, 显然通过显著性水平可以判断是否接受零假设。

    3.显著性水平与拒绝和接受域 因为5%的显著性水平在标准正态分布上对应的Z值加减1.96,所以当检验值落在(-1.96.1.96)时,我们认为零,我们认为零假设有95%是对的,接受它,则该区域为接受域。

    而当检验值落在(-00.-1.96)或(1.96.+00)时,我们认为零假设只有5%是对的,拒绝它则该区域为拒绝域 4.差异显著判断规则(正态检验) 虽然我们比较习惯取a=0.05和a=0.01,但也可以取其他的显著性水平直如,0.005和0.001。

    三,假设检验中的两类错误。

    (一)定义 错误(1型错误) Ho为真时却被拒绝,弃真错误。

    错误是指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使我们做出了拒绝虚无假设的结论。

    错误(ll型错误) Ho假时,却被结束,取伪错误。

    错误是指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域。致使我们做出了接受虚无假设的结论。说明事物之间没有显著的差异。

    (二) 两类错误的关系(简答) 1. 原因:与是两个前提下的概率。

    即a是拒绝原假设ho时犯错误的概率,这时前提是ho为真。

    (字母)是接受原假设ho时犯错误的概率,这时前提ho为伪 2.在其他条件不变情况下,和不能同时减小或增大。

    当减小的时候,一定增大。

    当增大的时候,一定减小。

    想要和同时降低,需要改变数据分布,即要增大抽样的样本 3.统计检验力 三,单车与双侧检验 1.双侧检验:只强调差异,不管大小(左右两侧都可以) 检验假设为 ho-零假设 h1-备则假设 2.单侧检验:强调大小 检验假设形式一: ho -零假设 h1-备则假设 形式二:
    ho h1 四,假设检验的步骤 1.提出原假设和备则假设(三种)单侧双侧 单侧又分为左侧右侧 2.确定适当地检验统计量(z,t,F) 3.指定检验中的显著性水平a。

    4.利用显著性水平,建立拒绝ho原则。

    5.计算样本统计量的值 6.做出统计决策(两种方法) (1)将检验统计量的值与拒绝规则所指定的临界值相比较,确定是否拒绝原假设。

    (2)有检验统计量计算p值,利用p值确定是否拒绝原假设。

    例题8-1 某校一个心理班进行比奈智力测验,M=110,班级人数n=50,该测验常模(公式)。该班智力水平(字母)(不是这一次检测结果)是否与常模水平有显著差异。

    解: 1.提出零假设和备择假设。

    备择假设:用H1表示,即研究假设 希望证实 的假设。

    (公式)(该班智力水平确实与常模有差异。)(公式) 零假设:用ho表示,即虚无假设,原假设,无差异假设 (公式) 2.确定适当的检测统计量。

    用于假设,检测问题的统计量称为检验统计量,与参数估计相同,需要考虑。

    (1)总体是否正态分析 (2)大样本还是小样本 (3)总体方差已知还是未知。

    本例中总体正态,样本容量大于等于30,检验统计量为z分布。

    3.指定检验中的显著性水平。

    显著性水平就是指当假设正确时人们却把它拒绝了的概率和风险。用a表示 通常取a=0.05或a=0.01或a=0.001,那么接受原假设时正确的可能性(概率)为95%,99%,99.9% 这里取a=0.05,因为是z检验,所以临界值是-1.96 4.利用显著性水平,建立拒绝ho的规则。

    5.计算样本统计量的值 (公式) 6.做出统计决策 (公式)所以z落入拒绝区域,推翻ho。接受h1,即该班的智力水平与常模有显著差异。

    第二节平均数的显著性试验。

    一 检验方法 平均数的显著性检验是指检验一个样本平均数与相应总体平均数之差。

    二 条件分析 1.确定是双尾检验,还是单尾检验 2.明确总体方差(字母)是已知的还是未知的 3.分析总体分布是正态的,还是非正态的。

    4.决定是采用z检验还是t检验,又或是检验。

    第三节,平均数差异的显著性实验。

    一.均数之差标准误的基本公式。

    随机从总体中抽取两个容量为n1和n2的一切可能样本时。两个样本的均速之差(公式)会形成一种抽样分布,两均数之差D在抽样分布上的标准差称两均数之差的标准误。记为(公式),只是根据不同的具体条件。(公式)公式有所不同 方差齐性指的是总体方差齐性。

    两个样本方差一般是不齐性的 第九章       方差分析 第一节:方差分析的基本原理 第二节:完全随机的方差分析 第三节:随机区组的方差分析 第四节:事后检验(了解) 第五节:多因素方差分析初步。

    一.方差分析的基本原理:综合的检验(F检验t检验的推广版) 方差分析:为了探讨一个因变量和一个或多个自变量之间的关系,主要功能在于分析实验数据中的自变量是否对因变量有重要影响。

    方差分析主要处理两个以上的总体平均数之间的差异检查问题。需要检验的虚无假设就是“任何一对平均数”之间是否有显著性差异,你的是虚无假设为,样本所属的所有总体的平均数都相等。

    一般把这个假设称为“综合虚无假设”表达方式为 方差分析最关键的步骤就是变异的分解。

    表示总平方和,指试验产生的总变异。

    表示组间平方和,指不同试验处理而造成的变异。

    表示组内平方和,个体差异+随机误差,实验误差造成的差异。(误差) 组间自由度 组内自由度 总自由度 为个数 为限制条件的个数 组间均方 (均方=方差) 组内均方 后两者直接判断差异不显著 二 方差分析的基本过程与步骤。(简答) (一)求平方和 (二)计算自由度 (三)计算均方(方差) (四)计算值 (五)查F表进行检验并做决断 (六)列方差分析表 二 自由度的分析 总自由度为总容量减去1,本例有12个数据,所以:(公式) 组间自由度为组数(k)减1,本例有3个组,所以:(公式) 组内自由度为总容量减组数减用总自由度减去组间自由度,既有(公式) (三)计算均方 均方是平方和除以自由度。

    组间平方:(公式) 组内均分:(公式) (四)计算值 (公式) (五)查分布临界值作出判断。

    (公式) (公式) 三 方差分析的基本假定(选择) 1.总体正态分布 2.变异的相互独立性 3.总体方差齐性(先做) 进行方差分析要求各水平下的样本量相同 四  方差分析中的方差齐性检验。

    方差齐性检验就是检验各总体方差是否一致的统计方法。其虚无假设是假设各个总体的方差相等(即无显著差异)或是各个样本方差来自相同的总体,其表达方式即为: (分子自由度) 第二节 完全随机设计的方差分析。(组间方差分析、被试间方差分析) 在这种实验设计中,只有一个实验变量,这个实验变量有多个水平,每个被试只接受一种实验处理。

    第三节 随机区组设计的方差分析 每个被试接受所有水平处理 区组差异:体现了个体误差 区组差异个体误差 练习效应 疲劳效应 第四节 事后检验 多重比较是进一步分析成对平均数的差异。

    即我们知道几种实验处理之间是有差异的,现在我们想进一步知道是谁与谁之 间是有差异的。

    检验法(检验法) (一)N-K检验的原理 N-K检验室找出每对平均是之间存在的,随机变异,即各对平均数差异的标准误。

    然后该标准误比较平均数之间的差异,其统计量称为q值。

    (二)检验的步骤 1.把要比较的个平均数从小到大做等级排列以r表示。

    2.计算统计量(公式)是任意两个平均数的差值。

    3.计算等级的相差数即(公式) 4.找出自由度的df,这里是误差项与自由度即(字母) 5.根据r和(字母)和显著性水平0.01和0.05查处比较的临界值与计算的q值比较,做出决策 第五节 多因素方差分析 1 基本概念 (1)因素:自变量 水平:自变量的不同水平 (2) 交互作用:一个实验中有两个或两个以上的自变量,当一个自变量的 效果在另一个自变量的每一个水平上不一样时,我们就说存 在着自变量的交互作用。

    主效应:某因素不同水平的平均数差异成为主效应。(有几个自变量 就有几个主效应) 22完全随机 交互作用不明显 再看主效应 22随机区组 交互作用显著 再进行简单效应检验 第十章  卡方检验 (简答形式的计算题/计算题) 第一节 卡方检验的原理 第二节 配合度检验 第三节 独立性检验 思考: 例一,随机抽取60名学生,询问他们在高中是否需要文理分科,赞成分科的39人,反对分科的21人,问他们对分科的意见是否有显著差异。

    39大于21,所以学校决定不要分科这样做可以吗? 例2: 例某企业生产三种类型的手机:a类型b类型c类型,在一次市场调查中,公司市场研究小组提出了男女使用者对于三种手机类型偏好是否有差异的问题。(表格)  有的人因此用t检验检验两者的差异,这样做行吗。

    第一节 卡方检验的原理(皮尔逊) 称名数据的差异问题 一,卡方检验的假设 (一)分类相互排斥,互不包容。

    卡方检验中的分类必须相互排斥,这样每一个观测值就会被划分到一个类别和另一个类别之中。

    (二)观测直相互独立 各个被试的观测值之间彼此独立,这是最基本的一个假定 ,如果一个被试对某一品牌的选择对另一个被试的选择没有影响。

    (三)期望次数的大小有规定。(理论次数5) 为了努力使卡方分布成为卡方值准确的近似估计每一个单元格中的期望次数应该至少在五以上。

    二 卡方检验的类别 (一)配合度检验 配合度检验主要用来检验一个因素多项分类的实际观察数与某理论次数是否接近,这种卡发检验方法有时也称为无差假说检验。

    (二)独立性检验 独立性检验是用来检验两个或两个以上因素各种分类之间是否有关联或是和是否具有独立性的问题。

    卡方检验的基本公式(定义公式) 实际观察次数 理论次数 第二节 配合度检验 配合度检验主要用于检验单一变量(一个因素)的实际观察次数分布与某理论次数是否有差别,由于太检验的内容仅涉及一个因素多项分类的计数资料,故可以说是一种单因素检验。

    配合度检验的一般问题 (一) 统计假设 基本公式 (二) 自由度的确定 在配合度检验中 自由度公式:
    为分类项数 (三) 理论次数的计算规则。

    数据分布以其理论概率为依据,这时理论次数等于总次数乘以某种属性出现的概率。即 p每个分类出现的概率 理论次数计算一般是根据某种理论,按一定的概率通过样本的实际观察次数计算,某种理论有经验概率,也有理论概率,如二项分布,正态分布等。

    二,配合度检验的应用 (一)检验无差假说 无差价,说是指各项分类的实技术之间没有差异,也就是假设各项分类之间的机会相等,或概率相等,因此理论次数完全按概率相等的条件计算。即:(公式) 例10-3:某项民意测验答案有同意,不置可否,不同意,三种。调查了48人结果同意24人,不置可否2人,不同意12人,问持这三种意见的人数是否有显著不同。

    解:此题为检验无差假说,已知分类的项数为三,故各项分类假设实计数相等。所以(公式) 一  几个重要概念 1   列联表 定义:呈现两个变量之间关系的表格。记录两个变量不同水平的各种组合的被试频数 2    观测频数 一    几个重要概念 1   列联表 定义:呈现两个变量之间关系的表格。

    记录两个变量不同水平的各种组合的, 对试频数。

    2  观测频数 实际观测到的频次 3   期望频数 假设两个变量之间没有任何联系的情况下,我们所预期的各种变量组合应有的频次。

    4   边缘值 列表中每一行和每一列的观测评数的总和。

    二    独立性检验的内涵 独立性检验表示-对于x的,每个值,y值得次数分布是否有差异。

    如果对于x 的每个值,y值的次数分布一样,则表示:x变量和y变量毫无关系。

    如果对于x大每个值,y值的次数分布有差异 则表示:x变量和y变量有关联,或说两变量存在相关。

    所以独立性检验也是对两个变量之间相关程度的一种检验。

    ‌前面有关章节中讨论的统计推断问题有两个共同点:一方面他们都是在给定或假定总体的分布形式基础上,对总体的位置参数进行估计或者检验已明确的总体分布为前提,另一方面需要满足某些总体参数的假定条件。例如在t检验时基本假设是样本来自正态分布的总体,若是两独立样本的t检验,还要求两个总体方差齐。在方差分析中,需要满足正态性,可加性及各分组方差齐等基本假设。这一类假设检验,一般都称之为参数检验。实践中,研究人员对所研究的总体可能知之不多,有时对参数检验中的诸多要求和假定很难完全满足。这样,不符合参数检验的条件下参数检验就不适用了。此时,应当使用统计学中的另一类检验方法,既非参数检验。与参数统计相比,非参数检验对总体分布不做严格假定,又称任意分布检验,特别是用于计量信息较弱的资料,往往仅依据数据的顺序等级资料既可进行统计推断 在在实践中的到了极为广泛的应用。在心理学和其他行为科学中许多变量是称名变量和顺序变量 用非参数方法解决此类问题。前面讲过的斯皮尔曼等级相关。(字母)检验都属于非参数方法。

    相关热词搜索:

    • 考试时间
    • 范文大全
    • 作文大全
    • 课程
    • 试题
    • 招聘
    • 文档大全

    推荐访问