TreeMind树图在线AI思维导图
当前位置:树图思维导图模板高校与高等教育统计学《统计学》思维导图

《统计学》思维导图

  收藏
  分享
免费下载
免费使用文件
G. 浏览量:112022-11-16 20:10:49
已被使用0次
查看详情《统计学》思维导图

简述《统计学》中定量资料的统计描述等内容

树图思维导图提供 《统计学》 在线思维导图免费制作,点击“编辑”按钮,可对 《统计学》  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:a669ff726e7066d800246d0802fccdaa

思维导图大纲

《统计学》思维导图模板大纲

绪论

变量的类型

定量变量 数值,有单位,连续性;均数/标准差描述;t检验,F检验

连续型变量

离散型变量

定性变量:没有单位,间断性;率、构成比描述;卡方检验、秩和检验

无序变量

二分类变量

名义变量

有序变量—等级变量

总体与样本

总体:根据研究目的确定的同质观察单位的全体

样本:从总体中随机抽取的部分有代表性的观察单位的全体。

同质与变异

同质:研究对象具有的相同的状况或属性

变异:同质的各观察单位,其某变量值之间的差异

参数与统计量

参数:总体的统计指标,如总体均数、总体标准差,分别用希腊字母记为μ、σ。固定的常数 

样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为X-、S。 参数附近波动的随机变量 

定量资料的统计描述

描述集中趋势的统计指标:算术均数、几何均数和中位数

算术均数(适用于对称分布或近似对称分布的资料,μ表示总体均数,X表示样本均数)

直接法

频率表法:(当变量值的个数较多时,在编制频率表的基础上,应用加权法计算均数的近似值。)公式中,f 为各组段的频数,X0为各组段的组中值, X0=(组段上限+组段下限)/2

几何均数(G)(几何均数使用于原始变量不呈对称分布,但对变量经对数转换后呈对称分布的资料,又称对数正态分布资料。常见于正偏态分布资料)

直接法

频率表法(当资料中相同变量值的个数f(即频数)较多)

中位数(M)

适用:

变量值中出现个别特小或特大的数值

资料的分布呈明显偏态,即大部分的变量值偏向一侧

变量值分布一端或两端无确定数值,只有小于或大于某个数值

资料的分布不清

直接法(例数较少,先将变量值由小到大顺序排列)

n为奇数时 

n为偶数时 

频率表法(例数较多)

先从累计频率找出M所在的组段,然后按公式计算,式中L为中位数所在组段的下限,i为该组段的组距,fm为该组段的频数,ΣfL为小于L的各组段累计频数

描述离散趋势的统计指标:极差、四分位数间距、方差、标准差和变异系数

四分位数间距(Q)

极差的不稳定主要受两端值的影响,如将两端数据各去掉一部分,这样所得的数据就比较稳定了

两端各去掉25%,取中间50%的数据的极差,这样可先计算P25和P75,求出P75与P25之差,即为四分位数间距。

一般和中位数一起描述偏态资料的分布特征

Q= P75-P25

方差

反映每个观察值之间的离散情况,同时又能考虑到观察个数的影响,可取离均差平方和的均数

总体方差用σ2表示,样本方差用S2表示

对于频率表资料

标准差

总体标准差用σ表示,样本标准差用S表示

对于频率表资料

变异系数(CV)

当两组或多组变量值的单位不同或均数相差较大时,不能或不宜用两个或多个标准差的大小来比较其离散程度的大小

正态分布t分布

正态分布

概念和特征

正态曲线的定义:称以下函数f(x)的图象称为正态曲线

如果变量X的概率密度函数服从上述函数,则称该变量服从正态分布。记做

正态分布曲线的两个参数

均数µ决定曲线在横轴上的位置是正态分布曲线的位置参数。 µ决定高峰的位置。

标准差σ决定曲线的形状是正态分布曲线的形状参数(变异度参数), σ决定曲线的“胖瘦”。

标准正态分布

µ=0, σ=1的正态分布

正态分布 和 标准正态分布曲线下面积分布规律

参考值范围的估计(正常值范围的制定) 

正态分布法

百分位数法

资料呈偏态分布

双侧95% P2.5-P97.5

单侧95% P95 (单侧上界)P5(单侧下界)

计算百分位数的公式

t分布

均数的抽样误差  标准误

抽样误差:由抽样而引起的样本均数与总体均数之间的差别及样本均数与样本均数之间的差别

标准误:从正态分布的同一总体中随机抽取例数相等的若干个样本,分别计算它们的均数,这些样本均数的标准差称为标准误

标准误与标准差的区别

标准差描述个体变量值间的变异程度。凡同性质的资料,标准差大表示个体变量值变异大,样本均数对个体的代表性差。标准差小表示个体变量值变异小,样本均数对个体的代表性好。

标准误是样本均数的标准差,即描述样本均数的抽样误差。凡同性质的资料,标准误大说明抽样误差大,用样本均数估计总体均数的可靠性小;而标准误小,说明抽样误差小,用样本均数估计总体均数的可靠性大。

样本均数的正态分布(中心极限定理)

从一个呈正态分布的总体中随机抽取样本含量相等的许多样本,分别计算出它们的样本均数。这些样本均数的频数分布仍是以总体均数为中心的正态分布。

中心极限定理

样本的平均值约等于总体的平均值。

不管总体是什么分布,任意一个总体的样本平均值都会围绕在总体的整体平均值周围,并且呈正态分布。

所以我们才能够用样本去估计总体。

样本均数的标准正态分布

t值  t分布

t分布特征

t 值自由度( ν ) df=n-1

t 分布特征

t界值与概率的关系

相关思维导图模板

医学统计学思维导图

树图思维导图提供 医学统计学 在线思维导图免费制作,点击“编辑”按钮,可对 医学统计学  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:35d1f8c1aa1ea6abed116a1826701bd9

05模型:如何抽象数据的分布知识思维导图

树图思维导图提供 05模型:如何抽象数据的分布知识 在线思维导图免费制作,点击“编辑”按钮,可对 05模型:如何抽象数据的分布知识  进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:d338093601fbff459795a57df5c254db