统计学的基础概念思维导图
树图思维导图提供 统计学的基础概念 在线思维导图免费制作,点击“编辑”按钮,可对 统计学的基础概念 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:8eb9f24c25bdae0912501928667eee5b
统计学的基础概念思维导图模板大纲
可以分为两类:描述统计学:主要在于数据的刻画
包括图表展示(比如:如何选取合适的图表来表示)
概括性数字度量(比如:平均数μ,中位数,标准差σ,方差等)
推断统计学:以样本来推测总体,比如从5000包面粉中,抽出100包进行称重
通过这个数据便可以推测总体的相关数据,下篇我们会进行详细的讲述;变量,等同于字段
数据,是变量的统计值,等同于记录;可以联想Excel表格。
变量可以分为:分类型变量(又称定性变量,离散分布,如等级-ABCD,性别-男女等)
数值型变量(又称定量变量,一般连续分布,如身高,体重,工资等)样本,总体
样本的概括性数字度量为统计量,而总体的概括性数字度量为参数。
概率概率和统计的关系:可见,概率就是知道小桶里的分布,来求取出什么小球的可能性
而统计就是知道取出的小球内容,来估计小桶里面的分布。
古典概型(如投硬币,掷色子等,可以计算)统计而来
正态分布:正态分布什么意思?统计学家发现很多数据的分布都服从正太分布,比如身高,重量,成绩。
概率密度图是什么意思呢以和x轴围成的面积来表示概率
比如高于180的概率即为下图展示的围成面积;而整个概率密度图和x轴围成的面试为1
曲线越高的部分,越可能发生,越低的部分,越不可能发生。
由于超出均值±三倍标准差的数据很少,故我们常把超出均值±三倍标准差的值称为异常值。
随机变量;概率分布,概率密度;离散型随机变量:二项分布(伯努利分布),泊松分布
超几何分布;连续型随机变量:均匀分布,指数概率分布,
正态分布(衍生:卡方分布,t分布,F分布,推断统计学会用到)
大数定理:当样本足够大时,样本均值收敛于总体均值
基础统计包括:描述统计、总体推断、抽样方法、卡方检验、T检验、方差检验。
多指标统计分析:相关分析、回归分析、因子/主成分分析、logistic回归、时间序列分析
统计分析的目的:总结历史数据的变化规律,解释为什么这么变化,然后基于当前情况做预测。
统计分析的手段:描述性统计和推断性统计。
通过样本估计总体,后边跟着一个估计准确性的百分比。
描述统计测量尺度:定类尺度(性别)、定序尺度(喜爱宠物的顺序)、定距尺度(1-10评分)、定比尺度(体重)
定距和定比的区别的是,定比可以乘除,定距乘除没意义。
定序和定类合成分类变量,定距和定比合成连续变量。
不同的测量尺度使用的描述性方法是不一样的。
均值和中位数用于连续变量也就是数值型变量。
抽样误差与标准误、t分布、参数估计、假设检验因为总体抽样,然后用样本估计总体肯定会产生误差
这样用标准误这个指标来衡量这个抽样误差。总体数据呈现各种各样的特征
于是有各种分布来描述它们的分布,知道了分布就可以估计这个抽样误差
接着就可以做参数估计、假设检验(就是统计推断)
参数估计是说已经知道样本的各种描述性特征了,用这些综合分布来估计总体的各项参数
估计一个数就是点估计,估计一个范围就是区间估计。假设检验是检验这个估计对不对
给出一个概率。大数定律:样本量越大,样本均值几乎必然等于均值
中心极限定理:样本量趋于无穷大的时候,多次抽样得到的样本们的均值的频次逐渐趋于正态分布。
抽样误差是指抽出的样本和总体的差异,不同的抽样方法产生的抽样误差不一样。
t分布自由度可以简单理解为样本量,当自由度趋向于无穷大时,T分布趋近于正态分布。
标准正态分布就是均值是0,标准差为1的正态分布。
转化方法就是减去均值再除以标准差。这个转化又叫标准化或者Z值标准化。
这个转化也可以判断数值是不是异常,Z值绝对值大于3为异常值,大于5为极端值。
小概率反证法,也就是说,如果看到的天鹅都是白色
然后假设天鹅都是白色的,那么这个时候如果出现一只不是白色的天鹅,就可以推翻这个原假设。
出现不是白色的天鹅就是这个小概率事件。默认显著性水平是0.05。
说根据分布特点来选对应的检验统计量,然后再去计算对应P值显著性水平
犯第一类错误的最大概率。H0一般定义成没有显著性,没有差异。
这里介绍的相关和回归是关于二维双变量的最简单最实用的线性回归
散点图:显示出二变量数据的模式相关性:变量之间的数学关系。
线性相关性:两个变量之间呈现的直线相关关系。
最佳拟合直线:与数据点拟合程度最高的线。(即每个因变量的值与实际值的误差平方和最小)
线性回归法:求最佳拟合直线的方法(y=ax+b),就是求参数a和b斜率
相关系数r:表征描述的数据与最佳拟合线偏离的距离。(r=-1完全负相关,r=1完全正相关,r=0不相关)
树图思维导图提供 904名中国成年人第三磨牙相关知识、态度、行为和病史的横断面调查 在线思维导图免费制作,点击“编辑”按钮,可对 904名中国成年人第三磨牙相关知识、态度、行为和病史的横断面调查 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:10b9a8a2dd2fb4593f8130ef16c320fc
树图思维导图提供 1113爆卡会总结会会议纪要 在线思维导图免费制作,点击“编辑”按钮,可对 1113爆卡会总结会会议纪要 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:aaf6c152a765d5821e8e1787f2b3226e