统计学概率分布思维导图
树图思维导图提供 概率分布 在线思维导图免费制作,点击“编辑”按钮,可对 概率分布 进行在线思维导图编辑,本思维导图属于思维导图模板主题,文件编号是:607e6dc38aab6c01670fc32a9f65190b
概率分布思维导图模板大纲
统计学是基于随机事件来计算的,比如抛硬币事件,出车祸事件等等
事件得出的结果就是随机变量{正、反}
离散随机变量(分类变量) 连续随机变量(连续变量)
概率分布是指这些随机事件的结果发生的概率的分布情况,这些概率之和是1
幂律分布 这个分布和二八原则很类似,大部分的资源都集中在少部分人手中
幂律分布很大程度上和用户的留存率相关
伯努利分布 抛硬币就是伯努利实验
二项分布 二项分布就是多次伯努利实验
几何分布 在重复多次的伯努利试验中,试验进行到某种结果出现第一次为止
此时的试验总次数服从几何分布,如:射击,首次击中目标时的次数
泊松分布 泊松分布适合于描述单位时间内随机事件发生的次数
如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数
汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数等等
我们常常用三个标准差来衡量异常值
拿出小朋友班级的成绩表,每隔2分统计一下人数画出钟形
然后说这就是正态分布,大多数的人都集中在中间,只有少数特别好和不够好
拿出隔壁班的成绩表,让小朋友自己画画看,发现也是这样的现象
然后拿出班级的身高表,发现也是这个样子的
大部分人之间是没有太大差别的,只有少数人特别好和不够好
这是生活里普遍看到的现象,这就是正态分布
通常来说我们要获得一个总体的统计量,比如说均值、标准差等
是很难的一件事,所以我们通过选取样本来代表总体
用样本的特征来推断总体的特征,这些样本都是通过随机采集的每个样本被选去的概率是相等的
按经验来说样本的大小大于30以上,只有有足够多的样本,才能代替整体
达到 样本约等于 总体的效果,具有代表性,实验结果才足够可信
例如:我们知道抛一个正常硬币的正面概率是1/2,抛十次其实不一定是1/2
有很大的随机,但是抛十万次,肯定会逐渐收敛近似到1/2
那么需要知道多少样本才是最合适的呢? 这时候我们就要用到 置信区间置信水平
置信区间表示的是总体的参数有一定的概率落在一个范围内,而这个范围就是置信区间
置信水平就是上述所说的那个概率,通常我们都取 95%
美国大选中,川普的支持率为 55%,而置信水平 0.95 上的置信区间是 (50%,60%)
那么他的真实支持率落在 50% 和 60% 之区间的机率为 95%
因此他的真实支持率不足 50% 的可能性小于 2.5%(假设分布是对称的)