终于看完第十章了,胜利的曙光已经初现!再接再励,下周争取结束公共基础课,迈向专业课!
统计技术基础:
随机变量的基本概念:
事件区分为3种:
必然事件:一定条件下必然出现的事件,用U表示;
不可能事件:一定条件下不可能出现的事件,用V表示;
随机事件:对一次试验可能出现也可能不出现,而在多次重复试验中却具有某种规律的事件
概率是一个确定的数,是客观存在的,与每次试验无关;
随机事件概率介于0-1之间;
必然事件概率等于1;
不可能事件概率等于0
互斥事件、独立事件(不影响)、小概率事件(几乎是不会发生的)
随机变量定义:取某一值或或某一范围取一个量或事件
按照随机变量所取数值的分布情况不同,可分为两种:连续性和离散型
随机变量的数字特征:包括数学期望、方差、矩、协方差
数学期望-是一个平均的大约数值,分为离散型和连续性;是以概率为权的加权平均值
方差=标准差的平方
协方差(略,教材)
常见随机变量的概率分布(三种分布的特点):
均匀分布:分为离散型和连续性,平均值(a+b)/2,方差(b-a)^2/12
正太分布:(教材和安慧讲义,大量样本)
具有对称性,正太曲线呈钟型,两头低,中间高,左右对称;
标准差越小,曲线越陡峭(精度高,好);标准差越大,曲线越扁平(精度差,不好)-越陡越好,小陡大扁
曲线与横州间面积总等于1
N(0,1)的概念:N(数学期望,方差)
正太分布图特点:单峰性(绝对值小的误差比绝对值大的误差,出现机会多)、对称性(绝对值相等的正负误差出现的概率相等)、有界性(有限检测中,偶然误差绝对值不会超出一定的界限)
抵偿性(重要):是偶然误差最本质的统计特性,凡有抵偿性都可以按偶然误差处理(选择题)
相同条件下,对同一量检测,偶然误差平均值随测量次数无限增加,趋于零
偶尔误差符合正太分布
t型分布:两个样本均值差异进行显著性测试;
n越大,越趋近于标准正太分布曲线-N(0,1)
(所以,标准正太分布是t分布的特殊形式)
总体(全体)、样本(子集)、样本空间(所有可能结果的集合)
算术平均值:和除以总数
相关系数:两个标准化随机变量的乘积均值
概率计算规则:独立事件概率相乘+互斥事件概率相加(独立相乘,互斥相加)
概率的大小是固定的,不是变动的,只是随着重复次数增多呈现规律性变化
t分布有一个拐点
常用数理统计工具(调直分因):
调查表、分层法、因果图、直方图
调查表:
不合格项目+工序质量特性分布+调查缺陷位置
分层法:按数据的来源、性质、使用目的、要求进行分类、总结、分析
分层法是数据分析的一项基础工作
因果图(鱼骨、树枝、特征要因图):
组成部分-主干、大枝、小枝
作用:找出产生质量问题的原因
直方图:
作用:分析掌握质量数据分布和估算工序不合格品率
分类:频率和频数,频数使用较多
(多选)判断质量分布状态:
正常:中高边低,对称,正太分布
孤岛:材料发生变化,测试有误差
双峰:数据来自两个不同分布的总体
折齿:凹凸不平,数据分组太多,测量仪器误差过大
陡壁:一边倾斜,数据搜集不正常
偏态:界限限制
平顶:数据源自多个分布总体,或质量在某个区间均匀变化
(口诀:质量正常看直方,分析原因看鱼骨)
抽样技术的应用:
抽样方案:确定样本大小和判断数组等
质量检验:分为全数检验和抽样检验
抽样检验-从一批产品中随机抽出少量单个产品检验
全数检验可靠性好,抽样检验以数理统计为依据
(多选)影响检验可靠性的因素:
质量检验手段-可靠性
抽样检验方法、方案-科学性
抽样检验类型:简单随机抽样、系统抽样,等等(略)
简单随机抽样:总体中每个样本被抽取的概率相等
按样品是否放回,又分为重复抽样(重复样本,概率分布不同;抽出又放回去)和不重复抽样(无重复样本,概率分布相同;抽出不放回去,其余的继续抽)
按抽样方法分为:抽签法(抽签摇号,样品数量小)和随机数法(样品数量大,对样品编号,抽取特定的号)
系统抽样:按一定顺序排列,随机抽取,然后确定样品抽样。
分为等距抽样(每间隔K个样本)+定位抽样(流水线中的固定位置或时间抽取)
分层抽样:样本抽自不同层,每层至少有一个抽样
整群抽样:总体分成若干群,随机选群
多阶段抽样:类似节目海选,初阶段、次阶段
网友评论