二.等价检验与标准 t 检验在两个方面存在重大区别。
目前,各指导原则均建议采用预设接受标准进行工艺变更前后关键质量属性的可比性研究,但是对于采用的统计学方法,接受标准设定依据,实验设计等均未做明确要求。T 检验法是最常用的比较两组数据均数的方法,但是在实际应用过程中,当检验结果拒绝零假设时,推断2个总体不等,但是未必2个总体不等效,因为2个总体不等的程度可能在允许的差异范围内; 相反,当检验结果不能拒绝零假设时,只能证明拒绝零假设的证据不足,不能确定二者一定相等。因此 T 检验法不适用于工艺变更前后可比性研究。
举证责任落在证明等价上面在均值的标准 t 检验中,原假设假定某个总体均值与目标值或另一个总体均值相同。因此,举证责任落在证明该均值与目标值或另一个总体均值不同上面。在等价检验中,原假设假定某个总体均值与目标值或另一个总体均值不同。因此,举证责任落在证明该均值与目标值或另一个总体均值相同上面。
例如,考虑双样本 t 检验与双样本等价检验之间的差异。可以使用双样本 t 检验来检验两个总体的均值是否不同。对于该检验进行如下假设:
原假设 (H0):两个总体的均值相同。
备择假设 (H1):两个总体的均值不同。
如果检验的 p 值小于 alpha (α),则您否定原假设并得出均值不同的结论。
相反,可以使用双样本等价检验来检验两个总体的均值是否等价。检验的等价是由您指定的值范围(又称为等价区间EAC)定义的。对于该检验进行如下假设:
原假设 (H0):均值之间的差值位于等价区间之外。均值不等价。
备择假设 (H1):均值之间的差值位于等价区间内。均值等价。
如果检验的 p 值小于 α,则您否定原假设并得出均值等价的结论。
用户为差值定义可接受值的范围
从功能和实用意义上来讲,产品之间存在微小差异并不总是十分重要。例如,在 200 mg 的药物剂量中,相差 1 mg 不会产生任何实际效应。当您使用等价检验时,您必须输入等价限值,以指示差值必须为多大才被认为是重要的。位于等价限值范围内的较小差值被视为不重要。如此一来,等价检验便可评估总体均值差值的实际显著性和统计显著性。
要在等价检验和标准 t 检验之间进行选择,请考虑您希望证明或说明的内容。如果您希望证明两个均值相等或者证明均值等于目标值,而且您可以确切地定义在所属领域中属于重要差值的差值大小,则您可能希望使用等价检验,而不是标准 t 检验。
三、等价检验的分类:
1. 单样本等价检验
对产品或过程的均值与标准进行比较。在 Minitab 中,选择统计 > 等价检验 > 单样本。
例如,一名工程师用一种新方法来进行铝箔袋密封试验。该名工程师想要确保打开铝箔袋所需的力在目标值 4.2 N(牛顿)的 10% 范围内。工程师收集了 28 个用新方法密封的袋子,并检验打开这些袋子所需的力。
2. 双样本等价检验
使用两个相互依存的样本比较两个产品均值或两个过程均值。在 Minitab 中,选择统计 > 等价检验 > 双样本。
例如,一家特医食品公司设计了一个新配方。分析人员想要确保折扣特医食品的蛋白质含量与原始特医的蛋白质含量相同。他们测量了这两个配方中每 100 克特医食品中的蛋白质含量,并检验它们在 ± 0.5 克的范围内是否等价。
3. 使用配对数据的等价检验
在配对观测值后(如从同一个人或同一个部件获取两次治疗或处理的测量值后),比较两个产品均值或两个过程均值。在 Minitab 中,选择统计 > 等价检验 > 配对。
例如,一家护目镜公司针对护目镜开发了一种新的清洁液。分析人员想要确认新款清洁液的清洁效果与原有的清洁液的清洁效果是否一样好。分析人员让 14 名参与者配戴一天护目镜后清洁镜片。每名参与者都用新清洁液清洁一个镜片,用原有配方清洁液清洁另一个镜片。通过使用配对观测值,分析人员减少了由参与者之间的差异所导致的变异量。最后,分析人员通过测量镜片上的液滴接触角度来评估每个镜片的清洁程度。液接触角度会受到镜片薄膜或沉积物的影响。
4.2x2 交叉设计的等价检验
比较 2x2 交叉设计中数据的处理均值。2x2 交叉研究通常用于检验各个参与者对于两种不同药物是否能体验到等价效果。在 Minitab 中,选择统计 > 等价检验 > 2x2 交叉设计。
例如,一家制药公司的分析人员想要确定其普通抗酸药与名牌抗酸药是否等价。有两组参与者,在前 5 天他们服用一种抗酸药,接着是两周的清除期,在之后的 5 天服用另一种抗酸药。分析人员在每次处理的最后一天测量胃部 pH 值。由于 pH 值越低酸性越大,因此值越大表示药效越好。如果检验 pH 值在参考 pH 值的 10% 范围内,分析人员会将这两种抗酸药视为等价。
为帮助审核人员更快处理,请填写举报原因:
为帮助审核人员更快处理,请填写举报原因: