
在光学镜头检测中,处理MTF值异常值需结合统计方法(如3σ或IQR)检测异常,再通过数据验证与业务规则判断(如测量误差剔除、真实缺陷标记),最终避免误判良率。
异常值是指数据集中偏离其他观测值较远的数值。数据清洗是去除或修正这些异常值的过程。
| 方法 | 定义 | 特性 | 使用场景 | 注意点 |
|---|---|---|---|---|
| 3σ原则 | 正态分布下,数据点在μ±3σ外的视为异常 | 假设数据正态分布,对异常敏感 | 适合正态分布的连续数据(如MTF值,若测量误差服从正态) | 若数据偏态,结果可能不准确 |
| IQR方法 | 基于四分位距,异常值在Q1-1.5IQR或Q3+1.5IQR外 | 不依赖分布,对异常更稳健 | 适合非正态分布或小样本数据 | 对极端值敏感度较低 |
伪代码处理MTF值异常(以IQR方法为例):
def detect_mtf_outliers(mtf_values):
q1 = np.percentile(mtf_values, 25) # 下四分位数
q3 = np.percentile(mtf_values, 75) # 上四分位数
iqr = q3 - q1
lower_bound = q1 - 1.5 * iqr
upper_bound = q3 + 1.5 * iqr
outliers = [val for val in mtf_values if val < lower_bound or val > upper_bound]
return outliers
# 示例数据(假设0.72为异常值)
mtf_data = [0.8, 0.85, 0.82, 0.78, 0.9, 0.75, 0.88, 0.72]
outliers = detect_mtf_outliers(mtf_data)
print("检测到的异常值:", outliers) # 输出: [0.72]
处理步骤:
若检测到异常值(如0.72),先核查测量设备是否正常(如传感器故障),若为测量误差则剔除该数据;若为镜头真实缺陷(如光学元件划痕),则标记为次品,但不直接剔除数据,而是记录缺陷类型,用于良率统计时区分“测量误差”和“真实缺陷”。
(约90秒)
“面试官您好,处理MTF值异常值的核心思路是先通过统计方法检测异常,再结合业务逻辑判断处理方式,避免误判良率。具体来说,我会采用3σ原则或IQR方法检测异常。比如3σ原则,假设MTF值服从正态分布,计算均值和标准差,若某个镜头的MTF值低于均值-3σ或高于均值+3σ,则标记为异常;IQR方法则计算四分位距,异常值在Q1-1.5IQR或Q3+1.5IQR之外。检测到异常值后,首先验证数据来源,比如检查测量设备是否正常,若为测量误差则剔除该数据;若为镜头真实缺陷(如光学元件瑕疵),则标记为次品,但不直接剔除数据,而是记录缺陷类型,用于良率统计时区分。这样既能去除测量错误导致的误判,又能保留真实缺陷的信息,最终确保良率计算的准确性。”