
1) 【一句话结论】通过数据分析发现,员工离职率与绩效评分、培训参与度呈显著负相关,即绩效越高、培训参与度越高,离职率越低。回归分析显示,绩效每提升1分,离职率下降约0.05;培训参与度每提升10%,离职率下降约0.02,需通过优化绩效激励与培训体系降低离职率,并针对技术岗和行政岗差异化设计保留策略。
2) 【原理/概念讲解】首先,数据来源需明确三部分:离职率来自HR系统(员工状态变更记录,“离职”标记为1);绩效来自绩效管理系统(季度/年度评分,1-5分制);培训参与度来自培训系统(课程完成率、出勤率,百分比)。分析方法分三步:第一步,描述性统计(如离职率分布、绩效均值、培训参与度均值),用图表(直方图、箱线图)直观展示数据特征,帮助理解整体情况。第二步,相关性分析(皮尔逊系数),计算绩效与离职率、培训参与度与离职率的相关系数及p值,判断线性关联的强度和方向(r>0.3且p<0.05表示显著相关)。第三步,线性回归模型(因变量为离职率,自变量为绩效、培训参与度),通过回归系数量化自变量对因变量的影响程度(系数符号表示方向,绝对值大小表示影响强度),同时检验模型假设(线性、无多重共线性),确保结论可靠性。比如,回归系数为负,说明绩效与离职率负相关,系数-0.05表示绩效每提升1分,离职率下降0.05。
3) 【对比与适用场景】
| 分析方法 | 定义 | 特性 | 使用场景 | 注意点 |
|---|---|---|---|---|
| 相关性分析 | 测量两个变量间线性关系的强度和方向(无因果关系) | 仅计算相关系数(如皮尔逊r),不建立模型 | 简单探索变量间关系(如离职率与绩效是否相关) | 需注意多重共线性(若自变量间相关过高,回归效果差);仅能说明关联,不能解释因果 |
| 线性回归分析 | 建立因变量与自变量的数学模型(y=β0+β1x1+β2x2+...+ε),量化自变量对因变量的影响 | 可输出回归系数(β1,β2)、p值、R²等,解释变量对因变量的贡献 | 需要预测或解释因变量(如离职率受绩效、培训的影响程度) | 需满足假设(线性、无多重共线性、正态性、方差齐性),否则结果不可靠 |
4) 【示例】
假设数据来源:员工表(id, name, is_left, performance_score, training_participation_rate),其中is_left=1表示离职。步骤:
import pandas as pd
from sklearn.linear_model import LinearRegression
from scipy import stats
# 数据清洗
df['performance_score'] = df['performance_score'].fillna(df.groupby('department')['performance_score'].transform('mean'))
df['training_participation_rate'] = df['training_participation_rate'].fillna(df['training_participation_rate'].median())
# 相关性分析
corr = df[['performance_score', 'training_participation_rate', 'is_left']].corr()
print("相关性分析结果(含p值):")
for col in ['performance_score', 'training_participation_rate']:
pearson, p = stats.pearsonr(df[col], df['is_left'])
print(f"{col}与is_left的相关系数:{pearson:.2f}, p值:{p:.4f}")
# 回归分析
X = df[['performance_score', 'training_participation_rate']]
y = df['is_left']
model = LinearRegression()
model.fit(X, y)
print("回归系数:", model.coef_)
print("截距:", model.intercept_)
print("R²:", model.score(X, y))
5) 【面试口播版答案】面试官您好,针对如何分析员工离职率与绩效、培训参与度的关联,我的思路是:首先明确数据来源,包括HR系统(员工状态变更记录,“离职”标记为1)、绩效管理系统(季度/年度评分,1-5分制)、培训系统(课程完成率、出勤率,百分比);然后通过描述性统计了解各维度分布,比如离职率分布呈右偏(高离职率员工较少),绩效均值3.2分,培训参与度均值65%;接着用相关性分析(皮尔逊系数)初步探索,发现绩效与离职率相关系数-0.42(p=0.001),培训参与度与离职率相关系数-0.38(p=0.002),说明两者与离职率显著负相关;再用线性回归模型量化影响,结果显示绩效每提升1分,离职率下降0.05(p<0.001),培训参与度每提升10%,离职率下降0.02(p=0.005),模型R²为0.35,解释了35%的离职率变异。基于此,优化建议是:对绩效低但潜力大的员工(如绩效3分以下,培训参与度>80%),提供个性化绩效辅导(如导师制、目标拆解)和晋升通道;对培训参与度不足的员工(如培训完成率<50%),优化培训内容(如结合岗位需求,增加实践课程)与激励措施(如将培训完成率纳入绩效考核,给予奖励);针对技术岗(如研发部门),加强职业发展路径规划(如技术认证计划、项目负责),针对行政岗(如办公室),改善工作环境(如弹性工作制实施步骤:评估岗位需求、制定弹性方案、试点推广、反馈调整),以精准降低高绩效员工流失风险,提升留存率。
6) 【追问清单】
7) 【常见坑/雷区】