S3. 预测模型
| 状态 | 完成进度 |
|---|---|
| 待完成 | 0% |
研究内容
本阶段将基于筛选出的关键变量构建ROP发病风险预测模型。
特征工程
- 特征重要性排序
- 使用随机森林、XGBoost、CNB三种方法筛选特征
- 取三方法共有变量作为最终输入变量
模型构建
- 随机森林(Random Forest, RF)
- 极端梯度提升树(Extreme Gradient Boosting, XGBoost)
- 补朴素贝叶斯分类算法(Complement Naive Bayes, CNB)
模型评估
- 使用80%数据作为训练集,20%作为验证集
- 五折交叉验证
- 评价指标:AUC、灵敏度、特异度、准确率等
最优模型选择
- 比较三种模型的性能
- 选择最优模型
- 模型解释与临床意义分析
本阶段工作尚未开始...