S3. 预测模型

状态 完成进度
待完成 0%

研究内容

本阶段将基于筛选出的关键变量构建ROP发病风险预测模型。

特征工程

  • 特征重要性排序
  • 使用随机森林、XGBoost、CNB三种方法筛选特征
  • 取三方法共有变量作为最终输入变量

模型构建

  • 随机森林(Random Forest, RF)
  • 极端梯度提升树(Extreme Gradient Boosting, XGBoost)
  • 补朴素贝叶斯分类算法(Complement Naive Bayes, CNB)

模型评估

  • 使用80%数据作为训练集,20%作为验证集
  • 五折交叉验证
  • 评价指标:AUC、灵敏度、特异度、准确率等

最优模型选择

  • 比较三种模型的性能
  • 选择最优模型
  • 模型解释与临床意义分析

本阶段工作尚未开始...