当前位置 博文首页 > Weiyaner的博客:机器学习项目实战:基于随机森林进行心脏病分类

    Weiyaner的博客:机器学习项目实战:基于随机森林进行心脏病分类

    作者:[db:作者] 时间:2021-06-21 18:38

    ??本项目是Kaggle上面的一个经典竞赛题,心脏病分类问题,题目链接在这里. 主要基于随机森林的bagging集成学习框架,通过13个生理特征数据,实现对心脏病分类的预测。

    ??由于自己想要在这个项目更多的学习到模型解释方面的内容,所以对于模型精度没有过多的在意和调参。模型解释主要用了eli5,shap和部分依赖图。

    ??下面是完整的代码和运行结果。在python3.7环境下可以运行。

    文章目录

    • 1 导入各种模块
    • 2 导入数据
      • 2.1 修改特征名称
      • 2.2 特征说明
      • 2.3 特征属性说明
    • 3 建模
      • 3.1 模型选择
      • 3.2 随机森林绘图
    • 4 模型评价
      • 4.1 混淆矩阵
      • 4.2 精确率,召回率,准确率
      • 4.3 ROC和AUC
    • 5 模型解释
      • 5.1 基于eli5进行特征重要度排序
      • 5.2 部份依赖图
      • 5.3 shap值