Skip to content

OnePlusRay/flood_feature_analysis

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

洪水灾害预测问题

数据预处理

数据集介绍

异常值和缺失值处理

探索性数据分析

特征相关性分析(哪些特征对洪水发生概率的影响更大?)

原因和建议

自变量之间的关系探索

建模与预测

简单线性回归

机器学习建模(如xgboost)

我的任务

一、数据集和背景介绍

  1. 问题背景
    • 洪水预测
  2. 数据集介绍(各个变量的形式和含义)
    • 自变量全部都是0-15的评分,是离散变量
    • 因变量是洪水发生的概率,是连续的0-1之间的概率

二、描述性统计与可视化分析

  1. 各个自变量和因变量的分布(直方图和箱线图)
    • 所有自变量的分布都非常接近,大致呈正态分布,密度最高的位置集中在分数为5左右的位置
    • 偏度大都处于0.4-0.5之间,轻微的右偏,存在少量的10-15分的数据
  2. 这些分布的解释,为什么如此均匀?
    • 数据集已经经过一定的标准化处理
    • 数据的来源机制可能非常接近(部分数据由AI生成)

三、探索性数据分析

  1. 探索城市化和其他变量之间的关系
    • 结果:城市化和其他变量之间几乎没有相关性(从散点图可以看出来)
    • 解释:可能是当地的城市化与其他方面相对独立发展,因此相关性较低

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published