码迷,mamicode.com
首页 > 其他好文 > 详细

2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案

时间:2018-05-25 16:52:07      阅读:563      评论:0      收藏:0      [点我收藏+]

标签:机器学习

技术分享图片
1、数据需要清洗
注意在读取csv格式文件之后需要对空值进行补全类似如下代码:
技术分享图片
2、特征工程
此处选取以下几个指标作为分类和回归的特征
技术分享图片
3、深度模型失效
通过日志发现 正样本即Y>0的样本所占比例在14%左右,深度分类模型可能将所有的数据分为Y=0导致没有数据进行回归

所以此处采用传统方法 使用SVM 方法和 决策树进行分类
进过测试发现SVM效果较好

4、正样本过少
考虑将回归模型改为广义线性回归 放弃深度模型

2018平安产险数据建模大赛 驾驶行为预测驾驶风险中遇到的问题及解决方案

标签:机器学习

原文地址:http://blog.51cto.com/yixianwei/2120336

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!