码迷,mamicode.com
首页 > 编程语言 > 详细

python学习13之数据泄密

时间:2019-07-17 21:55:52      阅读:176      评论:0      收藏:0      [点我收藏+]

标签:开始   span   style   科学   target   数据科学   导致   目标   科学家   

  在本教程中,您将了解什么是数据泄漏以及如何防止数据泄漏。如果你不知道如何防止它,泄漏将经常出现,它将破坏您的模型在微妙和危险的方式。因此,对于实践数据科学家来说,这是最重要的概念之一。

  1、摘要

    数据泄漏(或泄漏)发生在您的训练数据包含关于目标的信息时,但是当使用模型进行预测时,将无法获得类似的数据。

    这将导致训练集上的高性能(甚至可能是验证数据),但是模型在生产中表现很差。

    换句话说,泄漏导致模型看起来很精确,直到您开始使用模型做出决策,然后模型变得非常不准确。

      泄漏主要有两种类型:

        target leakage 和 train-test contamination.

  2、 

python学习13之数据泄密

标签:开始   span   style   科学   target   数据科学   导致   目标   科学家   

原文地址:https://www.cnblogs.com/fb1704011013/p/11203906.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!