一、什么是类不平衡 在分类中经常会遇到:某些类别数据特别多,某类或者几类数据特别少。如二分类中,一种类别(反例)数据特别多,另一种类别(正例)数据少的可怜。如银行欺诈问题,客户流失问题,电力盗窃以及罕见疾病识别等都存在着数据类别不均衡的情况。 二、为什么要对类不平衡进行特殊处理 传统的分类算法旨在最 ...
分类:
其他好文 时间:
2020-01-02 16:04:53
阅读次数:
484
防止支付处理中的欺诈的区块链如今,犯罪分子正在借助新时代技术改进其欺骗手段。因此,重要的是利用一种能够抵制和应对任何骗局的技术。众所周知,区块链技术可以解决基于信任的效率低下问题,实际上可以使之成为可能。 使区块链在其他安全解决方案中脱颖而出的是去中心化。区块链在全球多个系统中记录交易数据,而独立于 ...
分类:
其他好文 时间:
2019-12-14 19:13:46
阅读次数:
92
《斯坦福2019全球AI报告》:每天2亿美元投入AI领域,1/10砸向自动驾驶《斯坦福2019全球AI报告》显示,2019年,全球私有AI投资超过700亿美元,相当于每天2亿多美元砸向AI领域。此外,自动驾驶汽车在过去一年中获得了全球投资的最大份额(77亿美元),其次是AI医疗(47亿美元)、面部识别(47亿美元)、视频内容(36亿美元)和欺诈检测和金融(31亿美元)来源:http://finan
分类:
其他好文 时间:
2019-12-14 00:03:21
阅读次数:
301
主要内容: XGBoost算法的介绍 XGBoost算法的损失函数 XGBoost函数介绍 算法的应用实战——信用卡欺诈行为的识别 1.XGBoost算法的介绍 XGBoost是由传统的GBDT模型发展而来的,GBDT模型在求解最优化问题时应用了一阶导技术,而XGBoost则使用损失函数的一阶和二阶 ...
分类:
数据库 时间:
2019-11-01 20:53:31
阅读次数:
158
主要内容: 非平衡数据的特征 SMOTE算法的思想及步骤 SMOTE算法的手工案例 SMOTE算法的函数介绍 1.非平衡数据的特征 在实际应用中,类别型的因变量可能存在严重的偏倚,即类别之间的比例严重失调。如欺诈问题中,欺诈类观测在样本集中毕竟占少数;客户流失问题中,忠实的客户往往也是占很少一部分; ...
分类:
编程语言 时间:
2019-10-31 22:10:26
阅读次数:
123
1.事件回顾: 2019.10.29日上线反欺诈优化功能,10月30日上午收到异常监控报警,随后业务反馈属地案调和总部案调无法正常提交。经核实,是因为属地案调和总部案调提交时,由于没有验证案调是否为总部、是否为补充调查。导致调用了发往属地代码,引发系统异常。BUG于10月30日中午一点半处理完毕。 ...
分类:
其他好文 时间:
2019-10-30 22:39:12
阅读次数:
140
++++ 介绍 在这篇博客中我们将讲解Logistic Regression的基本概念,以及它能帮我们解决什么样的问题。 Logistic Regression 是一个分类算法,将用于观察的值分配给离散的数据集(set of classes),例如检测邮件是否是垃圾邮件,网上交易是否包含欺诈,恶性或 ...
分类:
其他好文 时间:
2019-10-17 13:36:38
阅读次数:
81
“游击六原则:(1)以小的牺牲换取大的胜利; (2)不在消灭敌人,而在消磨敌人; (3)支配敌人,掌握主动; (4)积极进攻,绝少防御; (5)飘忽不 定,出没无常; (6)越是敌人后方,越是容易成功。 作战要领: (1)反敌人之道而行,并竭尽欺诈之能事,敌进我退,敌集我散,敌大我避,敌小 我欺,避 ...
分类:
其他好文 时间:
2019-09-26 11:38:11
阅读次数:
113
本文通过利用信用卡的历史交易数据进行机器学习,构建信用卡反欺诈预测模型,对客户信用卡盗刷进行预测 一、项目背景 对信用卡盗刷事情进行预测对于挽救客户、银行损失意义十分重大,此项目数据集来源于Kaggle,数据集包含由欧洲持卡人于2013年9月使用信用卡进行交的数据。此数据集显示两天内发生的交易,其中 ...
分类:
其他好文 时间:
2019-08-28 01:34:03
阅读次数:
309
风控的模式: 1.用户发起一笔借款,跑一次风控。 2.用户发起申请后,跑一次风控(反欺诈策略+反欺诈模型+信用模型+授信模型),给用户授信一次,在一段时间之内(比如两年)用户再过来申请借款, 都不会再重新跑风控,直到放款机构设置的重新授信时间点,才会重新跑风控和授信模型。 纯线上信贷业务合作模式: ...
分类:
其他好文 时间:
2019-08-24 20:19:00
阅读次数:
93