背景随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应用到了机器学习和数据挖掘技术,例如个性化推荐、筛选排序、搜索排序...
分类:
其他好文 时间:
2015-12-27 06:19:37
阅读次数:
243
转自csdn,加上一些自己的理解。基于特征化工程进行用户特征化,结合相关的机器学习算法对业务进行挖掘建模,在广告的精准投放、预测、风控等领域中应用的非常广泛。无论是有监督的学习分类算法,还是无监督的聚类也罢,都需要建立特征向量,对特征进行预处理;其中对于有监督的训练时,还需要进行样本的筛选。本章节讲...
分类:
其他好文 时间:
2015-07-17 20:42:49
阅读次数:
1713
----------一个小的游戏体验,对于不太熟悉Xlab RF和GBRT同学们都叫参考,不喜勿喷,大神绕道,米姆达。。。。。----------6月初的时候LR 做到4.9后一直上不去,看群里火热的讨论RF。转而使用RF,几经折腾上手后。在当时的那批对LR来说非常好的特征处理下,结果F1仅仅有3....
分类:
其他好文 时间:
2015-07-02 12:01:06
阅读次数:
127
机器学习中的数据清洗与特征处理综述随着美团交易规模的逐步增大,积累下来的业务数据和交易数据越来越多,这些数据是美团做为一个团购平台最宝贵的财富。通过对这些数据的分析和挖掘,不仅能给美团业务发展方向提供决策支持,也为业务的迭代指明了方向。目前在美团的团购系统中大量地应用到了机器学习和数据挖掘技术,例如...
分类:
其他好文 时间:
2015-07-01 20:39:26
阅读次数:
115
摘要:有人推崇产品,有人推崇运营,也有人推崇战略…到底该推崇什么?李智勇系统地分析了这三者之间的思路,并引用黑格尔的一句话,给出了自己的看法:在尺度中已经蕴含本质,这在产品、运营、战略的侧重上体现的非常好。视野不拉升或者认知不深入时,就容易在盲人摸象层面上反复,看到微信火了,那就产品最重要,看到阿里...
分类:
其他好文 时间:
2015-03-07 00:58:43
阅读次数:
167
详解机器学习中的数据清洗与特征处理在海军陆战队服役超过 10 年后,我于去年 7 月份退役了。随后在 8 月份找到了一份赌场的工作做公关,到今年 2 月中旬的时候又被辞退了。到 5 月中旬的时候我在 DE 协会找到了一份临时的“初级用户体验工程师”工作,而到了 8 月底我则成了正式的“用户体验工程师...
分类:
其他好文 时间:
2015-02-12 00:37:36
阅读次数:
344
[本文链接:http://www.cnblogs.com/breezedeus/p/4109456.html,转载请注明出处] 我的博客主营地迁至github,欢迎朋友们有空去看看:https://breezedeus.github.io/,阅读体验好很多。 本文具体内容:https://breez...
分类:
其他好文 时间:
2014-11-19 23:53:35
阅读次数:
724
一、特征向量的归一化 首先需要明确,特征向量的归一化与特征向量的尺度归一化有本质的区别。特征向量的归一化是entrywise,也就是针对的每一个向量元素;特征向量的尺度归一化则是将向量变换到“长度”为1的空间上。 1、线性函数转换,表达式如下: y=(x-MinValue)/(MaxVal...
分类:
其他好文 时间:
2014-07-30 17:22:53
阅读次数:
157
处理多示例学习(MIL)特征(matlab)本文地址: http://blog.csdn.net/caroline_wendy多示例学习(MIL)的特征(features)包含, "示例编号+视频编号+标签+特征"的形式;需要组成多示例学习特定包的形式, 每一个元胞是一个多示例包, 后面一位是标签, 即"特征包+标签"的形式;代码:%author @ C.L.Wang
%time @ 2014.5...
分类:
其他好文 时间:
2014-06-05 02:55:23
阅读次数:
361