码迷,mamicode.com
首页 > 其他好文 > 详细

携程一面凉经

时间:2019-09-17 22:48:24      阅读:117      评论:0      收藏:0      [点我收藏+]

标签:ble   应该   filter   数学   优劣   特征   相关性   嵌入   背景   

1 介绍一下项目:项目背景,使用的方法

1.1 特征组合如何组合的

1.2 如何选择的特征,GBDT如何选择特征?(没懂什么意思,gbdt训练的时候应该是用的所有的特征,为什么还会有特征选择)

1.3 介绍一下blending方法。

1.4 介绍一下所有的模型各自使用的特征?

2 介绍一下特征提取的方法

3 如何对大量的特征进行特征选择?(只答上来一个方面)

  • Filter(过滤法):按照发散性或者相关性对各个特征进行评分,设定阈值或者待选择阈值的个数,选择特征。
  • Wrapper(包装法):根据目标函数(通常是预测效果),每次选择若干特征,或者排除若干特征。
  • Embedded(嵌入法):先使用某些机器学习的算法和模型进行训练,得到各个特征的权值系数,根据系数从大到小选择特征。类似于Filter方法,但是是通过训练来确定特征的优劣。

 

4 由于本科是学数学的,有学统计相关的知识,如果特征之间存在多重共线性,会对lr造成什么影响,如何消除这种影响(从理论分析),没答上来

5 知道项目使用python写的,就好像没有什么兴趣了

6 目前企业上用的较多的还是sql,但是简历上没写,也就没问,就说了一下。

7 介绍一下svm的基本原理,为什么转化成对偶问题? 一方面是为了降维,另一方面也是为了引入核函数。

总体:太紧张了,很多东西都忘了,导致面试效果不佳

 

携程一面凉经

标签:ble   应该   filter   数学   优劣   特征   相关性   嵌入   背景   

原文地址:https://www.cnblogs.com/wzhao-cn/p/11537458.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!