Bagging分为两种:Bagging和Pasting,前者是概率中的放回随机采样,后者是不放回随机采样;默认是放回采样随机;设置bootstrap=False即设置为不放回采样;默认bootstrap=True是放回采样。 对于Bagging(放回采样)有了一个问题,就是总有约37%的样本将不会被... ...
分类:
其他好文 时间:
2018-10-28 12:17:49
阅读次数:
420
1. 问题 给定一系列不重叠的矩形,在这些矩形中随机采样一个整数点。 2. 思路 (1)一个矩形的可采样点个数就相当于它的面积,可以先依次对每个矩形的面积累加存起来(相当于概率分布中的分布累积函数CDF,Cumulative Distribution Function)。 (2)从 [1, 总面积] ...
分类:
移动开发 时间:
2018-10-27 14:51:52
阅读次数:
220
RRT是一种多维空间中有效率的规划方法。它以一个初始点作为根节点,通过随机采样增加叶子节点的方式,生成一个随机扩展树,当随机树中的叶子节点包含了目标点或进入了目标区域,便可以在随机树中找到一条由从初始点到目标点的路径。RRT方法是概率完备且不最优的。 function BuildRRT(qinit, ...
随机采样一致分割法,从点云中分割出线、面等几何元素 (1) SACMODEL_PLANE(三维平面) used to determine plane models. The four coefficients of the plane are itsHessian Normal form: [nor ...
分类:
其他好文 时间:
2018-05-02 02:35:19
阅读次数:
489
作为一种随机采样方法,马尔科夫链蒙特卡罗(Markov Chain Monte Carlo,以下简称MCMC)在机器学习,深度学习以及自然语言处理等领域都有广泛的应用,是很多复杂算法求解的基础。比如我们前面讲到的分解机(Factorization Machines)推荐算法,还有前面讲到的受限玻尔兹 ...
分类:
其他好文 时间:
2018-03-04 15:59:00
阅读次数:
217
这一周的主体是调参。 1. 超参数:No. 1最重要,No. 2其次,No. 3其次次。 No. 1学习率α:最重要的参数。在log取值空间随机采样。例如取值范围是[0.001, 1],r = -4*np.random.rand(), α = 10r。 No. 2 Momentum β:0.9是个不 ...
分类:
其他好文 时间:
2017-11-11 15:27:39
阅读次数:
285
最近在个性化推荐系统的优化过程中遇到一些问题,大致描述如下:目前在我们的推荐系统中,各个推荐策略召回的item相对较为固定,这样就会导致一些问题,用户在多个推荐场景(如果多个推荐场景下使用了相同的召回策略)、多次请求时得到的结果也较为固定,对流量的利用效率会有所降低;尤其对于行为较少的用户,用来作为 ...
分类:
编程语言 时间:
2017-10-27 19:08:25
阅读次数:
224
本文是对参考资料中多篇关于sampling的内容进行总结+搬运,方便以后自己翻阅。其实参考资料中的资料写的比我好,大家可以看一下!好东西多分享!PRML的第11章也是sampling,有时间后面写到PRML的笔记中去:) 背景 随机模拟也可以叫做蒙特卡罗模拟(Monte Carlo Simulati ...
分类:
其他好文 时间:
2017-10-27 15:50:56
阅读次数:
199
路径规划作为机器人完成各种任务的基础,一直是研究的热点。研究人员提出了许多规划方法:如人工势场法、单元分解法、随机路标图(PRM)法、快速搜索树(RRT)法等。传统的人工势场、单元分解法需要对空间中的障碍物进行精确建模,当环境中的障碍物较为复杂时,将导致规划算法计算量较大。基于随机采样技术的PRM法 ...
分类:
编程语言 时间:
2017-09-05 19:12:58
阅读次数:
360
Pandas是一个Python库,旨在通过“标记”和“关系”数据以完成数据整理工作,库中有两个主要的数据结构Series和DataFrame 本文主要说明完成数据整理的几大步骤: 1.数据来源 1)加载数据 2)随机采样 2.数据清洗 0)数据统计(贯穿整个过程) 1)处理缺失值 2)层次化索引 3 ...
分类:
其他好文 时间:
2017-08-20 17:02:59
阅读次数:
300