## 题目 ■ 空集属于任何一bai个非空集du合的子集 ■ ...
分类:
其他好文 时间:
2020-11-13 12:51:23
阅读次数:
6
蓄水池算法 分析一下蓄水池算法在抽奖中的应用。 应用场合 考虑参加抽奖的用户基数很大且未知,也可以说是这个基数可能会动态地增加,那么在这种情况下,固定选取k个人中奖,如何保证实时参加抽奖的n个用户中每个人中奖的概率为k/n呢?(为何不在最终结果n出来时再来随机抽取k个样本,保证概率为k/n呢?其实这 ...
分类:
编程语言 时间:
2020-11-12 13:29:05
阅读次数:
7
泊松分布的定义 设随机变量 X 所有可能取的值为 0 , 1, 2, ... , 且取各个值的概率为: $$P(X = k) = e^{-\lambda}\displaystyle\frac{\lambda^k}{k!}, \ k = 0, 1, 2,..., $$ 其中,\(\lambda > 0 ...
分类:
其他好文 时间:
2020-11-11 16:25:31
阅读次数:
6
做产品,要经常使用自家的产品,要站在用户的角度思考,是不是理所当然?看似简单,要做好,并不容易。作为骑车上班族的一员,自认为算是滴滴青桔的典型客户,对于滴滴青桔“车损”的流程,有槽要吐。先看一下,滴滴青桔,车损流程:(1)用户:扫码开锁(线上操作);(2)用户:尝试骑行,发现车损(线下);(3)用户:关锁,准备换一辆(线下);别扭的地方来了:(4)系统提醒:扣费;画外音:不爽,车还没骑,就扣费了。
分类:
其他好文 时间:
2020-11-08 17:31:04
阅读次数:
20
股票量化交易 金融市场基础知识 1.量化交易简介 1.1定义 量化交易(量化投资)是指借助现代统计学和数字(机器学习)的方法,利用计算机技术来进行交易的证券投资方式 量化交易从庞大的数据中海选出能带来超额收益的多种大概率事件指定策略,用数量模型验证及固化这些规律和策略,然后严格执行已固化的策略来指导 ...
分类:
其他好文 时间:
2020-11-08 17:20:28
阅读次数:
20
03:47ptz camera 13504-3 00:54tracking ball 8494-2 01:53perceptual_camera 4324-2 00:33eye_tracking 4094-2 01:16whiteborad testing 2254-2 00:45pose demo ...
分类:
其他好文 时间:
2020-11-07 17:05:08
阅读次数:
20
每到节假日,各大购物网站平台都会发放各种“秒杀”优惠券,从一两块到两三百甚至“零元购”的都有,但问题是,自己永远抢不到。不值钱的优惠券一堆人推荐,真正好的优惠券你就得花时间去抢,而抢到的概率几乎为零。如下图:对于商家来说,初心是好的,限时秒杀优惠券则是通过优惠营造稀缺氛围,节日促销的时候回馈老用户,以让利获得更多销量,用户购买的开心,口碑传播动力就越大,互利共赢的买卖。但最终结果呢?给消费者一种被
分类:
编程语言 时间:
2020-11-06 01:35:41
阅读次数:
16
C51算法理论上用Wasserstein度量衡量两个累积分布函数间的距离证明了价值分布的可行性,但在实际算法中用KL散度对离散支持的概率进行拟合,不能作用于累积分布函数,不能保证Bellman更新收敛;且C51算法使用价值分布的若干个固定离散支持,通过调整它们的概率来构建价值分布。 而分位数回归(q ...
分类:
其他好文 时间:
2020-11-06 01:13:28
阅读次数:
22
传统的强化学习算法具有很强的决策能力,但难以用于高维空间任务中,需要结合深度学习的高感知能力,因此延展出深度强化学习,最经典的就是DQN(Deep Q-Learning)。 DQN 2013 DQN的主要思想是训练CNN拟合出Q-Learning算法,以此让智能体在复杂的RL环境中从原始视频数据学到 ...
分类:
其他好文 时间:
2020-11-06 01:12:42
阅读次数:
18
本文主要研究了分布式强化学习,利用价值分布(value distribution)的思想,求出回报$Z$的概率分布,从而取代期望值(即$Q$值)。 Q-Learning Q-Learning的目标是近似Q函数,即在策略$\pi$下回报$Z_t$的期望值: \(Q^{\pi}(s,a)=\mathbb ...
分类:
其他好文 时间:
2020-11-06 01:12:19
阅读次数:
18