上篇文章 强化学习——时序差分 (TD) SARSA and Q-Learning 我们介绍了时序差分TD算法解决强化学习的评估和控制问题,TD对比MC有很多优势,比如TD有更低方差,可以学习不完整的序列。所以我们可以在策略控制循环中使用TD来代替MC。优于TD算法的诸多优点,因此现在主流的强化学习 ...
分类:
编程语言 时间:
2020-08-10 15:45:57
阅读次数:
77
题意 给三个整数 \(n,k,m\) 和 \(m\) 个限制 \((l_i,r_i,x_i)\),求有多少个长度为 \(n\) 的序列 \(a\) 满足: 对于 $1\leq i\leq n$ 有 $0\leq a_i<2^k$ 对于 $1\leq i\leq m$ 有 \(a_{l_i} \ope ...
分类:
其他好文 时间:
2020-08-10 14:31:19
阅读次数:
64
Candies POJ - 3159 题意: 给班级小朋友分糖果,要求满足以下条件:给定$m$组关系$A,B,c$,表示$B$得到的糖果比$A$得到的不多于$c$个,即$candy[B]-candy[A]≤c$,求$1$号小朋友与$N$号小朋友糖果数之差的最大值。 思路: 线性差分约束。对式子$ca ...
分类:
其他好文 时间:
2020-07-29 10:05:28
阅读次数:
64
AcWing 797. 差分 #include <bits/stdc++.h> using namespace std; const int N=1e6+10; int a[N],b[N]; void insert(int l,int r,int c){ b[l]+=c; b[r+1]-=c; } ...
AcWing 798. 差分矩阵 #include <bits/stdc++.h> using namespace std; const int N=1e3+10; int a[N][N],b[N][N]; void insert(int x1,int y1,int x2,int y2,int c) ...
题目非常得简洁明了,差分约束的裸题,甚至连不等式都给你写出来了 没什么好分析的,直接看不等式建立方程(这里把$Ti$和$Tj$都表示为$i$和$j$) 因为求的应该是最早的开始时间,我们应该转化为$≥$,然后跑最长路求解 \(i-j \leq b\) \(-j \leq b-i\) \(j \geq ...
分类:
其他好文 时间:
2020-07-28 09:57:56
阅读次数:
70
###思路 这个题是近似于差分约束的模板题(稍微难一点点),差分约束我之前好像听yt神仙讲过。 不懂差分约束的自行百度。 这个题需要注意的就是在建立超级原点的时候要倒叙建边(理论上正倒序都可以,但是这个题正序过不了应该是数据造得比较奇特)。 update:2020.7.26 正序这个题是可以正常过的 ...
分类:
其他好文 时间:
2020-07-26 23:20:55
阅读次数:
100
Magic Stones 题解:here 每一次变换都会导致差分数组的两个相邻元素位置交换,但是大小是不变的; 要保证两个数组相等,所有的差分数组都是要一样的,包括第一个,也就是第一个数要相等 这里第一个数和最后一个数是不变的,所以题目正解为:比较这两个差分数组是否相同,如果相同,再看c数组和t数组 ...
分类:
其他好文 时间:
2020-07-26 23:03:30
阅读次数:
71
我们用一张图来引入QoS,这张图显示出QoS的大致框架及逻辑。 QoS目前常用于差分服务模型中,那么QoS到底有几个模型呢? ① 尽力而为模型——简单粗暴,不区别对待,谁先来就帮谁转发。 ② 综合服务模型——利用RSVP协议(资源预留协议)预留出例如一个10M的带宽给客户的特殊流量单独使用。优点是特 ...
分类:
其他好文 时间:
2020-07-26 01:55:27
阅读次数:
92
http://judge.u-aizu.ac.jp/onlinejudge/description.jsp?id=2969 题意: \(Question1:\) 求覆盖一段区间所需的最少区间数量。 \(Question2:\) 求最少的区间数,使任意取区间都能覆盖整段区间 #贪心/差分 ###吐槽: ...
分类:
其他好文 时间:
2020-07-26 00:17:31
阅读次数:
73