标签:mda 能力 观察 and 实现 探索 col 需要 focus
有这样一种situation——我们需要根据此时的环境做出相应的行动,aim在于实现预期目标。
situation可以这样表示:
for(iter=START;iter!=END;iter++) #某个时间段 f(observation) #根据此刻观察到的环境采取相应行为
f(x)指的是从“此刻观察到的环境”到“采取某个特定的行为”的映射。
需要解决的问题是:找到最好的f(x)——“最好”指让我们最快实现目标。
标签:mda 能力 观察 and 实现 探索 col 需要 focus
原文地址:https://www.cnblogs.com/dynmi/p/11827093.html