基本概念
二、 基本概念
基本概念Agent(智能体、机器人、代理):强化学习训练的主体。Environment(环境):Agent在其中进行交up互和学习的世界。State(状态):状态即为对环境的描述,可leftright以是连续的,也可以是离散的。Action(行动):基于当前的State,Agent可以采取哪些action。Reward(奖励,回报):Agent给出动作后Environment对Agent的反馈
Agent(智能体、机器人、代理):强化学 习训练的主体。 二、基本概念 Environment(环境):Agent在其中进行交 互和学习的世界。 State(状态):状态即为对环境的描述,可 以是连续的,也可以是离散的。 Action(行动):基于当前的State,Agent可 以采取哪些action。 Reward(奖励,回报):Agent 给出动作后 Environment对Agent的反馈