从奖励和惩罚的视角来理解情绪

Emotions are defined as states elicited by rewards and punishers, that is, by instrumental reinforcers (Rolls, 2013)
行动者-评论员模型（actor-critic model）行动者-评论员模型（actor-critic model）的解释: 多巴胺神经元对预期的奖赏产生放电,起到行动者(actor)的作用,推动和支撑目标导向的行为。当奖赏出现时,多巴胺系统活动会突然停止。这为系统提供了奖赏出现的信号。多巴胺系统与眶下前额叶皮层(OFC)相连,后者编码奖赏的预期价值,起评论员(critic)的作用。当预期奖赏价值被修改时,眶下前额叶皮层会调整对多巴胺系统的激活,更新其信号。该模型既符合多巴胺神经元对非预期奖赏的激活数据,也解释了动机和决策过程中多巴胺系统的作用。多巴胺系统提供及时的奖赏反馈,并根据经验持续更新奖赏预测,从而支持目标导向行为和动机。
使用什么指标来测量行动者-评论员模型中的过程？
- EEG： LLP
- fMRI

Cohen, J. D., & Blum, K. I. (2002). Reward and decision. Neuron, 36(2), 193-198. Rolls, E. T. (2013). Emotion and decision-making explained. OUP Oxford. Dayan, P., & Balleine, B. W. (2002). Reward, motivation, and reinforcement learning. Neuron, 36(2), 285–298.