« Minimal Replication »

Home Tags About

14-SAC

Published at 2024-11-16
Licensed under CC BY-NC-SA 4.0 notesjulyfun技术学习hrl
  • DDPG 不是很稳定.
  • 【最大熵强化学习】
    • 为了防止陷入局部最优解,将策略的分布熵加入到 loss
    • image.png
  • [undone]

« Minimal Replication »

Powered by Astro