Policy Gradient

아티클 정리 - Policy Gradient Reinforcement Learning in PyTorch

2020.09.09

안녕하세요. 오늘은 꽤나 흥미로운 포스팅을 하나 준비해왔습니다. 최근에 딥 러닝의 추세라고 볼 수 있는 강화학습과 관련된 포스팅입니다. 본문은 아래와 같습니다. 링크 Policy Gradient Reinforcement Learning in PyTorch Solving the OpenAI gym problem with policy gradient learning medium.com 강화학습에 대해서 설명하기 위해서 먼저 environment와 agent에 대해서 설명해야합니다. agent는 딥 러닝으로 생각해보면 모델이 됩니다. agent는 항상 특정 state에서 최상의 reward를 얻기 위한 action을 취하게 됩니다. 그 reward와 다음 state에 대한 정보는 environment와 상호작..

아티클 정리 - Policy Gradient Reinforcement Learning in PyTorch

티스토리툴바