DQN 소개2015년 구글에서 발표한 논문에 나오는 알고리즘이다. DQN은 강화학습 딥러닝인 Q-Learning 알고리즘에 Neural Network를 더한 학습법이다. 기존의 Q-Learning은 현재 상태에서 특정 행동을 취할 때 받는 보상의 기대값인 Q-value를 학습시켜 최적 정책을 도출한다. Q-value를 테이블로 저장하여 학습시킨다. 하지만 이 Q-Learning은 State, Action, Space가 커지게 되면 많은 메모리를 사용하고, 긴 Exploration Time이 필요하게 된다. 그리고, State Space가 연속적인 경우에는 테이블을 만들기가 어렵다는 단점이 있다. 예를 들어 State의 도메인이 실수일때, 실수는 정수처럼 끊어지지 않고 연속적이기 때문에 테이블로 만들기 어..