July 5, 2019

Striking a Balance between Exploring and Exploiting

Learn how reinforcement learning agents balance trying new actions versus exploiting known rewards, with a practical tic-tac-toe implementation.

machine learning