Reinforcement Learning door Andrew G. Barto & Richard S. Sutton