[Перевод] Реализуем Q learning на Python. Обучение с подкреплением (Reinforcement learning) является одним из направлений ML. Суть этого метода заключается в том, что обучаемая система или агент учится принимать оптимальные решения через взаимодействие со средой. В отличие от других подходов, Reinforcement learning (RL) не требует заранее подготовленных данных с правильными ответами или явной структуры в них. Предполагается, что машинное обучение может быть либо контролируемым (модель обучается на размеченном наборе данных), либо неконт...