[Перевод] Реализуем Q learning на Python.

← Вернуться к статьям

2 октября в 10:23

habr.comтехнологии

2 октября в 10:23•

habr.com•технологии

[Перевод] Реализуем Q learning на Python. Обучение с подкреплением (Reinforcement learning) является одним из направлений ML. Суть этого метода заключается в том, что обучаемая система или агент учится принимать оптимальные решения через взаимодействие со средой. В отличие от других подходов, Reinforcement learning (RL) не требует заранее подготовленных данных с правильными ответами или явной структуры в них. Предполагается, что машинное обучение может быть либо контролируемым (модель обучается на размеченном наборе данных), либо неконт...

Еще статьи из категории

Еще статьи

← Вернуться к статьям

2 октября в 10:23

habr.comтехнологии

2 октября в 10:23•

habr.com•технологии

ВСЕ СТАТЬИ

Еще статьи из категории

Еще статьи

ВСЕ СТАТЬИ

Еще статьи из категории

Еще статьи