Introdução à Aprendizagem por Reforço

FLUXOGRAMA DO TRABALHO - Breve histórico ( Falando sobre acontecimento passados que levaram a teoria computacional de aprendizagem de máquina, experimentos de Thorndike e Pavlov) - Diferenciando Aprendizagem por reforço dos outros métodos de Aprendizagem de máquina, através de exemplos práticos e observados na indústria. - Explicando Como a aprendizagem por reforço funciona: - Processo de decisão de Markov (Policy e value function) - Exploitation X Exploration dillema - Recompensas - Modelo - Ambiente - Intersecção com Deep Learning - Aplicações práticas - Materiais de estudo e Roadmap REFERÊNCIAS: - Sutton and Barto's Reinforcement Learning Book - David Silver UCL class - Introduction to Reinforcement Learning - CS234 winter 2019 - Stanford

Coautores

João Pedro Vasconcelos Teixeira