Reinforcement Learning and advanced Deep Learning (RLD)

Exercises and project of RLD - M2 DAC+M2A, Sorbonne University

Students: Tianwei LAN, Jacques ROUGE

TME1: Upper Confidence Bound (UCB) and Linear Upper Confidence Bound (LinUCB)
TME2: Value Iteration and Policy Iteration
TME3: Q-Learning
TME4: Deep Q-Network (DQN)
TME5: Actor-Critic
TME6: Proximal Policy Optimization (PPO) with Adaptative KL and with Clipped Objective
TME7: Deep Deterministic Policy Gradient (DDPG)
TME8: Generative Adversarial Network (GAN)
TME9: Variational Autoencoder (VAE)
TME10: Multi-Agent Deep Deterministic Policy Gradient (MADDPG)

Name		Name	Last commit message	Last commit date
Latest commit History 25 Commits
TME10-MADDPG		TME10-MADDPG
TME3		TME3
TME4-DQN		TME4-DQN
TME5-ActorCritic		TME5-ActorCritic
TME6-PPO		TME6-PPO
TME7-DDPG		TME7-DDPG
README.md		README.md
TME1.ipynb		TME1.ipynb
TME9_VAE.ipynb		TME9_VAE.ipynb
TME_2.ipynb		TME_2.ipynb
TME_GAN.ipynb		TME_GAN.ipynb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Reinforcement Learning and advanced Deep Learning (RLD)

About

Releases

Packages

Contributors 2

Languages

tlan95/Reinforcement-Learning-and-advanced-Deep-Learning

Folders and files

Latest commit

History

Repository files navigation

Reinforcement Learning and advanced Deep Learning (RLD)

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages