[AI application] AI agent plays Sonic the Hedgehog
Source code: https://github.com/uvipen/Sonic-PPO-pytorch
Full demo: https://youtu.be/hN3Gw-YunBc
Trong lĩnh vực học tăng cường, PPO là 1 trong những thuật toán khá nổi tiếng, được giới thiệu bởi OpenAI. PPO cũng được sử dụng để train OpenAI Five, AI đầu tiên đánh bại được team của các cựu player chuyên nghiệp và caster DOTA 2. Rank của những người chơi này nằm trong khoảng 99.95% (chỉ có 0.05% người chơi trên thế giới là giỏi hơn họ mà thôi). Trong post này mình xin chia sẻ ứng dụng của PPO trong 1 game khác, đơn giản hơn rất nhiều mà mình nghĩ có rất nhiều bạn trong group biết đến: Sonic the Hedgehog. Khác với hướng tiếp cận dành cho các game phức tạp như DOTA 2, khi mà input là các thông tin chi tiết về trạng thái hiện tại của game, ở game Sonic input của mình chỉ là raw frame từ game mà thôi. Nếu các bạn quan tâm đến chi tiết thuật toán hoạt động như thế nào, các bạn có thể đọc thêm ở đây https://tek4.vn/cac-phep-toan-trong-trpo-va-ppo-hoc-tang.../
#j2team_share #Python #AI #ReinforcementLearning #PPO
[AI application] AI agent plays Contra
Source code: https://github.com/uvipen/Contra-PPO-pytorch
Full demo: https://youtu.be/YBd4l806Di8
#j2team_share #Python #AI #ReinforcementLearning
[AI application] AI agent plays Chrome Dino
Source code: https://github.com/uvipen/Chrome-dino-deep-Q-learning-pytorch
Full demo: https://youtu.be/Jl6FpraZ0UQ
#j2team_share #Python #AI #ReinforcementLearning