Chapter Summaries

1. INTRODUCTION

3. Counterfactual Multi-Agent Policy Gradients

Reference

Benchmarking

MAPPO (대세인듯으로 보임.)
- paper
- blog
QMIX
- paper
BENCHMARKING MULTI-AGENT DEEP REINFORCEMENT LEARNING ALGORITHMS (link)

Untitled

MARL aglorithms supported by Rllib

Untitled