La diversidad conductual surge como un factor crucial para lograr una colaboración eficaz en el Aprendizaje por Refuerzo Multiagente (MARL). Los métodos actuales suelen utilizar la compartición parcial de parámetros, como compartir la misma capa de representación, para equilibrar la diversidad conductual y la escalabilidad algorítmica.