Las políticas robóticas entrenadas de principio a fin para generar acciones de bajo nivel en respuesta a observaciones sensoriales proporcionan un enfoque poderoso y atractivo basado en el aprendizaje para el control robótico, obviando la necesidad de sensores complejos y pilas de control, y procesando observaciones complejas en controles diestros de bajo nivel