Multi-Agent Reinforcement Learning Framework towards Automotive Resiliency and Survivability of Mission-Critical Networks against Volatile Resource Flow

(Multiagentes Verstärkungslernen im Hinblick auf die Widerstandsfähigkeit und Überlebensfähigkeit von unternehmenskritischen Netzwerken gegenüber volatilen Ressourcenflüssen)

Team

Lernende Technische Systeme, Ruhr-University Bochum

  • Setareh Maghsudi
    Since 2023, Setareh Maghsudi is a full professor at Ruhr-University Bochum, leading the research group ‘Inteligent Technical System". From 2020-2023, she a tenure-track assistant professor at the University of Tübingen. From 2017 to 2020, she was an assistant professor at the Technical University of Berlin, where she also received her Ph.D. degree (summa cum laude) in 2015. From 2015 to 2017, she held post-doctoral positions at the University of Manitoba-Canada, and Yale University-USA. During 2017- 2020, she was visiting researcher at the University of Oxford, the University of Cambridge, the Alan-Turing Institute in the UK, also the African Institute of Mathematical Science in South Africa. In the Summer of 2019, she was a research fellow at Kyushu University, Japan.

Abstract

[EN] The synergy between wireless communication, cyber-physical system design, and artificial intelligence enables the autonomous operation of modern networked systems. For such infrastructures that underpin several critical missions, the vitality of resiliency is evident and unquestionable. Nevertheless, the scarcity of resources, the inevitable implementation of technologies for opportunistic resource acquisition, and security threats, render resiliency challenging to achieve, as they introduce volatility in the essential resource flow. In this proposal, we focus on two scenarios, namely resource sharing and backup resource reservation, to boost the resilience of a mission-critical system of systems against oblivious and non-oblivious adversaries that create a volatile resource flow; As such, uncertainty and information shortage count as the focal points of our research. We maintain a generic framework of resiliency via network adaptivity so that our proposal accommodates a variety of applications. Our solutions lie at the intersection of multiagent online convex optimization with bandit feedback, online hide-and-seek games, and statistical concepts such as change point detection. The proposed methods are amenable to distributed implementation, thus reducing the feedback and signaling overhead significantly. We will provide rigorous theoretical analysis concerning efficiency, scalability, and convergence. Also, we will investigate performance bounds.

[DE] Die Synergie zwischen drahtloser Kommunikation, cyber-physischem Systemdesign und künstlicher Intelligenz ermöglicht den autonomen Betrieb moderner vernetzter Systeme. Für solche Infrastrukturen, die mehrere kritische Missionen unterstützen, ist die Vitalität der Resilienz offensichtlich und unbestreitbar. Die Knappheit der Ressourcen, die unvermeidliche Einführung von Technologien zur opportunistischen Ressourcenbeschaffung und Sicherheitsbedrohungen machen die Umsetzung von Resilienz jedoch zu einer Herausforderung, da sie zu Schwankungen im wesentlichen Ressourcenfluss führen. In diesem Antrag konzentrieren wir uns auf zwei Szenarien, nämlich die gemeinsame Nutzung von Ressourcen und die Reservierung von Backup-Ressourcen, um die Resilienz eines missionskritischen Systems von Systemen gegen vergessliche und nicht-vergessliche Angreifer zu erhöhen, die einen volatilen Ressourcenfluss erzeugen. Wir behalten einen generischen Rahmen für Resilienz durch Netzwerkadaptivität bei, so dass unser Ansatz für eine Vielzahl von Anwendungen geeignet ist. Unsere Lösungen liegen an der Schnittstelle von konvexer Multiagenten-Online-Optimierung mit Bandit-Feedback, Online-Versteckspielen und statistischen Konzepten wie der Erkennung von Änderungspunkten. Die vorgeschlagenen Methoden eignen sich für eine verteilte Implementierung, wodurch der Feedback- und Signalisierungs-Overhead erheblich reduziert wird. Wir bieten eine rigorose theoretische Analyse bezüglich Effizienz, Skalierbarkeit und Konvergenz. Wir diskutieren auch Leistungsgrenzen.