Startseite Interaktive Trajektorienplanung mittels gemischt-ganzzahliger quadratischer Programmierung
Artikel Open Access

Interaktive Trajektorienplanung mittels gemischt-ganzzahliger quadratischer Programmierung

  • Christoph Burger

    Christoph Burger studierte Maschinenbau am Karlsruher Institut für Technologie mit den Schwerpunkten Mechatronik, Robotik und Automatisierungstechnik. Seit Juli 2016 arbeitet Herr Burger als wissenschaftlicher Mitarbeiter am Institut für Mess- und Regelungstechnik des KIT mit dem Forschungsschwerpunkt in kooperativer Trajektorien- und Manöverplanung für automatisierte Fahrzeuge. In 2022 promovierte er zum Thema “Interaction-Aware Motion Planning for Automated Vehicles.”

    EMAIL logo
    , Hendrik Königshof

    Hendrik Königshof studierte zwischen 2009 und 2015 Elektro- und Informationstechnik am KIT in Karlsruhe. Seit 2016 ist er wissenschaftlicher Mitarbeiter am FZI Forschungszentrum Informatik. In 2021 promovierte er zum Thema “Echtzeitfähige kamerabasierte Objektdetektion für automatisierte Fahrzeuge”. Anschließend begann er im Bereich der Bewegungsplanung für automatisierte Fahrzeuge und Studien zum menschlichen Fahrverhalten zu forschen.

    und Christoph Stiller

    Christoph Stiller studierte Elektrotechnik an der RWTH Aachen, mit einem Auslandssemester in Trondheim, Norwegen. Von 1988 bis 1994 war er wissenschaftlicher Mitarbeiter an der RWTH Aachen, wo er 1994 mit der Promotion zum Dr.-Ing. abschloss. Er arbeitete 1994/1995 für ein Postdoc-Jahr bei INRS-Telecommunications in Montreal, Kanada, und von 1995-2001 bei der Robert Bosch GmbH, Deutschland. Im Jahr 2001 wurde er zum Professor und Leiter des Instituts für Mess- und Regelungstechnik am KIT ernannt. Herr Stiller war und ist in verschiedenen Positionen für die IEEE tätig, insbesondere von 2012-2013 als Präsident der Intelligent Transportation Systems Society und zuvor, seit 2006, als Vizepräsident. Er war ebenfalls Editor-in-Chief des IEEE Intelligent Transportation Systems Magazine (2009-2011) sowie Associate oder Senior Editor für diverse IEEE Transactions und Magazine. Sein Forschungsinteresse gilt der Wahrnehmung und Bewegungsplanung mobiler Agenten.

    EMAIL logo
Veröffentlicht/Copyright: 7. April 2023

Zusammenfassung

Die Bewegungsplanung für automatisierte Fahrzeuge in gemischtem Verkehr, bei dem sich automatisierte und von Menschen gesteuerte Fahrzeuge die Straße teilen, ist eine anspruchsvolle Aufgabe. Um die Komplexität dieser Aufgabe zu reduzieren, gehen moderne Planungsansätze oft davon aus, dass die zukünftige Bewegung umliegender Fahrzeuge unabhängig vom Verhalten des automatisierten Fahrzeugs prädiziert werden kann. Die Trennung der Prädiktion anderer von der eigenen Planung kann, insbesondere in stark interaktiven Verkehrssituationen, zu suboptimalem, übermäßig konservativem Fahrverhalten führen. In dieser Arbeit wird ein Ansatz zur Planung von kooperativem, interaktionsbewusstem Verhalten auf Basis einer Multi-Agenten-Trajektorienplanung vorgestellt. Hierbei wird die Prädiktion anderer sowie die eigene Planung, mittels gemischt-ganzzahliger quadratischer Programmierung gemeinsam gelöst. Unsicherheiten im Verhalten anderer Verkehrsteilnehmer werden mittels unterschiedlicher Intentionsmodelle berücksichtigt. Die Anwendbarkeit des Ansatzes wird anhand numerischer Experimente für ein Fahrstreifenwechselszenario in dichtem Verkehr demonstriert.

Abstract

Motion planning for automated vehicles in mixed traffic, where automated and human-driven vehicles share the road, is a challenging task. To reduce the complexity of this task, modern planning approaches often assume that the future movement of surrounding vehicles can be predicted independently of the behavior of the automated vehicle. Separating the prediction of others from one’s own planning can lead to suboptimal, overly conservative driving behavior, especially in highly interactive traffic situations. In this paper, we present an approach to planning cooperative, interaction-aware behavior based on multi-agent trajectory planning. Here, the prediction of others as well as the planning for the automated vehicle is solved jointly using mixed-integer quadratic programming. Uncertainties in the behavior of other road users are taken into account by utilizing different intention models. The applicability of the approach is demonstrated by numerical experiments for a lane change scenario in dense traffic.

1 Einleitung

Sobald automatisierte Fahrzeuge (engl. automated vehicles, AVs) Teil des alltäglichen Verkehrs sind, werden sie nicht direkt alleine auf der Straße sein, sondern sich diese mit überwiegend menschlichen Fahrern teilen. Um einen effizienten Betrieb sicherzustellen, ist es daher entscheidend, dass AVs mit menschlichen Fahrern interagieren. Dies ist besonders wichtig in interaktiven Situationen, in denen die Aktionen mehrerer Fahrzeuge wechselseitig voneinander abhängen. Beispielsweise kann ein auf der Autobahn fahrender Fahrer beschließen, langsamer zu fahren, damit ein anderes Fahrzeug einfädeln kann; oder ein Fahrer kann eine Lücke anfahren in der Hoffnung, dass das Fahrzeug hinter ihm langsamer wird und somit einen Fahrstreifenwechsel ermöglicht.

Ein Schlüsselaspekt bei der effizienten Bewältigung solcher Szenarien ist die Berücksichtigung von Interaktionen zwischen AVs und menschlichen Fahrern. Um die Komplexität zu reduzieren folgen die meisten modernen Planungsansätze einer Prädiktions-Planungs-Struktur, bei welcher zunächst die zukünftige Bewegung umliegender Fahrzeuge prädiziert und in einem nachfolgenden Schritt die Bewegung des AVs unter Berücksichtigung dieser Prädiktionen geplant wird. Durch die Trennung von Prädiktion und Planung werden mögliche Interaktionen zwischen den Verkehrsteilnehmern vernachlässigt. Der Einfluss, den das erzeugte Verhalten des AVs auf andere Fahrer haben könnte, kann bei der Planung somit nicht berücksichtigt werden, was zu einer suboptimalen und überdefensiven Fahrweise führen kann.

Abbildung 1 veranschaulicht die Problematik anhand eines Fahrstreifenwechselszenarios. Bei einer Prädiktions-Planungs-Struktur, prädiziert das AV (blau) zunächst die zukünftige Bewegung der umliegenden Fahrzeuge und plant anschließend seine Trajektorie. In Abbildung 1(a) ist die geplante Trajektorie bei geringem Verkehrsaufkommen dargestellt. Bei hohem Verkehrsaufkommen, siehe Abbildung 1(b), ist der Prädiktions-Planungs-Ansatz nicht mehr in der Lage eine kollisionsfreie Fahrstreifenwechseltrajektorie zu finden, sodass das AV am Ende des Fahrstreifens anhält. Diese Problematik wird auch als das Frozen Robot Problem [1] bezeichnet.

Abbildung 1: 
Dargestellt sind die Ergebnisse eines Prädiktions-Planungs-Ansatzes für ein Fahrstreifenwechselszenario bei (a) geringem und (b) hohem Verkehrsaufkommen. Während bei geringem Verkehrsaufkommen die Trennung von Prädiktion und Planung eine nützliche Vereinfachung darstellt, kann diese bei hohem Verkehrsaufkommen zu einem suboptimalen, übermäßig konservativen Fahrverhalten führen.
Abbildung 1:

Dargestellt sind die Ergebnisse eines Prädiktions-Planungs-Ansatzes für ein Fahrstreifenwechselszenario bei (a) geringem und (b) hohem Verkehrsaufkommen. Während bei geringem Verkehrsaufkommen die Trennung von Prädiktion und Planung eine nützliche Vereinfachung darstellt, kann diese bei hohem Verkehrsaufkommen zu einem suboptimalen, übermäßig konservativen Fahrverhalten führen.

Einige Planungsansätze sind bereits in der Lage Interaktionen in der Bewegungsplanung zu berücksichtigen, was es ermöglicht die strukturellen Einschränkungen von Ansätzen, die nach dem Prädiktions-Planungs-Prinzip aufgebaut sind, zu überwinden. Diese Ansätze können in die folgenden drei Kategorien unterteilt werden: Vorwärts-Simulations-Ansätze, Multi-Agenten-Ansätze und spieltheoretische Ansätze.

1.1 Vorwärts-Simulations-Ansätze

Bei Vorwärts-Simulations-Ansätzen wird das aktuelle Verkehrsgeschehen für verschiedene Aktionen des AVs simuliert. Mit Hilfe von Transitionsmodellen wird beschrieben, wie sich die Umgebung durch die Aktionen des AVs verändert und wie andere Fahrer auf diese Veränderungen reagieren. Die meisten sampling-basierten Planungsmethoden [2], die Interaktionen berücksichtigen, können dieser Kategorie zugeordnet werden. Eine wichtige Gruppe unter den sampling-basierten Planungsmethoden sind Methoden, die auf partiell beobachtbaren Markov-Entscheidungsprozessen (POMDP) basieren [3].

Das Verhalten anderer Agenten wird oft mit speziellen Fahrermodellen modelliert, wie beispielsweise dem Intelligent Driver Model (IDM) [4] oder dem Minimum Overall Braking Induced by Lane change (MOBIL) Modell [5]. Ein Beispiel, bei dem das IDM verwendet wird um die Reaktion anderer Fahrzeuge zu bestimmen, wird in [6] vorgestellt. Bei diesem Ansatz werden zunächst mehrere Trajektorien für das AV generiert und anhand dieser, die aktuelle Verkehrssituation simuliert. Anschließend werden die Auswirkungen auf andere Verkehrsteilnehmer untersucht und eine finale Trajektorie für das AV ausgewählt.

Bei Vorwärts-Simulations-Ansätzen ist nicht explizit bekannt, wie sich Aktionen des AVs auf andere auswirken. Dieser Einfluss muss durch das Ausprobieren mehrerer Aktionen und anschließender Simulation des Verkehrsgeschehens ermittelt werden.

1.2 Multi-Agenten-Ansätze

Bei Multi-Agenten-Methoden wird die separate Prädiktion anderer Fahrzeuge durch die Planung gekoppelter Trajektorien ersetzt. Die Verkehrssituation wird als Multi-Agenten-Planungsproblem modelliert, wobei davon ausgegangen wird, dass sich alle Verkehrsteilnehmer so verhalten, dass ein gemeinsames Ziel optimiert wird [7], [8], [9], [10], [11]. Das AV löst dann das Multi-Agenten-Problem unter der Annahme, dass auch die anderen Agenten ihren Teil des Plans in etwa befolgen werden. Unterschiedliche Gewichte können verwendet werden, um unterschiedliche Kooperationsniveaus zu modellieren oder Asymmetrien im Verkehrsgeschehen zu berücksichtigen [12, 13]. Um mit Unsicherheiten im Verhalten von Menschen umzugehen, werden diese Methoden mit Tracking-Ansätzen kombiniert, um abzuschätzen, ob Menschen in etwa demselben Modell folgen [8, 14].

1.3 Spieltheoretische Ansätze

Bei spieltheoretischen Ansätzen wird auf die Annahme eines gemeinsamen Ziels verzichtet und angenommen, dass jeder Fahrer sein individuelles Ziel verfolgt [15], [16], [17].

Eine Schwierigkeit bei spieltheoretischen Ansätzen ist, dass es keine optimale Lösung im klassischen Sinne gibt, sondern je nach Struktur des Spiels verschiedene Lösungen existieren. Diese unterschiedlichen Lösungen werden auch als Equilibria bezeichnet. Dabei kommt erschwerend hinzu, dass selbst bei idealem Umgebungswissen i.d.R. mehrere Equilibria existieren [18] und unklar ist, welches von den anderen Teilnehmern gerade verfolgt wird.

In dieser Arbeit wird ein kooperativer, interaktionsfähiger Bewegungsplaner vorgestellt, der auf einer Multi-Agenten-Formulierung basiert. Der Ansatz zielt darauf ab, das übermäßig konservative Verhalten von Prädiktions-Planungs-Ansätzen zu überwinden, indem für mehrere Fahrzeuge gleichzeitig geplant wird. Diese Struktur ermöglicht es dem AV abzuschätzen, wie sein Verhalten andere und damit die Planung von interaktiven Trajektorien beeinflusst. Des Weiteren ist der vorgestellte Ansatz in der Lage Unsicherheiten in den Reaktionen anderer Fahrer zu berücksichtigen. Anspruchsvolle Fahrmanöver, welche mit Prädiktions-Planungs-Ansätzen nicht möglich wären, wie z. B. ein Einfädeln im dichten Verkehr, können somit durchgeführt werden.

2 Kooperative interaktionsbewusste Trajektorienplanung

Im Folgenden wird zunächst ein Überblick der einzelnen Komponenten der kooperativen interaktionsbewussten Trajektorienplanung vorgestellt.

In Abschnitt 2.1 wird die kooperative Multi-Agenten-Trajektorienplanung auf Basis einer gemischt-ganzzahligen quadratischen Programmierung präsentiert, welche auf [19] und [12] basiert.

Diese Multi-Agenten-Trajektorienplanung dient als Grundlage für die interaktionsbewusste Trajektorienplanung. Die Kernidee hierbei ist es, dass kooperative und interaktionsbewusste Trajektorien durch Optimierung einer gemeinsamen Kostenfunktion erzeugt werden können.

Im Allgemeinen reagieren menschliche Fahrer in interaktiven Szenarien unterschiedlich. Um dies abzubilden, wird davon ausgegangen, dass die verschiedenen Reaktionsweisen eines Menschen auf unterschiedliche Intentionen zurückzuführen sind. Diese Intentionen werden durch unterschiedlich parametrisierte Multi-Agenten-Planungsprobleme modelliert. Die Modellierung der Intentionen ist Gegenstand von Abschnitt 2.2.

Im darauffolgenden Abschnitt wird die Intentionsschätzung präsentiert. Die Intention eines Menschen kann nicht gemessen werden und muss aus Beobachtungen des Fahrverhaltens geschätzt werden. Die Schätzung erfolgt durch Beispieltrajektorien für die einzelnen Intentionsklassen, die dann mit Beobachtungen der realen Verkehrsszene verglichen werden. Durch den Vergleich können Rückschlüsse auf die zugrundeliegende Intention gezogen werden. Dabei repräsentieren die Beispieltrajektorien ein typisches Fahrverhalten für die verschiedenen Intentionsklassen.

Auf Basis der geschätzten Wahrscheinlichkeitsverteilung über die verschiedenen Intentionen wird das Verhalten des AVs geplant. Die Einzelheiten hierzu werden in Abschnitt 2.4 beschrieben.

Ein Überblick über den gesamten Ansatz ist in Abbildung 2 dargestellt.

Abbildung 2: 
Übersicht des Ansatzes zur Planung interaktionsbewuster Trajektorien. Verschiedene Intentionen modellieren die verschiedenen Arten, wie ein Mensch während einer Interaktion reagieren könnte. Die aktive Intention kann nicht gemessen werden und muss daher geschätzt werden. Auf der Grundlage dieser Schätzung wird anschließend die Trajektorie des AVs geplant.
Abbildung 2:

Übersicht des Ansatzes zur Planung interaktionsbewuster Trajektorien. Verschiedene Intentionen modellieren die verschiedenen Arten, wie ein Mensch während einer Interaktion reagieren könnte. Die aktive Intention kann nicht gemessen werden und muss daher geschätzt werden. Auf der Grundlage dieser Schätzung wird anschließend die Trajektorie des AVs geplant.

2.1 Kooperative Multiagenten-Trajektorien-Planung mittels MIQP

Das Multiagenten-Trajektorien-Planungsproblem für eine Gruppe von Fahrzeugen wird als gemischt-ganzzahliges quadratisches Problem (engl, mixed integer quadratic program, MIQP) formuliert. Das Schlüsselelement hierbei sind die Nebenbedingungen für die Kollisionsvermeidung welche mittels binärer Variablen formuliert werden. Dank dieser Formulierung ist die Lösung des Multiagenten-Trajektorien-Planungsproblem unabhängig von der Homotopie der Initialisierung.

Für eine Gruppe von Fahrzeugen V = V 1 , , V n v kann das Trajektorienplanungsproblem allgemein wie folgt formuliert werden:

(1a) min u 0 : N 1 1 : n v , x 1 : N 1 : n v J total = min u 0 : N 1 1 : n v , x 1 : N 1 : n v n = 1 n v w n × J ref n x 1 : N 1 : n v + J u n u 0 : N 1 n

s.t.:

n { 1 , , n v }

(1b) x k + 1 n = f x k n , u k n k = 0 , , N 1

(1c) x 0 n = x ̂ n

(1d) x ̲ x k n x ̄ k = 1 , , N

(1e) u ̲ u k n u ̄ k = 0 , , N 1

(1f) g dyn ̲ g dyn x k n g dyn ̄ k = 1 , , N

(1g) g col x k n , x k m 0 m { n + 1 , , n v } k = 1 , , N

Dabei wird jedes Fahrzeug V n als Punktmasse dritter Ordnung modelliert. Der Zustand x k n R 6 und Eingang u k n R 2 sind gegeben druch:

(2) x k n = p s , k n , v s , k n , a s , k n , p d , k n , v d , k n , a d , k n T u k n = j s , k n , j d , k n T

Hierbei bezeichnet p k die Position, v k die Geschwindigkeit, a k die Beschleuchigung und j k den Ruck zum Zeitpunkt k, jeweils in Längs- □ s und Querrichtung □ d . Mit der Diskretisierungsschrittweite τ ist die Systemdynamik (1b) wie folgt gegeben:

(3) x k + 1 n = A d 0 3 × 3 0 3 × 3 A d x k n + B d 0 3 × 1 0 3 × 1 B d u k n

mit

A d = 1 τ 1 2 τ 2 0 1 τ 0 0 1 B d = 1 6 τ 3 1 2 τ 2 τ

Um den nicht-holonomen Bewegungscharakter der Fahrzeuge sicherzustellen, werden mittels Gleichung (1f) die Geschwindigkeitskomponenten über den Gierwinkel Θ = arctan ( v y v y ) gekoppelt [20].

Um die physikalischen Beschränkungen des realen Systems zu berücksichtigen, werden Nebenbedingungen für die Zustände (1d), Eingänge (1e) sowie für den Anfangszustand (1c) eingeführt. Die Kollisionsvermeidungsnebenbedingungen (1g) sowie die Kostenfunktion (1a) werden nachfolgend im Detail erläutert.

2.1.1 Kollisionsvermeidung

Bei zwei beliebigen Fahrzeugen V n , V m V mit der Breite w und der Länge l ist eine Kollisionsvermeidung gewährleistet, wenn beide Fahrzeuge zu einem bestimmten Zeitpunkt nicht am gleichen Ort sind. Diese Bedingung kann durch die folgenden logischen Aussagen beschrieben werden:

(4a) p s n p s m l min n , m

(4b) p s n p s m + l min n , m

(4c) p d n p d m w min n , m

(4d) p d n p d m + w min n , m

wobei p s die longitudinale und p d die laterale Position des Fahrzeugmittelpunkts angibt. Unter Zuhilfenahme der Big-M-Methode [21] können diese logischen Aussagen in lineare Ungleichungsnebenbedingungen transformiert werden. Hierbei werden binäre Variablen δ i eingeführt, um Nebenbedingungen mittels Addition oder Subtraktion einer anwendungsspezifischen großen Konstanten M big zu aktivieren oder deaktivieren.

Die binäre Variable δ i entspricht dem Wert 1, wenn eine Nebenbedingung aktiv ist und 0 falls diese inaktiv ist. Durch diese Umformung, kann die Kollisionsvermeidung durch den folgenden Satz an Ungleichungsnebenbedingungen beschrieben werden:

(5a) p s , k n p s , k m l min n , m + 1 δ 1 , k n , m M big

(5b) p s , k n p s , k m + l min n , m 1 δ 2 , k n , m M big

(5c) p d , k n p d , k m d min n , m + 1 δ 3 , k n , m M big

(5d) p d , k n p d , k m + d min n , m 1 δ 4 , k n , m M big

(5e) i = 1 4 δ i , k n , m 1

Die Adjunktion der binären Variablen (5e) stellt sicher, dass mindestens eine der Nebenbedingungen aktiv ist.

2.1.2 Kostenfunktion

Die Kostenfunktion J total ergibt sich durch eine Linearkombination der individuellen Kosten der Fahrzeuge V n V , welche aus den Termen J u n und J ref n bestehen. J u n bestraft den Ruck eines Fahrzeugs quadratisch und ist gegeben durch:

(6) J u n = u n T R n u n = u k n R n 2

J ref n bestraft die Abweichung des Fahrzeugs von einem Sollzustand x ref n quadratisch und ergibt sich somit durch:

(7) J ref n = x n x ref n T Q n x n x ref n = x n x ref n Q n 2

R n und Q n sind positiv und semi-positiv definite Gewichtungsmatrizen, die zur Modellierung unterschiedlicher Fahrpräferenzen verwendet werden. So könnte für einen sportlichen Fahrer im Vergleich zu einem komfortablen Fahrer eine geringere Strafe für die Beschleunigung gewählt werden. Der Sollzustand kann für jedes Fahrzeug individuell festgelegt werden und wird durch folgenden Vektor beschrieben:

(8) x ref n = p s , ref n , v s , ref n , a s , ref n , p d , ref n , v d , ref n , a d , ref n T = 0 , v s , ref n , 0 , p d , ref n , 0,0 T

Hierbei beschreibt v s , ref n die Zielgeschwindigkeit und p d , ref n die Mitte der gewünschten Fahrstreifen. Mit den individuellen Gewichtungen der Fahrzeuge w n kann die Gesamtkostenfunktion J total wie folgt angegeben werden:

(9) J total u 0 : N 1 1 : n v , x 1 : N 1 : n v = n = 1 n v w n k = 1 N x k n x k , ref n Q n 2 + k = 0 N 1 u k n R n 2

Ist x ref linear abhängig oder unabhängig von x n und u n , kann das Problem als MIQP formuliert werden.

2.2 Intentionsmodellierung

Auf der Grundlage, der im vorherigen Abschnitt vorgestellten Formulierung für die kooperative Multi-Agenten-Trajektorienplanung können verschiedene Intentionsmodelle I i definiert werden. Dies kann unter anderem durch folgende Modifikationen umgesetzt werden:

  1. Änderung der Gewichte w n in J total

  2. Änderung von R n und Q n um den individuellen Fahrstil der Agenten zu modifizieren

  3. Festlegung einer bestimmten zeitlichen Abfolge, in der die Fahrzeuge einander passieren

Die Formulierung verschiederer Multi-Agenten-Dynamiken dient dazu, verschiedene Möglichkeiten der Interaktion eines Fahrers abzubilden. Beispielsweise kann ein Fahrer mit kooperativer Intention durch eine Gleichgewichtung der Kosten aller Verkehrsteilnehmer in der Kostenfunktion Gleichung (9) modelliert werden. Dementgegen kann ein nicht kooperativer Fahrer durch eine höhere Gewichtung seiner eigenen Kosten modelliert werden. Abbildung 3 veranschaulicht verschiedene Entwicklungen einer Verkehrsszene in Abhängigkeit der Intention eines Fahrers.

Abbildung 3: 
Verschiedene Entwicklungen einer Verkehrsszene in Abhängigkeit der Intention des Fahrers des grauen Fahrzeugs. Auf der linken Seite ist die Vorhersage für eine kooperative Intention dargestellt, auf der rechten für eine nicht-kooperative.
Abbildung 3:

Verschiedene Entwicklungen einer Verkehrsszene in Abhängigkeit der Intention des Fahrers des grauen Fahrzeugs. Auf der linken Seite ist die Vorhersage für eine kooperative Intention dargestellt, auf der rechten für eine nicht-kooperative.

2.3 Intentionsschätzung

Da die Intention eines Fahrers nicht direkt gemessen werden kann, muss diese aus Beobachtungen dessen Fahrverhaltens geschätzt werden. Dazu werden zunächst Beispieltrajektorien der einzelnen Intentionsklassen erstellt, welche das übliche Fahrverhalten dieser Intentionen wiederspiegeln. Durch einen anschließenden Vergleich dieser Beispieltrajektorien mit den Beobachtungen ergibt sich eine Wahrscheinlichkeitsverteilung der Intentionen. Dabei wird davon ausgegangen, dass jeder Fahrer zu jedem Zeitpunkt nach genau einem der Intentionsmodelle I = I 1 , I 2 , , I | I | handelt. Um zu berücksichtigen, dass Fahrer das aktuelle Verkehrsgeschehen fortlaufend neu bewerten, wird ebenfalls eine Intentionswechselwahrscheinlichkeit μ definiert. Das menschliche Verhalten wird somit durch einen stochastischen Prozess über | I | Modelle abgebildet, von denen jeweils genau eines aktiv ist.

Die aktuell aktive Intention eines Fahrers wird mittels eines Interacting Multiple Model (IMM) Kalman Filter (KF) [22] geschätzt, wobei jedes Intentionsmodell mit einem separaten KF beschrieben wird. Die Prädiktion des nachfolgenden Zustandes wird durch Anwenden der intensionsmodellspezifischen Stellgröße u I i bestimmt. Die a-posteriori Verteilung über die verschiedenen Intentionsmodelle P I i wird auf Basis der Observationen z, der a-piori Verteilung und der Intentionswechselwahrscheinlichkeit μ berechnet. Details zur Wahl des Observationenvektors sowie den Intentionsmodellen befinden sich in Abschnitt 3.2.

2.4 Trajektorienplanung

Im Gegensatz zu gängigen Verfahren, bei denen lediglich die aktuell wahrscheinlichste Intention berücksichtigt wird, basiert die Trajektorienplanung bei dem in dieser Arbeit vorgestellten Ansatz auf der geschätzten Wahrscheinlichkeitsverteilung über die Intentionen P I i . Diese Vorgehensweise hat den Vorteil, dass auch weniger wahrscheinliche Intentionen nicht vollständig ignoriert werden, was andernfalls zu gefährlichen Situationen führen könnte. Wenn z.B. die aktuelle Wahrscheinlichkeit für I 1 nur geringfügig niedriger ist als die für I 2, könnte eine Fahrstrategie, die nur das wahrscheinlichste Modell auswählt, in der Zukunft zu hohen Gesamtkosten führen. Werden dagegen alle Intentionen berücksichtigt, kann die Trajektorie frühzeitig angepasst werden, was zu geringer zu erwartenden Gesamtkosten führt.

Anstatt eine einzige Trajektorie über den gesamten Planungshorizont zu optimieren, kann sich diese, wie in Abbildung 4 dargestellt, nach einer gewissen Zeit t shared entsprechend der Intentionsmodelle, in mehrere Trajektorien teilen. Durch diese Aufteilung können Wechselwirkungen der unterschiedlichen Intentionsmodelle verringert werden, was eine verbesserte Optimierung für verschiedene Entwicklungen der Verkehrsszene ermöglicht.

Abbildung 4: 
Die Trajektorie für das AV wird unter Berücksichtigung aller möglichen Intentionen des menschlichen Fahrers erstellt. Die geplante Trajektorie teilt sich nach den gemeinsamen Zuständen x
shared auf, um die Abhängigkeiten zwischen den verschiedenen Intentionsmodellen zu reduzieren. In dem gezeigten Szenario ist die grüne Trajektorie für den Fall geplant, dass der Mensch eine kooperative Intention hat. Im Gegensatz dazu ist die blaue Trajektorie für den nicht-kooperativen Fall optimiert.
Abbildung 4:

Die Trajektorie für das AV wird unter Berücksichtigung aller möglichen Intentionen des menschlichen Fahrers erstellt. Die geplante Trajektorie teilt sich nach den gemeinsamen Zuständen x shared auf, um die Abhängigkeiten zwischen den verschiedenen Intentionsmodellen zu reduzieren. In dem gezeigten Szenario ist die grüne Trajektorie für den Fall geplant, dass der Mensch eine kooperative Intention hat. Im Gegensatz dazu ist die blaue Trajektorie für den nicht-kooperativen Fall optimiert.

Die zur Planung genutzte Kostenfunktion ist eine gewichtete Summe der intentionsspezifischen Kosten J I i multipliziert mit deren aktueller Wahrscheinlichkeit P I i und ist gegeben durch:

(10) J = i = 1 | I | P I i J I i x shared , x k shared + 1 : N I i , u shared , u k shared : N 1 I i

Dabei sind x shared die gemeinsamen Zustände und u shared die gemeinsamen Eingänge.

Der vorgestellte Ansatz stellt eine neuartige Methode dar, um mehrere, im Allgemeinen gegensätzliche, Manöverhypothesen zu kombinieren. Dank der Fähigkeit der MIQP-Formulierung, die optimale Lösung über alle Homotopien hinweg zu finden, wird die Entscheidung, welches Manöver schlussendlich gewählt wird, implizit vom Optimierer auf der Grundlage der erwarteten Kosten getroffen. Es sind keine von Hand entworfenen Entscheidungsheuristiken oder andere Entscheidungslogiken erforderlich.

3 Evaluation

In diesem Abschnitt wird der vorgestellte Ansatz anhand eines Fahrstreifenwechselszenarios in dichtem Verkehr evaluiert.

3.1 Szenarienbeschreibung

Wie in Abbildung 5 dargestellt, befindet sich das AV auf dem rechten Fahrstreifen und muss diesen verlassen, da dieser endet.

Abbildung 5: 
Für die Evaluation verwendetes Fahrstreifenwechselszenario. Das blau dargestellte AV muss aufgrund des Endes des rechten Fahrstreifens den Fahrstreifen wechseln. Die Lücke zwischen V
2 und V
3 ist zu eng, um sofort einen Fahrstreifenwechsel durchzuführen. Eine gemeinsame Betrachtung von Prädiktion und Planung ist notwendig, um zu antizipieren, dass sich durch Interaktion eine Lücke auftun könnte.
Abbildung 5:

Für die Evaluation verwendetes Fahrstreifenwechselszenario. Das blau dargestellte AV muss aufgrund des Endes des rechten Fahrstreifens den Fahrstreifen wechseln. Die Lücke zwischen V 2 und V 3 ist zu eng, um sofort einen Fahrstreifenwechsel durchzuführen. Eine gemeinsame Betrachtung von Prädiktion und Planung ist notwendig, um zu antizipieren, dass sich durch Interaktion eine Lücke auftun könnte.

Das AV, V 1, wird wie in Abschnitt 2.1 beschrieben als Punktmasse dritter Ordnung mit Zustand x 1 und Eingang u 1 modelliert. Für das betrachtete Szenario wird angenommen, dass V 2 seine laterale Position beibehält und keinen Fahrstreifenwechsel vornimmt. Mit einer konstanten Querposition p d 2 , kann dessen Modell zu einer reinen longitudinalen Dynamik mit dem Zustand x 2 = p s 2 , v s 2 , a s 2 T R 3 und Eingang u 2 = j s 2 R reduziert werden. Da keine Wechselwirkungen mit V 3 berücksichtigt werden, kann dieses Fahrzeug im Multi-Agenten-Problem als bewegliches Hindernis modelliert werden, für das eine separate Prädiktion gegeben ist. Die für die Optimierung verwendeten Parameter sind in Tabelle 1 gegeben.

Tabelle 1:

Für das Experiment genutzte Optimierungsparameter.

T = 20 s, τ = 0.8 s
diag(Q 1) = [0,1,2,1,2,4] T , diag(R 1) = [2,2] T
diag(Q 2) = [0,1,2] T , R 2 = 2
x ̄ = [ free , 10 m s , 3 m s 2 , 6 m , 2 m s , 2 m s 2 ] T , u ̄ = [ 3 m s 3 , 2 m s 3 ] T
x ̲ = [ 0,0 , 4 m s 2 , 1 m , 2 m s , 2 m s 2 ] T , u ̲ = [ 6 m s 3 , 2 m s 3 ] T

3.1.1 Intentionsmodelle

Für das vom Menschen gesteuerte Fahrzeug werden zwei verschiedene Intentionen I = ( I 1 , I 2 ) betrachtet. I 1 beschreibt eine kooperative Absicht, bei der die Kosten aller Fahrzeuge in der gemeinsamen Kostenfunktion (9) gleich gewichtet werden. I 2 beschreibt eine nicht-kooperative Absicht, bei der der menschliche Fahrer seine Kosten deutlich höher gewichtet, was zu einem vorrangig egoistischen Verhalten führt. Die beiden intentionsspezifischen Multi-Agenten-Probleme werden daher mit einem Gewichtsverhältnis von w 2/w 1 = 1 für I 1 und einem Verhältnis von w 2/w 1 = 100 für I 2 modelliert.

3.1.2 IMM-KF Parameter

Die beiden Intentionsmodelle I = ( I 1 , I 2 ) werden jeweils mittels separatem KF mit dem Zustand x KF = p s 2 , v s 2 , a s 2 T beschrieben. Hierbei liegt beiden Filtern das gleiche Systemmodell zugrunde, welches der Längskomponente in Gleichung (3) entspricht. Die unterschiedlichen Prädiktionen der Filter werden durch die intentionsmodellspeziefischen Eingangsgrößen erzeugt. Die Messungen z = [ s 2 , v 2 ] T bestehen aus der Position und der Geschwindigkeit von V 2. In Anlehnung an [23] wird für den IMM-Filter eine Intentionswechselwahrscheinlichkeit μ = 0.1 verwendet. Die anfängliche Wahrscheinlichkeitsverteilung wird zu P I 1 = 0.7 und P I 2 = 0.3 gewählt.

3.1.3 Trajektorienplanung

Die Trajektorie des AVs wird durch die Optimierung einer Linearkombination der beiden Multi-Agenten-Formulierungen erzeugt. Die Kostenfunktion kann wie folgt angegeben werden:

(11) J = P I 1 J V 1 + J V 2 + P I 2 J V 1 + 100 J V 2 + J soft 1,2

wobei J V { 1,2 } die Kosten der einzelnen Fahrzeuge sind. Für die Experimente wird t shared auf 4 τ gesetzt.

3.1.4 Modellierung des menschlichen Fahrers

Um Aussagen über die Übertragbarkeit auf den realen Verkehr treffen zu können, wird das Intelligent Driver Model (IDM) [4] zur Simulation des menschlichen Verhaltens verwendet. Die verwendeten IDM-Parameter sind in Tabelle 2 angegeben. Das intentionsspezifische Verhalten wird durch die Wahl des vorausfahrenden Fahrzeugs erzeugt. Wenn der menschliche Fahrer nicht kooperativ ist, wird V 3 als vorausfahrendes Fahrzeug verwendet. Ist der Mensch kooperativ, wird das AV als vorausfahrendes Fahrzeug betrachtet.

Tabelle 2:

Für das Experiment genutzte IDM-Parameter.

Parameter Beschreibung Wert
v des Zielgeschwindigkeit 5 m s
s 0 Minimale Distanz 1.5 m
a Maximale Beschleunigung 1.0 m s 2
b Komfortable Bremsbeschleunigung 2.0 m s 2
T Zeitlicher Abstand 2.5 s
δ Geschwindigkeitsexponent 4

3.2 Experimente

Im Folgenden werden zwei Experimente vorgestellt. Eines, bei dem der menschliche Fahrer eine nicht-kooperative Absicht hat, und eines, bei dem er zur Kooperation bereit ist. Die Planung des automatisierten Fahrzeugs erfolgt nach dem MPC-Verfahren. V 2 verhält sich gemäß des IDM-Modells. V 3 fährt mit konstanter Geschwindigkeit. Die Fahrzeuge werden durch Rechtecke mit der Länge l = 5 m und der Breite w = 2 m approximiert. Die in den Experimenten verwendeten Ausgangs-und Referenzzustände sind in Tabelle 3 angegeben.

Tabelle 3:

Ausgangs-und Referenzzustände der Fahrzeuge.

Ausgangszustand Referenzzustand
V 1 x 0 1 = [ 7.5 m , 5 m s , 0 m s 2 , 1.75 m , 0 m s , 0 m s 2 ] T x ref 1 = [ free , 5 m s , 0 m s 2 , 5.25 m , 0 m s , 0 m s 2 ] T
V 2 x 0 2 = [ 0 m , 5 m s , 0 m s 2 ] T , p d 2 = 5.25 m x ref 2 = [ free , 5 m s , 0 m s 2 ] T , p d 2 = 5.25 m
V 3 x 0 3 = [ 15 m , 5 m s , 0 m s 2 ] T , p d 3 = 5.25 m x ref 3 = [ free , 5 m s , 0 m s 2 ] T , p d 3 = 5.25 m

3.2.1 Nicht-kooperative Intention

Im ersten Experiment wird der Fall betrachtet, dass V 2 während der gesamten Interaktion eine nicht-kooperative Absicht hat. In diesem Fall wird der menschliche Fahrer den Fahrstreifenwechselversuch des AVs ignorieren. Die Simulationsergebnisse sind in Abbildung 6 dargestellt. Wie man sieht, nähert sich das AV zunächst der Lücke in Erwartung, dass sich diese öffnet. Im Laufe der Interaktion wird die aktive Intention des menschlichen Fahrers korrekt als nicht-kooperativ geschätzt, was einen Fahrstreifenwechsel vor V 2 nicht möglich macht. Infolgedessen reduziert das AV seine Geschwindigkeit und führt den Fahrstreifenwechsel hinter V 2 aus.

Abbildung 6: 
Dargestellt sind die Simulationsergebnisse für den Fall, dass der menschliche Fahrer nicht kooperiert. Zum besseren Verständnis sind der Ausgangszustand, der Endzustand und ein Zwischenzustand illustriert. Wie in der mittleren Grafik zu sehen ist, wird die Intention korrekt geschätzt, worauf das AV bremst und den Fahrstreifenwechsel hinter V
2 ausführt.
Abbildung 6:

Dargestellt sind die Simulationsergebnisse für den Fall, dass der menschliche Fahrer nicht kooperiert. Zum besseren Verständnis sind der Ausgangszustand, der Endzustand und ein Zwischenzustand illustriert. Wie in der mittleren Grafik zu sehen ist, wird die Intention korrekt geschätzt, worauf das AV bremst und den Fahrstreifenwechsel hinter V 2 ausführt.

3.2.2 Kooperative Intention

Das Ergebnis des zweiten Experiments ist in Abbildung 7 dargestellt. Nach Beobachtung des menschlichen Verhaltens wird die zunächst nicht-kooperative Intention richtig geschätzt, worauf das AV seine Geschwindigkeit reduziert. Ab dem Zeitpunkt k = 7 reagiert V 2 auf den Fahrstreifenwechselversuch und ändert daraufhin seine Intention. Wie im Geschwindigkeitsdiagramm ersichtlich, kooperiert V 2 indem es seine Geschwindigkeit verringert um die Lücke zu vergrößern. Der Intentionswechsel wird erkannt und das AV antizipiert, dass ein erfolgreicher Fahrstreifenwechsel vor V 2 möglich ist.

Abbildung 7: 
Dargestellt sind die Simulationsergebnisse für verzögertes kooperatives Verhalten. Neben den Trajektorien sind auch die Geschwindigkeitsprofile und die zeitliche Abfolge der Wahrscheinlichkeitsverteilung über die Absichten dargestellt. Bei k = 7 erkennt der menschliche Fahrer den Fahrstreifenwechselversuch und verhält sich daraufhin kooperativ. Das AV wird zunächst langsamer, da es ein nicht-kooperatives Verhalten schätzt. Bei k = 8 wird der Intentionswechsel zu kooperativem Verhalten registriert, worauf das AV beschleunigt und erfolgreich in die Lücke vor V
2 wechselt.
Abbildung 7:

Dargestellt sind die Simulationsergebnisse für verzögertes kooperatives Verhalten. Neben den Trajektorien sind auch die Geschwindigkeitsprofile und die zeitliche Abfolge der Wahrscheinlichkeitsverteilung über die Absichten dargestellt. Bei k = 7 erkennt der menschliche Fahrer den Fahrstreifenwechselversuch und verhält sich daraufhin kooperativ. Das AV wird zunächst langsamer, da es ein nicht-kooperatives Verhalten schätzt. Bei k = 8 wird der Intentionswechsel zu kooperativem Verhalten registriert, worauf das AV beschleunigt und erfolgreich in die Lücke vor V 2 wechselt.

4 Zusammenfassung

In dieser Arbeit wurde ein Ansatz zur Generierung von interaktionsbewusstem Fahrverhalten für AVs vorgestellt. Der Ansatz baut auf der Annahme auf, dass Interaktionen zwischen Verkehrsteilnehmern durch eine kooperative Multi-Agenten-Planung approximiert werden können.

Um die unterschiedlichen Reaktionsweisen menschlicher Fahrer zu erfassen, wurden Intentionsmodelle basierend auf unterschiedlich parametrisierten Multi-Agenten-Problemen eingeführt.

Die Trajektorie des AVs basiert auf der geschätzten Wahrscheinlichkeitsverteilung über die Intentionsmodelle. Anstatt nur für das aktuell wahrscheinlichste Modell zu optimieren, wird das Verhalten für mehrere Entwicklungen der Verkehrszene optimiert. Dies ermöglicht ein manöverneutrales Fahren im Falle einer unklaren Intention des menschlichen Fahrers. Die Entscheidung, ob z.B. vor oder hinter einem Fahrzeug der Fahrstreifen gewechselt werden soll, wird in diesem Fall implizit auf einen späteren Zeitpunkt verschoben. Desweiteren ist die endgültige Manöverentscheidung das Resultat der Optimierung und keine von Hand entworfene Heuristik ist erforderlich.

Die Experimente zeigen, dass die Fähigkeit, Interaktionen zu berücksichtigen, das AV in die Lage versetzt, die Reaktion der umliegenden Verkehrsteilnehmer zu antizipieren, was ein weniger konservatives Fahrverhalten ermöglicht. In Kombination mit der vorgestellten Intentionsschätzung können so anspruchsvolle Fahrmanöver, wie z.B. ein Fahrstreifenwechsel im dichten Verkehr, realisiert werden.


Korrespondenzautor: Christoph Burger and Christoph Stiller, Institut für Mess- und Regelungstechnik, Karlsruher Institut für Technologie (KIT), 76131 Karlsruhe, Germany, E-mail: (C. Burger), (C. Stiller)

Über die Autoren

Christoph Burger

Christoph Burger studierte Maschinenbau am Karlsruher Institut für Technologie mit den Schwerpunkten Mechatronik, Robotik und Automatisierungstechnik. Seit Juli 2016 arbeitet Herr Burger als wissenschaftlicher Mitarbeiter am Institut für Mess- und Regelungstechnik des KIT mit dem Forschungsschwerpunkt in kooperativer Trajektorien- und Manöverplanung für automatisierte Fahrzeuge. In 2022 promovierte er zum Thema “Interaction-Aware Motion Planning for Automated Vehicles.”

Hendrik Königshof

Hendrik Königshof studierte zwischen 2009 und 2015 Elektro- und Informationstechnik am KIT in Karlsruhe. Seit 2016 ist er wissenschaftlicher Mitarbeiter am FZI Forschungszentrum Informatik. In 2021 promovierte er zum Thema “Echtzeitfähige kamerabasierte Objektdetektion für automatisierte Fahrzeuge”. Anschließend begann er im Bereich der Bewegungsplanung für automatisierte Fahrzeuge und Studien zum menschlichen Fahrverhalten zu forschen.

Christoph Stiller

Christoph Stiller studierte Elektrotechnik an der RWTH Aachen, mit einem Auslandssemester in Trondheim, Norwegen. Von 1988 bis 1994 war er wissenschaftlicher Mitarbeiter an der RWTH Aachen, wo er 1994 mit der Promotion zum Dr.-Ing. abschloss. Er arbeitete 1994/1995 für ein Postdoc-Jahr bei INRS-Telecommunications in Montreal, Kanada, und von 1995-2001 bei der Robert Bosch GmbH, Deutschland. Im Jahr 2001 wurde er zum Professor und Leiter des Instituts für Mess- und Regelungstechnik am KIT ernannt. Herr Stiller war und ist in verschiedenen Positionen für die IEEE tätig, insbesondere von 2012-2013 als Präsident der Intelligent Transportation Systems Society und zuvor, seit 2006, als Vizepräsident. Er war ebenfalls Editor-in-Chief des IEEE Intelligent Transportation Systems Magazine (2009-2011) sowie Associate oder Senior Editor für diverse IEEE Transactions und Magazine. Sein Forschungsinteresse gilt der Wahrnehmung und Bewegungsplanung mobiler Agenten.

Danksagung

Die Autoren danken der Deutschen Forschungsgemeinschaft (DFG) für die Förderung im Rahmen des SPP 1835 - Kooperativ interagierende Automobile (CoInCar).

Literatur

[1] P. Trautman and A. Krause, “Unfreezing the Robot: navigation in dense, interacting crowds,” in 2010 IEEE/RSJ International Conf. on Intelligent Robots and Systems, Taipei, Taiwan, 2010, pp. 797–803.10.1109/IROS.2010.5654369Suche in Google Scholar

[2] B. Paden, M. Cap, S. Z. Yong, D. Yershov, and E. Frazzoli, “A survey of motion planning and control techniques for self-driving urban vehicles,” IEEE Trans. Intell. Veh., vol. 1, no. 1, pp. 33–55, 2016. https://doi.org/10.1109/TIV.2016.2578706.Suche in Google Scholar

[3] C. Hubmann, J. Schulz, G. Xu, D. Althoff, and C. Stiller, “A belief state planner for interactive merge maneuvers in congested traffic,” in 2018 21st International Conf. Intelligent Transportation Systems (ITSC), Maui, USA, 2018, pp. 1617–1624.10.1109/ITSC.2018.8569729Suche in Google Scholar

[4] M. Treiber, A. Hennecke, and D. Helbing, “Congested traffic states in empirical observations and microscopic simulations,” Phys. Rev. E, vol. 62, no. 2, pp. 1805–1824, 2000. https://doi.org/10.1103/PhysRevE.62.1805.Suche in Google Scholar

[5] A. Kesting, M. Treiber, and D. Helbing, “General lane-changing model MOBIL for car-following models,” Transport. Res. Rec. J. Transport. Res. Board, vol. 1999, pp. 86–94, 2007. https://doi.org/10.3141/1999-10.Suche in Google Scholar

[6] N. Evestedt, E. Ward, J. Folkesson, and D. Axehill, “Interaction aware trajectory planning for merge scenarios in congested traffic situations,” in 2016 IEEE 19th International Conf. on Intelligent Transportation Systems (ITSC), Rio de Janeiro, Brazil, 2016, pp. 465–472.10.1109/ITSC.2016.7795596Suche in Google Scholar

[7] S. Bansal, A. Cosgun, A. Nakhaei, and K. Fujimura, “Collaborative planning for mixed-autonomy lane merging,” in 2018 IEEE/RSJ International Conf. on Intelligent Robots and Systems (IROS), Madrid, Spain, 2018, pp. 4449–4455.10.1109/IROS.2018.8594197Suche in Google Scholar

[8] C. Burger, T. Schneider, and M. Lauer, “Interaction aware cooperative trajectory planning for lane change maneuvers in dense traffic,” in 2020 IEEE 23rd International Conf. on Intelligent Transportation Systems (ITSC), Rhodes, Greece, 2020, pp. 1–8.10.1109/ITSC45102.2020.9294638Suche in Google Scholar

[9] G. R. de Campos, P. Falcone, and J. Sjöberg, “Autonomous cooperative driving: a velocity-based negotiation approach for intersection crossing,” in 16th International IEEE Conf. on Intelligent Transportation Systems (ITSC 2013), The Hague, Netherlands, 2013, pp. 1456–1461.10.1109/ITSC.2013.6728435Suche in Google Scholar

[10] M. Kloock, Q. He, S. Kowalewski, and B. Alrifaee, “Trajectory verification for networked and autonomous vehicles using temporal logic and model checking,” in 2021 IEEE International Intelligent Transportation Systems Conf. (ITSC), 2021.10.1109/ITSC48978.2021.9564414Suche in Google Scholar

[11] D. Lenz, T. Kessler, and A. Knoll, “Tactical cooperative planning for autonomous highway driving using monte- carlo tree search,” in 2016 IEEE Intelligent Vehicles Symposium (IV), Gothenburg, Sweden, 2016, pp. 447–453.10.1109/IVS.2016.7535424Suche in Google Scholar

[12] C. Burger and M. Lauer, “Cooperative multiple vehicle trajectory planning using MIQP,” in 2018 21st International Conf. on Intelligent Transportation Systems (ITSC), Maui, Hawaii, USA, 2018, pp. 602–607.10.1109/ITSC.2018.8569776Suche in Google Scholar

[13] C. Burger, P. F. Orzechowski, Ö. Ş. Taş, and C. Stiller, “Rating cooperative driving: a scheme for behavior assessment,” in 2017 IEEE 20th International Conf. on Intelligent Transportation Systems (ITSC), Yokohama, Japan, 2017, pp. 1–6.10.1109/ITSC.2017.8317794Suche in Google Scholar

[14] J. Schulz, J. Löchner, M. Werling, and D. Burschka, “Estimation of collective maneuvers through cooperative multi-agent planning,” in 2017 IEEE Intelligent Vehicles Symposium (IV), Los Angeles, USA, 2017, pp. 624–631.10.1109/IVS.2017.7995788Suche in Google Scholar

[15] C. Burger, J. Fischer, F. Bieder, Ö. Ş. Taş, and C. Stiller, “Interaction-aware game-theoretic motion planning for automated vehicles using Bi-level optimization,” in 2022 IEEE 25th International Conf. on Intelligent Transportation Systems (ITSC), Macau, China, 2022, pp. 1–6.10.1109/ITSC55140.2022.9922600Suche in Google Scholar

[16] D. Sadigh, N. Landolfi, S. S. Sastry, S. A. Seshia, and A. D. Dragan, “Planning for cars that coordinate with people: leveraging effects on human actions for planning and active information gathering over human internal state,” Aut. Robots, vol. 42, no. 7, pp. 1405–1426, 2018. https://doi.org/10.1007/s10514-018-9746-1.Suche in Google Scholar

[17] M. Wang, Z. Wang, J. Talbot, J. C. Gerdes, and M. Schwager, “Game-theoretic planning for self-driving cars in multivehicle competitive scenarios,” IEEE Trans. Robot., vol. 37, no. 4, pp. 1313–1325, 2021. https://doi.org/10.1109/TRO.2020.3047521.Suche in Google Scholar

[18] L. Peters, D. Fridovich-Keil, C. J. Tomlin, and Z. N. Sunberg, “Inference-based strategy alignment for general-sum differential games,” 2020 CoRR abs/2002.04354. Available at: https://arxiv.org/abs/2002.04354.Suche in Google Scholar

[19] C. Burger, Interaction-Aware Motion Planning for Automated Vehicles, Karlsruher Institut für Technologie (KIT), 2022, in print.Suche in Google Scholar

[20] J. Nilsson, M. Brannstrom, E. Coelingh, and J. Fredriksson, “Lane change maneuvers for automated vehicles,” IEEE Trans. Intell. Transport. Syst., vol. 18, no. 5, pp. 1087–1096, 2017. https://doi.org/10.1109/TITS.2016.2597966.Suche in Google Scholar

[21] S. Nickel, S. Rebennack, O. Stein, and K. H. Waldmann, Operations Research. 3., überarbeitete und erweiterte Auflage, in Springer eBook Collection, Berlin, Springer Gabler, 2022.10.1007/978-3-662-65346-3Suche in Google Scholar

[22] H. A. P. Blom and Y. Bar-Shalom, “The interacting multiple model algorithm for systems with Markovian switching coefficients,” IEEE Trans. Automat. Control, vol. 33, no. 8, pp. 780–783, 1988. https://doi.org/10.1109/9.1299.Suche in Google Scholar

[23] S. Lefèvre, C. Laugier, and J. Ibañez-Guzmán, “Risk assessment at road intersections: comparing intention and expectation,” in 2012 IEEE Intelligent Vehicles Symposium, Madrid, Spain, 2012, pp. 165–171.10.1109/IVS.2012.6232198Suche in Google Scholar

Erhalten: 2022-12-26
Angenommen: 2023-03-01
Online erschienen: 2023-04-07
Erschienen im Druck: 2023-04-25

© 2023 the author(s), published by De Gruyter, Berlin/Boston

This work is licensed under the Creative Commons Attribution 4.0 International License.

Heruntergeladen am 9.9.2025 von https://www.degruyterbrill.com/document/doi/10.1515/auto-2023-0001/html
Button zum nach oben scrollen