Maschinelle Bildverabeitung spielt eine zentrale Rolle für autonome Fahrzeuge,da Kameras vergleichsweise günstig sind und eine Vielzahl an Informationonenüber die Umgebung erfassen。Insbesondere die Objektklasse,也是Objek tein Fußnger,Radfahrer oder Auto ist,kann sehr gut anhand von Bildmaterial erkannt werden的最佳人选。Umgebungserfassung im städtischen Umfeld is ein große Herausforderung für Bildverabeitungsalgorithmen,da die Umgebund sehr komplex und unstrukturiert ist:Fahrbahnberang und Spurmarkierungen,Schilder und Ampeln,und viele weitere Objekte die sich gegenseitig verdecken können,müssen in Echtzeit erkannt werden。Die derzeit存在于智能化的Fahrzeugen skalieren nicht ohne weiteres zu diesen Anforderungen中,da-jedes问题bzw jede Objektklasse getrent behandelt wird。Sogenanntes“Scene Labeling”,welches jedem Pixel im Bild eine Klasse zuweist,is eine vielversprechende Methode um diesen Mehraufw and zu vermeiden indem externate Bildmarkmale zwischen verschiedenen Klassen geteilt werden,《场景标签》中的像素。Verglichen mit Bounding-Box Detektoren liefert场景标签außerdem eine reichhaltigere und dictere Darstellung der Umgebung。Die meisten理解了场景标签Verfahren haben的意思,即在Echtzeit nicht ermöglicht中的eine Anwendung。Zusätzlich是Hinblick auf Bandbreite eindichte Darstellung auf Pixel Ebene的理想选择,它不适合在Fahrzeug(wie z.B.Lokalisierung and Pfad Planung)中使用Umgebung和模块。 Diese Dissertation geht Scene Labeling aus einem Automobil-Kontext an,indem ein Scene Labeling Konzept um das“Stixel Welt”Modell von Pfeiffer(2011)aufgebaut wird,welches dicte Umgebungsinformation zu einer Menge von kleinen senkrecht auf dem Boden stehenden Stäben komprimert。在dieser Arbeit wird erstmals die besthend Stixel-Formulierung dahingehend erweitert中,dass dicte gelernte Bildmerkmale auf Pixel-Ebene berücksichtigt werden。在einem zweiten Schritt werden Stixel als Bassisbortine der Szene benutzt um ein hocheffizientes标签模式auf Regions-Ebene zu realifieren中。Der letzte Teil dieser Arbeit stell ein Konzept vor,dass Labeling auf Pixel-Enee und Regions-Enee in einem einzigen Modell kombiniert,welches eine Genauggeit vergleichbar oder besser als Der aktuelle Stand Der Technik liefert und in Echtzeit mit typischen Bildwiederholraten ausgeführt werden kann。Diese Arbeit untersucht des Weiteren in wiefern vorhandene Tiefeninformation,z.B.von einer Stereo-Kamera,helfen kann um die Labeling-Präzision zu erhöhen und Laufzeit zu reduzieren。 |