Case Study: Algorithmustraining aus der Crowd – Intelligente Bildsegmentierungen für autonomes Fahren

Das Auto kommt automatisch, sobald die Wohnungstür abgeschlossen wird. Am Abend zuvor hat es sich selbstständig einen Parkplatz in der Nähe gesucht – ohne menschliches Zutun. Zukunftsmusik? Autos parken heute von selber ein, halten automatisch Abstand auf der Autobahn und warnen, wenn andere Verkehrsteilnehmer den Rückraum beim Ausparken kreuzen. Trotzdem sind wir noch weit davon... Read more »

5-gruende-warum-machine-learning-mit-crowd-guru-das-beste-fuer-dein-business-ist

Das Auto kommt automatisch, sobald die Wohnungstür abgeschlossen wird. Am Abend zuvor hat es sich selbstständig einen Parkplatz in der Nähe gesucht – ohne menschliches Zutun. Zukunftsmusik? Autos parken heute von selber ein, halten automatisch Abstand auf der Autobahn und warnen, wenn andere Verkehrsteilnehmer den Rückraum beim Ausparken kreuzen. Trotzdem sind wir noch weit davon entfernt lediglich Passagiere im eigenen Auto zu sein – auch wenn einige Hersteller bereits vollmundig von „Autopiloten“ sprechen. In der Realität handelt es sich um pilotiertes Fahren: Es ist immer noch der Mensch, der die Entscheidungshoheit hat und das Fahrzeug permanent überwachen und steuern muss.

Das Berliner Unternehmen Crowd Guru versucht die Zukunft schneller Realität werden zu lassen – mit einer Crowd, die online einen Algorithmus zum autonomen Fahren trainiert. Bei dieser Aufgabe arbeiten Menschen und Technik eng zusammen. Die Grundlage bilden tausende, vom Kunden als Inputdaten gelieferte Fotos alltäglicher Verkehrssituationen: überfüllte Kreuzungen, Autobahnfahrten, dichter Stadtverkehr oder auch fast leere Landstraßen. Die Bilder zeigen Tages- und Nachtzeiten sowie alle vorstellbaren Wettersituationen. Dies ist nötig, um ein möglichst großes Spektrum an Verkehrssituationen abzubilden und der Software so eine große Datengrundlage zu liefern. Die eigentliche Aufgabe der Crowd kann in zwei Abschnitte unterteilt werden: Zuerst segmentiert sie die Bilder, dann werden sie farblich annotiert. So wird bspw. der Himmel blau, die Straße grau, der Gehweg lila und die Menschen grün. Am Ende steht, je nach Ausgangsbild, ein abstrakt wirkendes Farbenmeer oder ein ziemlich eintönig  wirkendes Ergebnis. Jedes Bild wird von den QualitätsmanagerInnen bei Crowd Guru geprüft und ggf. angepasst. Die so finalisierten Resultate werden an den Auftraggeber geliefert. Dieser kann sie umgehend und ohne Einschränkungen nutzen, um seinen Algorithmus zu trainieren. „Unsere eigene mobile Zukunft so unmittelbar und direkt gestalten zu können ist besonders spannend für uns“, sagt  Hans Speidel, CEO von Crowd Guru, „Bildbearbeitungen wie Tagging oder Kategorisierungen mittels Crowdsourcing sind seit Jahren Standard für uns. Einen Zusammenhang zum autonomen Fahren hatten wir bisher aber noch nicht.“

Nicht nur eine Voll-, sondern auch eine Teilannotierung ist mit Crowd Gurus Lösung möglich

Nicht nur eine Voll-, sondern auch eine Teilannotierung ist mit Crowd Gurus Lösung möglich

 

Trotz der Erfahrungen im Bereich der Bildbearbeitungen erforderte die Bildsegmentierung fürs autonome Fahren einige besondere Anpassungen. So wurde eigens für diesen Job eine halbautomatische Vorsegmentierung implementiert: Auf Knopfdruck werden die einzelnen Bildbereiche (Himmel, Autos etc.) grob umrandet. „Wir erleichtern der Crowd so die Arbeit. Die Objekte und Gegenstände auf einem Bild sind viel schneller und einfacher zu segmentieren und zu annotieren. Die Crowd muss dann nur noch kleine Anpassungen durchführen“, weiß Alexander Kindziora aus der Crowd Guru IT, der die Software geschrieben hat. Es kann individuell eingestellt werden, wie kleinteilig oder grob das Bild vorsegmentiert werden soll.
Die vollflächige Segmentierung und Annotierung ist aber nur eine Möglichkeit Crowd Gurus Software zu nutzen. Je nach Kundenwunsch können nicht nur Full Segmentations, sondern  auch Bounding Boxes oder 3D Point Cloud Annotations abgebildet werden. Eine Maximalanzahl von Segmenten pro Bild gibt es dabei nicht – auch Bilder mit einer Vielzahl von Informationen können so bearbeitet werden. Durch die skalierbare Crowd sind auch große Aufträge schnell bearbeitet. Trotzdem stellt sich die Frage, ob es nicht bedeutend einfacher, günstiger und schneller wäre, eine interne Lösung zu finden, anstatt die Aufgabe extern zu vergeben? Immerhin sitzt das Wissen in Form von Angestellten ja schon in den Unternehmen.

 

Änderungen im laufenden Prozess

CEO Speidel verneint: „Am Ende sind wir um ein vielfaches schneller und genauer als eine interne Lösung. Das ist ja der große Vorteil beim Crowdsourcing: Intern müssen Sie Angestellte rekrutieren, anlernen, Sie müssen ggf. die Software schreiben, prüfen, testen, die Ergebnisse kontrollieren, noch mal testen – und im schlimmsten Fall fangen Sie noch mal von vorne an. Wir haben den Auftrag meistens schon geliefert, während eine interne Lösung noch in der Entwicklung steckt. Das ist einer der großen Vorteile, wenn Sie auf parallel arbeitende, qualifizierte und spezialisierte Crowdworker zurückgreifen können.“ Die meisten Aufträge sind zeitlich begrenzte, einmalige Projekte, deren interne Umsetzung meist unter keinem Gesichtspunkt effizient ist. Crowd Guru kann dank jahrelanger Erfahrung sehr genau sagen, wie lange die Bearbeitung dauert – und ob sich das Crowdsourcen der Aufgabe überhaupt lohnt.
Besonders ist, dass Änderungen selbst im laufenden Prozess möglich sind. Ändern sich die Vorgaben des Kunden, kann das innerhalb kurzer Zeit angepasst werden. Der Zeitverlust ist marginal. Überhaupt hat der Kunde viele Anpassungsmöglichkeiten und zahlreiche Optionen, um den Jobablauf genau auf seine Bedürfnisse zuschneiden zu lassen. Am Ende steht eine sehr schnelleBearbeitungs- und Lieferzeit. „Geliefert wird immer ein finales Bild, es kann vom Kunden sofort verwendet werden“ erklärt Speidel.

Lieferfertiges Bild nach der Methode Annotation durch Vollsegmentierung

Lieferfertiges Bild nach der Methode Annotation durch Vollsegmentierung

 

Die Kombination aus parallel arbeitender, spezialisierter & qualifizierter Crowd und Softwareunterstützung sorgt für eine individualisierbare, schnelle und effiziente Bildsegmentierung. Das solche Aufgaben nicht alleine Algorithmen überlassen werden sollten, liegt auf der Hand: Die menschliche Intelligenz und Vorstellungskraft  kann  durch künstliche Intelligenz zwar unterstützt, nicht aber ersetzt werden. Gerade bei sicherheitsrelevanten Themen ist es daher sinnvoll, Mensch und Maschine zusammenarbeiten zu lassen. Crowd Gurus Arbeits- und Qualitätsmanagementabläufe sind so eingespielt, dass Auftraggeber wie Crowdworker gleichermaßen vom Ergebnis profitieren.

 

Die Zukunft gestalten

Der Service rund um Segmentierung und Annotation wird bei Cowd Guru immer stärker nachgefragt. Immer geht es um Machine Learning und künstliche Intelligenzen. „Immer mehr Unternehmen wollen die Vorteile künstlicher Intelligenz nutzen, sind sich aber unsicher, was die Bearbeitung von Inputdaten angeht. Hier helfen wir schnell und effizient mit unserer Crowdlösung,“ erklärt Speidel abschließend.

 

Artikel als PDF

Zum Anfang des Artikels springen