Big Data: intelligentes und schnelles Datenmanagement durch die Crowd

Crowdsourcing ist ein Schlüsselbegriff, wenn es darum geht, Big Data zu organisieren und zielorientiert anzuwenden. Zur Strukturierung und Organisation dieser großen, teils unübersichtlichen Datenmengen, ist Crowdsourcing das Mittel der Wahl. Anwendungsbeispiele kommen aus ganz unterschiedlichen Bereichen, wie dem durch Crowdworker betriebenen Sammeln von Input zur Unterstützung der Klimawandel-These oder dem maschinellen Lernen. Der Einsatz einer... Read more »

big-data

Crowdsourcing ist ein Schlüsselbegriff, wenn es darum geht, Big Data zu organisieren und zielorientiert anzuwenden. Zur Strukturierung und Organisation dieser großen, teils unübersichtlichen Datenmengen, ist Crowdsourcing das Mittel der Wahl.
Anwendungsbeispiele kommen aus ganz unterschiedlichen Bereichen, wie dem durch Crowdworker betriebenen Sammeln von Input zur Unterstützung der Klimawandel-These oder dem maschinellen Lernen. Der Einsatz einer Crowd ist überall dort möglich, wo große Datenmengen bearbeiten werden müssen. Das führt zu nahezu unendlichen Einsatzmöglichkeiten – aber auch zur Notwendigkeit eines Partners, der etwas vom Crowd-Management versteht.

 

Inhalt

  1. Big Data: Technik und Mensch arbeiten Hand in Hand
  2. Datenmanagement: einige Beispiele aus der Praxis
  3. Big Data – Machine Learning als Paradedisziplin
  4. Fazit

 

1. Big Data: Technik und Mensch arbeiten Hand in Hand

Ob in Datenbanken, Suchmaschinen, sozialen Netzwerken oder anderswo – große Datenmengen – kurz: Big Data – bestimmen unser Leben und nehmen Einfluss darauf, wie wir unsere Umwelt erleben und unseren Alltag gestalten. Folglich besitzt auch das Datenmanagement – die sinnvolle Strukturierung, Aufbereitung und Organisation großer Datenmengen – eine enorme Bedeutung. Diesen Aufgaben widmen wir uns seit bald zehn Jahren. Gleich, ob wir die Rohdaten selbst aggregieren oder vom Kunden bereits geliefert bekommen, das simultane Sammeln, Recherchieren, Taggen und Aufbereiten von Big Data via Crowd ist das überlegene Modell. Bei uns agieren Mensch und Technik gekonnt und eingespielt miteinander.
Ein klassisches Beispiel ist unsere über die Jahre verfeinerte Recherche: Durch die parallele Bearbeitung zahlreicher Crowdworker besitzen Auftraggeber die Gewissheit, dass ihr Auftrag schnellstmöglich ausgeführt wird. Individuelle Wünsche – etwa die Lieferung in einem bestimmten Datenformat oder die Möglichkeit zur Realtime-Bearbeitung über eine Schnittstelle – sind bei uns nicht die Kür, sondern die Pflicht.

 

2. Datenmanagement: einige Beispiele aus der Praxis?

Durch die enge Verzahnung von Mensch und Technik erweist sich das Management großer Datenmengen durch die Crowd als äußerst effizient, kostensparend und innovativ. Das geschieht nicht nur im Geschäftsumfeld – Big Data Management via Crowd beeinflusst alle gesellschaftlichen Bereiche. So existiert etwa in den USA ein Projekt namens Zeean.net, bei dem Bürger zu Wissenschaftlern im Dienst des Klimaschutzes werden. Wie das funktioniert? Ganz einfach: Jeder, der will, hat in dem Open-Source- und Open-Data-Projekt die Möglichkeit, bestimmte Daten – in diesem Fall: Schlüsselindikatoren – abzuliefern, die mit dazu beitragen, wirtschaftliche und geopolitische Auswirkungen des Klimawandels frühzeitig zu erfassen. Nimmt man dieses Modell als gedanklichen Ausgangspunkt, so ergeben sich tatsächlich endlose viele Modelle, bei denen Bürger oder eben Crowdworker diverse Daten und Indikatoren beitragen.
Ein ebenfalls wirkungsvoller Anwendungsfall ist das Tagging via Crowd: Hierbei taggen die Crowdworker in kurzer Zeit große Mengen an Bildern, Videos oder Audiodateien. Auch hier gilt: Mensch und Technik arbeiten Hand in Hand und erzielen so optimale Resultate.

 

3. Big Data – Machine Learning als Paradedisziplin

Machine Learning – das durch Menschen betriebene Anlernen und Überprüfen von künstlichen Systemen zur anschließenden automatischen Erfüllung von diversen Aufgaben – kann man durchaus als Paradedisziplin des Crowdsourcing bezeichnen. Die Crowdworker sorgen hier unter anderem für eine Automatisierung des Kundensupports oder für den geplanten Einsatz von Chatbots. Gerade Letztere werden immer wichtiger: Viele Webseiten bieten mittlerweile eingebettete Chats an, bei denen Chatbots eine wichtige Rolle spielen. Auch Aufgaben, bei denen Geschwindigkeit in der Bearbeitung großer Datenmengen gefragt ist, übernehmen die Crowdworker. Beispiel: Full-Screen-Segmentierung von Bildern fürs autonome Fahren.

Am Ende des Tages erweist sich Crowdsourcing somit als effiziente, flexible und oft verblüffend innovative Möglichkeit, auch dann noch Herr im eigenen Haus zu bleiben, wenn große Datenmengen zu bewältigen sind. Oder hätten Sie zum Beispiel gedacht, dass die Crowd durch das repetitive Spielen einer App einen Beitrag für die Demenzforschung leisten kann?

 

4. Fazit

Es müssen drei Komponenten für ein erfolgreiches Big Data Management via Crowd gegeben sein:

  1. menschliche Intelligenz
  2. technisches Know-how
  3. effizientes Crowd-Management

Sind diese Voraussetzungen erfüllt, können Big Data Aufgaben in hoher Geschwindigkeit und bei einer äußerst geringen Fehlerquote erledigt werden.

 

Artikel als PDF
Zum Anfang des Artikels springen

 

Schlagwörter: , ,