10.000 TWEETS IN 24 STUNDEN KATEGORISIERT FÜR idalab
ALGORITHMUS TRAINING DURCH DIE CROWD
Kunde: idalab
idalab ist eine Data Science Agentur aus Berlin und berät führende Unternehmen und Start-Ups bezüglich Machine Learning, Artificial Intelligence und mathematischer Modellierung. In konkreten Projekten erarbeitet idalab dabei Algorithmen, die es ermöglichen, innovativen Mehrwert aus Daten zu ziehen und das Geschäftsmodell aktiv zu unterstützen.
„Die Arbeit von Crowd Guru bei der Annotation von Tweets ermöglicht es uns, einfacher Algorithmen zu trainieren, die den Inhalt von Twitter-Nachrichten verstehen und einordnen können. Somit können wir für unsere Kunden bessere daten-getriebene Produkte entwickeln, die auch auf unstrukturierte Tweets zurückgreifen können.“
Niels Reinhard, Data Strategist
Der Überblick
10.000 Tweets zu Verkehrsthemen müssen zum Algorithmus Learning kategorisiert werden.
Die Kategorisierung erfolgte durch die Crowd Gurus. Innerhalb von 24 Stunden lag idalab das Resultat vor.
Die Aufgabe
Crowd Guru unterstützte idalab bei der Kategorisierung und Bewertung von Tweets zum Algorithmus Training. Für idalab war wichtig zu wissen, ob ein Tweet eine Verbindung zu Verkehrsthemen hat. Ist er für Mobilität insgesamt, Autoverkehr, ÖPNV, Zugverkehr, Schifffahrt und / oder Fahrradverkehr relevant / nicht relevant / unklar?
Die Herausforderung
Die besondere Herausforderung lag im gezielten Briefing für die Gurus: Ab wann ist ein Tweet in welche Kategorie einzuordnen? Texte sind immer Interpretationssache – bei diesem Auftrag jedoch musste Text nach klaren Vorgaben kategorisiert werden.
Die Lösung
Der gesamte Auftrag wurde von Crowd Guru in Tausende kleine Einheiten zerlegt.
Vereinfacht gesagt: Pro Tweet eine Aufgabe. Durch die genaue Beschreibung der Aufgabe konnte die Fehlerquote auf ein Minimum gesenkt werden.
Die Vorteile
Bei dieser Aufgabenstellung werden die Vorteile der Crowd Guru Lösung deutlich: Bereits nach einem Tag lag idalab das finale Ergebnis vor. Intern wäre eine solch schnelle Bearbeitung nicht möglich gewesen. Idalab spart Zeit, Geld und interne Ressourcen.
Das Resultat
Eine Aufgabe, die intern Mitarbeiter über Wochen binden würde, konnte mit Hilfe von Crowd Guru in nur 24 Stunden bearbeitet werden. Die Daten wurden so aufbereitet, dass idalab sie sofort in den Workflow integrieren und verwenden konnte.
10.000 Tweets
zu Verkehrsthemen kategorisiert.
Nur 24h
Bearbeitungszeit.
150
speziell für dieses Projekt qualifizierte Gurus.