Case Study: Algorithmus Training – 10.000 Tweets in 24 Stunden kategorisiert

„Die Arbeit von Crowd Guru bei der Annotation von Tweets ermöglicht es uns, einfacher Algorithmen zu trainieren, die den Inhalt von Twitter-Nachrichten verstehen und einordnen können. Somit können wir für unsere Kunden bessere daten-getriebene Produkte entwickeln, die auch auf unstrukturierte Tweets zurückgreifen können.“

Niels Reinhard, Data Strategist, idalab

Inhalt

Unser Kunde
Die Aufgabe
Die Herausforderung für Crowd Guru
Die spezifischen Anforderungen
Die Lösung
Die Vorteile auf einen Blick
Das Resultat

 

Unser Kunde

idalab ist eine Data Science Agentur aus Berlin und berät führende Unternehmen und Start-ups bezüglich Machine Learning, Artificial Intelligence und mathematischer Modellierung. In konkreten Projekten erarbeitet idalab dabei Algorithmen, die es ermöglichen, innovativen Mehrwert aus Daten zu ziehen und das Geschäftsmodell aktiv zu unterstützen.

Die Aufgabe

Crowd Guru unterstützte idalab bei der Kategorisierung und Bewertung von Tweets zum Algorithmus Training. Für idalab war wichtig zu wissen, ob ein Tweet eine Verbindung zu Verkehrsthemen hat. Ist er für Mobilität insgesamt, Autoverkehr, ÖPNV, Zugverkehr, Schifffahrt und / oder Fahrradverkehr relevant / nicht relevant / unklar?

Die Herausforderung für Crowd Guru

Die besondere Herausforderung lag im gezielten Briefing für die Gurus: Ab wann ist ein Tweet in welche Kategorie einzuordnen? Texte sind immer Interpretationssache – bei diesem Auftrag jedoch musste Text nach klaren Vorgaben kategorisiert werden.

Die spezifischen Anforderungen

Im Datenjob sind für Sodexo u.a. für die Anzahl der Mitarbeiter und der Geschäftsführer der Zweigstelle relevant. Die Ergebnisse des Textjobs werden vom Vertrieb für eine detaillierte Ansprache genutzt. Sie müssen daher einen identischen Aufbau aufweisen.

Die Lösung

Der gesamte Auftrag wurde von Crowd Guru in Tausende kleine Einheiten zerlegt.
Vereinfacht gesagt: Pro Tweet eine Aufgabe. Durch die genaue Beschreibung der Aufgabe konnte die Fehlerquote auf ein Minimum gesenkt werden.

Die Vorteile auf einen Blick

Bei dieser Aufgabenstellung werden die Vorteile der Crowd Guru Lösung deutlich: Bereits nach einem Tag lag idalab das finale Ergebnis vor. Intern wäre eine solch schnelle Bearbeitung nicht möglich gewesen. Idalab spart Zeit, Geld und interne Ressourcen.

Das Resultat

Eine Aufgabe, die intern Mitarbeiter über Wochen binden würde, konnte dank Crowd Guru in nur 24 Stunden bearbeitet werden. Die Daten wurden von Crowd Guru so aufbereitet, dass idalab sie sofort in den Workflow integrieren und verwenden konnte.

Schlagwörter: , , ,

Schreibe einen Kommentar