Sentiment-Analyse (ZIM)
Projektleiter |
Prof. Dr.-Ing. Markus Haid |
Projektbeteiligte |
Ishak Boyaci, Jeet Biswas |
Projektpartner |
m-result – the data company – GmbH |
Laufzeit |
12/2018 – 11/2020 |
Das Projekt: „Entwicklung einer automatisierten Sinnerkennung von Bewertungsphrasen für ein strategisches Content-Analyse-Instrument“ oder hier abgekürzt mit „Sentimental-Analyse“, kombiniert Ansätze aus der künstlichen Intelligenz zur Erstellung eines Social Media Research Tools. So wie der zunehmende Anstieg von Sensoren in allen Märkten und die Verwendung von zunehmend kleineren und günstigere Sensoren, bringt eine ständig zu arbeitende wachsende Datenmenge nur eine geringe Qualität mit sich. Die Herausforderung liegt in der Auswertung und Analyse einer wachsenden Anzahl zu verarbeitender Datenmengen unterschiedlichster Datenquellen, dem sogenannten Big Data. Die Verarbeitung dieser generierten Daten benötigen intelligente und effiziente Algorithmen zur Verarbeitung und ein strukturiertes Datenverwaltungssystem.
Motivation
Die steigende Nachfrage nach Informationen zur Wahrnehmung des eigenen Unternehmens ließ in den vergangenen Jahren eine große Anzahl an Social Media Monitoring Tools entstehen, die softwarebasiert unspezifisch das Internet nach Daten durchforsten und Big Data Analysen zur Verfügung bereitstellen. Allerdings liefern diese Analysen nicht mehr als Häufigkeitszählungen von Beiträgen, sodass der Datenauswertung nicht für eine systematische Analyse geeignet ist. Entsprechend müssen die Daten manuell von Marktforschern ausgewertet werden.
Die Marktforschung liefert ständig Informationen für strategische Managemententscheidungen, abseits von groben Trendaussagen. Entsprechend müssen auch Kundenbedürfnisse hinsichtlich der Informationsqualität erfüllt werden: Die gelieferten Daten müssen sicher, verlässlich und objektiv sein.
Zur Lösung dieses Problems entstand die Idee zur Entwicklung des „sentiment lab“ Tools. Mit Sentiments (Polaritätswerte) können strukturierte Daten in Form von Phrasen gesucht und automatisiert ausgewertet werden. Die Werte schwanken zwischen -1 (sehr schlechte Bewertung) und +1 (sehr gute Bewertung) mit einer Bewertungspräzision von ca. 50 % mit Bezug auf Unternehmen, Produkt und Topic (z. B. eine Produkteigenschaft).
Ziele
Ziel des Vorhabens ist es, ein autonomes und selbstlernendes Social Media Research Tools „sentiment lab“ zur Bewertung mithilfe von Hidden Markov Models-basierten Algorithmen zu erstellen, das:
- Jede Bewertungsphrase mit einer statistischen Wahrscheinlichkeit belegt, dass richtig bzw. falsch erkannt worden ist.
- Den Prozentsatz automatisch richtig erkannter Bewertungen erhöht.
Aufgrund dessen, dass eine Bewertungsgenauigkeit bei 50 % liegt, ist eine vollständige Automatisierung nicht möglich. Dies ist vielfach durch manuelles Nachvalidieren untersucht worden.