Derzeit ist Big Data in aller Munde und wird neben Cloud-Services als DIE Technologie gepriesen. Was als Hypethema derzeit durch die (IT-)Medien geistert, ist nur die konsequente Weiterentwicklung von bestehenden Technologien und der Verknüpfung mit nun vorhandenen Möglichkeiten.
Was ist Big Data?
Wörtlich übersetzt heißt es soviel wie „große Daten“ oder „viele Daten“. Genaugenommen handelt es sich dabei um eine hohe Zahl an kaum- bis völlig unstrukturierte Daten. Bei diesen Daten würde es unverhältnismäßig viel Zeit und Geld kosten, diese in relationelle Datenbanken zu laden um sie anschließend zu analysieren. Der Begriff „Big Data“ gibt auch keine Aussage darüber, um wieviele Daten es sich handelt.
„Big Data“ fällt in jedem Unternehmen als unstrukturiertes Datenmaterial an. Dies können Logfiles, Office-Dokumente, eMail-, SMS oder Chatnachrichten sein. Diese Daten geben ebenfalls Aufschluss über Geschäftsvorfälle. Für Unternehmen von Interesse ist dabei die Verknüpfung von vorhandenen Kundendaten, die beispielsweise in Kundendatenbanken oder Data Warehouses liegen, mit den unstrukturiereten Daten innerhalb sowie externer Daten. Dadurch erhoffen sich Unternehmen Vorteile bei der Kundenbearbeitung.
Warum Big Data?
Bisher klingt es nicht nach einer großen Neuerung. Es war irgendwie alles schon einmal da. Gerade wenn man das Datawarehouse-Konzept kennt, fragt man sich zunächst wo hier ein Unterschied zu finden. Der Unterschied hier steckt in einem kleinen Detail. Bei Datawarehouses werden Daten aus den operativen System, in der Regel relationale Datenbanken, in eigene Datenmodelle extrahiert und mit Zusatzinformationen angereichert. Das Ziel dabei besteht sich einen Informationswürfel zu bauen, den man je nach Sicht auf die Daten drehen kann um daraus Antworten abzulesen. Vorraussetzung dafür ist jedoch dass die Daten zunächst in einer strukturiereten Weise in das Data Warehouse und damit in die Datenbank gelangen. Je nach Datenquelle ist hier ein aufwendiger Transformationsprozess notwendig, der für jede Quelle separat angepasst werden muss.
Dagegen arbeitet Big Data genau mit dem Vorteil dass die Daten nicht mehr in eine neue Struktur transformiert werden müssen, sondern in ihrer bisherigen Form analysiert werden. Dies setzt jedoch auch andere Techniken für die Analyse voraus. Interessant sind vor allem auch das Wissen, welches in der Verknüpfung der Daten liegt. Die verschiedenen Daten wie Facebook-Likes eines Benutzers, Loginzeiten oder auch Standortdaten mögen bereits für sich allein genommen interessante Ansatzpunkte für Kundenwissen sein. Damit könnte beispielsweise abgelesen werden, welche Interessen der Benutzer hat, wann er Zeit im Internet verbringt oder wo er sich bevorzugt aufhält. Kombiniert bieten diese Daten jedoch ein deutlich umfassenderes Bild. Es können diverse Verhaltensmuster vorhergesagt werden, wie beipielsweise dass Benutzer A sich zu 60% um 20h an einem bestimmten Ort aufhält und einem (gelikten) Hobby nachgeht. Mittlerweile lassen sich hier interessante Profile und auch politische wie religiöse Neigungen nachweisen.
It’s a long way to go…
Jedoch ist gerade in Europa und insbesonders in Deutschland der Datenschutz ein großer Knackpunkt für Big Data. Selbst anonymisirte Daten lassen sich durch die Verknüpfung untereinander wieder de-anonymisieren. Für Unternehmen die Big Data für sich als Technologie entdecken ist es daher ratsam offen mit den verwendeten Daten umzugehen und sich nicht innerhalb ihrer Burg zu verstecken. Dadurch würden sie nur ihr Vertrauen bei den Leuten verspielen.
Ebenfalls müssen sich Unternehmen auch Gedanken über neue Systeme und Anwendungen für die Auswertung von Big Data machen. Mt bisherigen Systemen werden hier sehr wahrscheinlich keine großen Potentiale entdeckt. Und vor allem die Storageumgebung sollte dabei nicht vergesen werden. Allein diese Anforderungen machen Big Data derzeit leider nur für große Unternehmen interessant. Für kleine Unternehmen dagegen bietet es sich an öffentliche Big Data-Quellen wie Facebook mit der Graphensprache „Facebook Query Language“, Twitter oder auch der Service Google Trend zu nutzen.