Daten analyse mit MySQL
Deskriptive Datenanaylse mit Java, MySQL und ApachePOI.
Projektbeschreibung
Problembeschreibung
Motivation
Eine saubere und strukturierte Datenbasis bietet viele Möglichkeiten, auf Basis von Analyseergebnissen Strategieentscheidungen zu treffen. Mit dem Verständnis der Daten auf einer grundlegenden Ebene kann ein Unternehmen erfolgreicher agieren. Das generierte Wissen aus den vorliegenden Rohdaten kann nutzbringend in Entscheidungsprozessen eingebracht werden. Nur mit diesem zusätzlichen Wissen lassen sich auch fundierte Entscheidungen treffen.
Eine Voraussetzung für Datenanalyse ist das vorhanden sein von strukturierten Daten. Viele Unternehmen speichern ihre Daten oft ohne das vorhandensein einer Idee was überhaupt mit den Daten passieren soll. Die Frage, wie diese Daten weiter verwendet werden können oder sollen wird oft nicht gestellt. Das führt dazu, das Daten unstrukturiert abgespeichert werden. In einem solchen Fall ist eine zielführende Analyse schwierig. Die Daten müssen erst bereinigt und zu brauchbaren Informationen transformiert werden. Zudem wird ein Datenmanagementsystem benötigt, das einen einfachen und schnellen Zugriff ermöglicht. Standarmäßig kommen relationale Datenbankverwaltungssystem wie MySQL zum Einsatz. Es gibt aber auch zahlreiche andere Systeme. Sturkturiert und sauber abgelegt kann nun mit verschiedenen Methoden und statistischen Analyseverfahren eine Datenvisualisierung und -bewertung durchgeführt werden. Anschließend können die gewonnen Erkenntnisse in Praxisentscheidungen einfließen. Die Auswahl der Methoden und Analyseverfahren ist dabei abhängig von der Fragestellung.
Beispielsweise kann eine Bewertung auf einer Datenbeschreibung, der sog. deskriptiven Datananalyse erfolgen. Bei dieser Art der Datananalyse stehen Fragen im Raum wie "Wie hoch waren die Ausgaben in den zurückliegenden Monaten?" oder "In welchen Mengen wurden Ersatzteile nachbestellt?" Im Allgemeinen erfolgt die Analyse zur Klärung der Frage "Was ist passiert?".
Ausgangsituation
Die Fragestellung: "Wie hoch ist das Bestellvolumen?" und "Wie setzt es sich zusammen?". Wichige Attribute sind die Menge und die Kosten. Eine Visualisierung sollte in Excel erfolgen. Ebenso wurde über die Bedienung über eine GUI nachgedacht.
Umsetzung
Die Komponenten zur Lösung des Problems sind Java, MySQL und ApachePOI. Mit Hilfe von JDBC können die Daten aus einer MySQL-Datenbank abgerufen werden. Die bekannten SQL-Anweisungen sind einfach als String an Funktionen zu übergeben. Die Daten können bei bedarf mit Java weiter verarbeit werden. Die ApachePOI-Bibliothek liefert die benötigten Funktionen, um die Daten in eine Excel-Tabelle einzufügen. Es besteht auch die Möglichkeit, die Daten sofort in eine Pivot-Tabelle zu schreiben. Excel bietet den Vorteil, dass es einfach anzuwenden ist und es bietet verschiedene Möglichkeiten zur nachträglichen Datenvisualisierung. Möglich wäre auch eine webbasierte Datenvisualiserung in Form eines Dashboards gewesen. Verschiedene Optionen zur Interaktion hätten einfach implementiert werden können.
Das Projekt wurde vorerst ohne GUI umgesetzt. Die Bedienung ist im ersten Entwicklungsstadium nur über die Kommandozeile möglich (leider hat diese Projekt dieses Stadium auch nicht mehr verlassen). Ohne grafisches Interface und aufgrund der vorhanden Bibliothken ist ein relativ kurzes Programm mit knapp über 200 Zeilen entstanden. Einen Codesnippet zeigt das folgende Bild.
Ihr Tech-Partner bei Software- und Webprojekten
Mit professioneller Einstellung und kreativer Energie von der Idee bis zur fertigen Anwendung.
Kontakt