Lernziele / Kompetenzen
|
Erfolgreiche Teilnehmer*innen kennen Konzepte sowie Technologien zur Speicherung und verteilten Verarbeitung von Big Data. Sie kennen Algorithmen zur Analyse von Big Data und können diese anwenden. Die Studierenden erwerben darüber hinaus Kenntnisse über die Techniken, Möglichkeiten und Anwendungen des Data Mining, insbesondere im Zeitreihenanalyse. Erfolgreiche Teilnehmer*innen sind in der Lage, Möglichkeiten zur Anwendung von Data Mining in einer Unternehmensumgebung zu erkennen, geeignete Techniken auszuwählen und anzuwenden und die Ergebnisse zu interpretieren.
|
Veranstaltungen
|
Data Mining
Art |
Vorlesung |
Nr. |
EMI2117 |
SWS |
2.0 |
Lerninhalt |
Data Mining wird allgemein als Ansatz zur Aufdeckung neuartiger Muster oder Zusammenhänge in großen Datenbeständen aufgefasst. Die betrieblichen Anwendungsmöglichkeiten von Data Mining sowie deren methodische Grundlagen werden in dem Modul vorgestellt, diskutiert und angewandt. Neben den einzelnen Methoden des Data Minings wird der Gesamtprozess von der Datenvorbereitung bis hin zur Evaluation nach dem CRISP-Standard behandelt. Themen sind u.a.
- Zeitreiehenanalyse
- Random Forest
- Gradient Boosting
- Support Vector Machines
|
Literatur |
Hastie, Trevor; Tibshirani, Robert; Friedman, J. H. (2017): The elements of statistical learning. Data mining, inference, and prediction. 12th ed. New York: Springer (Springer series in statistics). Hyndman, Rob J. (2018): Forecasting. Principles and practice ; [a comprehensive indtroduction to the latest forecasting methods using R ; learn to improve your forecast accuracy using dozenss of real data examples.]. second print edition. Lexington, Ky.: Otexts. Han, J., Kamber, M., Pei, J., Data Mining: Concepts and Techniques, 3rd ed. Burlington, Elsevier Science, 2011 Hand, D. J., Mannila, H., Smyth, P., Principles of data mining, Cambridge, Mass, MIT Press, 2001 |
Big Data Analytics
Art |
Vorlesung |
Nr. |
EMI2121 |
SWS |
2.0 |
Lerninhalt |
Speicherung, Abfrage und Analyse von großen Datenmengen ist ein anspruchsvolles Thema, das erhebliche Auswirkungen in verschiedenen Bereichen der Industrie und der Wissenschaft hat. Die Vorlesung behandelt Konzepte, Algorithmen und Technologien für Big Data sowie Beispiele für typische Anwendungen, die davon profitieren können.
Neben Ansätzen und Technologien zur Speicherung von großen Datenmengen wie bspw. auf Basis von Hadoop File System und NoSQL-Datenbanken werden insbesondere Konzepte zur Analyse von großen Datenmengen vorgestellt und diskutiert. Neben der Batch-Verarbeitung auf Basis von MapReduce oder SQL-ähnlichen Anfragesprachen sind auch Technologien zum Stream-Processing von besonderem Interesse. Es werden verschiedene Algorithmen und Technologien zum Machine Learning für Big Data Anwendungen wie beispielsweise Outlier Detection oder Page Rank und deren skalierbare Ausführung behandelt. Mögliche Big Data Anwendungen werden auch immer unter ethischen Aspekten diskutiert und bewertet.
|
Literatur |
Rajaraman, A., Ullman, J. D., Mining of massive datasets, New York, N.Y., Cambridge, Cambridge University Press, 2012 White, T., Hadoop, The definitive guide, 4. edition: O'Reilly & Associates, 2015 Marz, N., Warren, J., Big data: Principles and best practices of scalable realtime data systems, O'Reilly Media, 2013 Aggarwal, Charu C., Data Mining, The Textbook, Cham, Springer International Publishing, 2015 |
Praktikum Big Data Analytics
Art |
Praktikum |
Nr. |
EMI2122 |
SWS |
2.0 |
Lerninhalt |
Praktische Umsetzung von Konzepten, Methoden und Big Data Technologien in Übungen.
Bearbeitung von Fallstudien.
|
|