
Übersicht unserer Daten
Data

Gruppe C
01/15/2022

Die Abbildung zeigt unsere Daten in den verschiedenen Qualitäts-Leveln (Bronze, Silber, Gold und Platin). Außerdem zeigt sie auf, aus welcher Quelle die Daten stammen. Gelb sind die Genre-Listen, die Maren aus allen existierenden Spotify-Genres erstellt hat. Grün sind die Daten aus der Spotify- beziehungsweise der Firebase-API, da wir die Daten aus der Spotify-API zunächst in Firebase abspeichern. Blau sind die Daten der Ticketmaster-API. Man sieht wie die Daten nach und nach angepasst und bereinigt werden. Zudem wird erkenntlich, dass einige Daten voneinander abhängig sind diese zusammengeführt werden müssen. Beispielsweise wird die" genre-map_table" aus dem Bronze-Level für die Erstellung der "Ticketmaster_genre_agg_table" im Platin-Level benötigt.
Firebase-API
Die Firebase-API stellt in der Umsetzung unseres Use Cases einen Zwischenschritt dar. Da wir auf unserer Website nach der Berechtigung für die Spotify-Daten der User fragen, speichern wir diese Daten, die wir für den jeweiligen User über die API-Abfrage erhalten, in der Firebase-Datenbank ab. Wir verwenden Firebase, da es eine sehr nutzerfreundliche Datenbank ist und Daten einfach mit anderen Schnittstellen ausgetauscht werden können. Zusätzlich werden diese Daten mittels Firebase in unseren Delta Lake übertragen und liegen dort als Rohdaten im Bronze-Level vor. Dies wird nochmals in der Abbildung erkenntlich.