DBA24 Einführung in Data Science

Algorithmus, Baumdurchlauf, Compiler, Interpreter...; Cobol, Pascal, C/C++, Java & Co.
Antworten
sa.sa
Neues Mitglied
Neues Mitglied
Beiträge: 3
Registriert: 31.03.23 22:48

Hallo zusammen,

gibt es hier welche, die etwas über die TOK DBA24 berichten können?
Aufgabenstellungen etc.

Ich danke euch und viele Grüße
dergamler
Neues Mitglied
Neues Mitglied
Beiträge: 2
Registriert: 12.12.24 18:19

Für die Leute, die später draufstoßen, hier ist das Material aus dem Tutorium dazu:
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
dergamler
Neues Mitglied
Neues Mitglied
Beiträge: 2
Registriert: 12.12.24 18:19

Okay, habe heute geschrieben. Alles reiner Fließtext. Im großen und ganzen ist man gut damit getan, die Kontrollfragen aus dem Klausurvorbereitungszettel (und dem Begleitheft) zu lernen. ich hab auch mal meine Anki Karteikarten hochgeladen.
Für die Komplexaugaben wird aber auch Verständnis und nicht nur auswendig lernen vorausgesetzt.

1. Beschreibe die wesentlichen Unterschiede zwischen überwachtem und unüberwachtem Lernen. Nenne je drei Algorithmen und drei beispielhafte Anwendungsfälle (5 Punkte)
2. Erläutere die Precision und Recall Metriken. (4 Punkte)
3. Erläutere die Unterschiede zwischen Trainings-Sets, Test-Sets, und Validation-Sets. (6 Punkte)
4. Was ist TF-IDF in der Data Science? (5 Punkte)

Komplexaufgaben (2 von 3; je 20 Punkte)
5.
a. Erläutere ein Standardvorgehen für Data Mining anhand des CRISP-DM-Modells (12 Punkte)
b. Erläutere Overfitting und Underfitting
(vlt. wars auch Oversampling/Undersampling)
c. Wie geht man mit fehlenden Datensätzen um?

6.
a. Erläutere k-Means Algorithmus. Was ist das, wie ist er aufgebaut, wie funktioniert er? Nenne Vor- und Nachteile. (12 Punkte)
b. Man will die Regularisierung reduzieren. Eignet sich dafür ein kleines oder hohes k besser? Warum? (2 Punkte)
c. Man hat eine Aufgabe bei der 1000 Spalten und mehrere tausend Zeilen vorhanden sind. Ziel ist es die Dimensionen zu reduzieren. Der Computer hat Speicherbeschränkungen. Wie geht man hier vor? (6 Punkte)

7. Alles Codefragen zu Python, NumPy, Pandas, etc.
Du hast keine ausreichende Berechtigung, um die Dateianhänge dieses Beitrags anzusehen.
Antworten