Studiumsserver - Advanced Databases

Aufgabe 6: K-Means-Algorithmus I

Tabelle folgt

Clustern Sie die Punkte aus obiger Tabelle mit Hilfe des K–Means–Algorithmus. Nutzen Sie die Punkte P1, P4 und P6 als initiale Zentren.
Führen Sie das Clustering schriftlich durch und geben Sie für jede Iteration die entstandenen Cluster und die neuen Zentren an. Hat ein Punkt dieselbe kürzeste Distanz zu mehreren Zentren, so bleibt er demselben Cluster zugeordnet, dem er auch in der vorherigen Iteration zugeordnet war.

Datamining
K-Means

Lösung folgt irgendwann.

Aufgabe 7: Clustering

Geben Sie ein Beispiel bestehend aus drei natürlichen Zahlen an, bei dem der K– Means–Algorithmus mit K = 2 abhängig von der Wahl der initialen Clusterzentren, zwei unterschiedliche Resultate liefert.
Welches Resultat wird durch ein hierarchisches Clustering erreicht?

Datamining
Clustering

Lösung folgt irgendwann.

Aufgabe 8: K-Means-Algorithmus II

Wir betrachten die folgende Tabelle Employee:

Tabelle folgt

Normalisieren Sie die Tabelle Employee wie folgt:
– Ignorieren Sie die Attribute Ssn and Superssn.
– Transformieren Sie die Attribute Bdate and Salary wie folgt:
Bdate 􏰀→ (Bdate−1900)/10,
Salary 􏰀→ Salary/10000.
– Definieren Sie passende Abbildungen dom(A) → IRn – finden Sie jeweils passende n – für die Attribute Sex and Dno, sodass die Euklidische Distanz zwischen zwei unterschiedlichen Werten 2 beträgt.
Wenden Sie den K–Means–Algorithmus mit K = 3 auf die normalisierte Tabelle Employee’ an.
Wählen Sie die Tupel 2, 4, 5 der Tabelle als initiale Clusterzentren.
Sie dürfen diese Aufgabe auch mit Hilfe eines selbst erstellten Programms/Excel-Sheets/etc. lösen. Geben Sie in diesem Fall den Programm-Code ausgedruckt mit ab.

Datamining
K-Means

Java-Code folgt irgendwann.

Advanced Databases (DB2)

3. Übungsblatt

Aufgabe 6: K-Means-Algorithmus I

Aufgabe 7: Clustering

Aufgabe 8: K-Means-Algorithmus II