Advanced Databases (DB2)

3. Übungsblatt

Aufgabe 6: K-Means-Algorithmus I

12

Tabelle folgt
Clustern Sie die Punkte aus obiger Tabelle mit Hilfe des K–Means–Algorithmus. Nutzen Sie die Punkte P1, P4 und P6 als initiale Zentren.
Führen Sie das Clustering schriftlich durch und geben Sie für jede Iteration die entstandenen Cluster und die neuen Zentren an. Hat ein Punkt dieselbe kürzeste Distanz zu mehreren Zentren, so bleibt er demselben Cluster zugeordnet, dem er auch in der vorherigen Iteration zugeordnet war.
0%
Lösung folgt irgendwann.

Aufgabe 7: Clustering

8
  1. Geben Sie ein Beispiel bestehend aus drei natürlichen Zahlen an, bei dem der K– Means–Algorithmus mit K = 2 abhängig von der Wahl der initialen Clusterzentren, zwei unterschiedliche Resultate liefert.
  2. Welches Resultat wird durch ein hierarchisches Clustering erreicht?

0%
Lösung folgt irgendwann.

Aufgabe 8: K-Means-Algorithmus II

15
Wir betrachten die folgende Tabelle Employee:
Tabelle folgt
  1. Normalisieren Sie die Tabelle Employee wie folgt:
    – Ignorieren Sie die Attribute Ssn and Superssn.
    – Transformieren Sie die Attribute Bdate and Salary wie folgt:
    Bdate 􏰀→ (Bdate−1900)/10,
    Salary 􏰀→ Salary/10000.
    – Definieren Sie passende Abbildungen dom(A) → IRn – finden Sie jeweils passende n – für die Attribute Sex and Dno, sodass die Euklidische Distanz zwischen zwei unterschiedlichen Werten 2 beträgt.
  2. Wenden Sie den K–Means–Algorithmus mit K = 3 auf die normalisierte Tabelle Employee’ an.
    Wählen Sie die Tupel 2, 4, 5 der Tabelle als initiale Clusterzentren.
    Sie dürfen diese Aufgabe auch mit Hilfe eines selbst erstellten Programms/Excel-Sheets/etc. lösen. Geben Sie in diesem Fall den Programm-Code ausgedruckt mit ab.

0%
Java-Code folgt irgendwann.