Die Abstände zwischen den einzelnen Objekten und die Abstände zwischen den Clustern sind berechenbar. Die Abstände zwischen den einzelnen Merkmalen sind definiert als $d(n,m)=d_{nm}$.
Bei ordinalskalierten Merkmalen ergeben sich zahlreiche Probleme, da die Messung von Abständen nicht ohne weiteres möglich ist. Daher muss man sich hierbei auf die ganzzahligen Abstände beschränken, welche berechnet werden können.
Quantitative Merkmale
Zu den wichtigsten Distanzen zählt die Lq-Distanz. Sie ist definiert als
$$d_q(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^q})^{\frac{1}{q}}$$
Eine wichtige Ausprägung ist die sog. euklidische Distanz, welche auch L2-Distanz genannt wird.
$$d_2(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^2})^{\frac{1}{2}}$$
Eng verwandt mit diesen Abständen ist die City-Block-Metrik:
$$d_1(x_n,x_m)=(\sum{\mid x_{ni}-x_{mi} \mid^1})^{\frac{1}{1}}$$
Umgestellt ergibt das dann:
$$d_q(x_n,x_m)=\sum{\mid x_{ni}-x_{mi}\mid} $$
An folgender Grafik kann man sehr gut erkennen, woher der Begriff „City-Block-Metrik“ kommt.
Sie gibt quasi den Weg an, der zwischen zwei „Blöcken“ liegt. Die euklidische Distanz hingegen berechnet die „Luftlinie“. Daraus wird auch leicht ersichtlich, dass die City-Block Metrik immer größer oder gleich der euklidischen Distanz sein muss.
Weitere interessante Inhalte zum Thema
-
Die Preiselastizität der Nachfrage
Vielleicht ist für Sie auch das Thema Die Preiselastizität der Nachfrage (Nachfrageänderung und die Marktnachfrage) aus unserem Online-Kurs Mikroökonomie interessant.
-
Kapazitätsabstimmung
Vielleicht ist für Sie auch das Thema Kapazitätsabstimmung (Aggregierte Produktionsplanung) aus unserem Online-Kurs Produktion interessant.