Die Blockmodellanalyse: Theorie und Anwendung einer netzwerkanalytischen Methode (German Edition) 383506049X, 9783835060494

Richard Heidler gibt einen Überblick über die Blockmodellanalyse, die er aus verschiedenen Perspektiven reflektiert. Die

110 94 6MB

German Pages 135 [129] Year 2006

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Die Blockmodellanalyse: Theorie und Anwendung einer netzwerkanalytischen Methode (German Edition)
 383506049X, 9783835060494

Citation preview

Richard Heidler Die Blockmodeilanalyse

SOZIALWISSENSCHAFT

Richard Heidler

Die Blockmodellanalyse Theorie und Anwendung einer netzwerkanalytischen Methode

Mit einem Geleitwort von Dr. Rainer Diaz-Bone

Deutscher Universitats-Verlag

Bibliografische Information Der Deutschen Nationalbibliothek Die Deutsche Nationalbibliothek verzeichnetdiese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet iJber abrufbar.

1. Auflage Dezember2006 Alle Rechte vorbehalten © Deutscher Universitats-Verlag I GWV Fachverlage GmbH, Wiesbaden 2006 Lektorat: Brigitte Siegel / Ingrid Walther Der Deutsche Universitats-Verlag ist ein Unternehmen von Springer Science+Business Media. www.duv.de Das Werk einschlieBlich aller seiner Telle ist urheberrechtlich geschijtzt. Jede Verwertung auBerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verlags unzulassig und strafbar. Das gilt insbesondere fijr Vervielfaltigungen, Ubersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten waren und daher von jedermann benutzt werden durften. Umschlaggestaltung: Regine Zimmer, Dipl.-Designerin, Frankfurt/Main Druck und Buchbinder: Rosch-Buch, ScheBlitz Gedrucktauf saurefreiem und chlorfrei gebleichtem Papier Printed in Germany ISBN 978-3-8350-6049-4

Geleitwort Die Sozialwissenschaftliche Netzwerkanalyse ermoglicht die systematische Analyse komplexer sozialer Strukturen. In vielen Teilbereichen der Sozialwissenschaften wie Organisations- und Innovationsforschung, Wirtschaftssoziologie, Sozialstrukturanalyse, Sozialgeschichte, Stadtsoziologie oder Familiensoziologie und anderen finden netzwerkanalytische Verfahren zunehmend Anwendung. Seit den 1970er Jahren stellt die Netzwerkanalyse auch fortgeschrittene formale Techniken und Strategien zur Verfiigung, um komplexe Netzwerkstrukturen abzubilden, zu verdichten und zu analysieren. Zu diesen Verfahren zahlt die von Harrison C. White und seinen Mitarbeiter in den USA entwickelte Blockmodellanalyse. Diese gruppiert Akteure oder Organisationen, die gleiche oder ahnliche Muster von Netzwerkbeziehungen aufweisen. Die so gebildeten Blocke stellen die eigentliche Struktur eines komplexen Netzwerkes dar, die ohne den Einsatz der Blockmodellanalyse nicht erkennbar ware. Die so erhaltene Struktur kann - je nach theoretischem Blickwinkel - nun ihrerseits als Ursache oder als Resultat sozialer Prozesse angesehen werden. Die erhaltenen Blocke konnen weiterhin netzwerkanalytisch untersucht und interpretiert werden, die netzwerkanalytischen Befunde konnen aber auch mit anderen Daten und Methoden kombiniert werden. Das vorliegende Buch von Richard Heidler schlie£t eine Liicke in der einfiihrenden Literatur zur Sozialwissenschaftlichen Netzwerkanalyse. Denn es eroffnet einen verstandlichen Zugang zu den soziologischen und formalen Grundlagen der Blockmodellanalyse sowie zu ihren neueren Entwicklungen. Eine Starke dieses Buches liegt aus soziologischer Sicht darin, dass es die Vernetzung von soziologischtheoretischen Grundlagen und den formalen netzwerkanalytischen Strategien herausstellt. Auch die Blockmodellanalyse basiert auf soziologischen Traditionen und Theoremen, die hier zunachst vorgestellt werden. Auf dieser soziologischen Grundlage erhalten die Verwendungsmoglichkeiten der Blockmodellanalyse ihren soziologischen Sinn und wird der soziologische Zusammenhang zwischen Theorie und Methode in der konkreten Forschungspraxis herstellbar. Diese Einfiihrung verzichtet weitestgehend auf eine mathematische Darstellungsweise und fiihrt mit Hilfe vieler Beispiele und dem Einsatz von Grafiken in die Blockmodellanalyse ein. Richard Heidler stellt die Entwicklung der Blockmodellanalyse, ihre Logik und

VI

Geleitwort

die Differenzierung in verschiedene Varianten dar. Er vergleicht die Eigenschaften der verwendeten Algorithmen, fiihrt in die Interpretation von Blockmodellen ein und erlautert Kriterien, wie man blockmodellanalytische Result ate beurteilen kann. Zudem wird die Frage erortert, wie Blockmodellanalysen das Verhaltnis von Struktur und Handlung oder dasjenige von Struktur und Dynamik handhaben. Insgesamt wird so auch dargelegt, was Blockmodellanalysen leisten konnen und was ihr mogliches Einsatzspektrum ist. Damit leistet dieses Buch auch eine Hinfiihrung zur eigenen praktischen Anwendung der Blockmodellanalyse. Es ist sowohl fiir Studierende geeignet, die sich fiir die moderne Verfahren der empirischen Sozialforschung interessieren, aber auch niitzlich fiir Sozialwissenschaftlerinnen und Sozialwissenschaftler in universitarer oder aul^eruniversitarer Praxis, die sich iiber den Stand der Blockmodellanalyse einen Uberblick verschaffen wollen, um zu priifen ob - und dann auch wie - sie selber ein Netzwerk blockmodellanalytisch untersuchen konnen. Die Sozialwissenschaftliche Netzwerkanalyse wird sich mit ihrem umfangreichen Arsenal an Verfahren und Theoremen sowie mit den vielen mittlerweile vorliegenden paradigmatischen Untersuchungen in den Sozialwissenschaften weiter etablieren. Dieser Band wird dazu sicher einen Beitrag leisten. Dr. Rainer Diaz-Bone

Danksagung

Dieses Buch basiert auf meiner Diplomarbeit, die ich 2006 an der FU-Berlin geschrieben habe. Die Entwicklung der Thematik ergab sich aus einem Projektseminar «Sozialwissenschaftliche Netzwerkanalyse» im WS 2004/05 und SS 2005 von Dr. Rainer Diaz-Bone. Ihm danke ich besonders fur seine vielseitige Unterstiitzung und anregende Kritik. Neben Dr. Rainer Diaz-Bone wurde die Diplomarbeit von Prof. Heiner Ganftmann betreut, ihm sei herzUch gedankt. Fiir die gro£zugige Uberlassung der Daten danke ich Prof. Jorg Sydow und Prof. Arnold Windeler. Die Moglichkeit, forschungspraktische Erfahrung zu sammeln, ergab sich fiir mich und meinen Studiumskollegen Clemens Bliimel durch eine Kooperation mit Prank Lerch vom Lehrstuhl fiir Unternehmenskooperation an der FU Berlin. Beiden danke ich fiir die freundschaftliche Unterstiitzung und anregenden Diskussionen. Weiterhin danke ich Patrick Wohrle fiir seinen unermlidlichen Einsatz beim Korrekturlesen und seine vielen hilfreichen Anregungen. Andreas Witzel danke ich dafiir mir die Verwendung des Textsatzprogramms LMgK nahegelegt zu haben, ohne seine Unterstiitzung ware die Verwendung von WTJ^ nicht gelungen. Meiner Familie danke ich fiir ihre stete emotionale und finanzielle Hilfe, ihr ist die Arbeit gewidmet. Richard Heidler

Inhaltsverzeichnis

Geleitwort

V

Dank

VII

1

Einleitung

1

2

Grundlegendes zur Blockmodellanalyse

5

2.1

5

3

4

5

Das grundlegende Konzept der Blockmodellanalyse

2.2

Die Geschichte der Blockmodellanalyse

11

2.3

Einordnung der Blockmodellanalyse in ihren methodischen Kontext

17

Theoretische Perspektive der Blockmodellanalyse

23

3.1

Das relational-strukturalistische Postulat

23

3.2

Structuralist determinism

24

3.3

Der Rollenbegriff der Blockmodellanalyse

26

3.4

Soziale Position und Soziale Struktur

30

3.5

Structuralist instrumentalism

31

3.6

Structuralist constructionism

35

3.7

Blockmodellanalyse und Dynamik

38

Positionale Analyse der Blockmodellanalyse

39

4.1

Verschiedene Verfahren im Vergleich

39

4.2

Der Datensatz

41

4.3

Verfahren

43

4.3.1

Direkte Verfahren

43

4.3.2

Die Clusteranalyse

49

4.3.3

Das CONCOR-Verfahren

61

Von der Partition zum Blockmodell

65

5.1

Blockdichtematrix

65

5.2

Blockkriterien fiir eine Image-Matrix nach struktureller Aquivalenz

66

5.2.1

67

Fat Fit

X

Inhaltsverzeichnis

5.3 6

7

5.2.2

Nullblockkriterium

68

5.2.3

Das a-Dichte-Kriterium

69

Der Image-Graph

70

Die Interpretation eines Blockmodells

77

6.1

Assoziation mit Akteursattributen

78

6.2

Interpretation der Positionen

81

6.3

Interpretation der Gesamtstruktur

85

GutemaBe und Vergleich der GiJtewerte

89

7.1

Gutema£e

89

7.2

Vergleich nach Giitemal^en

92

7.3

Tabellen zu den Giitema£en

98

7.4

Tabellen zur methodische Vorgehensweise

98

8

Weitere Verfahren

105

9

Diskussion der Ergebnisse und Ausblick

109

Literaturverzeichnis

113

Abbildungsverzeichnis

2.1

Graph des Freundschaftsnetzwerk

6

2.2

Image-Graph des Freundschaftsnetzwerk

9

2.3

Kombinationsmoghchkeiten von Rollenanalyse und Blockmodellanalyse nach Wasserman und Faust (1994, S.352)

21

4.1

EukUdische Distanz der Akteure C und E mit der Option «retain»

52

4.2

EukUdische Distanz der Akteure C und E mit der Option «ignore»

53

4.3

EukUdische Distanz der Akteure C und E mit der Option «reciprocal» 53

4.4

Der Korrelationskoeffizient und die EukUdische Distanz am einem Beispiel im Vergleich

4.5

55

Zunahme der Fehlerquadratsumme (Y-Achse), Clusterzahl (X-Achse) (Analyse A2)

59

4.6

Dendrogramm des Wardverfahrens (Analyse A2)

60

5.1

Image-Graph klassisch (Analyse A4)

74

5.2

Modifizierter Image-Graph (Analyse A4)

75

6.1

Klassifikation von Punkten nach Harary, Norman und Cartwright (1965, S.16)

81

Tabellenverzeichnis

2.1

Soziomatrix Preundschaftsnetzwerk

5

2.2

Permutierte Soziomatrix Preundschaftsnetzwerk

7

2.3

Blockdichtematrixmatrix Preundschaftsnetzwerk

8

2.4

Image-Matrix Preundschaftsnetzwerk

8

4.1

Dichte der Relationstypen

43

4.2

Die vier idealen Blocktypen bei struktureller Aquivalenz

44

4.3

Die vier idealen Blocktypen bei struktureller Aquivalenz als Blockmatrix nach Doreian, et al. (2005, S.173)

4.4

44

Inkonsistenzen nach Blocken bei dem einfachen Pajekverfahren (Analyse B6)

46

4.5

Beispieltabelle fiir die Berechnung der Euklidischen Distanz . . . .

52

4.6

Beispielrechnung zum Korrelationskoeffizient

55

4.7

Partitionierung nach dem CONCOR-Verfahren

62

5.1

Piktive partitionierte Soziomatrix

65

5.2

Blockdichtematrix der Soziomatrix aus Tabelle 5.1

65

5.3

Blockdichtematrix personliche Beziehungen (Analyse A4)

66

5.4

Blockdichtematrix Porschungsbeziehungen (Analyse A4)

66

5.5

Blockdichtematrix Geschaeftsbeziehungen (Analyse A4)

66

5.6

Image-Matrix personliche Beziehungen (Analyse A4)

69

5.7

Image-Matrix Porschungsbeziehungen (Analyse A4)

69

5.8

Image-Matrix Geschaftsbeziehungen (Analyse A4)

70

6.1

Anteil der Institutionentypen an den Positionen (Spaltenprozente)

6.2

Anteil der Organisationen mit technol. Spezialisierungen an den Positio-

...

nen (mehrere Spezialisierungen moglich, Spaltenprozente) 6.3

79 80

Positionstypologie nach Burt (1976, S.107). (die Werte 0,0 und 0,5 stellen dabei einen Richtwert da und sind modifizierbar)

82

6.4

Positionstypologie (Marsden 1989, S.448)

84

6.5

Zentrum/Peripherie-Struktur einer Image-Matrix

85

XIV 6.6

Tabellenverzeichnis Image-Matrix Forschungsbeziehungen (Permutierte Version von Tabelle 5.7)

86

6.7

Hierarchie-Struktur einer Image-Matrix

87

7.1

Vergleich der Giitemafte fiir das multiple Netzwerk

99

7.2

Vergleich der Giitemafte fiir das einfache Netzwerk

100

7.3

Analysemethoden fiir das multiple Netzwerk (A1-A3)

101

7.4

Analysemethoden fiir das multiple Netzwerk (A4-A6)

102

7.5

Analysemethoden fiir das einfache Netzwerk (B1-B5)

103

7.6

Analysemethoden fiir das einfache Netzwerk (B6-B7)

104

8.1

Zwei ideale Blocktypen bei regularer Aquivalenz nach Doreian et al. (2005, S.174)

106

1 Einleitung Name me something in sociology that isn't structural. What isn't? . . . (Harrison C White

(2001))

Die Blockmodellanalyse ist ein anspruchsvolles Verfahren, um soziale Netzwerke zu untersuchen. Sie stammt aus den 70er Jahren, als sich die Sozialwissenschaftliche Netzwerkanalyse als eigenes Forschungsparadigma etablierte und eine Fiille von Methoden zur Analyse von sozialen Netzwerken und damit verkniipften theoretischen Perspektiven entwickelte. Die Blockmodellanalyse ist deswegen besonders interessant, weil sie fundament ale theoretische Konzepte wie «soziale Rolle», «soziale Position» und «soziale Struktur» mit einer formalen quantitativen Analysemethode verkniipft. Das Verfahren ist vielseitig anwendbar und hat schon in mehreren Forschungsgebieten wie der «historischen Soziologie», z.B. Bar key und Van Rossem (1997); Padgett und Ansell (1993), der «Forschung zu kommunalen Eliten», z.B. R. L. Breiger (1979); Kappelhoff (1987), der Forschung zu «Interorganisationalen Netzwerken», z.B. Galaskiewicz und Krohn (1984); Lincoln und Gerlach (2004); Knoke und Rogers (1979), der Forschung zu «internationalen Handelsbeziehungen», z.B. R. L. Breiger (1981); Nemeth und Smith (1985), der Forschung zu «Wissenschaftsnetzwerken», z.B. Burt (1978/79) und in der Ethnologic, z.B. Bearman (1997), zu substantiellen Beitragen gefiihrt. Die Wichtigkeit dieser Methode ergibt sich daraus, dass sie moglicherweise geeignet ist, ein Auseinanderfallen der Soziologie in Theorien und Methoden zu iiberwinden. Auf der Theorieseite gibt es die von Durkheim (1894) formulierte soziologische Grundiiberlegung, dass Soziales als soziale Tatsache ein iiber das Individuum hinausgehendes eigenstandiges Wesen sui generis besitzt, das wiederum auf das Individuum als Zwang zuriickwirkt.^ Simmel (1908) definierte als konstitutiven Gegenstand der Soziologie entsprechend nicht das Individuum, sondern die Vergesellschaftung^ al^ Die Verbindung von Durkheim mit der theoretischen Perspektive der Blockmodellanalyse ist allerdings nur teilweise gegeben (Wellman 1988, S.33). Die theoretische Position Durkheims kann als normativer Strukturalismus bezeichnet werden, wohingegen die Blockmodellanalyse auf einem relationalen Strukturalismus basiert.

1 Einleitung so dcLS in Wechselwirkung-Tveten der Individuen. Auf der anderen Seite steht eine simplifizierende angewandte Sozialforschung, die dies haufig nicht beriicksichtigt und immer wieder beim Individuum als Untersuchungseinheit stehen bleibt. Dabei kann die Soziologie von einer Uberwindung dieser Kluft sicherlich profitieren. Das primare Interesse dieser Arbeit liegt also in der besonderen theoretischen Konzeption dieser Methode. Daraus resultiert jedoch auch ein Interesse an der konkreten Durchfiihrung und Anwendung des Verfahrens. Die Entwicklung der Methode wurde von einigen mit einem umfangreichen mathematischen Hintergrund ausgestatteten Spezialisten in den letzten Jahren vorangetrieben.^ Allerdings scheint der Einsatz der Methode ihrer Entwicklung hinterherzuhinken, und das nicht unproblematische CONCOR-Verfahren ist zur Durchfiihrung einer Blockmodellanalyse noch recht verbreitet. Besonders problematisch ist, da^s in einigen Forschungsarbeiten die methodischen Entscheidungen, die zur Durchfiihrung einer Blockmodellanalyse notwendig sind, kaum begriindet und reflektiert werden.^ Dabei ist die Blockmodellanalyse gerade ein Verfahren, dass dem Forscher besonders viele methodische Entscheidungen abverlangt. Es fehlt an einer Einfiihrung, die diese Entscheidungen iibersichtlich darstellt, um die Implikationen verschiedener Vorgehensweisen zu verdeutlichen.'* Dabei sollen auch praktische Hinweise gegeben werden, mit welchen Computerprogrammen welche Analyseschritte durchgefiihrt werden konnen.^ Somit ergeben sich fiir diese Arbeit zwei Fragestellungen, die auseinander hervorgehen: (1) Die theoretische Grundlegung des Verfahrens soil rekonstruiert werden. Dem liegt die Uberzeugung zugrunde, dass sich Theorien und Methoden nicht voneinander trennen lassen. Dabei soil insbesondere die soziologische Erklarungsleistung einer strukturell-relationalen Theoriekonzeption herausgearbeiSo sind z.B. Harrison C. White, Stanley Wassermann, Vladimir Batagelj, Paul Holland alle diplomierte Mathematiker oder Physiker (Freeman 2004, S.135). Z.B. bei Koku und Wellman (2004); Serdiilt (2000). Die umfangreiche Einfiihrung in den entsprechenden Kapiteln 9, 10, 12 und 16 bei Wasserman und Faust (1994) ist leider nicht mehr ganz aktuell und beriicksichtigt direkte Verfahren der Blockmodellanalyse kaum. Am ehesten kann noch das Buch «Generalized Blockmodeling» von Doreian, Batagelj und Ferligoj (2005) als Einfiihrung in aktuelle Verfahren dienen, ist aber im besonderen Ma£e auf das «Generalized Blockmodeling» ausgerichtet, eine besondere Richtung der Blockmodellanalyse (siehe Kapitel 8). Zudem werden die theoretischen Grundlagen der Blockmodellanalyse dort kaum erlautert. Im deutschsprachigen R a u m gibt es das lesenswerte Lehrbuch von Jansen (2003) zur Netzwerkanalyse, das allerdings beziiglich der Blockmodellanalyse auch nicht auf dem neuesten Stand ist und fiir die konkrete methodische Durchfiihrung kaum Hilfestellung gibt. Insbesondere werden in dieser Arbeit die C o m p u t e r p r o g r a m m e zur Sozialwissenschaftlichen Netzwerkanalyse Ucinet (Borgatti, Everett & Freeman 2002), Pajek (Batagelj & Mrvar 2006) und Netminer (Cyram 2005) sowie das Clusteranalyseprogramm ClustanGraphics (Wishart 2005a) verwendet.

tet werden. (2) Um die Anwendung der Methode zu fordern, sollen die Schritte bei der Durchfiihrung iibersichtlich dargestellt werden. Daraus resultiert eine methodische Pragestellung: Was muss ein Forscher beachten, wenn er sich fiir die Anwendung einer Blockmodellanalyse entscheidet? Diese Pragestellung ergibt sich insbesondere auch deshalb, weil einige methodische Alternativen bisher noch nicht systematisch beziiglich ihrer Giite gepriift wurden. Dies soil hier geschehen, um dem Forscher eine Entscheidungshilfe an die Hand zu geben. Die Arbeit ist dabei folgendermaften gegliedert. Kapitel 2 ist eine Einfiihrung in die Grundlagen der Blockmodellanalyse. Dabei werden in Kapitel 2.1 an einem fiktiven kleinen Netzwerk element are Techniken und Begriffe eingefiihrt. Anschliefeend wird in Kapitel 2.2 die Blockmodellanalyse in einen wissenschaftshistorischen Kontext eingeordnet, um die Verortung der Methode im Feld der Soziologie zu erleichtern. In der Sozialwissenschaftlichen Netzwerkanalyse haben sich weitere Methoden entwickelt, von denen die Blockmodellanalyse zum Teil abzugrenzen ist; andere Methoden stellen eine Erganzung dar. Dies soil in Kapitel 2.3 dargelegt werden. In Kapitel 3 wird dann die theoretische Perspektive der Blockmodellanalyse beleuchtet. Dabei werden zentrale Begriffe naher erlautert, und die spezifische theoretische Position, die mit der Blockmodellanalyse verbunden ist, soil herausgearbeitet werden. In Kapitel 4 sollen dann verschiedene Verfahren der positionalen Analyse vorgestellt werden, auf denen die Blockmodellanalyse aufbaut. Zuerst wird allerdings in Kapitel 4.2 ein Datensatz eines interorganisationalen Netzwerkes vorgestellt, der im Verlauf der weiteren Arbeit zur Exemplifizierung verschiedener Analysen dient. Alle Analysen, die im Verlauf der Arbeit erfolgen, sind in den Tabellen 7.3-7.6 beschrieben. Die Analysen, die fiir das multiple Netzwerk (alle drei Netze des interorganisationalen Netzwerkes) durchgefiihrt wurden, sind mit Al bis A6 abgekiirzt. Die Analysen fiir das einfache Netzwerk der personlichen Beziehungen in dem interorganisationalen Netzwerk wurden mit Bl bis B7 abgekiirzt. Bei den zu vergleichenden Verfahren der Blockmodellanalyse stehen Verfahren nach struktureller Aquivalenz^ im Vordergrund, auch wenn sich die Logik der Verfahren, z.T. wie in Kapitel 8 erlautert auf andere Aquivalenzdefinitionen (ibertragen lasst. Bei der Gegeniiberstellung der Verfahren sollen drei Typen betrachtet werden. In Kapitel 4.3.1 werden Verfahren vorgestellt, die auf der Permutation von Netzwerken beruhen. In Kapitel 4.3.2 sollen clusteranalystische Verfahren behanDas Konzept der strukturellen Aquivalenz wird im Verlauf der Arbeit naher erlautert.

1 Einleitung delt werden. In Kapitel 4.3.3 wird das CONCOR-Verfahren naher beleuchtet. Die drei Verfahren sollen in ihrer Logik und ihrer Anwendbarkeit verglichen werden. In Kapitel 5 wird dann die Konstruktion eines Blockmodells aus der mit den Verfahren der positionalen Analyse vorgenommenen Gruppierung der Akteure erlautert. Dabei wird in Kapitel 5.3 insbesondere auch die Erstellung eines Image-Graphen beschrieben. In Kapitel 6 sollen die Moglichkeiten der Interpretation eines Blockmodells deutlich gemacht werden. Dazu wird auch die Analyse des interorganisationalen Netzwerkes herangezogen. Kapitel 6 bezieht sich dann wieder starker auf die in Kapitel 3 dargelegten theoretischen Voraussetzungen, auf deren Basis ein Blockmodell interpretiert werden kann. Blockmodelle stellen immer nur eine unter vielen moglichen Reprasentationen eines Netzwerkes dar. Wie gut solch ein Blockmodell eine Netzwerkstruktur reprasentiert, kann mit verschiedenen Gutema£en gemessen werden. Diese sollen in Kapitel 7 vorgestellt werden. Die in Kapitel 4 aufgeworfenen Fragen, welche Konsequenzen verschiedene methodische Alternativen fiir die Giite eines Blockmodells haben, werden in der vergleichende Analysen in Kapitel 7.2 beantwortet. Die zugehorigen Giitema^e sind in Tabelle 7.1 und Tabelle 7.2 abgebildet. Als Ausblick werden abschlieftend in Kapitel 8 weiterfiihrende Methoden der Blockmodellanalyse kurz erlautert. Schliefelich werden die Ergebnisse der Arbeit dann in Kapitel 9 diskutiert und in einen allgemeineren Kontext gestellt.

2 Grundlegendes zur Blockmodellanalyse

2.1 Das grundlegende Konzept der Blockmodellanalyse In diesem Abschnitt werden das grundlegende methodische Konzept der Blockmodellanalyse kurz vorgestellt und einige Begriffe eingefiihrt. Die einzelnen Schritte, die zur Durchfiihrung einer Blockmodellanalyse notwendig sind, werden in den jeweiligen Kapiteln 4-7 noch genauer erlautert. Die Idee der Blockmodellanalyse ist es, ein Netzwerk so zu reduzieren, dass die element are Struktur des Netzwerkes sichtbar wird und dennoch moglichst viele Informationen des urspriinglichen Netzwerkes erhalten bleiben. Dies soil an einem Beispiel erklart werden. Gegeben sei ein kleines (fiktives) Freundschaftsnetzwerk, bestehend aus den Akteuren Peter, Bernd, Werner, Frank und Hans. Nehmen wir weiter an, zur Erhebung des Netzwerkes wurden die fiinf Akteure jeweils gefragt, wer fiir sie ein wichtiger Freund ist. Dieses Netzwerk kann man nun verschieden darstellen, als Soziomatrix oder als Graphen.^ Die Soziomatrix ist eine quadratische Matrix, in der nicht vorhandene Beziehungen mit einer 0 markiert sind und vorhandene Beziehungen mit einer 1. Eine Soziomatrix fiir unser Freundschaftsnetzwerk ist in Tabelle 2.1 zu sehen. Peter Bernd Werner Prank Hans

Peter 0 0 0 0

Bernd 1 0 0 0

Werner 0 1 1 1

Frank 1 0 0 0

Hans 0 1 1 1 -

Tabelle 2.1: Soziomatrix Freundschaftsnetzwerk Bei ungerichteten Beziehungen (also wenn es nur Beziehungen zwischen Akteuren und nicht Beziehungen von bestimmten Akteuren zu bestimmten Akteuren gibt) ist die Soziomatrix symmetrisch und die Werte unter der Diagonalen sind Fiir eine grafische Darstellung von Netzwerken werden die Begriffe G r a p h und Soziogramm haufig aquivalent benutzt. Der Begriff G r a p h bezieht sich auf das mathematische Konzept der Graphentheorie, die von einem Set von Knoten (Akteuren) und Kanten (Beziehungen) ausgeht. Der Begriff Soziogramm steht allerdings in der Tradition der Soziometrie Jakob Morenos und hat deshalb eine eigene theoretische Konnotation. Deshalb wird im Folgenden der Begriff G r a p h verwendet.

2 Grundlegendes zur

Blockmodellanalyse

gleich den Werten iiber der Diagonalen. Bei gerichteten Beziehungen (wie in dem Beispiel) ist es Konvention, dass die Akteure, von denen Beziehungen ausgehen (die Sender), in der Zeile stehen und Akteure, zu denen Beziehungen eingehen (die Empfanger), in der Spalte notiert sind. So lasst sich z.B. in der Zeile von Bernd ablesen, wen er als Freund wahlt, und in seiner Spalte, wer ihn wahlt. Die Werte in den Feldern der Tabelle konnen auch als Xij identifiziert werden, wobei i der Index der Zeile (des Senders) und j der Index der Spalte (des Empfangers) ist. In unserem Netzwerk ist X43 = 1, d.h. Frank wahlt Werner als Freund. In einem Graphen wird das Beziehungsnetz, wie in Abbildung 2.1 gezeigt, visuell dargestellt. Grafisch wird eine gerichtete Beziehung (hier eine Freundschaftswahl) klassischerweise durch einen Pfeil reprasentiert. Fiir die Akteure werden meist Punkte oder Kreise verwendet. Hans

Frank •

• Bernd

Abbildung 2.1: Graph des Freundschaftsnetzwerk Wenn man sich den Graphen genauer anschaut, kann man erkennen, dass es Akteure gibt, die sich gleichen Positionen befinden. Der BegrifF Position bezeichnet eine Gruppe von Akteuren, die beziiglich einer gewahlten Aquivalenzdefinition ahnlich sind und deshalb (durch ein Analyseverfahren) zusammen gruppiert werden.^ Zu einer Position zusammengefasst werden, konnen einmal Bernd und Frank, denn sie wahlen beide Hans und Werner und werden beide von Peter gewahlt. Sie haben die gleichen aus- und eingehenden Beziehungen. Solche Akteure nennt man «strukturell aquivalent». Strukturelle Aquivalenz ist ein zentrales Konzept der Blockmodellanalyse. Da Hans und Werner perfekt strukturell aquivalent sind, sind sie austauschbar. Wiirde in dem Graphen die Namen von Bernd und Frank weggelassen, konnte man nicht mehr bestimmen, wer Frank und wer Bernd Der Begriff der Position wird in Kapitel 3.4 noch genauer erlautert. Zudem werden im weiteren Verlauf der Arbeit noch verschiedene Aquivalenzdefinitionen vorgestellt.

2.1 Das grundlegende Konzept der Blockmodellanalyse

7

ist. Dasselbe gilt fiir Hans und Werner, auch sie sind strukturell aquivalent. Anders ausgedriickt kann man strukturelle Aquivalenz auch so definieren: Briefly, two actors a structurally equivalent if they have identical ties to and from all other actors in the network (Wasserman & Faust 1994, S.356).^ Ein zentrales Ziel der Blockmodellanalyse ist es, solche Akteure zu Positionen zusammenzufassen. Wenn man sich nun die Soziomatrix anschaut, scheint es wenig Ordnung zu geben, und die strukturellen Aquivalenzen zwischen den Akteuren Bernd und Frank, sowie Hans und Werner sind auf den erst en Blick nicht zu sehen. Um nun die strukturelle Aquivalenz zwischen Akteuren besser zu erkennen, hilft es, die Matrix umzustellen, also die Reihenfolge der Spalten und Zeilen simultan zu verandern. Dieses Verfahren nennt man auch Matrixpermutation, es ist eine grundlegende Operation der Blockmodellanalyse. Sinnvoll ist es nun, die Matrix so umzustellen, dass strukturell aquivalente Akteure nebeneinander stehen. Wenn man dies ausfiihrt, sieht man in Tabelle 2.2, dass die strukturell aquivalenten Akteure jeweils gleiche Muster in ihren Zeilen und Spalten haben. Peter Peter Frank Bernd Werner Hans

0 0 0 0

Frank 1 0 0 0

Bernd 1 0 0 0

Werner 0 1 1

Hans 0 1 1 1

1

Tabelle 2.2: Permutierte Soziomatrix Freundschaftsnetzwerk Des Weiteren sieht man, dass - wenn man die Akteure mit einem gleichen Muster in Zeilen und Spalten einer Gruppe zuordnet und dies durch eine dicke Linie abtrennt - sich sog. «Blocke» ergeben, also die durch Linien abgeschlossenen Felder in der Tabelle, die entweder nur aus Nullen oder Einsen bestehen. Solche Blocke sind ein grundlegendes Element der Blockmodellanalyse und fiir das Verstandnis der Blockmodellanalyse zentral. An dieser Stelle sei darauf hingewiesen, dass manchmal fiir Gruppen von aquivalenten Akteuren einerseits und fiir die durch das Liniengitter abgegrenzten Felder der Soziomatrix andererseits der Begriff Block verwendet wird und somit eine terminologische Unklarheit besteht. ^ Der Vollstandigkeit halber sei hier noch die Orginaldefinition struktureller Aquivalenz von Lorrain und W h i t e (1971, S.63) wiedergegeben: «[...] a is structurally equivalent to 6 if a relates to every object a; of C in exactly t h e same ways as b does»

2 Grundlegendes zur

Blockmodellanalyse

Um dieser Unklarheit zu entgehen, wird im weiteren Verlauf der Arbeit - aufbauend auf der Definition von Lorrain und White (1971, S.769) und Wasserman und Faust (1994, S.394, S.461) - eine Menge von Akteuren, die aufgrund ihrer Ahnlichkeit im Bezug auf eine Aquivalenzdefinition gruppiert wurden, als Cluster Oder Position beschreiben, und nur letzteres, also die abgegrenzten Felder der Soziomatrix, als Block bezeichnen. Die einzelnen Blocke reprasentieren nun nicht mehr Beziehungen zwischen einzelnen Akteuren, sondern zwischen Positionen. Wenn man fiir diese Blocke den Anteil der Einsen an der Gesamtgrofte der Blocks berechnet, erhalt man einen Blockdichtewert. Dieser Wert reprasentiert die sog. «Dichte» der Beziehungen zwischen den Akteuren in den beiden Positionen, die jeweils aus den Akteuren in den Spalten und den Zeilen des Blocks bestehen. Die Blockdichte gibt also den Anteil der tatsachlichen an den moglichen Beziehungen zwischen zwei Positionen an.^° Die Blockdichtewerte fiir die diagonalen Blocke geben die interne Relationsdichte einer Position an. Wenn man fiir alle Blocke die Dichtewerte berechnet und daraus eine Matrix erstellt, erhalt man die Blockdichtematrix (Tabelle 2.3). In unserem Beispiel gibt es nur Blockdichtewerte von 0,0 und 1,0. Wenn einzelne Akteure jedoch nicht perfekt strukturell aquivalent waren, hatten wir auch andere Blockdichtewerte. Wiirde beispielsweise Bernd nicht Hans als best en Freund wahlen, hatten wir in dem Block nur 3 Einsen und eine Null und somit einen Blockdichtewert von 0,75. Peter Peter Frank u. Bernd Werner u. Hans

0,0 0,0

Frank u. Bernd 1,0 0,0 0,0

Werner u. Hans 0,0 1,0 1,0

Tabelle 2.3: Blockdichtematrixmatrix Freundschaftsnetzwerk Peter Peter Frank u. Bernd Werner u. Hans

0 0

Frank u. Bernd 1 0 0

Werner u. Hans 0 1 1

Tabelle 2.4: Image-Matrix Freundschaftsnetzwerk Aus dieser Blockdichtematrix kann man dann eine so genannte Image-Matrix bilden, in der nicht mehr die Beziehungen zwischen (einzelnen) Akteuren, sondern zwischen Positionen dargestellt sind. 1st eine Beziehung zwischen Positionen ^° Bei metrischen Daten ware die Blockdichte der durchschnittliche Beziehungswert zwischen den Positionen.

2.1 Das grundlegende Konzept der Blockmodellanalyse

9

vorhanden, steht in der Image-Matrix eine Eins, ansonsten eine Null. Die ImageMatrix erhalt man, wenn man die Dichtematrix ab einem bestimmten Wert dichotomisiert, also z.B. Einsen fiir Werte iiber 0,5 und Nullen fiir Werte unter 0,5 in die Blockdichtematrix einsetzt.^^ Sind, wie in unserem Fall, die Blockdichtewerte nur 0,0 und 1,0, unterscheidet sich die Image-Matrix (Tabelle 2.4) nicht von der Blockdichtematrix. 1st dies nicht der Fall, braucht man ein Kriterium, nach dem man aus den Blockdichtewerten Nullen und Einsen fiir die Image-Matrix erstellt. Die Konstruktion sowohl einer Blockdichtematrix als auch einer Image-Matrix werden in Kapitel 5 noch ausfiihrlich erlautert. Einige Erklarungen mussten hier allerdings schon vorweggenommen werden, da sie fiir das weitere Verstandnis notwendig sind. Solch eine Image-Matrix kann auch als sog. Image-Graph visuell dargestellt werden und stellt dann die reduzierte Struktur des Netzwerkes dar (Abbildung 2.2):

Werner

u. Hans

o •

Frank u. Bernd
/C

0

0

IB ^

E

1

1

S

^^H

1

0

1

0

0

^^^^H

0 ^m

1

m 1



0 0

Abbildung 4.2: Euklidische Distanz der Akteure C und E mit der Option «ignore» = ^/5 Allerdings ware es durchaus sinnvoll, die Werte zu den Selfties und der gegenseitigen Beziehung als Information zu nutzen und jeweils zu vergleichen. Hier miisste, wie in Burt und Minor (1983) vorgeschlagen, verglichen werden, ob C zu E eine Beziehung hat, falls E zu C eine Beziehung hat (und vice versa), und ob beide Akteure Selfties haben oder nicht. Dies kann iiber die hier dargestellte «swapping procedure» erreicht werden (siehe Schaubild 4.3). Zeilen

0 IH

Spalten

1

0

1 •I

1 •i

0

Abbildung 4.3: Euklidische Distanz der Akteure C und E mit der Option «reciprocal» = V9 Dementsprechend wird nun auch nicht mehr die Euklidische Distanz, sondern die korrigierte Euklidische Distanz^^ berechnet. Dies entspricht einer strengen Definition von struktureller Aquivalenz, bei der nicht nur die aus- und eingehenden Beziehungen, sondern auch die Selfties und die gegenseitigen Beziehungen gleich sein miissen (Doreian et al. 1992). Die Euklidische Distanz ist eine Unterform der allgemeinen Minkowski-Metrik (Bacher 1996, S.199). Geometrisch stellt sie die Distanz zweier Punkte in einem n-dimensionalen Raum dar. Einen anderen mathematischen Ansatz hat der Pearson's Produkt-Moment Korrelationskoeffizient. Er ist ein Ma£ fiir den Zusammenhang zweier Variablen. Der Korrelationskeffizient der Beziehungen zweier Akteure fiir multiple Netzwerke berechnet sich folgendermaften: Die Formel hierzu lasst sich z.B. in Doreian, Batagelj und Ferligoj (1992, S.71) nachschlagen.

54

4 Positionale Analyse der

X^r=l yz2r=l

zZk^li^ikr

i-zfe^lV"^*^^

Xim)[Xjkr

— Xi*yyYlr=l

Blockmodellanalyse

Xj

X/fc^lV^^'^'^

i^»r

fiir z ^ /c, j / /c. Hierbei ist Xikr wieder der Wert der Beziehung von Akteur i zu Akteur k fiir die Relation r. Hier ist zu beachten, dass die Formel fiir die Soziomatrizen Xr inklusive ihrer Transponierung X'^ gilt. Auch fiir den Korrelationskoeffizienten kann die schon beschriebene Korrektur berechnet werde, sodass er einer strengen Definition von struktureller Aquivalenz entspricht. Der Korrelationskoeffizients variiert von -1 bis + 1 , wobei er bei gegenlaufigen Variablen Richtung -1 tendiert und bei gleichlaufigen Variablen Richtung -f 1. In der netzwerkanalytischen Literatur herrscht Uneinigkeit dariiber, ob zur Berechnung der strukturellen Aquivalenz die Euklidische Distanz oder der Korrelationskoeffizient zu bevorzugen ist7^ Mathematisch lasst sich herleiten, dass in die Euklidische Distanz im Vergleich zu dem Korrelationskoeffizienten nicht nur die (Un)ahnlichkeit der Auspragungsmuster zweier Variablen einfliel^en, sondern auch Differenzen im Mittelwert der Variablen und in der Streuung. Dieser Effekt ist tendenziell bei metrischen Variablen grower als bei dichotomen Variablen. Wiirde man beispielsweise ein Blockmodell fiir die Handelsbeziehungen verschiedener Lander bilden und hierfiir das Ma£ der strukturellen Aquivalenz berechnen, so miissten bei dem Kriterium der Euklidischen Distanz fiir eine geringe Distanz nicht nur das Muster der Handelsbeziehungen, sondern auch das Volumen der Handelsbeziehungen moglichst gleich sein. Insofern stellt die Euklidische Distanz sicher das strengere Kriterium dar. Allerdings konnte hier die Frage nach dem sinnvolleren Kriterium nur, wie bei so vielen methodischen Entscheidungen, aufgrund der theoretisch ausgearbeiteten Forschungsfrage getroffen werden. Wenn es theoretisch um das Muster der Handelsbeziehungen, und nicht um die Hohe geht, ware sicher der Korrelationskoeffizient vorzuziehen. Faust und Romney (1985) kritisieren an der Euklidischen Distanz gerade, dass hierdurch EfFekte der Differenz von Streuungen und Mittelwerten mit den Effekten ahnlicher Muster konfundiert werden. Allerdings stellt sich bei dichotomen Variablen die Frage, ob man dort Ronald S. Burt bevorzugt die Euklidische Distanz, die er auch in seinem P r o g r a m m S T R U C T U R E implementiert h a t t e . Faust und Romney (1985) kritisierten dessen Verwendung in dem Text «Does Structure Find Structure?: A Critique of Burts Use of Distance as a Measure of Structural Equivalence» und favorisieren den Korrelationskoeffizienten. In der darauffolgenden Ausgabe von «Social Networks» erscheint unter dem Titel «A Cautionary Note» eine Replik von Burt, in der er konstatiert: «I have a great respect for other work by the a u t h o r s and in this paper they are not at their best.» (Burt 1986, S.205) und kritisiert: «Faust an Romney's illustration of the importance of removing means and variances is a failure.» (Burt 1986, S.210)

4.3 Verfahren

55

nicht auch gerade Unterschiede in den Mittelwerten von Variablen als Fehlen von struktureller Aquivalenz interpretieren sollte. Hierzu ein Beispiel: Gegeben seien die beiden Variablen x und y fiir die aus- und eingehenden Beziehungen von Akteur A und B (Tabelle 4.6):

x l O O O O O O O O O y 1 1 1 1 1 1 1 1 1 0 Tabelle 4.6: Beispielrechnung zum Korrelationskoeffizient Berechnen wir nun den Korrelationskoeffizient en dieser zwei Variablen, so erhalten wir den Wert 0,1. Wir erhalten sogar einen positiven Korrelationswert, da das Beziehungmuster gleichlaufig ist (da wo x einen hoheren Wert hat, hat y auch tendenziell einen hoheren Wert.) Wenn wir allerdings die Euklidische Distanz berechnen, so erhalten wir den Wert y/S = 2,8284. Der maximale Wert fiir die Eukhdische Distanz ware \/lO = 3,1622. Vergleichen wir nun die Verortung der beiden Werte im moglichen Zahlenbereich, sehen wir, dass hier die Euklidische Distanz fast den Maximalwert erreicht hat, also eine geringe strukturelle Aquivalenz signalisiert, und der Korrelationskeffizient auf leichte strukturelle Aquivalenz schlieften lasst (siehe Tabelle 4.4):

+1 3.16 -^ • 0 Abbildung 4.4: Der Korrelationskoeffizient (0,1111 oben) und die Euklidische Distanz (2,8284 unten) am Beispiel aus Abbildung 4.6 im Vergleich. Die linke Seite steht fiir niedrige strukturelle Aquivalenz, die rechte Seite fiir hohe strukturelle Aquivalenz Dem theoretischen Konzept der strukturellen Aquivalenz folgendend, das strukturelle Aquivalenz nur dann annimmt, wenn beide Akteure gleiche Beziehungen zu den gleichen Akteuren haben, trifft die Euklidische Distanz hier die theoretische Definition besser. Allerdings stellt dieses Beispiel auch einen eher extremen Fall dar, im Allgemeinen sind die Werte der Euklidischen Distanz mit denen des Korrelationskoeffizienten bei dichotomen Werten durchaus vergleichbar. An dieser Stelle bleibt es dem Forscher iiberlassen, eine informierte Entscheidung zu treffen.^^ ^^ Hierzu Burt (1986, S.210): «However, routinely throwing away d a t a on t h e average strength and variation in an individual's relationships by replacing Euclidean distance with a correlation coefficient has yet to be justified in theory or methodology.»

56

4 Positionale Analyse der

Blockmodellanalyse

2. Auswahl des Fusionierungsalgorithmus:

Die hierarchische Clusteranalyse stellt nun diverse Algorithmen zur Verfiigung, um Akteure zu klassifizieren. Clusteranalytische Verfahren versuchen, allgemein gesprochen, Falle beziiglich der Ahnlichkeit der Auspragung mehrerer gewahlter Variablen zu klassifizieren.^° Hierarchisch-agglomerative Verfahren gehen dabei so vor, dass alle Falle zu Beginn der Analyse ein eigenes Cluster bilden. Zuerst werden nun die zwei ahnlichsten Akteure, also die mit den niedrigsten Distanzwerten oder den hochsten Ahnlichkeitswerten, zu einer neuen Gruppe zusammengefasst. Dann werden in jedem Schritt weitere Akteure oder Gruppen nach Ahnlichkeitskriterien zusammengefasst. Dies wird solange fortgesetzt, bis alle Akteure einen einzigen Cluster bilden. Hier ist es natiirlich notwendig, eine Clusterlosung auszuwahlen, die zwischen den beiden redundanten Clusterlosungen liegt, bei der alle Akteure in einem Cluster sind oder jeder Akteur einen Cluster bildet. Der erste Schritt der Clusteranalyse, bei dem die zwei Akteure mit der gro£ten Ahnlichkeit/niedrigsten Distanz in einem Cluster zusammengefasst werden, ist bei alien Fusionierungsalgorithmen derselbe. Im zweiten Schritt besteht allerdings das Problem, dass es nicht mehr nur Akteure, sondern Gruppen von Akteuren gibt. Hier stellt sich also die Frage, wie die Distanz zwischen Gruppen und Akteuren oder Gruppen und Gruppen bestimmt werden kann, und hierin unterscheiden sich dann auch die verschiedenen Fusionierungsalgorithmen. Beim Single-linkage-Algorithmus wird die Distanz zwischen zwei Gruppen zum Beispiel definiert als der Abstand der ahnlichsten zwei Akteure aus den beiden Clustern, beim Average-linkage-Algorithmus ist die Distanz zwischen zwei Clustern der durchschnittliche Abstand aller Elementpaare aus den beiden Clustern. Als weitere hierarchisch-agglomerative Algorithmen sind zu nennen das Centroid-, das Complete-linkage- und das Median-Verfahren.^^ Fiir diese Verfahren eignen Siehe Bacher (1996) fiir eine ausfiihrliche Einfiihrung zur Clusteranalyse. Die genannten Verfahren haben fiir die Blockmodellanalyse des Interorganisationsnetzwerkes keine befriedigenden Ergebnisse erbracht. Das Single-, Centroid-, Median- und das Averagelinkage-Verfahren haben Cluster produziert, die extrem ungleich in ihrer Grofte waren. Eine extreme Ungleichverteilung der Clustergrofee beeintrachtigt zum einen die Intepretation der Image-Matrix, da eine Differenzierung der Akteure nach Position kaum moglich ware, zum anderen legen die Ergebnisse mit dem CONCOR-Verfahren und mit den permutierenden Verfahren eine so starke Ungleichverteilung nicht nahe, als dass eine solche «Partitionierung» des Netzwerkes sinnvoll scheint. Beim Complete-linkage Verfahren war das Problem weniger gravierend, allerdings ist es ebenso wie das Single-linkage Verfahren nicht zu empfehlen, da es immer nur zwei Akteure aus den Clustern vergleicht und somit in seiner Konstruktion sehr ungenau ist. Verfahren, die dazu neigen, sehr ungleich grofte Cluster zu bilden nennt m a n kontrahierend, dies ist jedoch nur fiir das Single-linkage-Verfahren bekannt. Die anderen genannten Verfahren sollten eher konservativ sein, also weder kontrahierend, noch delatierend sein (das andere E x t r e m ) . Das Problem der Ungleichverteilung lag moglicherweise daran, dass, wie eine Multidimensionale Skalierung nahegelegt hat, die Verteilung der Akteure beziiglich Ihrer Ahnlichkeit recht homogen streut und sich keine ganz eindeutige

4.3 Verfahren

57

sich sowohl die Korrelation als auch die Euklidische Distanz als Ahnlichkeitsoder Distanzmafee. Auch das Ward-Verfahren ist ein hierarchisch-agglomeratives Verfahren. Das Ward-Verfahren wird haufig empfohlen, da es zu «guten» Ergebnissen fiihrt (Backhaus et al. 2003, S.516 - S.517). Das Ward-Verfahren zeichnet sich dadurch aus, dass es diejenigen Gruppen zusammenfasst, die ein vorgegebenes Heterogenitatsmaft, die Fehlerquadratsumme, am wenigsten erhohen. Die Fehlerquadratsumme berechnet sich wie folgt: Kg

J

k=lj=l

Wobei Xkjg der Beobachtungswert der Variable j fiir Objekt k (fiir alle Objekte k = 1,..., Kg in der Gruppe g) und Xjg der Mittelwert iiber die Beobachtungswert e der Variablen j in Gruppe g ist. Die Fehlerquadratsumme berechnet eine Varianz innerhalb der Gruppen: Je naher die Werte in der jeweiligen Gruppe am jeweiligen Mittelwert liegen, desto geringer ist die Fehlerquadratsumme und umso besser passt die Gruppe zusammen. Nun ermittelt das Ward-Verfahren bei jedem neuen Schritt, bei welcher Fusionierung die Fehlerquadratsumme am wenigsten zunehmen wiirde, also bei welcher neuen Gruppe die Fehlerquadratsumme am wenigsten steigen wiirde. Diese Fusionierung wird dann ausgefiihrt, und um die Zunahme der Varianz der Gruppe steigt die Fehlerquadratsumme. Das Ward-Verfahren sollte mit der quadrierten Euklidischen Distanz ausgefiihrt werden.®^ Um eine Verzerrung zu vermeiden, die dann entstehen wiirde, wenn man das Ward-Verfahren mit der normalen quadrierten Euklidischen Distanz berechnen wiirde, also ohne Beriicksichtigung von Diagonalwerten und reziproken Werten (option «retain»), hat man zwei Moglichkeiten vorzugehen. (1) Man berechnet die korrigierte quadrierte Euklidische Distanz mit einem Netzwerkanalyseprogramm, iibernimmt diese Werte als Distanzmatrix in ein Clusteranalyseprogramm und fiihrt die Analyse mit der Distanzmatrix durch. (2) Man ladt den Datensatz in ein Clusteranalyseprogramm und behandelt die Diagonalwerte als fehlende Werte. Clusterzuteilung ergibt. Bei dem Ward- und dem K-means-Verfahren war das Problem der extremen Ungleichverteilung so nicht vorhanden. Die Giitemafee der Analyse mit dem Wardund K-Means-Verfahren werden in Kapitel 7.2 vorgestellt. ^^ Da das Ward-Verfahren iiber die minimale Zunahme der Fehlerquadratsumme definiert ist, konnte m a n sich fragen, wieso es iiberhaupt Wahlmoglichkeiten bei den Distanzmafeen gibt. Allerdings lasst sich das Verfahren mathematisch so umformen, dgiss sich die Clusterbildung aus einer Distanzmatrix berechnen lasst (Bacher 1996, S.298).

58

4 Positionale Analyse der

Blockmodellanalyse

Vorgehensweise (1) hat das Problem, dass die Berechnung des Ward-Verfahrens aus einer Distanzmatrix nicht fiir die korrigierte quadrierte Euklidische Distanz definiert wurde und es deswegen moglicherweise zu einer Verzerrung kommt. Vorgehensweise (2) hat den Nachteil, dass der Vergleich der gegenseitigen Werte, wie er in der «swapping-procedure» stattfindet, ausbleibt. Allerdings ware die «swapping-procedure» hier auch nicht sehr sinnvoll, da nie zwei Akteure alleine verghchen werden. Die beide Vorgehensweisen werden in Kapitel 7.2 beziigUch ihrer Giitewerte vergleichen. 3. Festiegung des Abbruchkriteriums (der Clusterzahl):

Zur Bestimmung der Zahl der Cluster wird haufig ein Heterogenitatsmafe verwendet, das in Beziehung zur Zahl der Cluster gesetzt wird. Fiir das Ward-Verfahren ist dieses Heterogenitatsmaft die schon beschriebene Fehlerquadratsumme. Die Zunahme der Fehlerquadratsumme lasst sich am besten in einem Diagramm grafisch beurteilen. Die Analyse fiir das multiplen Netzwerkes ergibt, dass der Anstieg der Fehlerquadratsumme einen Bruch aufweist. Hier ist es sinnvoll, die Zahl der Cluster zu wahlen, die sich vor dem iiberproportionalen Anstieg der Fehlerquadratsumme ergibt. Diese Kriterium nennt man auch das «Ellenbogenkriterium» (Backhaus et al. 2003, S.524). Wenn wir nun eine Ward-Analyse fiir das multiple Interorganisationsnetzwerk (Analyse A2) durchflihren, dann erhalten wir, wenn wir auf der y-Achse die Zunahme der Fehlerquadratsumme auftragen und auf der x-Achse die Clusterzahl, Abbildung 4.5. Hier lasst sich visuell feststellen, dass es zwei iiberproportionale Anstiege der Anstiege der Fehlerquadratsumme gibt, beim Ubergang von zwei zu einem Cluster und beim Ubergang von fiinf zu vier Clustern. Das erste ist trivial, das zweite hilfreich: Es ware also sinnvoll, die fiinf-Clusterlosung zu wahlen, da beim nachsten Fusionierungsschritt sonst Cluster gebildet werden miissten, die eher schlecht zusammenpassen.^^ Falls sich solch eine klare visuelle Losung nicht ergibt, wurden in der Clusteranalyse eine Vielzahl weiterer Kriterien entwickelt, die einen Hinweis darauf geben sollen, welche Clusterlosung am sinnvollsten ist, z.B. Mojena's Upper Tail Rule, Calinski and Harabasz' Variance Ratio, Duda and Hart's Error Ratio.^^ Bei der Entscheidung iiber die Clusterzahl sollte natiirlich auch eine Rolle spielen, wie differenziert die Blockmodellanalyse im Hinbhck auf die theoretische Fragestellung sein soil. Eine stark erhohte Zahl an Clustern differenziert Fiir das Multiple Netzwerk der beispielhaften Analysen A l bis A6 wurde deshalb eine fiinfClusterlosung gewahlt. Fiir die beispielhaften Analysen B l bis B7 ergab die gleiche Vorgehensweise eine vier-Clusterlosung. ^'^ Fiir einen guten iiberblicksartigen Vergleich der Abbruchkriterien siehe Wishart (2005b).

4.3 Verfahren

59

13

14

15

16

17

18

19

20

Abbildung 4.5: Zunahme der Fehlerquadratsumme (Y-Achse), Clusterzahl (X-Achse) (Analyse A2)

zwar starker im Hinblick auf individuelle Akteure, aber die Gesamtstruktur des Netzwerkes ist eher schlechter sichtbar. Allerdings hat die hierarchische Clusteranalyse im Vergleich zu den anderen Verfahren klar den Vorteil, dass sie immerhin statistische Anhaltspunkte fiir eine sinnvolle Zahl an Clustern gibt und somit eine trotz theoretischer Begriindung notwendigerweise eher willkiirliche Festlegung der Clusterzahl vermeidet. Eine Strategie, um die Durchfiihrung der Clusteranalyse zu visualisieren, ist das sog. Dendrogramm. Das Dendrogramm wird von links nach rechts gelesen: Zu Beginn sind alle Akteure in einem eigenen Cluster, was an den horizontalen Linien links abzulesen ist. Jede Linie stellt einen Akteur da. Dort, wo die horizontalen Linien durch vertikale Linien unterbrochen werden, findet eine Fusionierung von einzelnen Akteuren oder Clustern statt. Die Lage der vertikalen Unterbrechung auf der unter dem Dendrogramm dargestellten Achse zeigt die Hohe der Zunahme der Fehlerquadratsumme, die fiir diesen Fusionierungsschritt notwendig ist. Bereiche, in denen die horizontalen Linien besonders lange nicht unterbrochen werden, stehen so fiir stabile Clusterlosungen. Zieht man eine imaginare vertikale

4 Positionale Analyse der

60

Blockmodellanalyse

Linie durch das Dendrogramm, lassen sich auch verschieden grol^e Clusterlosungen ablesen: Alle Akteure, die links von der imaginaren vertikalen Linie verbunden sind, stellen ein Cluster dar. Abbildung 4.6 zeigt solch ein Dendrogramm fiir die Wardanalyse (Analyse A2), die Akteure der fiinf-Clusterlosung sind markiert.

0,000

0,084

0,169

0,253

0,337

0,421

0,506

0,590

Abbildung 4.6: Dendrogramm des Wardverfahrens (Analyse A2), fiinf-Clusterlosung; ohne Beschriftung der Falle, die sonst links neben den horizontalen Linien steht. Auf der Y-Achse ist die Zunahme der Fehlerquadratsumme abgetragen. (Analyse A2)

Die hierarchisch-agglomerative Clusteranalyse hat allerdings den Nachteil, dass Akteure, die einmal einem Cluster zugeordnet wurden, nicht mehr ihre Position wechseln konnen, auch wenn es auf einer hoheren Ebene vielleicht sinnvoll ware. Hier stellt das K-means-Verfahren eine Moglichkeit dar, eine vorhandene Clusterlosung zu iiberpriifen oder zu verbessern. Das K-means-Verfahren kann auch dazu verwendet werden, eine eigene Clusterlosung zu bilden. In Kapitel 7.2 werden beide Vorgehensweisen beziiglich ihrer Giitekriterien verglichen. Das K-means-Verfahren geht anders als das Ward Verfahren nicht hierarchisch-agglomerativ, sondern permutierend vor. Hierbei wird versucht, (iber die Permutation eine Kriteriumsfunktion zu minimieren: Bei dem K-means-Verfahren ist dies im Normalfall die Fehlerquadratsumme, die auch im Ward-Verfahren verwendet wird. Der Permutations-

4.3 Verfahren

61

algorithmus ist dabei meistens der gleiche wie der des Pajek-Verfahrens.^^ Dies ist kein Zufall, denn die Entwickler des Pajekverfahrens, Vladimir Batagelj und Anuska Ferligoj, waren urspriinglich Clusteranalytiker^^ und haben den Permutationsalgorithmus fiir das Pajek-Verfahren aus dem K-means-Verfahren iibernommen. Die Kriteriumsfunktion der Fehlerquadratsumme ist insofern ahnhch der Kriteriumsfunktion iin Panningsverfahren, als sie ein Varianzkriterium ist. Hier ist es jedoch wichtig, sich die Unterschiede zwischen den indirekten Verfahren (Ward-Verfahren, K-means-Verfahren) und den direkten Verfahren der Blockmodellanalyse (Pajekverfahren, Panningverfahren) vor Augen zu halten. Bei den indirekten Verfahren geht es um die Homogenitat von Akteuren oder Gruppen von Akteuren. Bei den direkten Verfahren geht es um die Homogenitat der Blocke in dem Netzwerk, die sich aus der Verkniipfung verschiedener Positionen ergeben. Inwieweit sich fiir die direkten Verfahren dadurch auch Vorteile beziigUch der Giitemafee ihrer Partitionen ergeben, soil in Kapitel 7.2 gepriift werden. Ein wichtiger Vorteil der clusteranalytischen Verfahren ist, dass sie sich (softwarema£ig) auch auf multiple Netzwerke anwenden lassen. Ein besonderer Vorteil der hierarchisch-agglomerativen Verfahren ist, dass es hier Anhaltspunkte fiir eine sinnvolle Position/Clusterzahl gibt. Allerdings entsprechen die direkten Verfahren konsequenter der theoretischen Logik der Blockmodellanalyse, da sie die Analyse der Netzwerkstruktur iiber das gesamte Netzwerk, und nicht iiber die Ahnlichkeit von Akteuren bestimmen. 4.3.3 Das CON COR-Verfahren Das CONCOR-Verfahren war eines der ersten Verfahren der Blockmodellanalyse und ist heute immer noch recht verbreitet.^^ Das CONCOR-Verfahren mischt Doreian, Batagelj und Ferligoj (1992, S.66) zufolge Elemente direkter und indirekter Verfahren: The other widely used procedure, CONCOR (Breiger et al 1975), is harder to classify as it has aspects of both approaches. It is indirect ®^ Allerdings nicht fiir das P r o g r a m m Clustan. Da weicht er leicht ab, denn es wird nur die Verschiebung von Fallen zwischen Clustern getestet, und nicht, wie im Pajek-Verfahren auch der Tausch. (Wishart 2004a, 2004b) ^^ «At t h a t time [1988], Vlado and Nu§a saw themselves as cluster analysts and P a t was a social network analyst. As we talked, it became clear t h a t the two fields could be joined t o m u t u a l benefit. A shared passion and dream was born: form a synthesis of cluster analystic ideas and social network ideas.» (Doreian et al. 2005, Preface) ®^ Lincoln und Gerlach (2004) untersuchen beispielsweise die Entwicklung der japanischen Keiretsu-Netzwerke in eine komparativ-statischen Analyse der J a h r e 1978-1997 mit dem CONCOR-Verfahren. Weitere Beispiele der Anwendung von C O N C O R : Thurner und Stoiber (2001); Bearman (1997).

62

4 Positionale Analyse der

Blockmodellanalyse

in the sense of creating a partition - with users having options for the hand, it is direct in the sense of seeking partitions to maximize within clusters (iterated) correlations (to -hl.O) and to minimize

correlations

between clusters (to -1.0). However there is no explizit criterion function in the usual sense of an optimization problem. Ihre Argumentation ist an dieser Stelle zwar nicht ganz kongruent mit ihrer eigenen Definition von direkten und indirekten Verfahren, allerdings kann man sagen, dass das CONCOR-Verfahren insofern ein indirektes Verfahren ist, als dass es Aquivalenzpartitionen iiber den Ahnhchkeitsvergleich von Akteuren herstellt, das Verfahren aber, anders als die Clusteranalyse, kein Standard verfahren der statistischen Datenanalyse ist. Kann man fiir das hierarchische Clustering zur Erstellung eines Blockmodells zwischen verschiedenen Ma^en wahlen, so ist das CONCORVerfahren, wie der Name schon besagt («CONvergence of iterated CORrelations»), auf ein Ma£ zur Messung der Ahnlichkeit (Ma£ struktureller Aquivalenz) von Akteuren beschrankt: die Korrelation. Hier hat der Anwender die Moglichkeit, in Ucinet fiir die Berechnung der Korrelation die Optionen «retain», «ignore» und «reciprocal» zu wahlen und so gegebenenfalls Selfties und gegenseitige Werte zu beriicksichtigen. Die Korrelation zwischen den Akteuren wird berechnet, indem die Zeilen und Spalten der Matrizen fiir jeweils zwei Akteure hintereinander gestellt und die Werte wie zwei «Variablen» verwendet werden. Dann wird fiir diese «Variablen» der Korrelationskoeffizient berechnet, der zwischen + 1 (ahnliche Beziehungen) und -1 (gegenlaufige Beziehungen) schwankt. Fiir die sich nun ergebende Korrelationsmatrix werden wieder die Zeilen und Spalten der Akteure miteinander korreliert. Dieser Schritt fiihrt dazu, dass man die Korrelationen der Korrelationen berechnet. Wird diese Iteration mehrfach fortgesetzt, werden die Korrelationen gegen +1 und -1 konvergieren. Man bekommt also eine Matrix mit Werten zwischen -f 1 und - 1 . Wenn man die Reihenfolge der Akteure nun vertauscht, bekommt man eine Matrix, die in ihrer vereinfachten Form wie folgt aussieht (siehe Tabelle 4.7):

Akteure der Position 1 Akteure der Position 2

Akteure der Position 1 +1 -1

Akteure der Position 2 -1 +1

Tabelle 4.7: Partitionierung nach dem CONCOR-Verfahren Die Akteure konnen nun ihren iterierten Korrelationswerten folgend (also jeweils die Akteure, die gemeinsam + 1 oder -1 Werte haben) in zwei Gruppen aufgeteilt

4.3 Verfahren

63

werden.^® Fiir die gebildeten Gruppen konnen nun wieder die Korrelationsmatrizen berechnet werden (allerdings jeweils mit den Werten der aus- und eingehenden Beziehungen zu alien Akteuren). Daraus ergibt sich wieder eine neue Division der gebildeten Gruppe in zwei Gruppen. So konnen die Blocke weiter geteilt werden. In seiner Vorgehensweise der immer feineren Partitionierung ist das CONCORVerfahren hier mit einem divisiven hierarchischen Clustering zu vergleichen.^^ Der mathematische EfFekt, dass die Korrelationen der Korrelationen fiir die Gruppen nach -1 und + 1 streben, wurde von der Forschungsgruppe um Harrison White in den 80er Jahren entdeckt und als Algorithmus in ein Programm implementiert. Das Verfahren wurde schon friih stark kritisiert: Sailer (1978) problematisierte vor allem die Verwendung von Korrelation der Korrelationen im CONCOR-Verfahren, die fiir ihn nicht nachvollziehbar ist; iiber diesen Prozess werden Akteure namlich nicht mehr dann als strukturell aquivalent angesehen, wenn sie dieselben Beziehungen wie andere Akteure haben, sondern, wenn sie ahnliche Ahnlichkeiten zu anderen Akteuren haben wie andere. Akteur A und B werden also tendenziell dann in ein Cluster kommen, wenn sie ahnUche AhnHchkeiten haben. Sailer (1978, S.77) schreibt dazu: [In] the CONCOR algorithm - two points are SE [structurally equivalent] if they are structurally equivalent to the same points. This is totally different! It is like saying that lawyers are equivalent because they are equivalent to lawyers. The right concept is that lawyers are equivalent because they are related to judges and clients. Hier ist bis heute nicht klar, welche theoretische Grundlage solch ein Vorgehen legitimiert. Das Verfahren hat also den Nachteil, «dass unklar ist, welches Kriterium durch die Korrelation der Korrelation maximiert wird» (Jansen 2003, S.227), denn die mathematische Grundlage des Verfahrens ist weitgehend ungeklart: /...] the excact mathematical properties of CONCOR remain obscure (it is not clear what, if anything, it is optimizing), it is advisable to use CONCOR with a great deal of caution. (Wgisserman & Faust 1994, S.380) In Ucinet konnen Toleranzen wie z.B. 0,1 angegeben werden, sodass schon Werte von + 0 , 9 und -0,9 als Konvergenzkriterium ausreichen. Etwas verwirrend ist hier jedoch, dass diese in dem Feld «convergence criteria» angegeben werden sollen, obwohl es sich hier, der UcinetHilfe (Borgatti et al. 2002) zufolge, u m die Toleranzen des Konvergenzkriteriums handelt. ®^ «In this sense C O N C O R may be thought as a (divisive) hierarchical clustering method» (Wasserman &; Faust 1994, S.378)

64

4 Positionale Analyse der

Blockmodellanalyse

Methodisch wurde durch die Anwendung auf hypothetische Netzwerke nachgewiesen, dass das Verfahren nicht immer zu Partitionen fiihrt, die struktureller Aquivalenz entsprechen (Faust 1988). Aufgrund der mangelnden formalen Fundierung von CONCOR hat selbst einer der Begriinder, Phipps Arabie, das Verfahren schUe^hch aufgegeben (Friedkin 1998, S.7). AhnUch wie in der hierarchischagglomerativen Clusteranalyse konnen Akteure, die einmal einer Partition zugefiihrt wurden, ihre Position nicht mehr wechseln. Durch das divisive Vorgehen ist die Bestimmung einer sinnvollen Clusterzahl mit dem CONCOR-Verfahren besonders schwierig. Das Verfahren hefert von sich aus immer eine Verdopplung der Cluster und fiihrt somit nur zu Zweier-Potenzen als Clusterzahlen, was nicht unbedingt der Struktur des Netzwerkes entsprechen muss. Falls man sich dann dafiir entscheidet, nur die Division bestimmter Cluster zur Konstruktion des Blockmodells zu verwenden, fehlt eine Entscheidungskriterium dafiir, welche Division sinnvoll ist. Hier ware eine Moglichkeit, Giitemafte fur verschiedene Subdivisionen zu berechnen und den Giitema£en entsprechend zu entscheiden. In der Praxis wird jedoch manchmal lapidar die 4-Clusterlosung von CONCOR als Blockmodell genommen, ohne (explizite) Priifung, inwiefern dies der Struktur des Netzwerkes entspricht. Aussagen wie: «CONCOR produced a four-block partition of TechNet members.» (Koku & Wellman 2004, S.22 des Onlinemanuskripts) suggerieren, dass dies das einzig mogliche Blockmodell ist. Es bleibt erstaunlich, wieso das Verfahren trotz aller Schwierigkeiten, die damit verbunden sind, weiterhin recht verbreitet ist. Ein Grund kann sein, dass alternative Verfahren wie das Ward-Verfahren, das sich fiir multiple Netzwerke anbieten wiirde, in den meisten Netzwerkanalyseprogrammen nicht implementiert sind. Hinzu kommt vielleicht eine Haltung, die der methodischen Grundlegung bei der Durchfiihrung einer Blockmodellanalyse mit einer gewissen Indifferenz gegeniibersteht. Jansen (2003, S.227) schreibt z.B.: Wenn andere Verfahren zu vergleichbaren Ergebnissen kommen und diese auch im Lichte weiterer Kenntnisse und unabhdngiger Messungen zum Untersuchungsgegenstand

haltbar erscheinen, so sollte man

sich als Forscher wohl von der Nutzung des nicht ganz

verstandenen

Verfahrens nicht abhalten lassen, zumal die Giite des Blockmodells anschliefiend uberpriifbar ist. Wie das Verfahren tatsachlich in Bezug auf seine Giitewerte im Vergleich zu den anderen vorgestellten Verfahren abschneiden wird, soil in Kapitel 7.2 beim Performanzvergleich fiir die Verfahren untersucht werden.

5 Von der Partition zum Blockmodell

5.1 Blockdichtematrix Im einfiihrenden Kapitel 2 wurde die Blockdichtematrix schon kurz erwahnt. Die Blockdichtematrix stellt einen Zwischenschritt zur Erstellung einer Image-Matrix dar. Sie kann auch schon unabhangig interpretiert werden und sollte bei der Interpretation einer Image-Matrix zur genaueren Interpretation hinzugezogen werden. In der Blockdichtematrix sind fiir die Blocke noch Dichtewerte angegeben, in der Image-Matrix nur noch Nullen und Einsen. Sind die Akteure mit Hilfe eines der in Kapitel 4 vorgestellten Blockmodellverfahren in disjunkte Gruppen aufgeteilt, so lasst sich aus der Gruppenaufteilung und der urspriinglichen Soziomatrix eine Blockdichtematrix erstellen. Dies soil an einem kleinen (fiktiven) Beispiel gezeigt werden (Tabelle 5.1 und 5.2).

A B C D E F G H

A 0 1 0 0 0 0 0 0

B 1 0 0 1 1 0 0 0

C 0 0 0 1 1 1 1 1

D 0 0 1 0 0 1 0 1

E 0 0 1 1 0 1 1 1

F 0 0 1 1 1 0 1 0

G 0 0 0 0 0 0 0 1

H 0 1 0 1 0 0 1 0

Tabelle 5.1: Fiktive partitionierte Soziomatrix

Bl B2 B3

Bl 1,0 0,25 0,0

B2 0,0 0,917 0,75

B3 0,25 0,125 1,0

Tabelle 5.2: Blockdichtematrix der Soziomatrix aus Tabelle 5.1 Die Berechnung der Dichtewerte ist einfach die Zahl der vorhandenen Beziehungen in einem Block geteilt durch die Zahl der moglichen Beziehungen, wobei in den diagonalen Blocken die Diagonalwerte {xu) aus der Berechnung ausgeschlos-

66

5 Von der Partition zum

Blockmodell

sen werden, falls sie nicht definiert sind. Fiir den Block B2-B3 wiirde man den Blockdichtewert z.B. mit 1 (vorhandene Beziehungen)/ 8 (mogliche Beziehungen) = 0,125 berechnen. Anders ausgedriickt ist der Blockdichtewert der Durchschnitt der Blockwerte. Die Analyse (Analyse A4) des regionalen Interorganisationsnetzwerkes «optische Technologien» ergibt folgende Blockdichtematrizen (Siehe Tabelle 5.3, Tabelle 5.4 und Tabelle 5.5):

A B C D E

A 0,689 0,4 0,395 0,236 0,145

B 0,529 0,405 0,336 0,184 0,074

C 0,315 0,321 0,287 0,036 0,034

D 0,314 0,214 0,071 0,357 0,027

E 0,224 0,197 0,112 0,027 0,074

Tabelle 5.3: Blockdichtematrix personliche Beziehungen (Analyse A4)

A B C D E

A 0,689 0,171 0,24 0,243 0,179

B 0,171 0,024 0,036 0,092 0,025

C 0,175 0,064 0,103 0 0,053

D 0,164 0,071 0,021 0,176 0,027

E 0,138 0,015 0,064 0,012 0,075

Tabelle 5.4: Blockdichtematrix Forschungsbeziehungen (Analyse A4)

A B C D E

A 0,156 0,671 0,265 0,179 0,107

B 0,457 0,81 0,486 0,296 0,148

C 0,175 0,593 0,197 0,029 0,043

D 0,107 0,459 0,071 0,385 0,022

E 0,052 0,291 0,034 0,03 0,032

Tabelle 5.5: Blockdichtematrix Geschaeftsbeziehungen (Analyse A4)

5.2 Blockkriterien fur eine Image-Matrix nach struktureller Aquivalenz Hat man eine Blockdichtematrix erstellt, kann man darauf aufbauend ein reduziertes Bild der Netzwerkstruktur produzieren. Dieses reduzierte Abbild nennt man Image-Matrix.^^ Ziel der Image-Matrix ist es, einen Graphen zu erstellen, in dem ^° Blockdichtematrizen lassen sich mit Ucinet iiber das Menii Transform>Block und bei Netminer Analyze>Position>Blockmodell>Conventional erstellen, wobei bei Netminer die Partition als attributionale Variable an die Soziomatrix angefiigt sein muss.

5.2 Blockkriterien fiir eine Image-Matrix nach struktureller Aquivalenz

67

nicht mehr Beziehungen zwischen Akteuren gezeichnet sind, sondern Beziehungen zwischen Positionen. Hier dient die Image-Matrix dazu, Informationen iiber Muster von Beziehungen zu gewinnen oder Annahmen dariiber zu iiberpriifen. Partitio nierungen von Netzwerken konnen in Bezug auf verschiedene Aquivalenzdefinitionen erstellt werden. In diesem Abschnitt soil gezeigt werden, welche Moglichkeiten es gibt, bei der Partitionierung nach struktureller Aquivalenz eine Image-Matrix zu erhalten. Diese verschiedenen Moglichkeiten nennt man auch Blockkriterien. Blockkriterien sind Regeln, nach denen man Blocke zu Nullen oder Einsen dichotomisiert. Auch fiir eine Partitionierung nach regularer Aquivalenz lasst sich eine solche Image-Matrix erstellen, hier gibt es jedoch andere Blockkriterien (dies wird in Kapitel 8 vorgestellt). Die Beispiele in diesem Kapitel 5.2, in Kapitel 5.3 und in Kapitel 6 werden auf der Partitionierung durch die K-means-Analyse auf Basis der Ward-Partition mit dem multiplen Netzwerk (Analysenummer A4, siehe Tabelle 7.4) beruhen.^^

5.2.1 Fat Fit Wie in Kapitel 4.3.1 dargestellt, wiirde eine Partitionierung von perfekt strukturell aquivalenten Akteuren nur vier verschiedene Formen von Blocken zulassen. Bestehen Blocke nur aus Einsen, nennt man sie Einserblocke, bestehen sie nur aus Nullen, nennt man sie Nullblocke. Die Diagonalblocke sind bis auf die Diagonalwerte bei strukturell aquivalenten Akteuren auch Einserblocke oder Nullblocke. Falls man ein solches Blockmodell erhalt, welches nur aus Einserblocken und Nullblocken besteht, spricht man von «Fat Fit». Hier ist es einfach, aus der Soziomatrix (in der alle Akteure in den Zeilen und Spalten stehen) eine Image-Matrix (in der nur noch die Positionen in den Zeilen und Spalten stehen) zu konstruieren. Im Grunde ist bei einem Fat Fit die Blockdichtematrix schon eine Image-Matrix, da es nur Dichtewerte von 1,0 und 0,0 gibt. Man ersetzt also einfach Einserdichten in der Dichtematrix durch eine Eins in der Image-Matrix und Nullerdichten durch eine Null. Die Felder in der Image-Matrix stehen dann nicht mehr fiir eine Beziehung von Akteuren zueinander, sondern von Position zueinander (oder zu sich selbst). Das Besondere an einem solchen Fat-Fit ist, dass die Image-Matrix dann eine vollstandige Reprasentation der Soziomatrix ist und keine Informationen fehlen. Wie schon angefiihrt, entspricht ein empirisches Netzwerk jedoch selten der ^^ Die K-Means-Analyse auf Basis der W a r d - P a r t it ion wurde hierfiir ausgewahlt d a sie im Vergleich mit den anderen Methoden zusammen mit der W a r d - P a r t it ion fiir das multiple Netzwerk die besten Giitewerte aufweist (siehe Kapitel 7.2 und Tabelle 7.1.)

68

5 Von der Partition zum

Blockmodell

Idealstruktur eines «Fat Fit». Nun gibt es drei Moglichkeiten, aus einem nicht perfekten Netzwerk eine Image-Matrix zu bilden, von denen hier zwei etwas genauer vorgestellt werden.^^

5.2.2 Nullblockkriterium

Das Nullblockkriterium wurde urspriinglich von H. C. White, Boorman und Breiger (1976) vorgeschlagen. Nach dem Nullblockkriterium wird, sobald mindestens eine Beziehung in einem Block vorhanden ist, eine Beziehung zwischen zwei Positionen angenommen, d.h. eine Eins in der Image-Matrix notiert. Eine fehlende Beziehung zwischen den Positionen wird nur dann angenommen, wenn es keine Beziehung in dem Block gibt. Die Fokussierung auf Nullblocke ergibt sich aus theoretischen Uberlegungen, die die genannten Autoren vorgenommen haben. Vor allem das Fehlen von Beziehungen und Asymmetrien in dem Beziehungsmuster definiert die Struktur eines Netzwerkes. Es ist nicht zwingend notwendig, dass in einem Freundschaftsnetzwerk alle Akteure eine Beziehung zu alien Akteuren einer anderen Position haben. Wenn es aber von bestimmten Positionen zu bestimmten anderen Positionen gar keine Beziehungen gibt, ist dies ein bedeutsames Phanomen. Recognizing that the «holes» in a network may define its structure was a primary substantive motivation for the work reported here. (H. C. White et al. 1976, S.732) Problematisch bleibt dennoch, dass das strenge Nullblockkriterium in der Praxis selten anwendbar ist. Vor allem bei grol^eren Netzwerken gibt es schnell einzelne Beziehungen zwischen Positionen, auch wenn ansonsten viele «Nullen» im Block sind. Die Analyse des multiplen Interorganisationsnetzwerks (Analyse A4) ergibt fiir die Blockdichtematrix nur einen Block in alien drei Netzwerken der tatsachlich null Beziehungen hat und somit dem Nullblockkriterium gerecht werden wiirde (Siehe Tabelle 5.4). Deswegen ist es oft sinnvoll, ein weniger strenges Kriterium zu nehmen, da bei einer strengen Anwendung Informationen liber die Netzwerkstruktur verloren gehen. Das Einserblockkriterium wird nicht genauer vorgestellt, da es so gut wie nie angewandt wird. Das Einserblockkriterium kann als das Gegenstiick des NuUblockkriteriums verstanden werden: Blocke werden nur dann als Eins codiert, wenn sie nur aus Einsen bestehen.

5.2 Blockkriterien fiir eine Image-Matrix nach struktureller Aquivalenz

69

5.2.3 Das a-Dichte-Kriterium

Neben dem Nullblockkriterium gibt es noch das Einserblockkriterium, welches eine genaue Umkehrung des Nullblockkriteriums darstellt: Schon bei einer Null im Block wird der Block als 0 kodiert. Da nun beide Kriterien fiir ein empirisches Netz zu streng sind, ist es sinnvoll, einen Grenzwert zu bestimmen, iiber dem eine Eins kodiert wird und unter dem eine Null kodiert wird. Als solch ein Grenzwert wird von Arable, Boorman und Levitt (1978) die Netzwerkdichte vorgeschlagen. Um eine Dichotomisierung mit Hilfe eines a-Kriteriums durchzufiihren, verwendet Arable (1984) bei multiplen Netzwerken ein einziges a fiir alle Relationen. Von anderen Autoren wird stattdessen empfohlen, einen relationenspezifischen Grenzwert zu bestimmen, wenn die Dichtewerte der Relationen variieren (Wasserman &: Faust 1994, S.401). Das hei£t, man kann als a-Wert die Dichte der jeweiligen Relation als Grenzwert bestimmen. Dieses Vorgehen wurde auch fiir die in Tabelle 5.6-5.7 prasentierten Image-Matrizen gewahlt. Das Nullblock- und das Einserblockkriterium sind im Grunde Varianten des allgemeinen a-Kriteriums: Bei dem Nullblockkriterium ist der Grenzwert Null, und bei dem Einserblockkriterium ist der Grenzwert Eins. Es konnen beliebige Werte dazwischen gewahlt werden, wenn sie aus einer theoretischen Fragestellung begriindbar sind. Die Anwendung des aKriteriums mit der relationenspezifischen Dichte als Grenzwert fiihrt zu folgenden drei Image-Matrizen (Analyse A4, Tabelle 5.6, Tabelle 5.7 und Tabelle 5.8):

A B C D E

A 1 1 1 1 0

B 1 1 1 1 0

C 1 1 1 0 0

D 1 1 0 1 0

E 1 1 0 0 0

Tabelle 5.6: Image-Matrix personhche Beziehungen (Analyse A4)

A B C D E

A 1 1 1 1 1

B 1 0 0 1 0

C 1 0 1 0 0

D 1 0 0 1 0

E 1 0 0 0 0

Tabelle 5.7: Image-Matrix Forschungsbeziehungen (Analyse A4)

70

5 Von der Partition zum

A B C D E

A 1 1 1 1 0

B 1 1 1 1 1

C 1 1 1 0 0

D 0 1 0 1 0

Blockmodell

E 0 1 0 0 0

Tabelle 5.8: Image-Matrix Geschaftsbeziehungen (Analyse A4) 5.3 Der Image-Graph Wie in Kapitel 6 noch gezeigt wird, konnen sowohl die Blockdichtematrix als auch die Image-Matrix zur Interpretation der Netzwerkpositionen und -struktur herangezogen werden. Dariiber hinaus wird empfohlen, eine grafische Visualisierung der Netzwerkstruktur iiber die Image-Matrix vorzunehmen, also einen Image-Graphen (auch «reduced graph») zu erstellen (Wasserman & Faust 1994, S.403-404). Solch eine Visualisierung wird in der Praxis immer wieder vorgenommen.^^ Sie bietet eine kompakte Darstellung der wichtigen Struktureigenschaften des Netzwerkes. Das Prinzip der Visualisierung unterscheidet sich im Grunde nicht von der Visualisierung einer Soziomatrix bis darauf, dass die Knoten des Netzwerkes keine Akteure, sondern Positionen sind und die Kanten keine einfachen Beziehungen, sondern Beziehungen zwischen Positionen. Positionen kann man durch Kreise und Beziehungen zwischen Positionen durch Pfeile darstellen. Hierbei ist bei der Interpretation jedoch zu beachten, dass die Pfeile, je nach Blockkriterium, unterschiedliche Sachverhalte symbolisieren. Bei einem NuUblockkriterium symbolisiert ein Pfeil, dass mindestens eine Beziehung zwischen Positionen besteht, ein fehlender Pfeil, dass keine einzige Beziehung zwischen zwei Positionen besteht. Bei einem a-Dichte-Kriterium, wie in unserem Analysebeispiel, symbolisiert ein Pfeil eine «uberdurchschnittliche» Zahl von Beziehungen^^ und ein fehlender Pfeil eine unterdurchschnittliche Zahl von Beziehungen. Ein auf die Position (den Kreis) zurlickgewendeter, oder auch ein um die Position gehender Pfeil symbolisiert allgemein eine Verkniipfung von Akteuren in einer Position mit sich selber, bei einem a-Dichte-Kriterium konkret eine iiberdurchschnittliche interne Kohasion einer Position. Image-Graphen lassen sich sowohl fiir Analysen von einfachen Netzwerken und fiir Analysen von multiplen Netzwerken erstellen. Bei einfachen Netzwerken kann die Image-Matrix sehr komfortabel mit einem Netzwerkanalyseprogramm ^^ Z.B. bei Koku und Wellman (2004); Barkey und Van Rossem (1997); P a d g e t t und Ansell (1993). ^^ In unserem Beispiel bezogen auf den relationenspezifischen Durchschnitt.

5.3 Der Image-Graph

71

visualisiert und als einen Visualisierungsalgorithmus fiir einfache Soziomatrizen ein sog. Spring-Embedder verwendet werden.^^ Spring-Embedder generieren eine visuelle Darstellung eines Netzwerkes auf Basis einer zufalligen Startanordnung. Dabei benutzen sie ein Kraftemodell bei dem sich verbundene Knoten, umso weiter sie voneinander entfernt sind, wie von Federn anziehen, wenn sie zu nahe sind stolen sie sich ab. Iterativ wird dann ein niedriger energetischer Zustand des Gesamtsystems hergestellt. Zusatzlich konnen noch weitere asthetische Kriterien beriicksichtigt werden um die Lesbarkeit zu erhohen.^^ Bei multiplen Netzwerken gibt es fiir die Darstellung im Prinzip zwei Alternativen: Entweder man visualisiert jedes relationenspezifische Netzwerk fiir sich, oder man visualisiert alle Relationentypen in einem Bild. Zweiteres entspricht konsequenter einer multiplen Analyse und macht auch eine einfache visuelle Inspektion der Interpenetration verschiedener Beziehungstypen moglich. Allerdings ist fiir eine visuelle Darstellung von Netzwerken die Preihandzeichnung des Forschers vonnoten, da die computergenerierte sinnvolle Visualisierung multipler Netzwerke bisher ein Desiderat bleibt.^^ Fiir die Preihandzeichnung macht es Sinn, sich an allgemeinen Konventionen und Regeln der Konstruktion von Netzwerkgraphen auszurichten, die entwickelt wurden, als zur Visualisierung von Netzwerken noch keine Computerprogramme zur Verfiigung standen.^® Es ist sinnvoll, Image-Graphen so zu zeichnen, dass sich moglichst wenige Pfeile iiberschneiden. Sich iiberschneidende Pfeile vermindern die Ubersichtlichkeit der Darstellung. Ein weiteres wichtiges Prinzip der Visualisierung ist es, diese so vorzunehmen, dass die Darstellung sich an den strukturellen Eigenschaften des Netzwerkes ausrichtet. So ist es sinnvoll, Positionen, die fiireinander direkt erreichbar sind, nahe beieinander zu platzieren und Positionen, die eine h5here Pfaddistanz aufweisen, weiter voneinander entfernt. Zudem ist es sinnvoll, Positionen mit einer hohen Beziehungsdichte zentral zu platzieren. Hierbei kann man sich am Indegree (den eingehenden Beziehungen), Outdegree (den ausgehenden Beziehungen), der interne Positionsdichte oder an alien drei Kriterien orientieren. Diesen Regeln folgend wurde ein Image-Graph fiir das regionale Interorganisationsnetzwerk auf Basis der Image-Matrizen in Tabelle 5.6, Tabelle 5.7 ^^ z.B. der in Pajek und Netminer implementierte Kamada-Kawai Algorithmus ( K a m a d a &; Kawai 1989). ^^ Eine umfassende Darstellung der Visualisierungmoglichkeiten von Netzwerken bietet Krempel (2005). Weder Pajek noch Netminer noch Ucinet konnen multiple Relationen so darstellen, dass P u n k t e mit mehreren Pfeilen verkniipft werden. Dem Autor ist kein P r o g r a m m bekannt, dass dies leistet. ^® Zur Geschichte und einigen Regeln der Preihandzeichnung: (Freeman 2000, Kapitel: Hand Drawn Images in Social Network Analysis).

72

5 Von der Partition zum

Blockmodell

und Tabelle 5.8 konstruiert (Abbildung 5.1). Solch ein Image-Graph ist ein sehr hilfreiches Instrument, um die Struktur eines Netzwerkes darzustellen. Allerdings beruht er auf einer sehr star ken Informationsreduktion, und zur Interpretation eines Image-Graphen sollte immer auch die Blockdichtematrix hinzugezogen werden. Ein Vorschlag fiir eine mogliche verbesserte Visuahsierung, die die Informationsreduktion vermindert und die strukturellen Eigenschaften des Netzwerkes starker reprasentiert, sieht aus wie in Abbildung 5.2 dargestellt.^^ Das grundsatzUche Beziehungsmuster richtet sich hier an der Image-Matrix aus. Es werden also nur dann Pfeile zwischen Blocken (oder positionsintern) gezeichnet, wenn die Blockdichte den relationenspezifischen Dichtewert iiberschreitet (aDichte-Kriterium). Nun wird aber die Pfeildicke proportional an den Blockdichtewert angepasst. Ein dicker Pfeil steht fiir eine hohe Blockdichte und ein diinner fiir eine niedrige Blockdichte (die aber immer noch hoher als der a-Wert ist). Zusatzlich macht es Sinn, die Zahl der Akteure in den unterschiedlichen Positionen zu visualisieren, wobei der Flacheninhalt der Kreise proportional zu der Zahl der Akteure variiert.^°° Ein Problem ergibt sich hier nur fiir die Pfeildicke bei reziproken Beziehungen, falls diese als Doppelpfeil gezeichnet sind. Das Problem ergibt sich daraus, dass sich die Beziehungsdichte in eine Richtung von der in die andere Richtung unterscheiden kann. Hier gibt es grundsatzlich zwei Moglichkeiten: Entweder reziproke Beziehungen werden durch zwei Pfeile mit (eventuell) unterschiedlicher Dicke dargestellt, oder die Pfeildicke fiir reziproke Beziehungen wird aus der durchschnittlichen Pfeildicke bestimmt. Die erstere Variante ist eigentlich konsequenter an der Methode der Blockmodellanalyse ausgerichtet, da unterschiedliche Dichte von aus- und eingehenden Beziehungen zu Positionen fiir die Interpretation von Blockmodellen sehr wichtig ist. Bei der zweiten Variante ergibt sich das Problem, dass die Unterschiede in der Dichte von aus- und eingehenden Beziehungen nicht mehr sichtbar sind. Allerdings mildert sich das Problem dadurch, dass es ohnehin nur dann auftritt, wenn die Dichte fiir beide gegenseitige «Wahlen» iiber dem a-Dichte-Kriterium ist. Asymmetrische Beziehungskonstellationen, wo die Dichte der Riickwahl unter dem a-Dichte-Kriterium bleibt, werden weiterhin als gerichtete Pfeile dargestellt. Diese Variante mit zwei Pfeilen geht allerdings zulasten der Ubersichtlichkeit, besonders bei BlockmodelDiese Art der Visualisierung wurde auch bei Bliimel, Heidler und Lerch (2006) verwendet. Hierbei sollte vermieden werden, s t a t t des Flacheninhalts den Radius der Kreise proportional zur Akteurszahl zu variieren; dies suggeriert visuell starkere Grofeenunterschiede, d a die Kreisflache A = r^n durch die Quadrierung nicht proportional zum Radius variiert.

5.3 Der Image-Graph

73

len mit vielen Relationentypen. Die beispielhafte Darstellung der modifizierten Image-Matrix orientiert sich an der zweiten Variante, auch weil die Asymmetrien bei reziproken Wahlen, die iiber dem a-Dichte-Kriterium liegen, fiir die meisten Dyaden eher klein sind. Neben der vorgeschlagenen Visualisierung sind auch andere Visualisierungen denkbar. Krempel (2005, S.134-S.143) unterscheidet drei Grundvarianten der Visualisierung von Blockmodellen, die sich je nach Datengrundlage, auf deren Basis die Visuahsierung vorgenommen wird, unterscheiden. Moghch sind hierbei eine VisuaUsierung auf Basis der Soziomatrix, der Image-Matrix oder einer Distanzmatrix. Fiir die Visuahsierung auf Basis der Image-Matrix schlagt Krempel eine ahnliche Vorgehensweise wie hier vor.^^^ Bei einer Visualisierung auf Basis der Soziomatrix wird einfach die komplette Soziomatrix mit einem Spring-Embedder visualisiert. Dann konnen die Knoten je nach Blockzugehorigkeit farblich markiert werden, und durch schraffierte Flachen unterlegt werden. Es ist auch moglich jeweils mehrere Knoten iiber eine geometrische Positionsaggregation zusammenzufassen, dann entsteht ein ahnliches Bild, wie das Bild auf Basis der Image-Matrix, nur dass die Lage der Blocke durch die urspriingliche Soziomatrix bestimmt ist und nicht durch die Image-Matrix. Die dritte Variante, auf Basis einer Distanzmatrix, ist eine hilfreiche Visualisierung, um die Ahnlichkeit/Unahnlichkeit der Akteure beziiglich des Aquivalenzkriteriums zu iiberblicken. Hierzu kann die Distanzmatrix (z.B. die Eukhdische Distanz) mit einem Spring-Embedder fiir metrische Daten visualisiert werden. Das Resultat ist, dass zueinander ahnliche Akteure sich nahe beieinander befinden. Solch eine Vorgehensweise fiihrt natiirlich zu einem anderen Bild als eine Visualisierung auf Basis der Soziomatrix, da nun nicht mehr die Verbundenheit von Akteuren, sondern deren Ahnlichkeit zur Darstellung genutzt wird.^°^ Auch hier ist es moglich die Positionszugehorigkeit durch farbliche Markierung, Flachen oder geometrische Aggregation darzustellen. Diese Variante kann sinnvoll in Kombination mit einer klassischen Visualisierung auf Basis des ImageGraphen kombiniert werden. Die Entwicklung einer sinnvollen Visualisierung kann nicht schematisch vorgegeben werden, sie sollte sich immer an der jeweiligen theoretischen Konzeptualisierung und an der gewahlten Forschungsfrage orientieren. ^^^ Allerdings visualisiert Krempel bei seinem exemplarischen multiplen Netzwerk jede Matrix einzeln mit einem Spring-Embedder, dadurch wird die Interpenetration der Beziehungen nicht sichtbar. Zudem zeichnet er die internen Beziehungen der Positionen nicht ein, so dass diese strukturelle Information fehlt. ^°^ Eine ahnliche Vorgehensweise wird auch von Wasserman und Faust (1994, S.385-388) vorgeschlagen. Er nutzt hierfiir die Multidimensionale Skalierung, s t a t t einem Spring-Embedder, wobei ein Spring-Embedder als ein Spezialfall der Multidimensionalen Skalierung gesehen werden kann. (Krempel 2005, S.113)

74

5 Von der Partition zum

H^ Forschungsbeziehung • • Geschaftsbeziehung • • personliche Beziehung Abbildung 5.1: Image-Graph klassisch (Analyse A4)

Blockmodell

5.3 Der Image-Graph

Forschungsbeziehung • • Geschaftsbeziehung • • personliche Beziehung Abbildung 5.2: Modifizierter Image-Graph (Analyse A4)

75

6 Die Interpretation eines Blockmodells

Blockmodelle sind ein vereinfachtes Abbild der Struktur eines Netzwerkes. Nun gibt es verschiedene Ebenen, auf denen ein Blockmodell interpretiert werden kann: 1. Das Blockmodell kann mit Akteursattributen assoziiert werden 2. Die Positionen konnen beschrieben werden 3. Die Gesamtstruktur kann beschrieben werden Diese drei Interpretationsebenen stellen grundlegende Moglichkeiten dar, die Ergebnisse einer Blockmodellanalyse zu verwerten.^^^ Hierbei gibt es auch einige weiterfiihrende Konzepte und Methoden, um solch eine Interpretation vorzunehmen. Allerdings muss beriicksichtigt werden, dass auch andere Interpretationen und Auswertungen von Blockmodellen moglich sind und denkbar waren (z.B. eine Kombination von qualitativen Forschungsmethoden mit Blockmodellen). Die Interpretation von Blockmodellen setzt dabei i.A. eine genaue Kenntnis des untersuchten Netzwerkes voraus. Sie erfolgt vor dem Hintergrund einer theoretischen Pragestellung, die aufbauend auf den in Kapitel 3 vorgestellten Grundlagen entwickelt werden kann. Die vorgestellten Interpretationsmoglichkeiten sind haufig verwendete Strategien der Auswertung von Blockmodellen. Die konkrete Auswertung von Blockmodellen hangt jedoch immer von der spezifischen Forschungsfrage sowie von der theoretischen Perspektive und dem empirischen Interesse der Untersuchung ab. Im folgenden Abschnitt werden die verschiedenen Auswertungsmoglichkeiten exemplarisch am Beispiel des regionalen Interorganisationsnetzwerkes aufgezeigt. Hier erfolgt die Interpretation natiirlich nur «ad hoc», eine theoretisch fundierte Interpretation, die auf einer Forschungsfrage basiert, ist nicht die Intention dieser Arbeit und wiirde weit liber ihren Rahmen hinausgehen.^^'* Es geht vielmehr darum, exemplarisch die verschiedenen Interpretationskonzepte aufzuzeigen. ^°^ Zur Interpretation von Blockmodellen siehe auch Wasserman und Faust (1994, S.408 - S.424). ^^'^ Fiir eine theoretisch fundierte Auswertung des hier besprochenen Netzwerkes, bei der insbesondere in Auseinandersetzung mit dem Transaktionskostenansatz eine strukturelle Perspektive auf interorganisationale Netzwerke entwickelt wird, sei auf Bliimel, Heidler und Lerch (2006) verwiesen.

78

6 Die Interpretation eines Blockmodells

6.1 Assoziation mit Akteursattributen Die Assoziation des Blockmodells mit Akteursattributen stellt sowohl eine Strategic der Validierung von Blockmodellen dar als auch eine Moglichkeit der Uberpriifung von Hypothesen. Sie ist aus theoretischer Perspektive besonders deswegen interessant, weil sich hieriiber (Wechsel)wirkungen zwischen Eigenschaften von Individuen und der Netzwerkstruktur beschreiben lassen. Die Grundidee ist, die Akteure in den verschiedenen Positionen beziiglich der Auspragung von Akteursattributen zu vergleichen. Variieren die Attribute systematisch mit verschiedenen Positionen im Netzwerk, weist dies auf einen Zusammenhang zwischen der Netzwerk-Position mit bestimmten Eigenschaften hin. Insbesondere Verhalten und Einstellungen werden dabei aus relational-strukturalistischer Perspektive als abhangig von der Position in der Netzwerkstruktur angesehen (Siehe Kapitel 3). Bei der Validierung von Positionen mit attributionalen Daten geht es weniger darum, theoretische Zusammenhange zu untersuchen, sondern die Ubereinstimmung der blockmodellanalytischen Gruppierung mit prima facie erstellten Typologien zu priifen. Allerdings miissen blockmodellanalytische Gruppierungen, die der Gruppierung nach Attributen nicht entsprechen, nicht zwingend das Blockmodell widerlegen, sondern konnen auch auf die Ahnlichkeit verschiedener attributionaler Gruppen beziiglich ihres Beziehungsmusters verweisen. Zur Validierung der Positionen kann fiir das regionale Interorganisationsnetzwerk der Institutionstypus herangezogen werden (siehe Tabelle 6.1). Es ist zu vermuten, dass unterschiedliche Organisationstypen/^^ z.B. Unternehmen und Universitaten, sich beziiglich ihrer Beziehungsmuster unterscheiden. Hierzu wird eine Kreuztabelle zwischen dem Institutionentypus und der Position erstellt. Die Kreuztabelle ist ein allgemeines Verfahren, um den Zusammenhang zwischen nominal skalierten Variablen zu untersuchen. Tatsachlich besteht beispielsweise Position D zu 92,9% aus Unternehmen. Position A besteht dagegen zu 70% aus Forschungseinrichtungen (Universitaten und aul^eruniversitare Forschungseinrichtung). Dass einzelne Positionen aus gemischten Institutionentypen bestehen, spricht nicht zwingend gegen das Blockmodell, sondern zeigt, dass Organisationen durchaus iiber die Grenzen solch einer «com^°^ Damit ist der organisatorische und rechtliche S t a t u s der Einrichtung gemeint. Hierbei wurde zwischen privaten Dienstleistern und staatlichen Insititutionen, aufieruniversitaren Forschungseinrichtungen und Universitaten und produzierenden Unternehmen unterschieden. Dabei sind private Dienstleister und staathche Institutionen Akteure, die nicht selbst in der Forschung und Entwicklung tatig werden, sondern lediglich Dienstleistungen fiir das Netzwerk erbringen, (z.B. Rechtsberatung, Finanzierung, Forderung der Kooperation oder Hilfe bei der EtabHerung von Forschungsprojekten).

6.1 Assoziation mit Institutionentyp/ Position Universitat Aufeeruniversitare Forschungsein. Unternehmen staatliche Institution priv. Dienstleister

E

79

Akteursattrihuten

A

B

c

D

E

E

30,0% 3 40,0% 4 20,0% 2 10,0% 1 0,0% 0 100,0% 10

0,0% 0 0,0% 0 42,9% 3 14,3% 1 42,9% 3 100,0% 7

0,0% 0 15,0% 3 60,0% 12 5,0% 1 20,0% 4 100,0% 20

0,0% 0 7,1% 1 92,9% 13 0,0% 0 0,0% 0 100,0% 14

24,1% 7 17,2% 5 55,2% 16 0,0% 0 3,4% 1 100,0% 29

12,5% 10 16,3% 13 57,5% 46 3,8% 3 10,0% 8 100,0% 80

Tabelle 6.1: Anteil der Institutionentypen an den Positionen (Spaltenprozente)

mon sense»-Organisationentypologie ahnliche Beziehungsmuster haben und sich gemeinsam einer Netzwerkposition zuordnen lassen.^^^ Auf theoretischer Ebene konnte man sich die Prage stellen, inwieweit technologische Spezialisierungen von Organisationen mit ahnlichen Beziehungsmustern zusammenhangen. Inwiefern sind Positionen in Netzwerken mit einer bestimmten technologischen Ausrichtung^^^ verkniipft? Wie in Tabelle 6.1 lasst sich auch hierzu eine Kreuztabelle erstellen (Siehe Tabelle 6.2). Auch hier lassen sich Zusammenhange zwischen den Positionen im Blockmodell und den Attributen feststellen. In Position A, in der sehr viele Forschungseinrichtungen vertreten sind, geben 90% der Organisationen biomedizinische Optik als Technologieschwerpunkt an. In Position C geben 75,0% UV- und Rontgentechnologie als Spezialisierung an, in Position D beschaftigen sich 92,9% der Organisationen mit optischen Technologien fiir das Internet. Es ist also durchaus eine positionenspezifische Spezialisierung erkennbar; in welchem Wirkungszusammenhang technologische Spezialisierung und das positionenspezifische Beziehungsmuster stehen, ist allerdings eine Prage, die auf theoretischer Ebene geklart werden miisste. Will man den Einfluss mehrerer Variablen auf die Gruppenzugehorigkeit unter^^^ Fiir Galaskiewicz und Krohn (1984) sind solche Konfigurationen, bei denen verschiedene Organisationstypen ahnliche Beziehungsmuster haben, theoretisch bedeutsam. Sie werden als symbiotic configurations bezeichnet, im Gegensatz zu commensurate configurations, bei denen gleiche Organisationstypen ahnliche Beziehungsmuster haben. ^° Die hier erhaltenen D a t e n beruhen auf einer D a t e n b a n k des Forderverbandes, in der die Organisationen des Netzwerkes b e s t i m m t e n Themengebieten zugeordnet sind. Dabei waren auch Mehrfachzuordnungen moglich.

6 Die Interpretation eines Blockmodells

80 Spezialisierung/ Position Biomedizinische Optik Optische Technologien fiir das Internet Optische Technologien fiir Verkehr und Raumfahrt UV und Rontgentechnologie Netzwerkdienstleistungen Zahl der A k t e u r e Position

pro

A

B

c

90,0% 9 30,0% 3 60,0% 6 70,0% 7 0,0% 0 10

14,3% 1 14,3% 1 42,9% 3 42,9% 3 57,1% 4 7

30,0% 6 10,0% 2 30,0% 6 70,0% 14 20,0% 4 20

D

E

21,4% 3 92,9% 13 35,7% 5 35,7% 5 0,0% 0 14

60,7% 17 17,9% 5 21,4% 6 39,3% 11 7,1% 2 28

E

45,6% 36 30,4% 24 32,9% 26 50,6% 40 12,7% 10 79

Tabelle 6.2: Anteil der Organisationen mit technol. Spezialisierungen an den Positionen (mehrere Spezialisierungen moglich, Spaltenprozente)

suchen und ist mindestens eine dieser Variablen metrisch skaliert, macht es Sinn, den Zusammenhang zwischen der Netzwerkposition und attributionalen Daten mit Hilfe einer Diskriminanzanalyse zu untersuchen. Durch die Diskriminanzanalyse kann gepriift werden, ob sich Gruppen in Bezug auf bestimmte Variablen unterscheiden und inwieweit bestimmte Variablen dazu geeignet sind, Gruppenzugehorigkeit vorherzusagen.^^^ Arable (1984) verwendet die Diskriminanzanalyse zur Veranschaulichung der Validierung der Blockmodellanalyse durch attributionale Daten und untersucht den Zusammenhang individueller Merkmale von Gefangnisinsassen mit der Position in der Netzwerkstruktur.^°^ Die Positionen, die er dabei unterscheidet, beruhen auf vier Partitionen des CONCOR-Verfahrens, das er basierend auf vier Relationstypen erstellt.^^^ Dabei berechnet er die standardisierten Diskriminanzkoeffizienten von fiinf Variablen. Der standardisierte Diskriminanzkoeffizient gibt die Bedeutung der jeweiligen Variablen in der Diskriminanzfunktion an. Er ist also ein Indikator fiir die «Trennkraft» der Variablen beziiglich der Gruppen. Den groftten standardisierten Diskriminanzkoeffizienten hat fiir die Diskriminanzfunktion dabei die Variable schwarz/nicht schwarz (Hautfarbe), gefolgt ^ Fiir eine Einfiihrung in die Diskriminanzanalyse siehe Backhaus et al. (2003, Kapitel 3). Dabei verwendet er die Daten 69 mannlicher Insassen des «Cook County Jail», die von John H. Gagnon 1958 mit diversen soziometrische Fragen, sowie iiber 100 Fragen zu a t t r i b u t i o n a len Variablen erhoben wurden. ^^° Die vier Fragen, auf denen die Beziehungen beruhen, sind Freundschaftswahlen, andere Insassen, mit denen Ego gern nach New York fahren wiirde, Mithaftlinge, die Ego zufolge Frauen a t t r a k t i v finden wurden, und Mithaftlinge, die Ego zufolge im Gefangnis gut zurecht kommen. Die vier Fragen konnen alle als Operationalisierung eines positiven Affekts verstanden werden.

81

6.2 Interpretation der Positionen

von der Schulbildung, der Frage, ob die Eltern noch leben, dem Alkoholkonsum sowie der Planung der Insassen, nach dem Gefangnisaufenthalt weiter in Chicago zu leben.^^^ Die Untersuchung des Zusammenhangs dient hier sowohl zur Validierung als auch zur Interpretation der Positionen des Blockmodells. Daneben kann dariiber aber auch eine theoretische KonzeptuaHsierung des Zusammenhangs bestimmter individueller Merkmale (wie hier Bildungsstand und Hautfarbe) und sozialer Strukturen (hier das Muster der Relationen in einem Gefangnis) erfolgen, wobei der Kausalnexus, je nach theoretischer Perspektive und Wahl der Variablen, sowohl von den Attributen in Richtung Netzwerkstruktur (die Hautfarbe wirkt auf die Position im Netzwerk) als auch von der Netzwerkstruktur in Richtung der Attribute gehen kann (die Netzwerkposition wirkt auf den Alkoholkonsum).

6.2 Interpretation der Positionen Neben der Interpretation von Blockmodellen mithilfe von attributionalen Variablen kann das Blockmodell auch auf einer positionalen Ebene interpretiert werden. Dabei wurde auf die Idee von Harary, Norman und Cartwright (1965, S. 16-18) zuriickgegriffen, Akteure nach deren Muster von aus- und eingehenden Beziehungen zu beschreiben. ansi mitter

1

• isolate

'' rece iver

^' ordii nary

Abbildung 6.1: Klassifikation von Punkten nach Harary, Norman und Cartwright (1965, S.16) Harary et al. unterscheiden dabei fiinf Typen von Akteuren (Punkten) (siehe Abbildung 6.1). Isolates haben weder aus- noch eingehende Beziehungen. Transmitter haben nur ausgehende Beziehungen, receiver haben nur eingehende Beziehungen. Carrier haben genau eine ausgehende und eine eingehende Beziehung. Alle anderen Punkte sind ordinary points. Harary et al. machen die Bedeutung Der Wert der durch die Diskriminanzfunktion korrekt klassifizierten Insassen fiir den kompletten Datensatz b e t r a g t mit den fiinf Variablen 56,92%.

82

6 Die Interpretation

eines

Blockmodells

der T y p e n an d e m Beispiel eines Kommunikationsnetzwerkes deutlich: /.../ an isolate point corresponds nor receive messages

to a person

in the network,

send but not receive messages,

a transmitter

a receiver

not send, and the two remaining

who can neither

send

to one who

can

to one who can receive

but

types to persons

and receive (a carrier being more constrained

who can both send

than an ordinary

point).

(Harary et al. 1965, S.18) Die Idee einer Rollen-/Positionstypologie nach d e m Verhaltnis der aus- u n d eingeh e n d e n Beziehungen w u r d e s p a t e r von A k t e u r e n auf Positionen

iibertragen (Mars-

den 1989). B u r t (1976, S.107) erstellt dabei eine eigene Typologie. Sie entspricht in ihrem G r u n d m u s t e r d e m Konzept von H a r a r y et al.; allerdings interessiert B u r t nicht, ob Beziehungen von den Positionen ausgehen, sondern wie das Verhaltnis der ausgehenden Beziehungen zu den positionsinternen Beziehungen ist. Z u d e m interessiert ihn der Anteil der zu der Position gehenden Beziehungen a n alien ausgehenden Beziehungen (siehe Tabelle 6.3).

Anteil der an die Position selbst gehenden, an alien von der Position ausgehenden Beziehungen

> Q.S ^ Q^

Anteil der von anderen Akteuren an die Position gehende Beziehungen, an alien von anderen Akteuren ausgehenden Beziehungen ?^ 0.0 >0.0 Isolates Primary Position Sycophant Broker

Tabelle 6.3: Positionstypologie nach Burt (1976, S.107). (die Werte 0,0 und 0,5 stellen dabei einen Richtwert da und sind modifizierbar) Dabei legt B u r t (1976, S.107) sein H a u p t a u g e n m e r k hier auf die «Form» der Beziehungen, die, in A n l e h n u n g a n Simmels Unterscheidung von Form u n d Inhalt von «Wechselwirkungen» (Simmel 1908), mit b e s t i m m t e n Inhalten in Wechselwirk u n g steht. Die theoretische Idee d a h i n t e r ist, dass alleine die Form (zahlenmafeige Verhaltnisse von aus- und eingehenden Beziehungen sowie Selbstwahlen) einen Einfluss auf die inhaltliche Gestalt von Positionen u n d Beziehungen hat.^^^ Die Begriffe der Typologie eignen sich dabei bei B u r t fiir positive affektuelle Wahlen wie Freundschaft u n d Respekt. Bei anderen Beziehungsinhalten miissten andere ficant part in some social phenomenon, occupancy of different types of positions within the network should be associated with different antecendents and consequences»

6.2 Interpretation der Positionen

83

Begriffe fiir die Typologie gewahlt werden. In einer Untersuchung zweier interorganisationaler stadtischer Netzwerke, bei der es um den Austausch von Ressourcen geht, verwenden Galaskiewicz und Krohn (1984) die Begriffe Generator, Consumer, Transmitter und Isolate zur Charakterisierung von Positionen. Allerdings ist die Operationalisierung der Typologie bei ihnen etwas anders als bei Burt. Eine in der Sozialwissenschaftlichen Netzwerkanalyse immer wieder thematisierte Position ist dabei die, des Brokers. ^^^ Galaskiewicz und Krohn stellen dabei fest, dass die Position des Transmitters, (der Burts Broker^ ^^ entspricht), welche aus Organisationen besteht, die in der Stadt Ressourcen wie Geld, Information und Unterstiitzung redistribuieren und nicht etwa die Position des Generator (der sie erst «ausgibt/generiert») als besonders einflussreich wahrgenommen wird (Galaskiewicz & Krohn 1984, S.546-548). Bossevain (1974, Kapitel 6) formuliert in seinem Buch «Priends of Friends. Networks, Manipulators and Coalitions» eine umfassende Beschreibung des Brokers (Bossevain 1974, Kapitel 6). Er schreibt hierzu: A broker is thus a special type of entrepreneur: one who controls second order resources and manipulates these for his own profit. Broker are thus highly expert network specialists. (Bossevain 1974, S.148) Burts Typologie hat allerdings einige Eigenheiten und wurde spater modifiziert. Zum einen beriicksichtigt sie nicht die Gro£e von Positionen. Umfasst eine Position nur 10% der Akteure eines Netzwerkes, wird ihr Anteil der Selbstwahlen an alien Wahlen schnell die 0,5 unterschreiten. Macht eine Position dagegen 60% der Netzwerkakteure aus, wird es eher iiberraschen, wenn der Anteil der Selbstwahlen an alien Wahlen unter 0,5 liegt. Sinnvoll ware hier ein Ma£, das die Neigung, von Positionen Beziehungen auszusenden, misst und dieses beriicksichtigt.^^^ Au£erdem vermischt die Typologie von Burt zwei Interpretationsfragen. Erstens: Neigt die Position dazu, sich besonders stark selbst zu wahlen? Zweitens: Neigt die Position dazu besonders stark andere Positionen zu wahlen? Theoretisch konnteman. ^^^ Die anderen drei T y p e n bleiben bei B u r t auf theoretischer Ebene kaum ausgearbeitet. ^^^ Allerdings ist der Broker in der positionenspezifischen Typologie etwas anders konzeptualisiert als der auch von Burt entwickelte Broker, der auf Basis des Constraint-Ma£es berechnet wird (Burt 1992). Mit diesem Mafe lasst sich die Brokerfahigkeit eines einzelnen Akteurs (nicht einer Position!) berechnen. Dabei zeichnet sich dieser Broker dadurch aus, dass er strukturelle Locher («structural holes») iiberwinden kann, d.h. ansonsten unverbundene Akteure iiber ihn verkniipft sind. Dies ist tendenziell fiir den Broker aus der Positionentypologie auch gegeben, ist aber nicht zwingend, d a Positionen die er verbindet, auch miteinander verbunden sein konnen. ^^^ Um dies zu beriicksichtigen wurde die Burtsche Typologie von Wasserman und Faust (1994, S.413-414) modifiziert.

84

6 Die Interpretation

eines

Blockmodells

u m diese Fragen zu beantworten, die ausgehenden, die eingehenden und die positionsinternen Blockdichten mit der gewichteten durchschnittlichen Blockdichte vergleichen. Hier bietet es sich a b e r auch an, ein stochastisches Blockmodell basierend auf d e m p l - M o d e l l zu bilden u n d die Koeffzienten a^ (expansiveness) /3j (popularity) u n d 7^2 (ingroup preference) zu verwenden:^^^

Value of Participation Parameter on Output Side {ai)

positiv

Value of Participation Parameter on Input Side {fSi) positive negative

negativ

positive negative

Level of Ingroup (jii) positiv Primary Position Low Status Clique High Status Clique Isolate Clique

Preference

negativ Broker Sycophant Snob Isolate

Tabelle 6.4: Positionstypologie (Marsden 1989, S.448)

M a r s d e n s Typologie ist dabei differenzierter als die B u r t s , sie kann z.B. zwischen «Isolate» u n d «Isolate Clique» unterscheiden. Die Idee hinter solchen Typologien ist, wie schon erlautert, dass sie mit b e s t i m m t e n Voraussetzungen u n d Konsequenzen fiir die A k t e u r e in den jeweiligen Positionen verkniipft sind.^^^ Solche Typologien sind nicht zwingend sinnvolL Je nach theoretischer Perspektive u n d empirischem G e g e n s t a n d sollte entschieden werden, wie b e s t i m m t e Positionen in Netzwerken interpretiert oder weiteren Auswertungen zugefiihrt werden sollten. Wichtig ist jedoch zu sehen, dass sowohl die Dichte der ausgehenden Beziehungen (die Zeilen in der Blockdichtematrix), die der eingehenden Beziehungen (die Spalt e in der Blockdichtematrix) u n d die Dichte der Selbstwahlen (die Diagonalwerte in der Blockdichtematrix) bei der I n t e r p r e t a t i o n von Positionen in Blockmodellen beriicksichtigt werden sollten.

^^ Die P a r a m e t e r geben die Neigung von Akteuren an, Beziehungen «auszusenden» (expansiveness) und zu «empfangen» (popularity) oder sich selbst zu wahlen (ingroup preference). Die Berechnung erfolgt iiber stochastische Blockmodelle (siehe Kapitel 8). Auch wenn diese Arbeit keine umfassende Einfiihrung in die stochastische Blockmodellanalyse gibt, sei die Typologie von Marsden hier trotzdem erwahnt, d a sie sich theoretisch auch auf die konventionelle Blockmodellanalyse iibertragen lasst und einen Hinweis fiir Interpretationsmoglichkeiten von Blockmodellen geben soil. ^^^ Leider ist jedoch von Marsdens fiir seine Typologie auf theoretischer Ebene kaum ausgearbeitet worden mit welchen Konsequenzen die jeweiligen strukturellen Positionen verkniipft sind.

6.3 Interpretation

der Gesamtstruktur

85

6.3 Interpretation der Gesamtstruktur Uber die einzelnen Positionen hinaus gibt ein Blockmodell auch Auskunft iiber die Gesamtstruktur eines Netzwerkes. Die Interpretation der Gesamtstruktur eines Netzwerkes ist ein wichtiges analytisches Ziel der Blockmodellanalyse. Die Gesamtstruktur entspricht dem, was in Kapitel 3 als spezifisch blockmodellanalytische Konzeption der sozialen Struktur herausgearbeitet wurde. Sie ist das Kernstiick einer blockmodellanalytischen Arbeit und zeichnet die Blockmodellanalyse als distinkte Forschungsmethode aus. Die Interpretation der Gesamtstruktur kann dabei, wie in Kapitel 3 anhand der Typologie von Emirbayer und Goodwin (1994) dargelegt wurde, durchaus mit variierenden theoretischen Schwerpunkten verbunden sein. Die strukturell-relationale Perspektive, die die Bedeutsamkeit solch einer Struktur fiir das Verstandnis sozialer Phanomene postuliert, bleibt jedoch immer das Kernstiick der Blockmodellanalyse. Die Gesamtstruktur lasst sich am besten an der Image-Matrix und am Image-Graphen (siehe Abbildung 5.2) ablesen. Eine immer wieder in verschiedenen Kontexten auftretende Netzwerkstruktur ist beispielsweise die Zentrum/Peripherie-Struktur (Borgatti &i Everett 1999). Idealisiert kann die Image-Matrix einer Zentrum/Peripherie-Struktur folgenderma^en wie in Tabelle 6.5 dargestellt werden. 1 1 1 1

1 1 1 0 0 0 0 0 0 0 0 0

Tabelle 6.5: Zentrum/Peripherie-Struktur einer Image-Matrix Der Image-Graph hierzu wiirde, wenn man ihn zeichnete, sternformig aussehen, mit einer zentralen Position in der Mitte. In solch einer idealen Form wird man eine Zentrum/Peripherie-Struktur moglicherweise nicht antreffen, aber die Struktur einer empirisch erhaltenen Image-Matrix lasst sich mit solch einer Struktur vergleichen. Hierzu konnen wir uns noch einmal die Image-Matrix der Forschungsbeziehungen fiir deis Interorganisationsnetzwerk anschauen (siehe Tabelle 6.6). Die Tabelle wurde etwas permutiert, um die Struktur besser sichtbar zu machen. Es zeigt sich, dass das Modell der Zentrum/Peripherie-Struktur das Forschungsnetzwerk recht gut beschreibt. Das Modell weicht allerdings etwas von der klassischen Zentrum/Peripherie-Struktur ab, da eine Beziehung von D zu B besteht und die Positionen C und D intern vernetzt sind. Hierbei gibt es also noch fiir das

86

6 Die Interpretation eines Blockmodells

A C D B E

A 1 1 1 1 1

C 1 1 0 0 0

D 1 0 1 0 0

B 1 0 1 0 0

E 1 0 0 0 0

Tabelle 6.6: Image-Matrix Forschungsbeziehungen (Permutierte Version von Tabelle 5.7) Forschungsnetzwerk eine Abstufung zwischen kohasiv geschlossenen «peripheren» Positionen und kohasiv nicht geschlossenen peripheren Positionen. Wenn man sich den Image-Graphen in Tabelle 5.2 anschaut, erkennt man, dass das okonomische Netzwerk ahnlich strukturiert ist. Das interorganisationale Netzwerk lasst sich also als ein difFerenziertes Netzwerk mit einem Forschungszentrum und einem okonomischen Zentrum beschreiben. Daneben gibt es zwei periphere, kohasiv weitgehend geschlossene Positionen (C und D) und eine fast isolierte, kohasiv nicht geschlossene (also nicht intern vernetzte) Position E. Die personlichen Beziehungen sind dort iiberdurchschnittlich vorhanden, wo auch andere Beziehungen vorhanden sind. Zusatzliche Komplexitat bekommt ein Blockmodell dadurch, dass fiir verschiedene Beziehungen verschiedene Strukturen vorhanden sein konnen und die Strukturen zudem miteinander verkniipft sind. Hier konnten z.B. bestimmte Ressourcen in eine Richtung getauscht werden und andere in die Gegenrichtung, wobei die Strukturbeschreibung das Ineinandergreifen der zwei Beziehungstypen beriicksichtigen miisste.^^^ Es gibt auch die Moglichkeit solche Zentrum/Peripherie-Modelle zu testen oder gezielt zu suchen (Borgatti & Everett 1999). Wasserman und Faust (1994, S.423) beschreiben noch weitere Modelle fiir Netzwerkstrukturen, wie «kohasive Subgruppen», «Hierarchie», «Transitivitat» und «Zentrahsiert». Ein zentralisiertes Netzwerk ist mit einem Zentrum/Peripherie-Netzwerk vergleichbar, mit der Einschrankung, dass die Wahlen auch nur in eine Richtung gehen konnen (vom Zentrum in die Peripherie oder umgekehrt). Eine hierarchische Struktur dagegen wiirde beispielsweise folgenderma^en aussehen (siehe Tabelle 6.7): In einer Hierarchic wird immer die «daruberliegende» Position gewahlt, die diese Wahlen jedoch nicht erwidert. Solche Asymmetrien und fehlende Reziprozitat in einer Netzwerkstruktur wiirden sich je nach Relationeninhalt und Operationalisierung der Beziehung auch als Macht- oder Abhangigkeitsverhaltnis beschreiben ^^^ Zur Analyse der Verkniipfung von Relationen («compound relations») kann die in Kapitel 2.3 beschriebene Rollenstrukturanalyse herangezogen werden.

6.3 Interpretation

der Qesamtstruktur 0 0 0 0

87 1 0 0 0 1 0 0 0 1 0 0 0

Tabelle 6.7: Hierarchie-Struktur einer Image-Matrix lassen. In Peter Bearmans Untersuchungen zum Frauentausch der Aborigines auf «Groote Eylandt» lasst sich die Gesamtstruktur, wie in Kapitel 3.5 dargelegt, als eine Ringstruktur beschreiben, woran er weitgehende theoretische Interpret at ionen anschlieftt. Das «Generalized Blockmodeling» bietet die Moglichkeit, gezielt verschiedene Strukturen zu iiberpriifen (Doreian et al. 2005). Neben den dargestellten Strategien ist bei der Interpretation einer Blockmodellanalyse immer auch weiteres Wissen iiber das zu untersuchende Netzwerk sowie eine theoretische KonzeptuaUsierung des sozialen Phanomens vonnoten. Die verschiedenen vorgestellten Ansatze zur Interpretation eines Blockmodells stellen jedoch eine Hilfestellung dar, die es dem Forscher ermoghchen soil, zu einem theoretisch fundierten und konsistenten Gesamtbild eines Netzwerkes zu kommen.

7 GutemaBe und Vergleich der Gutewerte verschiedener Analysemethoden

In diesem Kapitel sollen zunachst verschiedene Giitemal^e fiir Blockmodelle vorgestellt werden. Giitemafte ermoglichen die Beurteilung, inwiefern ein bestimmtes Blockmodell die zugrunde liegende Netzwerkstruktur reprasentiert. Giitemafte sind deswegen notwendig, weil sich reale Netzwerke haufig nicht in Gruppen zerlegen lassen, die der gewahlten Aquivalenzdefinition perfekt entsprechen. Hierbei werden verschiedene Giitema^e fiir die konventionelle Blockmodellanalyse nach struktureller Aquivalenz beschrieben.-^^^ Fiir Blockmodelle nach regularerer Aquivalenz gibt es eigene Giitemai^e, die aber in ihrer Logik ahnlich sind. Ein Spezialfall von Giitemai^en sind stochastische Giitemafee, die auf dem Prinzip der stochastischen Blockmodelle aufbauen. Die stochastische Blockmodellanalyse wird in Kapitel 8 als Ausblick kurz angerissen. Anschliei^end werden Blockmodellanalysen, die mit den verschiedenen vorgestellten Verfahren vorgenommen wurden, beziiglich ihrer Giitewerte vergleichend gegeniibergestellt. Hierbei soil am empirischen Beispiel des Interorganisationsnetzwerkes die Performanz der verschiedenen Verfahren gepriift werden.

7.1 GutemaBe Ein grundlegendes Prinzip von Giitemafeen fiir Blockmodelle ist der Vergleich von realisierten Beziehungen mit in der Image-Matrix «modellierten» Beziehungen. Umso hoher die Ubereinstimmung des «beobachteten» mit dem «Zielnetzwerk» ist, umso hoher wird das Giitema£. Hierbei ist jedoch fiir solche Giitema£e zu beachten, dass die Giitemal^e unterschiedlich ausfalien konnen, je nachdem, wie die Image-Matrix konstruiert ist. So erhalt man andere Giitewerte, wenn man die Image-Matrix nicht, wie es meist geschieht, iiber das a-Dichte-Kriterium, sondern iiber das Nullblockkriterium konstruiert (siehe hierzu Kapitel 5). Ist das Blockmodell einmal konstruiert, ist ein nahe liegendes und einfaches Giitemai^ der sog. Match-Koeffizient. Der Match-Koeffizient gibt den Anteil der Werte in der beobachten Matrix an alien Werten an, die mit der Image-Matrix iibereinstimmen: ^^^ Siehe hierzu auch Wasserman und Faust (1994, Kapitel 16).

90

7 GiitemaEe und Vergleich der Gutewerte

0x2 — J-

Rxgx{g-1)

X sind hierbei die beobachteten Werte und x^*^ die Werte der Image-Matrix. Die Zahl der Akteure ist mit g notiert und die Zahl der Relationen mit R. Der Match-Koeffizient ist ein Ahnlichkeitsma£, dessen Wertebereich zwischen 0 und 1 liegt, wobei ein Wert von 1 fiir eine Ubereinstimmung aller Werte steht, der Wert 0 indes fiir keine Ubereinstimmung der Werte. Ein weiteres Ma£, das die beobachtete Matrix mit der Image-Matrix vergleicht, ist die Matrixkorrelation. Die Matrixkorrelation ist der bivariate Korrelationskoeffizient zwischen den beobachteten Werte x und den Werten der Image-Matrix, wobei die x*j> die Standardabweichung der beobachteten Werte und x^^* die Standardabweichung der Werte der Image-Matrix sind:

0x3 ~

R E r=\

\^9 sr9 A^i = l ^j = l

* At)* ^ijr-^ijr

/v^ v^ v^ ^*2 /v^ v^ v^ I( a Hier ist c die Zahl der Blocke, Oi ist die beobachtete Blockdichte und v ist die Gesamtzahl der Elemente der Matrix. Der Korrekturfaktor t dient dazu, Abweichungen nach oben und unten zu normieren. Fiir multiple Netzwerke ist b einfach der Durchschnitt der b-Werte fiir jede Matrix. Die vorgestellten Giitemafte lassen sich mit den Standardnetzwerkanalyseprogrammen berechnen.^^^ Giitema^e von Blockmodellen sind insbesondere sinnvoll, um verschiedene Partitionen zu vergleichen und das Blockmodell zu optimieren. Hier konnen jedoch nur Partitionen mit der gleichen Anzahl an Positionen sinnvoll verglichen werden, denn mit einer zunehmenden Zahl an Position nehmen Giitewerte zwangslaufig zu. Besteht jede Position aus einem Akteur, sind zwangslaufig die maximalen Giitewerte erreicht. Auch der Vergleich von Analysen aus verschiedenen Netzwerken ist nur beschrankt moglich, da die Giitemafte auch von der Netzwerkgro£e abhangig sind. Ein Desiderat fiir Giitekriterien ist es, Signifikanzen von GiitemaJ^en anzugeben. Dass das Giitemafe eine Ubereinstimmung der beobachteten Matrix mit der Image-Matrix signalisiert, ist allein nicht iiberraschend, da die Blockmodelle doch gerade hierzu konstruiert wurden. Es stellt sich die Frage, inwieweit eine solche Ubereinstimmung «zufallig» zustande gekommen sein kann. Mit parametrischen Verfahren, die auf einer bestimmten Wahrscheinlichkeitsverteilung, beruhen sind prinzipiell fiir stochastische Blockmodelle die Berechnungen von Signifikanzen moglich. ^^° Sowohl mit Ucinet als auch Netminer kann m a n den Simple-Match-Koeffizienten berechnen. Allerdings ist die Berechnung mit Netminer u m ein vielfaches komfortabler (liber das Menii Analyze>Position>Blockmodel>Conventional), d a nicht die Erstellung der ImageMatrix «von Hand» notwendig ist. Der Carrington-Heil-Berkowitz-Index lasst sich, soweit dem Autor bekannt softwaretechnisch nur mit dem P r o g r a m m Netminer berechnen (unter der Bezeichnung Max Chi-square).

92

7 GiitemaRe und Vergleich der Gutewerte

Allerdings besteht hier das Problem, dass diese Verteilungen nicht mehr giiltig sind, wenn die Partitionierung aus den Daten gewonnen wurde, fiir die die Signifikanzen berechnet werden soUen (Wasserman & Faust 1994, S.703-704). Es gibt jedoch auch nichtparametrische Verfahren, um die Signifikanz von Giitemai^en zu untersuchen. Sie beruhen auf dem Prinzip der zufalligen Matrix-Permutation. Die Zeilen und Spalten werden simultan mehrfach (z.B. 1000 Mai) vertauscht. Fiir diese zufalligen Matrizen wird das Giitemafe berechnet. Der Anteil der liber dem Giitemaft fiir das Blockmodell liegenden Giitewerte soil anzeigen, mit welcher Wahrscheinlichkeit dieser Giitewert zufallig aufgetreten ist.^^^ Solche Permutationstests konnen z.B. mit Net miner fiir die beschriebenen Giitemafee vorgenommen werden.

7.2 Vergleich verschiedener Verfahren nach Gutemafien Nachdem nun in Kapitel 7.1 verschiedene Giitemal^e und in Kapitel 4 verschiedene Verfahren zur Partitionierung von Akteuren in Positionen und deren Variationsmoglichkeiten vorgestellt wurden, sollen in diesem Abschnitt die verschiedenen Verfahren der Partitionierung nach struktureller Aquivalenz beziiglich ihrer Giitemafte verglichen werden. Hierzu wurden sechs verschiedene Analysen mit Verfahren zur Partitionierung von multiplen Netzwerken (Analysen A1-A6) anhand des multiplen Interorganisationsnetzwerkes mit den drei Beziehungstypen «personliche Beziehungen», «Forschungsbeziehungen» und «Geschaftsbeziehungen» getestet. Sieben verschiedene Analysen (B1-B7) wurden fiir das einfache Netzwerk mit den personlichen Beziehungen des Interorganisationsnetzwerkes durchgefiihrt. Als Giitemafte wurden die drei in Kapitel 7.1 vorgestellten Giitema^e MatchKoeffizient, Korrelationskoeffizient und Carrington-Heil-Berkowitz-Index berechnet (siehe Tabelle 7.1 und Tabelle 7.2). Fiir die Giitemafee der jeweiligen Einzelnetze wurden auch die in Kapitel 7.1 beschriebenen Permutationstests durchgefiihrt. Die genaue methodische Durchfiihrung der verschiedenen Analysen ist in den Tabellen 7.3-7.6 beschrieben. Das Ward-Verfahren wurde in drei Variationen durchgefiihrt, bei denen die «Selfties» jeweils unterschiedlich behandelt wurden. Wie in Kapitel 4.3.2 dargetiert werden. Die P e r m u t a t i o n der Matrizen bei der Konstruktion der Blockmodelle bei den direkten Verfahren erfolgt im Gegensatz dazu nach einem systematischen Algorithmus (siehe Kapitel 4.3.1). Allerdings besteht bei einem solchen nichtparametrischen Test dennoch dass Problem, dass theoretisch immer ein «signifikantes» Blockmodell konstruiert werden konnte, wenn m a n die bestmogliche Partition aus dem Permutationstests als Partition fiir das Blockmodell nehmen wiirde.

7.2 Yevgleich nach GiitemaEen

93

legt, fiihrt die fehlende Beriicksichtigung der Selfties (Option «retain») bei der Berechnung von Distanzmal^en zu einer Verzerrung der Analyse. Der Vergleich der Ward-Analyse mit der Option «retain» (Analyse Al) mit der Ward-Analyse mit der Option «ignore» (Analyse A2) fiir das Ward-Verfahen zeigt, dass dieser Effekt durchaus an den Giitemafeen ablesbar ist. Mit der Option «ignore» hat zwar der Korrelationskoeffizient fiir die personlichen Beziehungen gleiche, fiir die Forschungsbeziehungen hohere, fiir die Geschaftsbeziehungen schlechtere Werte. Allerdings sind sowohl der Carrington-Heil-Berkowitz-Index als auch der MatchKoeffizient fiir das Gesamtnetz aus alien drei Beziehungen bei der Ward-Analyse mit der Option «ignore» hoher, als bei der Option «retain». Man kann also sagen, dass es sich durchaus lohnt, die Selfties zu ignorieren und die Analyse nicht mit einer Software durchzufiihren, die bei der Clusteranalyse nicht mit «Missing values» umgehen kann.^^^ Man konnte vermuten, dass sich die Giitema£e fiir die Option «reciprocal» weiter verbessern. Dies ist jedoch, wie in Tabelle 7.1 abzulesen, nicht der Fall. Dies liegt vermutlich an der Art der Durchfiihrung: Die Ward-Analyse beruht eigentlich nicht auf der Verrechnung von Distanzma£en, sondern auf der Zunahme der Fehlerquadratsumme. Wie in Kapitel 4.3.2 beschrieben, lasst sich die Methode mathematisch so umformen, dass sie aus einer Distanzmatrix mit der quadrierten Eukhdischen Distanz durchgefiihrt werden kann (Bacher 1996, S.298). Dabei macht es fiir die Clusterlosung im Normalfall keinen Unterschied, ob sie aus der Distanzmatrix oder dem ganzen Datensatz iiber die direkte Berechnung der Fehlerquadratsumme durchgefiihrt wird. Dies ist allerdings nicht der Fall, wenn fehlende Werte vorhanden sind. Hier ist eine Analyse mit den kompletten Daten einer Analyse mit der Distanzmatrix vorzuziehen, da sie mehr Informationen nutzt. Die Berechnung der Fehlerquadratsumme mit «Missing values» funktioniert bei dem hier verwendeten Programm Clustan so, dass die Werte der Fehlerquadratsumme bei den einzelnen Variablen jeweils nur aus den vorhandenen Wert en berechnet werden (Wishart 2004a, S.36). Die Varianz fiir die einzelnen Variablen (hier Beziehungen) wird in jedem Cluster nur fiir die Akteure berechnet, die an der Stelle kein Selftie haben. Vermutlich liegt hierin der Grund, dass die Giitema£e fiir die Ward-Analyse mit dem ganzen Datensatz und der Behandlung der Selfties als «Missing values» (Analyse A2)^^^ etwas hoher sind. Fiir eine Analyse mit dem ^^2 Wie z.B. SPSS. ^^^ Hier sei erwahnt, das diese Variante der Einfachheit halber «Ward (ignore)» genannt wurde. Korrekterweise bezieht sich die Option «ignore» jedoch auf die Berechnung des DistanzmaEes und nicht auf die Berechnung der Fehlerquadratsumme. Die Idee, den Vergleich der Selfties mit anderen Werten zu unterlassen, ist jedoch, wenn m a n hierfiir die Diagonalwerte als «Missing Value» deklariert, fiir die Berechnung der Fehlerquadratsumme dieselbe wie fiir

94

7 GutemaEe und Vergleich der Giitewerte

ganzen Datensatz mit Clustan lasst sich natiirlich nicht die Option «reciprocal» verwenden, da das Programm nicht fiir Blockmodellanalysen, sondern Clusteranalysen konzipiert wurde.^^^ Fiir das Ward-Verfahren lasst sich also feststellen, dass die Durchfiihrung mit einem Clusteranalyseprogramm mit dem ganzen Datensatz und einer Behandlung der Selfties als «Missing values» zu empfehlen ist, auch wenn die Unterschiede zwischen den Variant en recht gering sind. Das in Kapitel 4.3.2 vorgestellte K-means-Verfahren kann auf zwei verschiedene Arten angewandt werden. Entweder kann das Verfahren auf Basis einer gegebenen Partition versuchen, die Partition zu verbessern und eine Verringerung der Fehlerquadratsumme zu erzielen, oder es startet von einer zufalligen Partition und versucht mittels Permutation die Fehlerquadratsumme zu verringern. Beide Vorgehensweisen wurden getestet. Das K-means-Verfahren auf Basis der Ward-Partition (Analysenummer A4 auf Basis der Partition A2) nimmt einige Verschiebungen vor und erreicht damit fiir fiinf der neun Giitewerte der Einzelnetze eine Verbesserung im Vergleich zu «Ward (ignore)». Das Verfahren «Ward (ignore)» hat allerdings einen leicht besseren Wert fiir den Match-KoefRzienten und den Carrington-Heil-Berkowitz Index in Bezug auf das Gesamtnetzwerk. Beide Analysen haben Giitewerte auf einem sehr hohen Niveau und unterscheiden sich insgesamt nur in Nuancen. Die K-means-Analyse auf Basis einer zufalligen Startpartition (A5) wurde wie alle Verfahren auf Basis von zufalligen Startpartitionen dreifach durchgefiihrt, um die Stabilitat der Losungen zu priifen. Zwei der drei Losungen waren, trotz zufalliger St art part it ion, gleich wie die K-Means-Losung auf Basis der Ward-Partition. Zum Vergleich wurde dann die K-Means-Losung auf Basis der zufalligen Partition herangezogen, die nicht die gleiche ist wie die K-Means-Losung auf Basis der Ward-Part it ion. Auch diese Partition (A5) weist gute Giitewerte auf, allerdings ist der Gesamtmatchkoeffizient zu Ungunsten des Gesamt-Carrington-Heil-Berkowitz-Index recht hoch. Es zeigt sich also, dass die verschiedenen Clusteranalyseverfahren ab einem bestimmten Niveau vergleichbadie Berechnung der Distanz mit der Option «ignore». •"^^^ Netminer ist das einzige dem Autor bekannte Netzwerkanalyseprogramm, das fiir multiple Netzwerke das Ward-Verfahren verwenden kann. Hierbei kann das Ward-Verfahren auch mit der Option «reciprocal» durchgefiihrt werden. Allerdings lasst sich nicht rekonstruieren, ob die Analyse dann iiber die Zunahme der Fehlerquadratsumme oder iiber die Distanzmatrix berechnet wird. Zudem verwendet das P r o g r a m m als Distanzma£ die Euklidischen Distanzen und nicht die quadrierten Euklidischen Distanzen. Testweise wurde eine Analyse mit Netminer (Version 2.6.0) durchgefiihrt, die im Vergleich zu Analyse A2 und A3 sehr schlechte Giitemafee ergab, insbesondere die Korrelationskoeffizienten (0,326; 0,217; 0,305) und der Carrington-Heil-Berkowitz-Index (0,232; 0,219; 0,256) waren im Vergleich sehr schlecht. Der Match-Koeffizient lag mit Analyse A2 und A3 ungefahr gleich auf (0,74; 0,667; 0,701). Eine Durchfiihrung der Ward-Analyse mit dem P r o g r a m m Netminer ist demnach nicht zu empfehlen.

7.2 Yeigleich nach GiitemaJ^en

95

re Giitewerte produzieren, die sich jedoch unterschiedlich auf die verschiedenen Teilnetze und Giitemafte verteilen. In solch einem Fall ist es durchaus legitim, wenn der Forscher je nach Interesse an einem bestimmten Giitemaft oder je nach Bedeutsamkeit der Einzelnetze entscheidet. Allerdings war auch fiir die Clusteranalyseverfahren eine Differenzierung erkennbar, wobei das K-means-Verfahren auf Basis der Ward-Partition (ignore) und die Ward-Partition (ignore) die besten Giitemafte haben. Im Vergleich zum starken Abfallen des CONCOR-Verfahrens bleiben diese Unterschiede allerdings eher gering. Die CONCOR-Losung kann zwar fiir den Gesamt-Match-Koeffizienten noch mithalten, aber bei den Korrelationskoeffizienten und insbesondere beim Carrington-Heil-Berkowitz-Index fallen die Giitewerte relativ schlecht aus. Da das CONCOR-Verfahren nur vier- oder acht-Clusterlosungen standardmaftig produziert, wurden vier verschieden fiinfClusterlosungen produziert, jedoch wurde nur eine davon in die Tabellen 7.1 und Tabelle 7.2 aufgenommen. Zwei der anderen drei sind in Ihren Giitewerten mit der aufgenommenen Analyse noch vergleichbar, die vierte Losung hat noch schlechtere Giitewerte. Die Leistungsfahigkeit des CONCOR-Verfahren muss vor diesem Hintergrund als fragwiirdig eingestuft werden. Zusammen mit der mangelnden formalen und theoretischen Grundlegung des Verfahrens (siehe Kapitel 4.3.3) muss die verbreitete Verwendung des CONCOR-Verfahrens kritisch betrachtet werden. Hierbei kann der Verzicht auf ein leistungsfahigeres Verfahren nur wohl begriindet erfolgen. Einige der vorgestellten Verfahren, insbesondere die «direkten Verfahren» auf Basis dar Matrixpermutation, sind fiir multiple Netzwerke nicht verfiigbar (siehe Kapitel 4.3.1). Um auch deren Leistungsfahigkeit zu priifen, wurden mehrere vergleichende Analysen fiir das Netzwerk der personlichen Beziehungen durchgefiihrt (siehe Tabelle 7.2). Auch hier schneidet das CONCOR-Verfahren am schlechtesten ab, es hat fiir alle drei Giitemafee die schlechtesten Werte im Vergleich. Fiir den Vergleich der Ward-Analyse (ignore) (Bl) mit der K-means-Analyse auf Basis der Ward-Partition (B3) ergibt sich ein ahnliches Bild fiir das multiple Netzwerk. Das Niveau der Giitema£e bleibt vergleichbar, diesmal ist jedoch fiir (B3) der Carrington-Heil-Berkowitz Index hoher. Dies bedeutet, dass durch die K-meansAnalyse nicht systematisch ein Giitemai^ optimiert wird. Als direkte Permutationsverfahren wurden das in Kapitel 4.3.1 vorgestellte Pajek-Verfahren (B6) und das auf einem gleichen Prinzip basierende UcinetVerfahren fiir binare Daten verwendet (B4).^^^ Die Partitionen unterscheiden sich In der Ucinet-Hilfe heifet es zum Verfahren: «A partition of a network divides t h e adjacency

96

7 GiitemaEe und Vergleich der Gutewerte

leicht, was moglicherweise an einer leichten Variation des Algorithmus liegt. Die Giitemafte liegen allerdings auf vergleichbaren Niveau. Im Vergleich mit den clusteranalytischen «indirekten» Verfahren (Bl und B3) schneiden die Verfahren etwas schlechter ab, auch wenn der Algorithmus sich explizit an Blockkriterien orientiert und deshalb den clusteranalystischen Verfahren eigentlich iiberlegen sein miisste. Das Problem der beiden Verfahren ist sicherlich, dass die Giitemafte, die entweder auf dem Vergleich mit einer Image-Matrix basieren oder auf der Abweichung von einem a-Wert beruhen, alle an der Gesamtdichte orientiert sind, falls die Image-Matrix iiber das a-Dichte-Kriterium konstruiert wird (siehe Kapitel 4.3.1). Die Verfahren B6 und B4 optimieren also ein netzwerkspezifisches Giitema^, aber eben nicht das im «Normalfall» interessierende Giitema^. In Kapitel 4.3.1 wurden zwei Moglichkeiten vorgestellt, mit diesem Problem umzugehen. Entweder man gewichtet die Abweichungen (Analysenummer B7) oder man verwendet den Panning-Algorithmus (Analysenummer B5). Beide Strategien erweisen sich im Vergleich als erfolgreich. Das Panning-Verfahren (in Ucinet auch Ucinet Optimization «valued» genannt) weist den hochsten Matchkoefhzenten und den zweithochsten Korrelationskoeffizienten aus. Das gewichtete Pajek-Verfahren hat einen niedrigeren Matchkoeffizienten, dafiir einen hoheren Carrington-HeilBerkowitz-Index. Beide Verfahren erreichen auch in ihren Giitewerten eine klare Verbesserung gegeniiber den clusteranalytischen Verfahren. Hier zeigt sich, dass die clusteranalytischen «indirekten» Verfahren noch nicht das Optimum der Leistungsfahigkeit der Partitionierung von Akteuren in Positionen darstellen. Dies bestatigt die Uberlegungen aus Kapitel 4.3.2, dass «blockorientierte» direkte Algorithmen die Partitionierung besser vornehmen als an Akteursgruppen orientierte Algorithmen. Dies ist natiirhch insofern nicht iiberraschend, da die Giitekriterien selbst «blockorientiert» sind. Es ware sicherlich lohnenswert, auch die direkten Verfahren softwaremaftig in die Analyse multipler Netzwerke zu integrieren. Zwar sind moglicherweise fiir andere Netzwerke Abweichungen der Leistungsfahigkeit der einzelnen Verfahren moglich, dennoch lassen sich iiber die Analyse eines empirischen Netzwerkes, wie sie hier durchgefiihrt wurde, Empfehlungen fiir die Wahl der Verfahren geben, da die m a t r i x into matrix blocks. For perfect structural equivalence each block should consist of zeros or all ones. T h e number of errors in a block are the least number of changes required to make either all zeros or all ones. T h e sum of the errors of all the m a t r i x blocks gives a measure or cost function of t h e degree of structural equivalence for a given partition. T h e routine a t t e m p t s to optimize this cost function to t r y and find the best partition of the vertices into a specified number of blocks.» (Borgatti et al. 2002, Hilfestichwort: Networks > Roles & Positions > Structural Equivalence > Optimization > Binary)

7.2 Yevgleich nach GiitemaEen

97

Tendenz zutrefFend sein diirfte.^^^ Allerdings muss darauf hingewiesen werden, dass die Auswahl einer Partition nach den Gutema£en nicht als unreflektierter Automatismus erfolgen sollte. Giitemafee bieten jedoch einen guten Anhaltspunkt fiir die Auswahl einer Partition: However, we do caution against the blind use of accepting a partition solely on the basis of a criterion function.

Other things equal,

for a given number of clusters, the value of a criterion function provides useful information about the partition. In addition, if an analyst adopts a partition that fits less well than another partition, it seems reasonable to ask that good reasons be put forth for adopting the less fitting partition. (Doreian et al. 1994, S.16) Solange «direkte» Verfahren fiir multiple Netzwerke in der verfiigbaren Software nicht implementiert sind, empfiehlt sich hierfiir ein clusteranalytisches Vorgehen, mit dem Ward-Verfahren unter Beriicksichtigung der Selfties oder mit dem Kmeans-Verfahren auf Basis des Ward-Verfahrens. Fiir einfache Netzwerke bieten sich die direkten Verfahren an, wobei hier das Panning-Verfahren oder ein gewichtetes Pajek-Verfahren zu empfehlen sind. Dennoch kann es sinnvoll sein, die Clusteranalyse mit dem Ward-Verfahren auch fiir einfache Netzwerke zu verwenden, um einen Anhaltspunkt iiber die Zahl der Cluster zu bekommen. Noch sinnvoller ware eine hierarchisch-agglomerative Vorgehensweise kombiniert mit einem direkten Permutationsverfahren (!) fiir jede mogliche Zahl an Positionen und einer Berechnung von blockmodellanalytischen Giitewerten (wie dem Carrington-HeilBerkowitz-Index oder der Matrixkorrelation zwischen beobachteter und ImageMatrix) auf jeder Ebene. Uber ein solches, auf die spezifischen Bediirfnisse der Blockmodellanalyse zugeschnittenes Verfahren ware dann iiber Zunahmen der blockmodellanalytischen Giitewerte eine noch genauere Bestimmung einer sinnvollen Positionenzahl moglich. Eine solche Vorgehensweise schwebte so ahnlich schon Panning (1982, S.88-89) vor, und ist ein Desiderat fiir die Blockmodellanalyse. ^^^ Eine komparative Analyse der Partitionierung nach struktureller Aquivalenz von (Doreian et al. 1994, S.13 fF.) stiitzt tendenziell die hier erhaltenen Ergebnisse, auch wenn ein Vergleich wegen einer anderen Vorgehensweise der Autoren schwierig ist. Sie vergleichen an zwei verschiedenen einfachen empirischen Netzwerken das direkte Verfahren, die Custeranalyse und das CONCOR-Verfahren. Dabei schneidet bei ihnen das einfache direkte Verfahren (hier Analyse B6) am besten ab. Sie verwenden jedoch nicht das Ward-Verfahren als clusteranalytisches Verfahren und verwenden als Giitemafe, anders als hier, die «Zahl der Inkonsistenzen». Insofern ist dort das bessere Abschneiden des einfachen direkten Verfahrens im Vergleich zur Clusteranalyse nicht verwunderlich. Ihre Ergebnisse decken sich mit den Ergebnissen dieser Arbeit im Hinblick auf das CON COR-Verfahren, das auch dort schlecht abschneidet.

98

7 Giitema^e und Vergleich der Giitewerte

7.3 Tabellen zu den Gutemafien 7.4 Tabellen zur methodische Vorgehensweise fur die vergleichende Analyse

7.4 Tabellen zur methodische

99

Vorgehensweise

10 rH

O O

# ^ #l O *C i •)(• ^ t CD

CO I>

lO

0

* *

-x^

10 I> CM

1> Oi CM

0

-x-xCO -^ CO

0

TH

TH

0

tt-

V V

1—1 0

•X-

-X-

-X-

^

-x-

-x-

CM 00 ^

CM c:5 CM

0

0

Q;

. 2

0

*

-x-

^

^

•XiO CM CO^

^ CO CO CM

^ I> CO CO

^CO ^CM ^ ^

0 "

0 ^

-x-

CO CM

0 ^

0

-x-

Th CM 0

T^ CO

CO 00 CM

o o

73 ce u O CO 03 0

^ -XO TH

N-

¥r # iO 0:1 CO

^C i CO

0~

CD

CD

CD

•X-

^

-X-

0

*! > ^^ ^CO

0 ^

0 ^

TH r H LO t>.^ CO^ CM

iO CO

0 ^

0 ^

* -X4(•X-X-X0 CM t CO 0 0 TH CM CM CO

CO 00 CM

0

0

0

0

^

i&

|i| 2 ^^ X CD CD CQ bO

ss *

^ fl

CD

3



O

CD

I

•X-

I

-X-

-x-

Oi t^ CO

T-\ CO CO

0

0

0 05 CO

•X•Xt rH CO^

-X-Jt -Jt -Jt t 00 CO CO CM CO

•X-X# •X^(- -XCO l > CM 1 0 1 0 CO CM CM CO

CM 00 CM

0

0 ^

0 ^

0

0

-xr-^ CO I:^ 0

0 ^

0

0

N dJ N CD

- ^ N >'-v

m

^ N

«^

-^

CD i-S

^ 00 O - a - a •^^ 3 ^ \ - . C * * -x* -x- -x-

3 3 o* p o* 3 Cfl

3 4^

O

5" !X ri-

{T

h-i

(r+

p

CD

w

cra'

* ^ # *

> > 3 tn

5* 3 3 p p CO

p"

O•X- O* H^ •)(•

•X-

(D

3 P ^ ^

^

n ^

CX CO CO

?^ cr P CD

3 ' ^ ^. ^ O DO "co "co "-q fa 0 2 ^ - J

p p p O •^

0 0 CO O i CO

* ^

* -x-x- -x-

Oj a-

3 ^ S tZ.

'^

ft>

7.4 Tabellen

zur methodische

Analysenr., Analysetyp, Software A l , Ward (retain), ClustanGraphics (Version 8.02)

A2, Ward (ignore)/ ClustanGraphics (Version 8.02)

A3, Ward (reciprocal)/ ClustanGraphics (Version 8.02)

Vorgehensweise

101

Beschreibung

Berechnung der Euklidischen Distanzen (retain) in Ucinet (Network > Roles Sz Positions > Structural > Profile...) mit der Option (Method of Handling Diagonal Values: retain). Kopie der Euklidischen Distanzen in eine Exceltabelle. Quadrierung der Euklidischen Distanz. Einlesen der Euklidischen Distanzen in Clustan (Speichern der Matrix als tabs-getrennte *.txt Datei. Importieren iiber (File > New > Poximities)). Start der Clusteranalyse iiber (Cluster > Proximities) mit der Methode «Increase in Sum of Squares» (andere Bezeichnung fiir das «Ward-Verfahren»). Speichern der 5-Clusterlosung (Cluster > Member). Einlesen der Daten in dem Clusteranalyse-Programm: - Erstellen einer Excelfile fiir jeden Beziehungstyp. - Markieren der Diagonalwerte durch eine Zahl die spater als Missing Value definiert wird. - Erstellen dreier *.csv-Dateien (Comma seperated Value). - Zusammenfiigen der *.csv-Dateien (Dies ist notwendig, die maximale Spaltenzahl in Excel zu gering ist). - Einlesen der *.csv Datei in Clustan. Definition der Missing Values. Clusteranalyse beginnen (Cluster > Data) mit der Methode «IncreEise in Sum of Squares». Berechnung der Fusionskoeffizienten (Tree > Validate). Speichern der 5-Clusterl6sung (Cluster > Member). Berechnung der Euklidischen Distanzen (reciprocal) in Ucinet (Network > Roles & Positions > Structural > Profile...) mit der Option (Method of Handhng Diagonal Values: reciprocal). Ansonsten wie Analyse A l .

Tabelle 7.3: Analysemethoden fiir das multiple Netzwerk (personlche-, Forschungs- und Geschaftsbeziehungen); 5-Cluster Losung.

7 GiitemaEe und Vergleich der Giitewerte

102

Analysenr., Analysetyp, Software A4, K-means auf Basis der Wardpartition, C lust an Graphics (Version 8.02)

A5, K-means auf Basis einer zufalligen Partition, ClustanGraphics (Version 8.02)

Beschreibung

Verwendung des gleichen Datensatzes wie fiir das WardVerfahren. Start der Analyse (Cluster > k-means). Wahl der Option (Initial Centre > Tree Partition), um die Wardlosung der Analyse A2 als Startpartition festzulegen. Zahl der maximalen Iterationen: 100. Speichern der 5-Clusterlosung (iiber den Button Member). Start der Analyse (Cluste > k-means). Wahl der Option (Initial Centre > Random Start), um eine zufallige Startpartition festzulegen. Zahl der maximalen Iterationen: 100. 3-fache Durchfiihrung mit Zufallsstartpartitionen. Zwei der drei Partitionen sind identisch mit der K-means-Partition auf Basis der Wardpartition. Die dritte Partition unterscheidet sich von den anderen und wird zum Vergleich ausgewahlt. Speichern der 5-Clusterlosung (iiber den Button Member).

A6, CONCOR, Ucinet (Version 6.29)

Importieren des Datensatzes und speichern im Ucinet-Format. Starten der Analyse (Network > Roles & Positions > Structural > CONCOR). Herabsetzen der Toleranz des Konvergenzkriteriums auf 0,1. Maximum der Iterationen auf 100. Behandlung von Selfties: Reciprocal. Durchfiihren der Analyse mit «max depth of splits» = 3. Also Produkion einer 2*^ = 8 Clusterlosung. Vergleich der vier moglichen 5-Clusterlosungen nach Gutekriterien. Verwendung der besten (drei der neun Giitekriterien am hochsten) Partition. • Speichern der 5-Clusterlosung (iiber eine Modifikation der Partitionsoutputdatei.).

Tabelle 7.4: Analysemethoden fiir das multiple Netzwerk (personliche-, Forschungsund Geschaftsbeziehungen); 5-Cluster Losung.

7.4 Tahellen

zur methodische

Analysenr., Analysetyp, Software Bl, Ward (ignore), ClustanGraphics (Version 8.02)

B2, CONCOR, Ucinet (Version 6.29)

B3, K-means auf Basis der Wardpartition, ClustanGraphics (Version 8.02) B4, Permutation (fiir binare Daten), Ucinet (Version 6.29)

Vorgehensweise

103

Beschreibung

Einlesen der Daten in Clustan (nur erste Matrix plus die erste transponierte Matrix). Ansonsten Durchfuhrung wie beim Wardverfahren mit 5 Clustern. Einlesen der Daten in UCINET (nur die erste Matrix). Durchfiihren der Analyse mit «max depth of splits» = 2. Also Produkion einer 2 - ^ = 4 Clusterlosung. Vergleich der Losungen nicht notwendig, da nur eine Losung produziert wird. Ansonsten Durchfuhrung wie Analyse A6. Verwendung des gleichen Datensatzes wie fiir das Analyse B l . Startpartition ist die Partition aus B l . Ansonsten Durchfuhrung wie bei Analyse A4.

Einlesen der Daten in UCINET (nur die erste Matrix). Start der Analyse (Net work > Roles & Positions > Structural > Optimization > Binary). «Number of Iterations auf 100» hochgesetzt (empfohlen wird n / 3 bis 5n). Dreifache Durchfiihrung mit zufalligen Startpartitionen, um die Stabilitat der Losung zu prufen. Die Losungen bleiben stabil, die Clusterzuordnungen andern sich nicht. 4-Clusterlosung gespeichert iiber «Output partition Dataset».

Tabelle 7.5: Analysemethoden fiir das einfache Netzwerk (nur personliche Beziehungen); 4-Cluster Losung.

104

Analysenr., Analysetyp, Software B5, Permutation (metrische Daten), Ucinet (Version 6.29)

B6, Permutation mit Pajek (einfach), Pajek (Version 1.12)

B7, Permutation mit Pajek (gewichtet), Pajek (Version 1.12)

7 GiitemaEe und Vergleich der Giitewerte

Beschreibung

Das Verfahren entspricht dem Panning-Algorithmus. Einlesen der Daten in Ucinet (nur die erste Matrix). Start der Analyse (Network > Roles & Positions > Structural > Optimazition > Valued). Ansonsten wie B4. Einlesen der Daten in Pajek. Ausschalten der Option «restricted options» (Operations > Blockmodeling > Restricted Options). Start der Blockmodellanalyse (Operations > Blockmodeling > Random Start). Zahl der «Repetitions» auf 50 gestellt, Zahl der Cluster auf 4. Dreifache Durchfiihrung mit Zufallsstartpartitionen. Die Losungen sind leicht instabil: Verwendung der besten (Zwei der drei Giitemafte besser) Partition. Speichern der Partition iiber das Save-Symbol unter «Partiti-

- Gewicht im Feld «Complete» (unter Operations > Blockmodeling > Random Start) auf 0,194 gestellt. - Dreifache Durchfiihrung mit Zufallsstartpartitionen. Die Losungen sind leicht instabil: Verwendung der besten (alle drei Giitemafte am besten) Partition. - Ansonsten wie Analyse B6.

Tabelle 7.6: Analysemethoden fiir das einfache Netzwerk (nur personliche Beziehungen); 4-Cluster Losung.

8 Weitere Verfahren

Schwerpunkt dieser Arbeit war die konventionelle Blockmodellanalyse auf Basis der strukturellen Aquivalenz. In diesem Abschnitt sollen noch einmal einige Hinweise zu Variationen der Blockmodellanalyse gegeben werden. Hierbei soil insbesondere erlautert werden, inwieweit es Ahnlichkeiten und Unterschiede in der Logik der Verfahren zur konventionellen Blockmodellanalyse gibt. Mehrfach erwahnt wurde schon das Konzept der regularen Aquivalenz. Akteure sind dann regular aquivalent, wenn sie die gleichen Beziehungen zu regular dquivalenten Akteuren haben. More generally, if actors i and j are regularly equivalent, and actor i has a tie to/from same actor, k, then actor j must have the same kind of tie to/from same actor \, and actors k and 1 must be regularly equivalent (Wasserman & Faust 1994, S.474) Die Definition der regularen Aquivalenz macht die tautologische Struktur dieses Konzeptes deutlich. Regulare Aquivalenz kann iiber ein indirektes Verfahren nicht so einfach gemessen werden wie strukturelle Aquivalenz. Um zu messen, inwieweit zwei Akteure regular aquivalent sind, miisste auch die regulare Aquivalenz der Akteure beriicksichtigt werden, zu dem die zwei Akteure eine Beziehung haben. Um dies zu bestimmen, miisste wiederum die regulare Aquivalenz anderer Akteure gemessen werden usw. Dennoch wurde schon friih ein Algorithmus entwickelt, um die regulare Aquivalenz zweier Akteure zu bestimmen. Der Algorithmus berechnet regulare Aquivalenz iiber ein iteratives Vorgehen (D. R. White & Reitz 1985; Borgatti & Everett 1989). Hierbei wird die regulare Aquivalenz iiber den sog. REGE-Algorithmus gemessen. Danach kann, ahnlich wie bei der in Kapitel 4.3.2 beschriebenen Vorgehensweise, mit einer Clusteranalyse die Partitionierung bestimmt werden. Dieser sog. REGE-Algorithmus ist allerdings auf formaler Ebene mit einigen Schwierigkeiten behaftet (Wasserman &: Faust 1994, S.481). Batagelj, Doreian und Ferhgoj (1992) haben nachgewiesen, dass fiir eine Partition nach regularer Aquivalenz ahnlich wie fiir eine Partition nach struktureller Aquivalenz bestimmte ideale Blocktypen vorkommen konnen.

106

8 Weitere Verfahren

0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

1 0 1 0 0 0 0 1 0 1 0 1 0 0 0 1 0 1 1 0

Tabelle 8.1: Zwei ideale Blocktypen bei regularer Aquivalenz nach Doreian et al. (2005, S.174) Die moglichen Blocktypen sind entweder Nullblocke oder regulare Blocke. Regulare Blocke haben mindestens eine 1 in jeder Spalte und mindestens eine 1 in jeder Zeile. Lasst sich eine Partition nach solch einem Muster bilden, sind die Akteure in den Partitionen regular aquivalent. Um solch eine Partition zu erhalten, kann analog zur Vorgehensweise der direkten Verfahren bei struktureller Aquivalenz (siehe Kapitel 4.3.1) eine Kriteriumsfunktion bestimmt werden, die Abweichungen misst, die iiber einen Permutationsalgorithmus minimiert werden.^^^ Diese direkte Vorgehensweise wird mit der indirekten Vorgehensweise des CatREGE-Algorithmus (eine Variante des REGE-Algorithmus) von Doreian, Batagelj und Ferligoj (1994) verglichen. Hierbei schneidet das direkte Verfahren weit besser ab. Der Unterschied in der Performanz ist dabei weit grower als bei Blockmodellen nach struktrueller Aquivalenz, was wohl daran liegt, dass sich strukturelle Aquivalenz bei indirekten Verfahren iiber den Vergleich zweier Akteure, iiber die Euklidische Distanz oder den Korrelationskoeffizienten weit besser berechnen lasst, als mit dem indirekten Verfahren und den damit verkniipften Algorithmen zur Berechnung der regularen Aquivalenz. Ist eine Partition nach regularer Aquivalenz erfolgt, konnen, wie bei Blockmodellen nach struktureller Aquivalenz, die Beziehungen zwischen den Blocken, dann auch in einem Graphen, ahnlich dem Image-Graphen (siehe Kapitel 5.3), dargestellt werden, wobei die Pfeile fiir regulare Beziehungen stehen. Fiir eine regulare Beziehung von Position A zu Position B muss hierbei zu jedem und von jedem Akteur, aus Position A zu Position B mindestens eine Beziehung vorhanden sein. Von hieraus ist es kein weiter Schritt zum «generalized blockmodeling» (Doreian et al. 2005), ein weiterfiihrendes Konzept der Blockmodellanalyse.^^^ Im Verlauf dieser Arbeit wurden schon drei verschiedene Blocktypen vorgestellt, Einserblocke, regulare Blocke und Nullblocke. Doreian, Batagelj und Ferligoj (2005) •"^^^ Diese Verfahren konnen mit Pajek und Netminer verwendet werden, allerdings nicht fiir multiple Netze. ^^^ Das Generalized Blockmodeling lasst sich mit den Programmen Pajek und Netminer durchfiihren.

107 definieren noch weitere Blocktypen, wie «row regular», «col regular», «rowdoininant», «rowfunctional» und «colfunctional». Das Generalized Blockmodeling ist nun eine Methode, fiir eine festgelegte Zahl an Positionen solche Blocktypen hypothetisch zu definieren und dann (iber den bekannten Permutationsalgorithmus (siehe Kapitel 4.3.1) eine optimale Partition zu finden. Dabei ist es moglich, ein weit differenzierteres Blockmodell zu erstellen. Allerdings ist eine theoretisch informierte, genaue Hypothese (iber die Netzwerkstruktur notwendig. Das Genarelized Blockmodeling lasst sich jedoch nicht fiir multiple Netzwerke durchfiihren.^^^ Die Verwendung von stochastischen Blockmodellen ist eine Variante der Blockmodellanalyse. Sie basiert auf log-linearen Modellen, die eine Methode zur Analyse von mehrdimensionalen Kreuztabellen darstellen. Dabei wird ein sog. pl-Modell erstellt und u.a. Parameter fiir die Neigung von Akteuren, Beziehungen «auszusenden» (expansiveness) und zu «empfangen» (popularity), berechnet (Holland et al. 1983).^^° Aufgrund dieser Parameter konnen dann stochastisch aquivalente Akteure (mittels einer Clusteranalyse des expansiveness- und des popularityParameters) zu Positionen zusammengefasst und Parameter fiir die Positionen berechnet werden (Wasserman k Faust 1994, 706-708). Auch hier kann dann ein Image-Graph gezeichnet werden, die Pfeile zwischen den Positionen reprasentieren dann allerdings nicht mehr Beziehungsdichten (wie bei konventionellen Blockmodellen nach struktureller Aquivalenz), sondern Wahrscheinlichkeiten von Beziehungen. Solche pl-Modelle spielen allerdings nicht nur bei der Erstellung von stochastischen Blockmodellen eine Rolle, sie eignen sich z.B. auch dazu den Zusammenhang einer oder mehrerer, nicht durch ein Blockmodell gewonnener attributionaler Variablen, mit dem Beziehungsmustern der Akteure zu testen.^^^

^^^ Hierfiir fiihren die Autoren auch theoretische Griinde an: «If t h e relations are very different, t h e n we see many more problems in bringing t h e m into t h e generalized blockmodeling framework and t r e a t i n g t h e m in t h e same fashion. Stacking markedly different relations in t h e indirect approach seems a guarantee for generating confusion. Unknown differences will be buried within t h e (dis)similarity measures» (Doreian et al. 2005, S.357) ^^° Solche pl-Modelle konnen mit Netminer oder mit Ucinet berechnen. ^^^ Stochastische Verfahren der Netzwerkanalyse, die auf Verfahren zur log-linearen Analyse, basieren sind vielseitig anwendbar. Die stochastische Blockmodellanalyse ist nur eine Anwendungsmoglichkeit. Fiir weitere Anwendungsmoglichkeiten siehe Wasserman und Faust (1994, Kapitel 15 u. 16).

9 Diskussion der Ergebnisse und Ausblick

Im Verlauf der Arbeit wurde ein umfassender Uberblick iiber die Blockmodellanalyse gegeben. Dabei zeigte sich, dass die Blockmodellanalyse sowohl beziiglich ihrer theoretischen Vorbedingungen als auch beziiglich ihrer methodischen Anwendung ein komplexes Verfahren darstellt. Die Arbeit hat die Verzahnung von Theorie und Methode deutUch gemacht. Insbesondere die im Strukturahsmus und in der britischen Sozialanthropologie fu^enden Theoriehintergriinde wurden ausgearbeitet. Dabei wird insbesondere Nadel oft als theoretischer Hintergrund der Blockmodellanalyse genannt, eine konsequente Aufbereitung dieser Zusammenhange fehlte bislang weitgehend. Ein erster Schritt in diese Richtung wurde hier vollzogen. Zudem wurde die Blockmodellanalyse auch in ihrer wissenschaftshistorischen Genese betrachtet. Hierbei sollte gezeigt werden, wieso die Methode geeignet war, dazu beizutragen, die Sozialwissenschaftliche Netzwerkanalyse als eigenes Paradigma zu etablieren. Dabei stellt die Sozialwissenschaftliche Netzwerkanalyse keinesfalls einen monolithischen Block dar: Eine elementar unterschiedliche Logik ist hier auf methodischer Ebene insbesondere zwischen kohasionsanalytischen und blockmodellanalytischen Netzwerkansatzen festzustellen, die aufgezeigt wurde. Auch auf theoretischer Ebene lassen sich die von Emirbayer und Goodwin (1994) herausgearbeiteten Unterschiede feststellen. Die strukturell-relationale Perspektive ist iiber diese Differenzen hinweg die Grundlage der Blockmodellanalyse, auf der die Anwendung dieses Verfahrens basiert ist. Hierbei sind die hier dargestellten Konzepte von «sozialer Rolle», «sozialer Position» und «sozialer Struktur» die entscheidenden Bausteine der Blockmodellanalyse. Neben den theoretischen Grundbedingungen wurden jedoch auch die methodischen Variationsmoglichkeiten aufgezeigt. Die vorgestellten Verfahren der Blockmodellanalyse folgen einer je eigenen Logik, die zu beriicksichtigen ist. Diese Logik soil dabei immer an die Pragestellung und die theoretischen Konzepte einer Arbeit riickgekoppelt sein. Die Arbeit hat auch gezeigt, dass die Verfahren zu unterschiedlich guten Blockmodellen fiihren, wenn man die Giite an den hier vorgestellten Giitekriterien misst. Dabei zeigte sich, dass die direkten Verfahren sowohl beziiglich ihrer inhaltlichen Konsistenz als auch ihrer Giitewerte zu bevorzugen sind. Dabei konnen die direkten Verfahren auch in Kombination mit der Clusterana-

no

9 Diskussion der Ergebnisse und Ausblick

lyse genutzt werden, um mit dieser die Zahl der Positionen zu bestimmen. Bei multiplen Netzwerken ist eine Analyse mit dem Ward-Verfahren und eventuell eine Optimierung durch das K-means-Verfahren zu empfehlen, wobei die Selfties als «Missing values» definiert sein sollten.^^^ Das CONCOR-Verfahren wurde in Hinblick auf formale Grundlegung und die erzielten Giitewerte kritisch beurteilt. Allerdings sind die Giitewerte kein Selbstzweck, eine kritische Diskussion sinnvoller Giitekriterien konnte hier nur angeschnitten werden. Die Giite einer blockmodellanalytischen Arbeit hangt sicherlich nicht primar von den Giitewerten ab. Die hier vorgestellten Blockmodellanalysen (Padgett & Ansell 1993; Bearman 1997) zeichnen sich vielmehr durch eine theoretisch elaborierte und gleichzeitig kreative Anwendung der Blockmodellanalyse aus. Inwieweit neuere Verfahren wie das «generaUzed blockmodehng» sich nicht einfach zu einer theoretisch unreflektierten aber technisch ausgearbeiteten Fittingstrategie entwickeln, bleibt abzuwarten.^^^ Der Instrumentenvergleich hat deuthch gemacht, dass die Implementation von direkten Verfahren der Blockmodellanalyse fiir multiple Netzwerke in die verfiigbare Software wiinschenswert ist. Inwieweit sich die Anwendung der Blockmodellanalyse in den nachsten Jahren ausweiten wird, bleibt abzuwarten. Zwar nimmt das Interesse an der Sozialwissenschaftliche Netzwerkanalyse in der Soziologie in Schiiben kontinuierlich zu, doch gilt sie nach wie vor als Spezialdisziplin.^^^ Oft fehlt es jedoch an theoretischen Einordnungen der Netzwerkanalyse, was dann zu dem Missverstandnis fiihrt, dass es sich lediglich um ein Set mathematischer Methoden handele.^"^^ ^^^ Diese Vorgehensweise ist insbesondere mit dem P r o g r a m m Clustan zu empfehlen. Besonders bei dem K-means-Verfahren ist bei anderen Programmen zur Vorsicht zu raten, da oftmals keine «exakte», sondern eine «naive» K-means-Analyse implementiert ist (Wishart 2004b). Zudem sollte bei anderen Programmen gepriift werde, ob diese wie Clustan mit «Missing values» umgehen konnen und die Missing Values auch tatsachlich (so wie Clustan) wie fehlende Werte behandeln, also nicht in Berechnungen mit einfliefeen lassen. Zudem konnte auch fiir die hier in der vergleichenden Analyse verwendeten Giitemafte kritisch gefragt werden, ob moglicherweise andere Giitemafte sinnvoller waren. ^^'^ Doreian, Batagelj und Ferligoj (1994, S.25) schreiben hierzu: «The generality of the method, with the full set of t h e types of connections, will permit in the most cases, t h e establishment of blockmodels t h a t fit very well. We suspect t h a t it is possible to fit blockmodels with zero error in most empirical situations. This may be seen as problematic and one objection to t h e approach and its methods, as proposed here, could run as follows. All t h a t we have done is look at blocks of a blockmodel and where a block has errors (within a structural equivalence or a regular equivalence perspective), we have redefined the block type and so eliminated errors by this slight of hand. We agree! However, we would change the tone and argue t h a t this approach is appropiate and fruitful.» ^"^^ Der Netzwerkbegriff wird dabei sogar zur soziologischen Gegenwartsdiagnose genutzt und die «Netzwerkgesellschaft» postuliert (Castells 2001). Allerdings fiihrt die Zunahme einer Netzwerkmetaphorik, wie sie in den letzten Jahren zu verzeichnen ist, nicht zwingend zu einer Verbreitung der Sozialwissenschaftlichen Netzwerkanalyse. ^ Allerdings sind in letzter Zeit insbesondere im deutschprachigen R a u m einige theoretisch motivierte oder fundierte Beschreibungen der Netzwerkanalyse zu verzeichnen (Jansen 2003; Trezzini 1998; Beckert 2005).

Ill Auf theoretischer Ebene sind jedoch im Bezug auf die Blockmodellanalyse noch einige Probleme zu losen. Die Blockmodellanalyse geht implizit von der Annahme aus, dass es moglich und sinnvoll ist Akteure trennscharf jeweils verschiedenen Gruppen (Positionen) zuzuordnen. Dahinter steht die Idee, dass Sets von Akteuren strukturell aquivalent sind, sich also in ihrem Beziehungsmuster gleichen. Hier stellt sich die Prage unter welchen Bedingungen sich solch Sets von Akteure bilden? Wie lauft der Prozess der Formierung von Positionen ab? Aus der Organisationsforschung ist bekannt, dass Organisationen dazu neigen, bei der Aufnahme neuer Beziehung Akteure vorzuziehen, zu denen sie eine indirekte Beziehung haben (Gulati k, Gargiulo 1999). Uber solche eigendynamische Netzwerkeffekte konnte es zu einer Angleichung des Beziehungsmusters kommen.^^^ Eine «strukturelle DifFerenzierung» im Laufe einer Netzwerkformierung muss jedoch nicht zwingend zu einer Ausdifferenzierung nach struktureller Aquivalenz fiihren, auch andere DifFerenzierungen sind denkbar. Allerdings ist die Aufnahme neuer Beziehung ein komplizierter Prozess. DiMaggio (1992) weist darauf hin, dass bei der Aufnahme neuer Beziehungen immer auch ein Prozess des «cultural matching» stattfindet, also die Priifung der Legitimitat einer Beziehung auf Basis der (kulturellen) Attribute des Gegeniibers. Eine radikal strukturdeterministische und antikategoriale Anwendung der Blockmodellanalyse kann solche Prozesse nicht beriicksichtigen. Kulturelle und attributionale Aspekte der Formierung von Netzwerken finden, entgegen anfanglicher Postulate, bei der Methode der Blockmodellanalyse ohnehin (manchmal implizite) Beriicksichtigung. DiMaggio (1992, S.121) macht dies an vier Punkte deutlich: Cultural understandings

enter into hlockmodeling in at least for re-

spects (all illustrated in White et al 1976): (1) the choice of ties on which to base blockmodels (2) the use of vivid, highly connotative language to denote blocks («hangers on,» (3) the interpretation

«loosers»y^^ of blockmodels (on the basis of ethnographic

accounts provided in research reports); and ^^^ Eine solche Angleichung iiber die Zeit konnte fiir das hier untersuchte regionale Interorganisationsnetzwerk festgestellt werden (Bliimel et al. 2006) ^^® Hier bezieht sich DiMaggio auf eine Positionentypologie des Blocker-Verfahren die hier nicht behandelt wurde. Allerdings gilt sein Argument auch fiir die in Kapitel 6.2 vorgestellten Positionstypologien mit den Begriffen wie «snob» oder «sycophant».

112

9 Diskussion der Ergebnisse und Ausblick (4) the models' validation (including «assesing the homogenity of persons in a position with regard to suitable characteristics») (770771)

Die Wahl der Beziehungen, die Positionstypologie, die Validierung und die Interpretation eines Blockmodells setzten das Verstandnis und die Analyse kultureller Prozesse und Elemente voraus. Die Einbeziehung attributionaler und kultureller Merkmale ist dabei, bei der konkreten Anwendung einer Blockmodellanalyse duchaus fruchtbar. Die beiden hier vorgestellten Analysen von Padgett und Ansell (1993) und Bearman (1997) nutzen dabei auch umfangreich qualitative Analyseinstrumente wie die Dokumentenanalyse und die ethnographische Beobachtung (bei Bearman jedoch nur aus zweiter Hand).^^^ Sinnvoll ist hierbei die qualitativen Analysen und Datenerhebungen in einer sytematischen Verzahnung mit der Blockmodellanalyse durchzufiihren, bei der die Strukturinformationen der Blockmodellanalyse beriicksichtigt werden. So konnen z.B. zwei Akteure aus den jeweiligen Positionen interviewt werden, um einerseits die Netzwerkeffekte auf Verhalten, Einstellung und kognitive Konstruktionen der Akteure, andererseits die Netzwerkstrategien der Akteure zu rekonstruieren. Auch Akteure die bei einer Blockmodellanalyse iiber mehrere Zeitpunkte ihre Position iiberraschend andern oder eben gerade nicht konnten speziell interviewt werden. Eine solche sequentielle Vorgehensweise, die das «interpretative Defizit» (Jansen 2003, S.278) der Netzwerkanalyse beriicksichtigt, wiirde auch zu einer Abschwachung des in der Anfangszeit der Entwicklung der Blockmodellanalyse vorhandenen «strukturalistischen bias» fiihren, die Akteursebene wiirde besser in den Blick kommen. Dies ist insbesondere notwendig um die Reproduktion und Veranderung von Netzwerkstrukturen zu verstehen. Allerdings geht die vorgeschlagene Vorgehensweise nicht auf Kosten der Beriicksichtigung der Sozialstruktur,^^^ sondern funktioniert gerade auf Basis der Sozialstruktur.

^ Umfangreiche ethnografische Beobachtungen in eine psychiatrischen Klinik werden von Romo (1986) mit einer Blockmodellanlyse verbunden. ^ ° Diese Gefahr besteht bei einer sich formierenden «qualitativen Netzwerkanalyse» (Hollstein & Straus 2006)

Literaturverzeichnis

Alexander, J. C. (1984). Social-structural analysis: Some notes on its history and prospects. The Sociological Quarterly, 25, 5-26. Anheier, H. K., Gerhards, J. & Romo, F. P. (1995). Forms of capital and social structure in cultural fields: Examining bourdieu's social topography. American Journal of Sociology, 100, 859-903. Arable, P. (1984). Validation of sociometric structure by data on individuals' attribute. Social Networks, 6, 373-403. Arable, P., Boorman, S. A. k Levitt, P. R. (1978). Constructing blockmodels: How and why. Journal of Mathematical Psychology, 17, 21-63. Bacher, J. (1996). Clusteranalyse: anwendungsorientierte

Einfiihrung (2 Aufl.).

R. Oldenburg Verlag, Miinchen. Backhaus, K., Erichson, B., Plinke, W. & Weiber, R. (2003). Multivariate lysemethoden. Eine anwendungsorientierte

Ana-

Einfiihrung (10 Aufl.). Springer,

Berlin. Barkey, K. k Van Rossem, R.

(1997). Networks of contention: Villages and

regional structure in the seventeenth century ottoman empire.

American

Journal of Sociology, 102, 1345-1382. Batagelj, V., Doreian, P. k Ferligoj, A. (1992). An optimizational approach to regular equivalence. Social Networks, 14, 121-135. Batagelj, V. k Mrvar, A. (2006). Pajek Yer. 1.12. Bearman, P. (1997). Generalized exchange. American Journal of Sociology, 102, 1383-1415. Beckert, J.

(2005). Soziologische Netzwerkanalyse.

In Aktuelle Theorien der

Soziologie. C. H. Beck, Miinchen. Bliimel, C., Heidler, R. k Lerch, F.

(2006). Struktur vor Entscheidung.

Ein

Beitrag zur Diskussion der Governance in Interorganisationsnetzwerken

aus

struktureller Perspektive.

(forthcoming)

Boorman, S. k White, H. C. (1976). Social structure from multiple networks: II. role structures. American Journal of Sociology, 81, 1384-1446. Boorman, S. A. k Levitt, P. R. (1983). Blockmodelling complex statuses: Map-

114

Literaturverzeichnis ping techniques based on combinatorial optimization for analyzing economic legislation and its stress points over time. Economic letters, 13, 1-10.

Borgatti, S. P. & Everett, M. G. (1989). The class of all regular equivalences: Algebraic structure and computation. Social Networks, 11, 65-88. Borgatti, S. P. & Everett, M. G. (1992). Notions of position in social network analysis. Sociological Methodology, 22, 1-35. Borgatti, S. P. & Everett, M. G. (1999). Models of core/periphery structures. Social Networks, 21, 397-407. Borgatti, S. P., Everett, M. G. & Freeman, L. C. (2002). Ucinet 6 for Windows. Software for Social Network Analysis.

Ver. 6.29. Analytic Technologies,

Harvard. Bossevain, J. (1974). Friends of friends, networks, manipulators and coalitions. Basil Blackwell, Oxford. Bourdieu, P. (1999). Die feinen Unterschiede: Kritik der gesellschaftlichen Urteilskraft (11 Aufl.). Suhrkamp, Frankfurt. Bourdieu, P. k Wacquant, L. J. (1992). An invitation to reflexive sociology. Polity Press, Cambridge. Breiger, R., Boorman, S. k Arabic, P. (1975). An algorithm for clustering relational data, with applications to social network analysis and comparison with multidimensional scaling. Journal of Mathematical Psychology, 12, 328-383. Breiger, R. L. (1979). Toward an operational theory of community elite structures. Quality and Quantity, 13, 21-57. Breiger, R. L. (1981). Structures of economic interdependence among nations. In Continuities in structural inquiry. Sage, Newbury Park, California. Breiger, R. L. & Pattison, P. E. (1986). Cumulated social roles: The duality of persons and their algebras. Social Networks, 8, 215-256. Bulte, C. Van den & Lilien, G. L. (2001). Medical innovation revisited: Social contagion versus marketing effort. American Journal of Sociology, 106, 14091435. Burt, R. S. (1976). Positions in networks. Social Forces, 55, 93-122. Burt, R. S. (1978/79). Stratification and prestige among elite experts in methodological and mathematical sociology circa 1975. Social Networks, 1, 105-158. Burt, R. S. (1982). Toward a structural theory of action. Academic Press, New York. Burt, R. S. (1986). A cautionary note. Social Networks, 8, 205-211.

Liter at urverzeichnis

115

Burt, R. S. (1987). Social contagion and innovation, cohesion versus structural equivalence. American Journal of Sociology, 92, 1287-335. Burt, R. S. (1992). Structural holes: The social structure of competition.

MA:

Harvard University Press, Cambridge. Burt, R. S. k Doreian, R

(1982). Testing a structural model of perception:

Conformity and deviance with respect to journal norms in elite sociological methodology. Quality and Quantity, 109-50. Burt, R. S. &: Minor, M. J. (1983). Applied network analysis. Sage, Beverly Hills. Carrington, R J., Heil, G. H. & Berkowitz, S. D. (1980). A goodness-of-fit index for blockmodels. Social Networks, 2, 219-234. Castells, M. (2001). Das Informationszeitalter.

Wirtschaft - Gesellschaft - Kultur.

Teil 1: Der Aufstieg der Netzwerkgesellschaft.

Leske + Budrich, Opladen.

Coleman, J. S. k Katz, H., Elihu und Menzel. (1966). Medical innovation: A diffusion study. Bobbs-Merrill, Inidianapolis. Cyram. (2005). NetMiner II. Ver. 2.6.0. Cyram Co., Ltd., Seoul. Davis, A., Gardner, B. B. & Gardner, M. R. (1941). Deep south. University of Chicago, Chicago. Diaz-Bone, R. (1997). Ego-zentrierte Netzwerkanalyse und familiale

Beziehungs-

systeme. Deutscher Universitatsverlag, Wiesbaden. DiMaggio, P. (1992). Nadel's paradox revisited: Relational and cultural aspects of organizational structure. In Networks and organizations. Harvard Buisness School press, Boston, Massachusetts. Doreian, P., Batagelj, V. &; FerUgoj, A. (1992). Direct and indirect methods for structural equivalence. Social Networks, 14, 63-90. Doreian, P., Batagelj, V. &; Ferligoj, A. (1994). Partitioning networks based on generalized consepts of equivalence. The Journal of Mathematical Sociology, 19, 1-27. Doreian, P., Batagelj, V. k, Ferligoj, A. (2005). Generalized blockmodeling. Cambridge University Press, Cambridge. Durkheim, E. (1894). Les regies de la methode sociologique. Les Presses universitaires de France, Pairs, 16. Auflage, 1967. Emirbayer, M. k Goodwin, J. (1994). Network analysis, culture, and the problem of agency. American Journal of Sociology, 99, 1411-1454. Faust, K. (1988). Comparison of methods for positional analysis: Structural and general equivalence. Social Networks, 10, 313-341. Faust, K. k Romney, A. K. (1985). Does structure find structure? a critique of

116

Literaturverzeichnis Burt' use of distance as a measure of structural equivalence. Social Networks, 7, 77-103.

Freeman, L. C. (2000). Visualizing social networks. Journal of Social Structure, 1, 1-15 (URL:

http.y/www.cmu.edu/joss/content/articles/volumel/Free-

man.html (abgerufen am 27.9.06)). Freeman, L. C. (2004). The development of social network analysis. BookSurge, LLC, North Charleston, South Carolina. Friedkin, N. E. (1998). A structural theory of social influence. Cambridge University Press, Cambridge. Galaskiewicz, J. & Krohn, K. R. (1984). Positions, roles and dependencies in a community interorganizational system.

The Sociological Quarterly, 25,

527-550. Granovetter, M. (1985/1992). Economic action and social structure: The problem of embeddedness. In The sociology of economic life (Bd. 91). Westview Press, Colorado. Gulati, R. & Gargiulo, M. (1999). Where do interorganizational networks come from? Journal of Sociology, 104, 1439-93. Harary, F., Norman, R. Z. & Cartwright, D. (1965). Structural models: An introduction to the theory of directed graphs. John Wiley & Sons, New York. Heil, G. & White, H. (1976). An algorithm for finding simultaneous homomorphic correspondence between graphs and there image graphs. Behavioral Science, 21, 26-35. Holland, P. W., Laskey, K. B. & Leinhardt, S. (1983). Stochastic blockmodels: Some first steps. Social Networks, 5, 109-137. Hollstein, B. & Straus, F. H. (2006). Qualitative Netzwerkanalyse.

Konzepte,

Methoden, Anwendungen. VS Verlag, Wiesbaden. Homans, G. C. (1951). The human group. Routhledge and Kegan Paul, London. Huisman, M. & Duijn, M. A. van. (2005). Software for social network analysis. In P. J. Carrington, J. Scott &; S. Wasserman (Hg.), Models and methods in social network analysis. Cambridge University Press, New York. Hummon, N. P. &; Car ley, K. M. (1993). Social networks as normal science. Social Networks, 15, 71-106. Jansen, D. (2003). Einfilhrung in die Netzwerkanalyse (2 Aufl.). Leske + Budrich, Opladen. Kamada, T. & Kawai, S. (1989). An algorithm for drawing general undirected graphs. Information Processing Letters, 31, 7-15.

Literal urverzeichnis

117

Kappelhoff, P. (1987). Blockmodellanalysen. In Methoden der Netzwerkanalyse. Oldenbourg, Miinchen. Knoke, D. &: Kulinsky, J. H. (1982). Network analysis.

Sage, Beverly Hills,

California. Knoke, D. Sz Rogers, D. L. (1979). A blockmodel analysis of interorganisational networks. Sociology and Social Research, 64, 28-52. Koku, E. F. & Wellman, B. (2004). Scholarly networks as learning communities: The case of technet. learning.

In Building online communities

in the service of

Cambridge: University Press. (Onlinemanuskript unter URL:

http://www.chass.utoronto.ca/~wellman/publications/scholar/barab4e.PDF (abgerufen am 27.9.06)). Krempel, L.

(2005).

Visualisierung komplexer Strukturen

- Grundlagen der

Darstellung Mehrdimensionaler Netzwerke. Campus Verlag, Frankfurt/New York. Kuhn, T. S. (1962). The structure of scientific revolutions. University of Chicago Press, Chicago. Lincoln, J. R. & Gerlach, M. L. (2004). Japan's network economy:

Structure,

persistence, and change. Cambridge University Press, New York. Lorrain, F. & White, H. C. (1971). Structural equivalence of individuals in social networks. Journal of Mathematical Sociology, i, 49-80. Mandel, M. J. (1983). Local roles and social networks. American Sociological Review, 48, 376-386. Marsden, P. V. (1989). Methods for the characterization of role structures in network analysis. In Research methods in social network analysis. George Mason University Press, Fairfax, Virginia. Marsden, P. V. &; Podolny, J.

(1990). Dynamic analysis of network diffusion

processes. In Social networks through time. ISOR, Utrecht. Moreno, J. L. (1934). Who shall survive? Nervous and Mental Disease Publishing Company, Washington, DC. Moreno, J. L. k Jennings, H. H. (1938). Statistics of social configurations. Sciometry, 1, 342-374. Nadel, S. F. (1965). The theory of social structure (3. Auflage, 1. Auflage 1957 Aufl.). Cohen k, West Ltd, London. Nemeth, R. &: Smith, D. (1985). International trade and world-system structure, a multiple network analysis. Review, 8, 517-560. Padgett, J. F. &; Ansell, C. K. (1993). Robust action and the rise of the medici.

118

Literaturverzeichnis American Journal of Sociology, 98, 1259-1319.

Panning, W. H. (1982). Fitting blockmodels to data. Social Networks, 4, 81-101. Parsons, T. (1937/1968). The structure of social action. Free Press, New York. Roethlisberger, F. J. k Dickson, W. (1939). Management and the worker. MA: Harvard University, Cambridge. Romo, F. (1986). Moral dynamics: A blockmodeling study of conflict and coalition formation

in a mental hospital.

Unveroffentlichte Dissertation, Yale

University. Rose, F. (1960). Classification of kin, age structure, and marriage amongst the groote eylandt aborigines: A study in method and a theory of australian kinship. Academie-Verlag, Berlin. Sailer, D. L, (1978). Structural equivalence: Meaning and definition, computation and application. Social Networks, 1, 73-90. Sampson, S. F. (1969). Crisis in a cloister. Unveroff'entlichte Dissertation, Cornell University. Scott, J. P. (2000). Social network analysis: A handbook. Sage Publications, London. Serdiilt, U.

(2000).

Politiknetzwerke

in der stddtischen

Drogenpolitik von

Bern, Chur, St. Galien und Ziirich. Abhandlung zur Erlangung der Doktorwiirde der Philosophischen

Fakultdt der Universitdt Zurich.

(URL:

http://www.dissertationen.unizh.ch/2004/serduelt/DISSUS03.pdf (abgerufen am 27.9.06)) Simmel, G. (1908). Soziologie. Untersuchungen iiber die Formen der Vergesellschaftung. Duncker & Humblot Verlag, Berlin. Strang, D. & Tuma, N. B. (1993). Spatial and temporal heterogeneity in diflFusion. American Sociological Review, 99, 614-639. Thurner, P. W. & Stoiber, M. (2001). Interministerielle Netzwerke: Formale und informelle Koordinationsstrukturen bei der Vorbereitung der deutschen Verhandlungspositionen zur Regierungskonferenz 1996. Arbeitspapiere - Mannheimer Zentrum fur Europdische Sozialforschung, 37, 1-57. Trezzini, B. (1998). Theoretische Aspekte der Sozialwissenschaftlichen Netzwerkanalyse. Schweizerische Zeitschrift fur Soziologie, 24^ 511-514. Wasserman, S. & Faust, K. (1994). Social network analysis: Methods and applications. Cambridge University Press, Cambridge. Wellman, B. (1988). Structural analysis: from metaphor to substance. In Social structures: A network approach. Cambridge University Press, Cambridge.

Liter at urverzeichnis

119

Wellman, B. & Berkowitz, S. (1988). Introduction: Studying social structures. In Social structures: A network approach (Kap. 1). Cambridge University Press, Cambridge. White, D. R. &; Reitz, K. P. (1983). Graph and semigroup homomorphisms on networks of relations. Social Networks, 5, 193-234. White, D. R. Sz Reitz, K. P. (1985). Measuring role distance: Structural, regular and relational equivalence, (unpubliziertes Manuskript. University of California, Irvine) White, H. C. (1963). An anatomy of kinship, mathematical models for structures of cumulated roles. Prentice-Hall, Inc. Englewood Cliffs, New Jersey. White, H. C. (1992). Identity and control Princeton University Press, Princeton. White, H. C. (2001). Interview with Harrison White (durch Alair MacLean und Andy Olds, 16.4-01). (URL: http://www.ssc.wisc.edu/theory@madison/papers/ivwWhite.pdf (abgerufen am 27.9.06)) White, H. C , Boorman, S. & Breiger, R. L. (1976). Social structure from multiple networks: I. blockmodels of roles and positions. American Journal of Sociology, 81, 730-780. Windeler, A. (2005). Netzwerktheorien: Vor einer relationalen Wende? In Kooperationen, Allianzen und Netzwerke. Grundlagen - Ansdtze - Perspektiven. Gabler, Wiesbaden. Winship, C. (1988). Thoughts about roles and relations: An old document revisted. Social Networks, 10, 209-231. Wishart, D. (2004a). ClustanGraphics primer: A guide to cluster analysis. Clustan Ltd., Edinburgh. Wishart, D. (2004b). Clustering messy social data with ClustanGraphics.

(Paper

presented at the International Socological Associations's sixth conference on Logic and Methodology (RC33) URL: http://www.clustan.com/rc33_04.zip (abgerufen am 27.9.06)) Wishart, D. (2005a). ClustanGraphics Version 8.02. Clustan Ltd., Edinburgh. Wishart, D. (2005b). Number of clusters. In Encyclopedia of statistics in behavioral science. Wiley, New York.