Dynamische Modelle zur Theorie der Regulierung [1. Aufl.] 978-3-8244-7609-1;978-3-322-89654-4

In den letzten Jahren hat der Staat versucht, in vielen Sektoren den Wettbewerb zu intensivieren. Dennoch verfügen weite

465 71 30MB

German Pages XXII, 347 [364] Year 2002

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Dynamische Modelle zur Theorie der Regulierung [1. Aufl.]
 978-3-8244-7609-1;978-3-322-89654-4

Table of contents :
Front Matter ....Pages I-XXII
Dynamische Aspekte der Theorie der Regulierung (Gudrun Bobzin)....Pages 1-6
Regulierung als Problem der optimalen Kontrolle (Gudrun Bobzin)....Pages 7-53
Optimale Regulierung eines Angebotsmonopols bei intertemporaler Maximierung des Gewinns (Gudrun Bobzin)....Pages 55-270
Kritische Würdigung der Ansätze (Gudrun Bobzin)....Pages 271-285
Anhang (Gudrun Bobzin)....Pages 287-337
Back Matter ....Pages 339-347

Citation preview

Gudrun Bobzin Dynamische Modelle zur Theorie der Regulierung

GABLER EDITION WISSENSCHAFT

Gudrun Bobzin

Dynamische Modelle zur Theorie der Regulierung Mit einem Geleitwort von Prof. Dr. Walter Buhr

Springer Fachmedien Wiesbaden GmbH

Die Deutsche Bibliothek - CIP-Einheitsaufnahme Ein Titeldatensatz für diese Publikation ist bei Der Deutschen Bibliothek erhältlich

Dissertation Universität Siegen, 2001

1. Auflage Mai 2002 Alle Rechte vorbehalten

© Springer Fachmedien Wiesbaden 2002 Ursprünglich erschienen bei Deutscher Universitäts-Verlag GmbH, Wiesbaden 2002.

Lektorat: Ute Wrasmann / Dr. Tatjana Rollnik-Manke www.duv.de Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung außerhalb der engen Grenzen des Urheberrechtsgesetzes ist ohne Zustimmung des Verla.9s unzulässig und strafbar. Das gilt insbesondere für Vervielfältigungen, Ubersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von Gebrauchsnamen, Handelsnamen, Warenbezeichnungen usw. in diesem Werk berechtigt auch ohne besondere Kennzeichnung nicht zu der Annahme, dass solche Namen im Sinne der Warenzeichen- und Markenschutz-Gesetzgebung als frei zu betrachten wären und daher von jedermann benutzt werden dürften. Umschlaggestaltung: Regine Zimmer, Dipl.-Designerin, Frankfurt/Main Gedruckt auf säurefreiem und chlorfrei gebleichtem Papier ISBN 978-3-8244-7609-1

ISBN 978-3-322-89654-4 (eBook)

DOI 10.1007/978-3-322-89654-4

Geleitwort Mit Bezug zur ökonomischen Theorie der Regulierung widmet sich diese Dissertation der Beeinflussung eines aus der Wohlstandssicht unbefriedigenden Marktergebnisses, das in der permanenten Marktmacht eines Angebotsmonopols über die Zeit begründet ist. Als Ansatzpunkte dienen zwei Regulierungsinstrumente, nämlich die Beschränkung der Rentabilität und die fallweise Preisregulierung des Monopols. Die dynamische Analyse erfolgt zunächst aus der Sicht der Unternehmung, anschließend aus der Sicht der wohlstandsmaximierenden Behörde als Regulierungsinstitution. Die Regulierung bedeutet die Einführung zusätzlicher Nebenbedingungen in das generelle Investitionsproblem des Angebotsmonopols. Die theoretische Behandlung der Lösungsansätze wird durch die Theorie der optimalen Kontrolle ermöglicht. In diesem Zusammenhang werden zunächst die Verfahren zur Optimierung der dynamischen Probleme, namlich die Methode der optimalen Steuerung und die der optimalen Regelung, diskutien und anschließend für die Theorie der Regulierung angewendet. Was die Übenragung der Theorie der Kontrolle im vorliegenden Zusammenhang auf die ökonomischen Probleme angeht, so sind folgende Tatbestände zu berücksichtigen. • Die Verfahren der Steuerung und der Regelung gehören insbesondere in den Ingenieurwissenschaften zum Standardinstrumentarium der Lenkung dynamischer Prozesse (vgl. zum Beispiel Föllinger (1994)). In der Ökonomik wird vor allem das Verfahren der optimalen Steuerung benutzt, ohne dass man immer zureichend die Voraussetzungen für seine sinnvolle Anwendung beachtet. • Auf dem Hintergrund dieser Einsicht ergibt sich der eigene Beitrag der Verfasserin aus der Darstellung der Voraussetzungen für einen zweckmäßigen Einsatz beider Verfahren (Steuerung und Regelung) in der Ökonomik, aus der Diskussion der Übertragbarkeit der Forderungen an eine optimale Regelung im Bereich der Ingenieurwissenschaften auf die Winschaftstheorie und aus der Anwendung der Verfahren auf das Problem der Regulierung eines Unternehmens. • Im Hinblick auf die Regulierung durch die Beschränkung der Rentabilität existien eine umfangreiche Literatur zur statischen Theorie (insbesondere Averch/Johnson (1962), Baumol/Klevorick (1970), Bailey (1973), Das (1980)). Hingegen ermöglicht die vorliegende Arbeit eine dynamische Analyse, die die Ansätze von El-Hodiriffakayama (1981) und Dechen (1984) fonfühn und umfangreiche Ergebnisse erbringt, die in den entsprechenden statischen Modellen fehlen. Die Unterschiede zu den bei den genannten Aufsätzen lassen sich wie nachstehend angeben.

Geleitwort

VI

• Hier wird speziell eine Cobb-Douglas-Produktionsfunktion mit einem Homogenitätsgrad größer als eins gewählt, wodurch die Annahme einer monopolistischen Marktstruktur gestützt wird. • Diese Erörterungen werden durch die Analyse der Diagramme unter Berücksichtigung verschiedener Annahmen über die Investitionskosten sowie die Auswirkungen unterschiedlich hoher Skalenerträge ergänzt. • Ferner wird ein wesentlicher Beitrag durch die Einordnung dieses Modells in das übergeordnete Optimierungsproblem der Behörde geleistet, das von den genannten Autoren nicht betrachtet wird. Das Modell der fall weisen Preisregulierung hat die Autorin selbständig entwickelt. Ihr Ansatzpunkt ist die Kritik von Klevorick (1971), dass die Modelle der beschränkten Rentabilität die Regulierung der Realität nur ungenau abbilden, da es sich im Kern um eine Preisregulierung handelt, die sich jedoch an dem Kriterium der fairen Rentabilität orientiert. Der fallweise Einsatz eines Regulierungsinstrumentes entspricht der politischen Realität am ehesten. So werden möglichst direkte Eingriffe in das Wirtschaftsgeschehen mit Bezug zu einer problematischen Größe insbesondere dann durchgeführt, wenn das Problem als besonders akut erscheint. Hingegen werden solche Maßnahmen häufig eingestellt, wenn die ursprünglichen Ziele erreicht worden sind. Die Handhabbarkeit des ohnehin komplexen Regulierungsproblems wird durch die Einführung der fall weisen Regulierung weiter erschwert. Aufgrund der Behandlung von Teilaspekten und durch die Zusammenführung der erhaltenen Erkenntnisse wird es dem Leser dennoch ermöglicht, einen Einblick in das Systemverhalten zu bekommen. Diese Erörterungen werden durch die anschließende Berechnung und Auswertung numerischer Simulationsläufe angereichert. Die Untersuchung der Regulierung aus der Sicht des Unternehmens wird durch die Behandlung des übergeordneten Optimierungsproblems der Regulierungsbehörde erweitert, dessen Analyse für beide Ansätze (Beschränkung der Rentabilität und fallweise Preisregulierung) durchgeführt wird. Auch diese Betrachtungen stellen einen eigenständigen Beitrag der Autorin zur bestehenden Literatur dar. Obwohl die Regulierungsbehörde als obrigkeitliche Institution ihre Regulierungsstrategie autonom bestimmen kann, ist festzuhalten, dass eine bestmögliche Regulierung es erfordert, die Reaktionen des Angebotsmonopols einzubeziehen. Während die Regulierung aus der Sicht der Behörde in den genannten Modellen von EIHodirifTakayama (1981) und Dechert (1984) nicht analysiert wird. findet sich eine solche Untersuchung aus der Wohlstandssicht in SibleylBailey (1978). Der Nachteil des Beitrags dieser Autoren liegt darin, dass das dynamische Verhalten des Unternehmens nicht modellen dogen erklärt wird. Hingegen zeichnen sich die von der Verfasserin entwickelten Modelle dadurch aus,

Geleitwort

VII

dass das Verhalten des Unternehmens in der Zeit durch die Lösung eines dynamischen Optimierungsproblems in Anhängigkeit von der Regulierung erfasst wird und damit modellen dogen hergeleitet werden kann. Im Rahmen der Arbeit wird auf ein breites Spektrum von Techniken zur Behandlung der Probleme zurückgegriffen. Hier ist auch darauf hinzuweisen, dass die numerische Lösung des Problems der fallweisen Preisregulierung mit Hilfe eines selbst erstellten e++-Programms erfolgt ist. Durch die Verbindungen der analytischen, grafischen und numerischen Betrachtungen der Probleme gelingt es, einen qualitativen Einblick in die Interaktion der Systemgrößen trotz der Komplexität der Systeme zu erhalten. Diese Arbeit stellt eine hervorragende Leistung dar, die sich aus der verwendeten Methodik und der Art der Analysen ergibt. Auch die pädagogisch gelungene Form der Darstellung der grundlegenden Tatbestände und Zusammenhänge besticht. Eine solchermaßen konzipierte dynamische Analyse kann dazu dienen, die Sensibilität für die Lenkung dynamischer Prozesse zu erhöhen. Mit der Gesamtanlage der Arbeit und der Behandlung der einzelnen Probleme geht die Autorin überzeugend über den gegenwärtigen Stand der einschlägigen Forschung auf ihrem Untersuchungsgebiet hinaus. Daher wünsche ich diesem Werk eine weite Verbreitung und allgemeine Akzeptanz.

Walter Buhr

Vorwort An dieser Stelle möchte ich mich bei meinem Doktorvater, Herrn Universitätsprofessor Dr. Walter Buhr, herzlich bedanken. Die Tätigkeit an seinem Lehrstuhl und die enge persönliche Zusammenarbeit mit ihm haben mir ein interessantes Arbeitsgebiet eröffnet. Die intensive Betreuung der Dissertation, die ich durch ihn erfahren habe, seine konstruktiven Vorschläge und die moralische Unterstützung während meiner Doktorandenzeit haben wesentlich zum Gelingen dieser Arbeit beigetragen. Herrn Universitätsprofessor Dr. Rüdiger Pethig danke ich für die Betreuung und Unterstützung meiner Arbeit als Zweitgutachter. Wie Herr Professor Buhr hat auch er mein Interesse an der Volkswirtschaftslehre bereits zu Studienzeiten geweckt und einen wesentlichen Teil meiner akademischen Entwicklung geprägt. Des Weiteren bedanke ich mich bei meinen Kollegen am Lehrstuhl für Volkswirtschaftslehre 11, insbesondere Herrn Dr. Thomas Christiaans und Herrn Dr. Mare Büdenbender, für ihre konstruktive Kritik im Rahmen der Doktorandenseminare. Eine besondere Stütze bei der Erstellung der Arbeit war vor allem mein Ehemann, Dr. Hagen Bobzin. Seine Begleitung bei der Erstellung der Arbeit, die ausführlichen fachlichen Diskussionen und nicht zuletzt seine moralische Unterstützung und Ermutigung in meiner gesamten Doktorandenzeit haben das Umfeld geschaffen, das mir die Durchführung des Dissertationsvorhabens ermöglicht hat. Herzlichen Dank hierfür.

Gudrun Bobzin

Inhaltsverzeichnis I Dynamische Aspekte der Theorie der Regulierung

1

11 Regulierung als Problem der optimalen Kontrolle

7

Theorie der Regulierung . . .

7

1.1 Begriff der Regulierung .

7

1.2 Argumente für die Regulierung .

11

1.3 Instrumente der Regulierung . .

18

1.3.1 Überblick über die Instrumente

18

1.3.2 Analyse ausgewählter Instrumente.

23

1.4 Probleme der intertemporalen Regulierung.

30

2 Theorie der optimalen Kontrolle . . .

34

2.1 Grundlagen der Kontrolltheorie .

34

2.2 Kontrolle eines Prozesses durch Steuerung.

36

2.3 Kontrolle eines Prozesses durch Regelung .

39

2.4 Steuerung mit Rückführung als Übergangsform von der Steuerung zur Regelung

45

3 Übertragung der Theorie der optimalen Kontrolle auf die intertemporale Theorie der Regulierung . . . . . . . . . . . . . . . . . . . . . . .

47

3.1 Regulierung als Problem der optimalen Steuerung .

47

3.2 Regulierung als Problem der optimalen Regelung

50

4 Zusammenfassung . . : . . . . . . . . . . . . . . . .

52

III Optimale Regulierung eines Angebotsmonopols bei intertemporaler Maximierung des Gewinns

55

Modellierung der Ausgangssituation

55

1.1 Vorstellung des Grundmodells

55

1.1.1 Problemstellung . . . .

55

1.1.2 Annahmen des Modells

58

1.2 Verhalten des Monopols ohne Regulierung.

63

1.2.1 Darstellung des Optimierungsansatzes

63

1.2.2 Herleitung des Phasendiagramms . . .

69 78 78

1.3 Vergleich der statischen und der dynamischen Analyse 1.3.1 Die Bedeutung der dynamischen Analyse . . . .

XII

Inhaltsverzeichnis

1.3.2 Statische Gewinnmaximierung . . . . . . . . . . . . . . ..

80

1.3.3 Dynamische Gewinnmaximierung mit progressiv steigenden Investitionskosten . . . . . . . . . . . . . . . . . . . . . . .

81

1.3.4 Dynamische Gewinnmaximierung mit linearen Anpassungskosten .

85

1.3.5 Betrachtung des Cournot-Punktes im dynamischen Ansatz . . . . .

89

1.3.6 Subadditivität der Kostenfunktion im statischen und im dynamischen Fall.

93

1.3.7 Ergebnisse des Vergleichs zwischen der statischen und der dynamischen Analyse. . . . . . . . . . . . . . . . .

96

2 Verhalten des Angebotsmonopols bei Regulierung

97

2.1 Beschränkung der Rentabilität . . . . . . . .

97 97

2.1.1 Darstellung des Optimierungsansatzes 2.1.2 Diskussion der Optimumbedingungen .

101

2.1.3 Fallunterscheidung für den Bruttogewinn

107

2.1.4 Verlauf derlsoklinen . . . . . . . . . . .

109

2.1.5 Diskussion des Phasendiagramms für das regulierte Monopol

114

2.1.6 Variation der zulässigen Rentabilität s .

........

2.1.7 Bedeutung der Untergrenze des regulierten Bereiches

121 132

2.1.8 Variation der Anpassungskosten .

137

2.1.9 Ergebnisse der Analyse . . . . .

140

2.2 Regulierung des Preises. . . . . . . . .

145

2.2.1 Darstellung des Optimierungsansatzes

145

2.2.2 Diskussion der Optimumbedingungen .

152

2.2.3 Verlauf der Isokline für

p= 0

. . . . .

2.2.4 Erweiterung der Analyse um die Isokline für)..2 = 0 2.2.5 Berücksichtigung der Isokline für Vk 2.2.6 Verlauf der Isokline für )..1

=0

=0

158 168 173

.....

174

2.2.7 Auswertung der Phasendiagramme . . .

180

2.3 Numerische Berechnungen zum Modell der Preisregulierung

184

2.3.1 Erläuterung der Modellstruktur . . . . . .

184

2.3.2 Allgemeine Darstellung des Lösungsweges

187

2.3.3 Beschreibung des Programmablaufs . . . .

191

2.3.4 Wahl der Startwerte im Zeitpunkt der Systemwechsel

195

2.3.5 Numerische Berechnung der Gleichgewichte

197

2.3.6 Berechnung der Rückwärtsintegration . . . .

202

2.3.7 Berechnung der Vorwärtslösung . . . . . . .

210

2.3.8 Abgrenzung der optimalen Entwicklung gegenüber alternativen Pfaden

219

Inhaltsverzeichnis

XIII

2.3.9 Ergebnis der numerischen Berechnungen ..

226

3 Optimierung der Regulierung aus der Sicht der Behörde

227

3.1 Darstellung alternativer Lösungsansätze . . . . . .

227

3.2 Beschränkung der Rentabilität . . . . . . . . . . .

230

3.2.1 Das dynamische von Stackelberg-Spiel als hierarchisches Entscheidungsproblem . . . . . . . . . . . . . . . . . . .

230

3.2.2 Das Optimierungsproblem der Unternehmung in der abhängigen Position

235

3.2.3 Das Optimierungsproblem der Behörde in der unabhängigen Position

238

3.2.4 Herleitung der Optimumbedingungen .

241

3.2.5 Ergebnisse des von Stackelberg-SpieIs

246

3.3 Regulierung des Preises.

249

3.3.1 Ziel der Analyse .

249

3.3.2 Referenzwert ohne Regulierung

250

3.3.3 Wohlstandseffekte bei fallweiser Preisregulierung mit Standardwerten für die Regulierungsparameter . . . . . . .

251

3.3.4 Variation der zulässigen Rentabilität s .

257

3.3.5 Variation der Anpassungsgeschwindigkeit

263

3.3.6 Ergebnisse der Analyse

265

4 Zusammenfassung . . . . . . . . .

IV Kritische Würdigung der Ansätze

269

271

Ergebnisse der Analyse . . . . . . .

271

2 Ausblick auf mögliche Erweiterungen.

276

V Anhang

287

I Mathematische Grundlagen

287

1.1 ModelIierung dynamischer Systeme mit Hilfe von Differentialgleichungen.

287

1.2 Verfahren zur Lösung der Systeme von Differentialgleichungen.

289

1.2.1 Analytische Verfahren

289

1.2.2 Qualitative Analyse .

292

1.2.3 Numerische Verfahren

298

1.3 Optimierung dynamischer Systeme mit Hilfe des Maximumprinzips

310

1.3.1 Das Standardproblem der optimalen Kontrolle . . . . . . . .

310

1.3.2 Optimierung unter Nebenbedingungen in der Form von Ungleichungen

316

1.3.3 Numerische Lösung von Kontrollproblemen . . . . . . . . . . . . . .

319

XIV

Inhaltsverzeichnis

2 Erläuterung der verwendeten Programme . . . . . . . . . . . . . . . . . . . . . . . . 325 2.1 Konstruktion der Phasendiagramme für den Fall des unregulierten Monopols mit Hilfe von MATIiEMATICA" . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325 2.2 Berechnung der langfristigen Gleichgewichte im unregulierten und im regulierten Monopolfall mit Hilfe von MATIiEMATICA" •.. • • • . • . • • • . . • . . • • • • 328 2.3 Programm in C++ zur numerischen Lösung des Systems von Differentialgleichungen bei Regulierung des Preises. . . . . . . . . . . . . . . . 331

Literaturverzeichnis

339

Verzeichnis der Abbildungen II.I

Systematik zum Begriff der Regulierung

10

II.2

Marktergebnis im Fall des natürlichen Monopols

14

11.3

Optimale Steuerung

36

II.4

Regelung......

40

II.5

Lineare Regelfläche

43

II.6

Optimale Regulierung in der Form einer Wirkungskette (optimale Steuerung)

48

II.7

Regulierung als Regelkreis im Zeitablauf . . . . . . . . . . . . . . . . . . .

50

111.1

Verlauf der Isokline für die gleichgewichtige Entwicklung der KozustandsvariabIen AI im Fall des unregulierten Monopols. . . . . . . . . . . . . . . . . . . ..

71

111.2 Verlauf der (Vk = O)-Isokline für die gleichgewichtige Entwicklung des Kapital111.3

stocks . . . . . . . . . . . . . . . . . . . . . . . . .

73

Phasendiagramm für den unregulierten Monopolfall

74

III.4 Schematische Darstellung des Phasendiagramms für den unregulierten Monopolfall 76 1Il.S Wirkung steigender Anpassungskosten für die Bruttoinvestitionen . . . . . . . ..

85

m.6 Phasendiagramm bei linearen Anpassungskosten . . . . . . . . . . . . . . . . ..

86

III.7 Phasendiagramm im Fall linearer Anpassungskosten und beschränkender Obergrenze für die Bruttoinvestitionen . . . . . . . . . . . . . . . . . . . . . . . . ..

88

11 I. 8 Darstellung der gewinnmaximalen Lösung im statischen Monopolfall . . . . . ..

89

III.9 Veränderung der momentanen Kostenkurven im Zeitablauf auf Grund einer Variation des Kapitalstocks . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . ..

92

III.lO Ermittlung des Bruttogewinns des regulierten Unternehmens in Abhängigkeit vom Kapitalstock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . !O8 111.11 Verlauf der Isokline für die gleichgewichtige Entwicklung der KozustandsvariabIen im regulierten Monopolfall . . . . . . . . . . . . . . . . . . . .

111

m.12 Wirkung einer Variation der maximal zulässigen Rentabilität. . . . .

112

III.l3 Verlauf der

c)"l

= O)-Isokline für einen Homogenitätsgrad Cl + K »

1

m.14 Phasen diagramm im Referenzfall bei Regulierung

113 116

III.l5 Phasendiagramm im Fall (a) . . . . . . . . . . . .

121

111.16 Phasendiagramm im Fall (b) . . . . . . . . . . . .

124

m.17 Darstellung einer inneren Lösung für das regulierte langfristige Gleichgewicht

125

III.l8 Phasendiagramm im Fall (c) . . . . . . . . . . . . . . . . . . . . . . . . . . .

127

III.l9 Phasendiagramm im Fall (d) . . . . . . . . . . . . . . . . . . . . . . . . . . .

131

m.20 Phasendiagramm im Fall (b) unter Berücksichtigung der Untergrenze des regulierten Bereiches . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 133

XVI

Verzeichnis der Abbildungen

III.21 Phasendiagramm unter Berücksichtigung einer Untergrenze des regulierten Bereiches bei Realisierung einer inneren Lösung . . . . . . . . . . . . . . . . . . . . . 134 III.22 Bedingung für eine innere Lösung bei einer Verringerung des Kapitalstocks unter Berücksichtigung der Untergrenze des regulierten Bereiches . . . . . . . .

135

III.23 Darstellung einer Randlösung an der Untergrenze des regulierten Bereiches

136

III.24 Reduktion des Kapitalstocks bei linearen Anpassungskosten

138

UI.25 Indifferente Lösung bei linearen Anpassungskosten . . . . .

139

III.26 Ausweitung des Kapitalstocks bei linearen Anpassungskosten

140

III.27 Abweichung des Kapitalstocks im langfristigen Gleichgewicht bei Regulierung von dem Kapitalstock ohne Regulierung. . . . . . . . . . . . . . . . . . . . . . . 143 III.28 Verlauf der Isokline für den gleichgewichtigen Preis bei parametrisch gegebenem Kapitalstock in der (p, A2)-Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . 159 111.29 Verlauf der Isokline für den gleichgewichtigen Preis bei parametrisch gegebenem Kapitalstock in der (p, A()-Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . 161 III.30 Verlauf der Isokline für den gleichgewichtigen Preis bei parametrisch gegebenem Kapitalstock im (p, A2' A()-Raum . . . . . . . . . . . . . . . . . . . . . . . . . . 162 UI.31 Verlauf der Isokline für die gleichgewichtige Kozustandsvariable im Hinblick auf die Anpassungsgleichung des Preises bei parametrisch gegebenem Kapitalstock in der (p, A2)-Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165 III.32 Verlauf der Isokline für die gleichgewichtige adjungierte Zustands variable A2 bei parametrisch gegebenem Kapitalstock in der (Alo A2)-Ebene . . . . . . . . . . . . 166 III.33 Verlauf der Isokline für die gleichgewichtige Kozustandsvariable A2 im Hinblick auf die Anpassungsgleichung des Preises bei gegebener Bruttoinvestition im (p. A2. A()-Raum. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

167

UI.34 Phasendiagramm für die Änderung des Preises p und der Kozustandsvariablen A2 in der (p, A2)-Ebene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169 III.35 Phasen diagramm für die Änderung des Preises p und der adjungierten Zustandsvariablen A2 für geringeres Y2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171 III.36 Phasendiagramm im (p, A2, A( )-Raum unter Berücksichtigung der Isokline für den gleichgewichtigen Preis p und der Isokline für die gleichgewichtige Kozustandsvariable A2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172 II1.37 Darstellung der Voraussetzung der Isokline für einen positiven gleichgewichtigen Kapitalstock im (p, A2, A()-Raum . . . . . . . . . . . . . . . . . . . . . . . . . . 173

XVII

Verzeichnis der Abbildungen III.38 Phasendiagramm im (P. A2. Ad-Raum für einen gegebenen positiven Kapitalstock unter Berucksichtigung der Isokline für den gleichgewichtigen Preis P und der Isokline für die gleichgewichtige Kozustandsvariable A2 sowie der Isokline für den gleichgewichtigen Kapitalstock Vk

• • • • • • • • • • • • • • • • • • • • • • • • • •

175

III.39 Verlauf der Isokline für die Kozustandsvariable AI im (AI. A2}-Raum bei gegebener Bruttoinvestition und gegebenem Preis . . . . . . . . . . . . . . . . . . . . . 177 III.40 Verlauf der Isokline für die gleichgewichtige Entwicklung der adjungierten Zustandsvariablen AI in der (p. Ad-Ebene . . . . . . . . . . . . . . . . . . . . . . . 178 III.41 Verlauf der Isokline für die gleichgewichtige Entwicklung der adjungierten Variablen AI im (P. A2. AI}-Diagramm . . . . . . . . . . . . . . . . . . . . . . . . . . 179 III.42 Schnitt der Isoklinen für die beiden Kozustandsvariablen AI und A2 .. . . . . . . 181 III.43 Kurve für den Ort aller gleichgewichtigen Punkte im Hinblick auf die Isoklinen für die beiden Kozustandsvariablen AI und A2 . . . . . . . . . . . . . . . . . . . . . . 182 III.44 Schnitt der gleichgewichtigen Kurve für die beiden Kozustandsvariablen AI und A2 mit der Isokline für den gleichgewichtigen Preis p . . . . . . . . .

183

111.45 Programmablaufplan für die Vorwärtslösung des Problems (Teil 1)

. . . . . . . . 191

III.46 Programmablaufplan für die Vorwärtslösung des Problems (Teil 2)

. . . . . . . . 192

111.47 Entwicklung des Kapitalstocks. des Preises. des Gewinns und der Rentabilität im Fall der Rückwärtsintegration . . . . . . . . . . . . . . . . .

205

III.48 Wirkungskreislauf der Variablen für den Fall der Regulierung . . . . . . . . . . . 206 III.49 Wirkungskeue der Variablen für den unregulierten Fall . . . . . . . . . . . . . . . 207 III.50 Gegenüberstellung des Verlaufs des Sattel pfades im regulierten Bereich im (Vk. p)Raum mit den optimalen Preisen aus der Sicht des unregulierten Monopols für den gegebenen Kapitalstock . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209 111.5 I Zeitpfade der Systemgrößen für den Fall der Vorwärtsintegration bei bestmöglicher Wahl der Anfangswerte der adjungierten Variablen . . . . . . . . . . . . . . . . . 214 111.52 Entwicklung der adjungierten Variablen AI für t E [0.45] beziehungsweise t E [0,50]

...................

215

= 52 111.54 Zeitpfade für den Anfangswert AI (0) = 53 III.53 Zeitpfade für den Anfangswert AI (O)

111.55 Verlauf der Zeitpfade für AI

= 52, 030553

220 222 223

= 52,030553.

224

III.57 Darstellung der Konsumentenrente . . . . . . . . . . . . . . .

238

111.56 Zeitpfad des Kapitalstocks mit tE [0,48] für AI

III.58 Wohlstandseffekte der Preisregulierung mit den Parametern

s = 0,20 und 1/1 = 1

254

I1I.59 Abweichungen der Wohlstandsmaße gegenüber der Referenzsituation ohne Regulierung . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 256

Verzeichnis der Abbildungen

XVIII

III.60 Entwicklung des Gewinns, der Konsumentenrente und der Rentabilität für 0,01 im Vergleich zum Referenzlauf mit

s=

s = 0,20 . . . . . . . . . . . . . . . . . = 0,01 im Vergleich zum Standard-

III.61 Zeitpfade für den optimalen Parameterwert s lauf mit s = 0,20 .

262 263



V.I

Isokline für XI

V2 V3

Isokline für X2 = Kombiniertes Phasendiagramm für die beiden gleichgewichtigen Isoklinen

294 294

V.4

Schematischer Verlauf einiger Trajektorien . . . . . . . . . . . . . . . . .

295

V.5

Schematische Darstellung der Gleichgewichtstypen im Phasendiagramm .

297

V6

Darstellung der Euler-Methode für einen einzigen Schritt mit der Länge h .

299

V7

293

°

Approximation der Lösung einer Differentialgleichung mit Hilfe der Euler-Methode für verschieden lange Schrittweiten . . . . . . . . . . . . . . . . . . . . . .

300

V8

Verwendete Steigungen beim Runge-Kutta-Verfahren. . . . . . . . . . . . . .

303

V.9

Darstellung des einfachen Schießverfahrens bei einem konstanten Endwert XT

VIO Darstellung der Mehrzielmethode mit dem Endwert XT

• • • . • . • • . • . • .

307

308

VII Phasendiagramm des Ramsey-Modells . . . . . . . . . . . . . . . . . . . . .

321

VI2 Lage des stabilen und des instabilen Arms im ursprünglichen Phasendiagramm

322

VI3 Lage des stabilen und des instabilen Arms im Phasendiagramm des transformierten Systems. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . VI4 Darstellung der Trajektorien für den unregulierten Monopolfall

324 328

Verzeichnis der Tabellen II.l

Angewendete Regulierungsverfahren in 48 Staaten der USA (1984-1995)

29

11.2 Anwendung der Regulierungsverfahren in den einzelnen Staaten der USA (1984-

..........................

30

11.3 Charakteristika einer Steuerung und einer Regelung . .

46

1995)

1II.1 Wirkung der beschränkten Rentabilität auf das langfristige Gleichgewicht

141

111.2 Ergänzende Angaben zur Wirkung der beschränkten Rentabilität auf das langfristige Gleichgewicht für einen Homogenitätsgrad (X

+" »

1

142

111.3 Abgrenzung des regulierten vom unregulierten System

186

1II.4 Standardwerte der Parameter . . . . . . . . . . . . . .

198

1II.5 Gleichgewichtige Werte. . . . . . . . . . . . . . . . .

199

111.6 Numerischer Output für den Fall der Rückwärtsintegration

204

111.7 Ermittlung der optimalen Startwerte AI (0) und A2 (0) der adjungierten Variablen 212

s

111.8 Variation des Parameters bei konstantem Wert

1/1 = 1 ...........

III.9 Variation der Anpassungsgeschwindigkeit 1/1 bei konstantem Wert

V.I

s = 0,20

Eigenschaften von Gleichgewichtspunkten . . . . . . . . . . . . . . . . . .

258 264 296

Verzeichnis der Symbole Symbole mit ökonomischer Bedeutung

cO cO

Kostenfunktion Kosten für die Installation von Kapitalgütern

C

Parameter der Funktion der Anpassungskosten bei Bruttoinvestitionen

e

Erlösfunktion

G

momentaner Gewinn

[b

Bruttoinvestitionen

KR

Konsumentenrente

p

Preis

qa

Lohnsatz

qk

Anschaffungspreis für den Faktor Kapital

r

Zinssatz

Rj • i

= I. 2

s

Reaktionsfunktion des Spielers i Ci

= I. 2)

Rentabilität

s

zulässige Rentabilität

u

Steuergrößen

W

kumulierter Barwert des Wohlstands

Va

Arbeitsmenge

Vk

Kapitalmenge

X

Produktionsmenge

xd

Nachfragemenge

a

Produktionselastizität in Bezug auf den Faktor Arbeit

Yt. Y2

Parameter der Preis-Absatz-Funktion

r

kumulierter und diskontierter Gewinn

ö

Abschreibungsrate

T)

Preiselastizität der Nachfrage

e

Technikniveau

K

Produktionselastizität in Bezug auf den Faktor Kapital

Jr

Bruttogewinn

a

Wachstumsrate des Lohnsatzes

1jr

Geschwindigkeit der Preisanpassung

Verzeichnis der Symbole

XXII

Mathematische Symbole Koeffizientenmatrix

A

Ci, i Di , i

= 1, ... , 7 = 1, ... , 7

Konstanten Konstanten Hamilton-Funktion (Zeitwert)

Je Je

Hamilton-Funktion (Barwert)

J

lacobi-Matrix

.J:. x,

Lagrange-Funktion Zustandsgrößen

Xi

ß), ß2' Al, A2,

~

adjungierte Kozustandsvariablen (Zeitwert)

A

adjungierte Kozustandsvariable (Barwert)

Q

zulässiger Bereich der Steuergrößen

Kapitel I Dynamische Aspekte der Theorie der Regulierung Unter ökonomischen Gesichtspunkten besteht das Ziel dieser Arbeit darin, die zeitliche Entwicklung eines Angebotsmonopols mit entsprechender Marktrnacht zu untersuchen. Als Korrekturinstanz wird dem Monopolisten eine Regulierungsbehörde gegenübergestellt, die die Aufgabe hat, den gesellschaftlichen Wohlstand zu maximieren. Dabei wird das besondere Augenmerk auf eine theoretische Analyse gelegt, die sich auf die dynamischen Aspekte der Regulierung konzentriert. Behandelt man in der heutigen Zeit, die durch die Liberalisierung einzelner Märkte geprägt ist, Modelle der Regulierung, so wird häufig die Frage gestellt, warum man sich ausgerechnet mit dem Thema der Regulierung und nicht mit der Deregulierung beschäftigt. Die Antwort ist, dass die aktuelle Entwicklung bei genauerer Betrachtung keineswegs eine Ablösung der Regulierung durch eine Politik des Laissez-faire widerspiegelt. Wie Fraquelli, Vannoni (2000) bemerken, verschiebt sich vielmehr der Schwerpunkt der staatlichen Intervention. Darüber hinaus zeigt die Einführung einiger Elemente des Wettbewerbs in Sektoren, die durch kapitalintensive Netzwerke geprägt sind, beispielsweise Telekommunikation, Energie, oder der Bahnverkehr, dass auch in Zukunft die alteingesessenen Unternehmen häufig über erhebliche Marktrnacht verfügen werden. Damit liegt unter politischen Aspekten der Grund für eine Fortsetzung der Regulierung auf der Hand. Denn obwohl große Bereiche für den Wettbewerb geöffnet worden sind, werden einige Unternehmen Marktrnacht behalten. Auf einigen Teilmärkten ist sogar damit zu rechnen, dass sich im Zeitablauf erneut Monopole herausbilden. Ein Beispiel, das unter anderem von Armstrong (1997) untersucht wird, ist der Markt für Zusammenschaltungen verschiedener Netze. Da einerseits die Zusammenschaltung mit einem anderen Telekommunikationsnetz mit fixen Kosten verbunden ist, andererseits Gespräche über Netzgrenzen hinaus aufgebaut werden müssen, ist es für neue Netzbetreiber von elementarer

Kapitel I Dynamische Aspekte der Theorie der Regulierung

2

Bedeutung, zumindest an das zentrale Netz direkt angeschaltet zu sein, mit dem die meisten anderen Wettbewerber ebenfalls verbunden sind. Häufig befindet sich dieses zentrale Netz in der Hand des ehemaligen Monopolisten, der damit über eine stärkere Marktposition verfügt. Die Aufgabe der Regulierung wird darin gesehen, dass diese Marktmacht nicht dahingehend ausgenutzt wird, die neuen Konkurrenten zu verdrängen, bis die ursprüngliche Monopolsituation wiederhergestellt ist. Da nur das zentrale Netz die direkte beziehungsweise indirekte Erreichbarkeit einer derartig großen Zahl von Teilnehmern ermöglicht, verfügt das Unternehmen über Marktmacht, die es bei der Festlegung der Zusammenschaltungstarife mit den anderen Netzen ausnutzen kann. Neben den traditionellen Aspekten in der Theorie der Regulierung, die insbesondere die Entscheidungen über Produktionsmengen und Preise in natürlichen Monopolen umfassen, treten in den letzten Jahren andere Sektoren verstärkt in das Zentrum des Interesses, wie zum Beispiel der Gesundheitsbereich. Einige Erklärungen für eine derartige Neuorientierung der Regulierung liefert zum Beispiel die politische Ökonomie. So stellt bereits Stigler (1971) die Regulierer als rationale Akteure dar, die den politischen Nutzen maximieren, der aus einer bestimmten Politik folgt. Stigler zeigt, dass kleine Gruppen eher ihre Ziele durchsetzen als große Gruppen, die nur einen geringen Nutzen pro Kopf aus einer bestimmten Politik ziehen. Diese Beobachtung erklärt, warum die Ausgestaltung von Regulierungsmaßnahmen - so widersprüchlich diese Aussage auch erscheint - entscheidend von den Interessen der regulierten Unternehmen geprägt ist. Wie Peltzman (1976) und Becker (1983) darlegen, ist die Regulierung das Ergebnis eines Wettbewerbs der Interessengruppen. Entsprechend sind die Phasen der Regulierung und der Deregulierung in verschiedenen Bereichen das Ergebnis eines politischen Prozesses mit wandelnder Gewichtung der involvierten Interessengruppen. Die bisherigen Bemerkungen legen nahe, dass die ModelIierung einer Regulierung eigentlich in der Form eines Spiels erfolgen müsste. Zu den Parteien, die in dieses Spiel eingebunden sind, gehören die regulierten Unternehmen, die Regulierungsbehörde und nicht zuletzt die Konsumenten, deren Interessen in der Regel durch die Regulierungsbehörde artikuliert werden. Sowohl die vitalen Interessen der Parteien gegenüber einer Regulierung als auch die Gewichtungen der Parteien im Prozess der politischen Willensbildung können sich im Zeitablauf verändern. Dabei wird die Entwicklung wesentlich durch den momentanen Grad der Zielerreichung, aber auch durch die jeweilige Interaktion der betroffenen Parteien im politischen Wettbewerb bedingt. Bereits in diesem Zusammenhang zeigt sich, dass dynamische Modelle eine geeignete Abbildung des Sachverhaltes ermöglichen. So stellt eine Regulierung einen Prozess von kontinuierlichen Aktionen und Reaktionen der beteiligten Parteien dar, wobei keine Partei vollständige Information über das zukünftige Verhalten der jeweils anderen Spieler besitzt. Entsprechend

Kapitel I Dynamische Aspekte der Theorie der Regulierung

3

werden Entscheidungen, die auf Vermutungen über das zukünftige Verhalten des Gegenspielers basieren, mit Fehlern behaftet sein. Die Regulierung ist somit ein sich selbst korrigierender Prozess aus wechselseitigen Antworten mit einer sukzessiven Informationsverarbeitung. Ein weiterer wesentlicher Aspekt, der die ModelIierung der Regulierung als dynamischen Prozess erfordert, ist der Zeitbedarf, den die Unternehmen benötigen, um ihre Produktionsstruktur an die jeweiligen Gegebenheiten anzupassen. Die entsprechenden Investitionsvorgänge implizieren erhebliche Kosten, die um so höher ausfallen, je schneller das Unternehmen seinen Anpassungsbedarf abbaut. Im Abschnitt 1.3 des dritten Kapitels wird mit Bezug zur neoklassischen Investitionstheorie gezeigt, dass es für das Unternehmen gegebenenfalls nicht optimal ist, sich unendlich schnell dem langfristig gleichgewichtigen Kapitalstock zu nähern. Stattdessen wird ein Zeitpfad für die Investition gewählt, auf dem das Unternehmen mit einer optimalen endlichen Geschwindigkeit gegen das jeweilige Gleichgewicht konvergiert. Ganz analog zum unregulierten Unternehmen wählt auch das regulierte Unternehmen einen Investitionspfad, um sich mit optimaler Geschwindigkeit in das langfristige Gleichgewicht zu bewegen. Im Unterschied zum unregulierten Fall ist hier jedoch zu berücksichtigen, dass das Unternehmen nun einer weiteren Restriktion durch die Behörde unterliegt, wodurch sich das langfristige Gleichgewicht verlagert. Im Umkehrschluss erfordert eine optimale Gestaltung der Regulierung, dass das dynamische Wesen von Investitionsprozessen und von unternehmerischen Prozessen zu berücksichtigen ist. Des Weiteren sind in der Realität auch Tatbestände wie der technische Fortschritt neben zufälligen Störfaktoren einzubeziehen. Eine rein statische Theorie der Regulierung führt somit zu einer Vernachlässigung von wesentlichen Merkmalen des unternehmerischen Verhaltens, das besser durch einen Prozess als durch einen fixierten Zustand abgebildet wird. Die genannten Tatbestände machen es erforderlich, den Regulierungsprozess als ein dynamisches Spiel zu modellieren. Dieses Spiel ist durch das intertemporale Kalkül der beteiligten Parteien und ihre kontinuierliche und simultane Interaktion geprägt. Leider erweist sich ein entsprechender Ansatz als sehr komplex und nicht zu handhaben. Man bedenke an dieser Stelle, dass bereits einfache dynamische Ansätze nur schwer zu lösen sind. Entsprechend werden die Lösungen im Rahmen dieser Arbeit schrittweise hergeleitet, wobei zunächst das optimale intertemporale Verhalten eines einzigen Akteurs, nämlich der regulierten Unternehmung, betrachtet wird. Das gewinnmaximierende Verhalten des Unternehmens bezeichnet einen dynamischen Prozess, der anschließend in das übergeordnete Optimierungsproblem der Regulierungsbehörde eingebunden werden muss. Für diese Institution wird angenommen, dass sie versucht, den kumulierten diskontierten Wohlstand im Planungszeitraum zu maximieren. Das zweite Kapitel ordnet die Arbeit in die zugehörigen wissenschaftlichen Themenbereiche ein. Dazu wird zunächst die Theorie der Regulierung als das eigentliche Objekt der Untersu-

4

Kapitel I Dynamische Aspekte der Theorie der Regulierung

chung vorgestellt. Diesem Ansatz wird die Kontrolltheorie gegenübergestellt, die als Instrumentarium zur Optimierung dynamischer Prozesse dient. Um die Verbindung dieser beiden Theoriegebiete zu gewährleisten, wird folgende Argumentationskette durchlaufen. Nachdem der Begriff der Regulierung definiert worden ist, lassen sich die Argumente für eine Regulierung sowie die zugehörigen Instrumente systematisieren. Schließlich wird aufgezeigt, inwiefern die Regulierung von Unternehmen als Lenkung eines dynamischen Systems aufzufassen ist und kein bloßes statisches Problem darstellt. Im zweiten Schritt erfolgt ein kursorischer Überblick über die Kontrolltheorie. Hier werden Methoden vorgestellt, die sich zur Optimierung dynamischer Prozesse heranziehen lassen. Nachdem die Funktionsweise der Verfahren erläutert worden ist, kann man die Voraussetzungen einer sinnvollen Anwendung der Methoden erörtern. Dabei wird deutlich, dass das in der Ökonomik häufig verwendete Verfahren der optimalen Steuerung angesichts von Informationsdefiziten und stochastischen Störungen kaum geeignet ist, eine optimale Lenkung des betrachteten dynamischen Prozesses herzuleiten. Daher wird die Steuerung im nächsten Schritt durch das Verfahren der Regelung ersetzt. Obwohl die Regelung keine eindeutig festgelegte optimale Entwicklung liefert, stellt sie einen sich selbst korrigierenden Lenkungsmechanismus bereit, der sich an verschiedenen Optimalitätskriterien orientiert und eine bestmögliche dynamische Anpassung an eine gewünschte Entwicklung realisiert. Nachdem die zwei wesentlichen Säulen der Arbeit - die Theorie der Regulierung und die Kontrolltheorie - zunächst isoliert betrachtet worden sind, erfolgt eine Synthese der beiden Ansätze. Hier werden in abstrakter Weise Möglichkeiten aufgezeigt, wie sich Probleme einer optimalen intertemporalen Regulierung von Unternehmen modellieren und lösen lassen. Das dritte Kapitel stellt den Kern der Arbeit dar. Die Analyse konzentriert sich auf die Regulierung des Preises im Angebotsmonopol. Der gewählte Ansatz entspricht damit dem klassischen Instrumentarium der Regulierung, wie es für den statischen Fall in einer umfangreichen Literatur untersucht worden ist. Einen umfassenden Überblick liefern Spulber (1989) sowie Laffont, Tirole (1993). Unterstellt man darüber hinaus, dass das Verhalten von Unternehmen auf Grund der Investitionstätigkeit inhärent dynamischer Natur ist, kommen statische Ansätze nicht als adäquate Abbildungen der Realität in Frage. Die Regulierung bezeichnet mit anderen Worten den Versuch, dynamische Prozesse optimal zu lenken. Im Zentrum der Betrachtung stehen dabei exemplarisch zwei Verfahrensweisen zur Preisregulierung. Der erste Ansatz ist eine Fortführung der traditionellen Theorie zur Beschränkung der Rentabilität; er basiert auf der Literatur zum statischen Averch-lohnson-Effekt (vgl. insbesondere Averch, lohnson (1962), Baumol, Klevorick (1970), BaHey (1973), Klevorick (1973) sowie Das (1980». Das hier gewählte dynamische Modell stellt eine Fortführung des Ansatzes von Dechert (1984) dar. Ein wesentlicher Beitrag der Arbeit besteht darin, das Optimierungsproblem der Unternehmung in das übergeordnete Problem der Wohlstandsmaximierung durch die Behörde einzuordnen. In

Kapitel I Dynamische Aspekte der Theorie der Regulierung

5

den üblichen Modellen zur Beschränkung der Rentabilität, wird die Regulierung in der Form einer Nebenbedingung berücksichtigt, die vorschreibt, dass die vom Unternehmen realisierte Rentabilität eine obere Schranke nicht übersteigen darf. Führt man sich hingegen vor Augen, wie in der Realität vorgegangen wird, ist die Formulierung dieser Obergrenze lediglich ein Zwischenschritt. Zunächst wird zwar die von der Regulierungsbehörde als "fair" erachtete Rentabilität ermittelt, sie geht jedoch nicht direkt als Restriktion in das Optimierungsproblem des Unternehmens ein. Vielmehr ermittelt die Behörde in einem zweiten Schritt die Preise, die im Zeitpunkt der Entscheidung gerade die Einhaltung der Rentabilitätsbeschränkung implizieren. Der eigentlich ausgeübte Eingriff in das Marktgeschehen besteht somit nicht in einer Beschneidung der Rentabilität, sondern in einer Fixierung des Preises. Der regulatorische Prozess wird somit bei der gewählten ModelIierung nur ungenau abgebildet, wie es auch Klevorick (1971) kritisiert. Die Schranke für die Rentabilitätsrate ist damit nicht das eigentliche Instrument, sondern lediglich eine Orientierungs größe zur Bestimmung des entsprechenden Güterpreises. Unter Berücksichtigung dieses Kritikpunktes erscheint es sinnvoll, die Modellierung der Regulierung zu korrigieren. Der modifizierte Ansatz orientiert sich weiterhin am Kriterium der fairen Rentabilität, da die Rentabilität als ein Indiz für eine hohe Monopolrente und damit eine ungleiche Rentenverteilung zu Lasten der Konsumenten angesehen werden kann. Übersteigt die Rentabilität, die als fair empfundene Schranke, so wird Druck auf die Produzenten ausgeübt, die Preise zu senken, wobei der Druck proportional zur Differenz zwischen der fairen und der tatsächlichen Rendite ist. Die Analyse des gewinnmaximierenden Verhaltens selbst stellt nur einen Teilaspekt der gesamten Betrachtung dar. Denn die Lösung des unternehmerischen Optimierungskalküls wird als dynamischer Prozess aufgefasst, der im nächsten Schritt von der Regulierungsbehörde korrigiert wird, die die Zielsetzung der Maximierung des gesellschaftlichen Wohlstands verfolgt. Das Optimierungsproblem der Regulierungsbehörde lässt sich analysieren, indem man die Methoden der optimalen Kontrolle einsetzt, die im zweiten Kapitel vorgestellt worden sind. Die Untersuchung zeigt, dass eine optimale Regulierung im dynamischen Kontext relativ komplexe Betrachtungen erfordert. Dabei wird unterstellt, dass die Regulierungsbehörde vollständige Information über das Verhalten des Unternehmens besitzt. Doch selbst wenn man die Behörde der Anmaßung von Wissen bezichtigt, so ist es wichtig, ein Referenzszenario zu kennen, in dem einer idealisierten Behörde alle erdenklichen Fähigkeiten und Kenntnisse unterstellt werden. Obwohl selbst eine derartige Behörde kein einfaches Patentrezept für eine optimale Regulierung ermitteln kann, liefert die Analyse dennoch wertvolle Einblicke in das dynamische Wesen des Problems. Der Konstruktion nach handelt es sich bei dem gewählten Modell um ein neoklassisches Investitionskalkül, das an späterer Stelle in die Maximierung des Wohlstandes eingebettet wird.

6

Kapitel I Dynamische Aspekte der Theorie der Regulierung

Da die dynamische Analyse bereits bei der Berücksichtigung weniger Differentialgleichungen recht komplizierte Lösungsalgorithmen erfordert, erweist es sich im Rahmen der Analyse als notwendig, von einer rein analytischen Betrachtung auf numerische Verfahren überzugehen. Erst die Integration analytischer, grafischer und numerischer Methoden ist in ihrer Gesamtheit in der Lage, einen Einblick in das komplexe Beziehungsgeftecht zu liefern, das durch das Zusammenwirken der verschiedenen Parteien entsteht. Im vierten Kapitel werden die Ergebnisse der Analyse einer kritischen Würdigung unterzogen, die erneut die Vorgehensweise und die Wahl des Untersuchungsgegenstandes einschließlich seiner empirischen Relevanz untersucht. So wird deutlich, dass die gewählten Ansätze trotz des erheblichen Abstraktionsgrades zu sehr komplexen Optimierungsproblemen führen, deren analytische Lösbarkeit begrenzt ist. In diesem Rahmen werden diverse Erweiterungsmöglichkeiten der Analyse aufgezeigt, die zum Beispiel die Berücksichtigung verzögerter Reaktionszeiten der Akteure umfassen, aber auch die Änderungen von Randbedingungen der Regulierung, wie Veränderungen der Faktorpreise, technischer Fortschritt et cetera. Angesichts der Komplexität dynamischer Optimierungsmodelle und der Abstraktion von weiteren realen Problemen, wie zum Beispiel fehlende Infomationen der Behörde und Veränderungen der Randbedingungen im Zeitablauf, wird deutlich, dass die dynamische Theorie der Regulierung nur bedingt in der Lage ist, eine Regulierung zu entwerfen, die im Sinne eines ,.Automatismus" die Maximierung des Wohlstands in der Realität sicherstellen kann. Allerdings wird auch dargelegt, dass die Vernachlässigung der dynamischen Natur des Optimierungsproblems zwangsläufig keinen optimalen Lenkungsmechanismus liefern kann. Hingegen ist die dynamische Theorie zumindest in der Lage, Orientierungshilfen für die Regulierung von Unternehmen zu entwickeln und den Blick für die Anforderungen an eine Regulierung eines dynamischen Prozesses zu schärfen.

Kapitel 11 Regulierung als Problem der optimalen Kontrolle 1 Theorie der Regulierung 1.1

Begriff der Regulierung

Das vorliegende Kapitel weist einen dreigeteilten Aufbau auf, wobei die Regulierung der Unternehmen den zentralen Aspekt darstellt. Entsprechend erfolgt im ersten Teil ein Überblick über die Theorie der Regulierung. Hier wird der Begriff der Regulierung definiert. Ferner werden Argumente für und wider eine Regulierung diskutiert und exemplarisch einige Regulierungsinstrumente vorgestellt. Damit ist der ökonomische Kontext in Bezug auf das Thema der Arbeit vorgegeben. Der zweite Teil ist technischer Art und dient dazu, die Methoden der Kontrolltheorie vorzustellen, die sich zur Optimierung dynamischer Prozesse anwenden lassen. Die Verfahren werden zunächst losgelöst vom ökonomischen Problem der Regulierung dargelegt. Schließlich erfolgt im dritten Teil die Übertragung der vorgestellten technischen Methoden auf die Regulierung von Unternehmen. Zum einen wird dargelegt, inwiefern die Beriicksichtigung dynamischer Aspekte in der Regulierung von Belang ist. Zum anderen werden alternative Modellierungen des Regulierungsprozesses entsprechend dem Instrumentarium der Kontrolltheorie aufgezeigt. Das Kapitel dient in seiner Gesamtheit dazu, die Grundlagen für die Theorie der Regulierung sowie für die Kontrolltheorie zu legen, um den Zugang zu den speziellen Problemen der intertemporalen Regulierung zu erleichtern, die im dritten Kapitel behandelt werden. Im allgemeinen Sprachgebrauch versteht man unter regulieren eine ordnende oder korrigierende Tätigkeit. Ausgehend von diesem Begriffsverständnis wird die Regulierung auch in der Ökonomik als eine lenkende und korrigierende Beeinflussung des Marktgeschehens interpretiert. Die Regulierung steht damit im Gegensatz zur Politik des Laissez-faire.

8

Kapitel 11 Regulierung als Problem der optimalen Kontrolle Im Rahmen dieser Arbeit orientiert sich der Begriff der Regulierung an der Definition der

Deregulierungskommission (1991). Regulierung ist danach jede staatliche oder staatlich sanktionierte Beeinflussung der Handlungsmöglichkeiten der Wirtschaftssubjekte. Sie betrifft ihre Verfügung über sich selbst, über Sachen und über Rechte, sei es in tatsächlicher, in rechtsgeschäftlicher, insbesondere vertraglicher Art. Man unterscheidet

• allgemeine Regulierungen, das heißt, Regulierungen, die prinzipielljedermann betreffen. Sie bilden den Gegenstand der allgemeinen Rechtsordnung, insbesondere des Eigentumsrechts, des Vertragsrechts, des Strafrechts, ... Das Ziel dieser allgemeinen Regulierungen besteht darin, ein gedeihliches Zusammenleben und Zusammenwirken autonomer Individuen zu ermöglichen, sowie eine Markt- und Wettbewerbsordnung zu errichten und aufrechtzuhalten;

• spezielle Regulierungen, die nur bestimmte Gruppen von Wirtschaftssubjekten betreffen. Sie umfassen somit besondere Beschränkungen der Vertragsfreiheit und explizite Ausnahmen von allgemeinen Beschränkungen der Vertragsfreiheit, wie zum Beispiel Ausnahmen vorn Kartellverbot. Sie betreffen gesonderte Bereiche, in denen die mittels allgemeiner Regulierungen errichteten Märkte keine zufriedenstelIenden Ergebnisse bewirken, und zielen darauf ab, einem solchen Marktversagen entgegenzuwirken. Mit dieser Definition liegt eine relativ weite Auffassung des Begriffes der Regulierung vor. In der Literatur finden sich häufig engere Definitionen, I in denen insbesondere der Begriff der Beeinflussung durch das Wort Beschränkung oder Eingriff ersetzt wird. Regulierung umfasst dann lediglich die Einengung von Handlungsmöglichkeiten. Hingegen beinhaltet die hier gewählte Definition auch die indirekte Einflussnahme durch Schaffung von Anreizen, die letztlich auch eine Abweichung von Laissez-faire-Situationen sind und gezielte Änderungen des Marktgeschehens implizieren. Auf der Basis der weiten Begriffsfassung bietet die Abbildung II.l auf der Seite 10 eine Systematik zur Theorie der Regulierung, die die Objekte der Regulierung und die zugehörigen Instrumente enthält. Dabei ist zu beachten, dass die Objekte der Regulierung, wie das Marktergebnis, die Marktform und das Verhalten auf einern Markt, interdependent sind. Entsprechend impliziert ein regulierender Eingriff mit dem Ziel, das Marktverhalten zu gestalten, auch Änderungen des Marktergebnisses und gegebenenfalls der Marktform. Die vorgestellte Gliederung orientiert sich also an dem vorrangigen Gegenstand der Regulierung und dient in diesem Sinne als Leitfaden für die zusammenfassende Darstellung der Theorie der Regulierung. Bereits an 1

Vgl. zum Beispiel Mitnick (1980), Francis (1993), Seite 5, Breyer, MacAvoy (\998) sowie die Übersicht über alternative Definitionen in Spulber (1989), Seite 22 ff.

1 Theorie der Regulierung

9

dieser Stelle ist zu betonen, dass die spezielle Regulierung den Kern der Analyse bilden wird. Dabei wird insbesondere die Regulierung des Marktergebnisses durch verschiedene Varianten der Preisregulierung aufgegriffen. Im Abschnitt 1.2 werden Argumente angeführt, die für oder gegen eine Regulierung sprechen. Ein Überblick über die verschiedenen Regulierungsinstrumente erfolgt im Rahmen des Abschnitts 1.3.2. Ergänzend zu der Systematik der Abbildung II.l ist anzuführen, dass in der Literatur teilweise zwischen einer ökonomischen und einer sozialen Regulierung unterschieden wird (vgl. zum Beispiel Joskow, Noll (1981), Seite 3 ff., Francis (1993), Seite 5 ff., beziehungsweise OECD (1998b), Seite 279 ff.). Unter ökonomischer Regulierung versteht man dabei die traditionelle Regulierung von Marktergebnissen und Marktformen in Sektoren mit steigenden Skalenerträgen, die den Wettbewerb im Wege der Bildung eines natürlichen Monopols eliminiert haben. Historisch gesehen bildet die Korrektur von Monopolpreisen bei gegebener Marktform den Schwerpunkt dieses traditionellen Zweiges der Theorie der Regulierung. Als weiterer wichtiger Aspekt ist die Regulierung der Marktform durch die staatlich verordnete Öffnung der Monopolmärkte für den Wettbewerb anzuführen. Hingegen wird die qualitative Regulierung, wie sie zum Beispiel im Gesundheitsmarkt und im Umweltbereich durchgeführt wird, sowie die Sicherung der Produktqualität auf Märkten, die mit besonderen Risiken und Informationsproblemen verbunden sind, der sozialen Regulierung zugeordnet. Im Rahmen dieser Arbeit wird auf die begriffliche Unterscheidung von ökonomischer und sozialer Regulierung verzichtet. Auch die Qualität von Gütern ist letztlich eine Facette des Marktergebnisses und ebenso das Ergebnis einer ökonomischen Entscheidung wie der Preis beziehungsweise die Produktionsmenge (vgl. die Abbildung 11.1). Ferner werden beide Arten der Regulierung dadurch gerechtfertigt, dass das Verhalten der Wirtschaftsakteure ohne einen regulatorischen Eingriff nicht mit den wohlstandstheoretischen und somit sozialen Zielsetzungen in Einklang steht. Entsprechend beruht die Einteilung in eine ökonomische und eine soziale Regulierung lediglich auf einer unterschiedlich starken Gewichtung von Komponenten, die in bei den Regulierungsarten vorhanden sind. Das Verständnis von Regulierung als Beeinflussung der Marktergebnisse, der Marktform und des Marktverhaltens betont eine Eigenschaft der Regulierung, die zugleich die Abgrenzung gegenüber der öffentlichen Auftragsvergabe darstellt. Wie Laffont, Tirole (1993), Seite 9, darlegen, besteht bei einer Regulierung die eigentliche wirtschaftliche Beziehung zwischen den Anbietern und den Nachfragern eines Gutes. Der Staat versucht, dieses wirtschaftliche Verhältnis zu beeinflussen, ist aber selbst weder Nachfrager, noch übernimmt er die Rolle des Anbieters. Hingegen ist eine öffentliche Auftragsvergabe dadurch charakterisiert, dass der Staat als Nachfrager auftritt. In diesem Zusammenhang ist auf den Sonderfall der Regulierung hinzuweisen, der in der Abbildung 11.1 als Versteigerung von Lizenzen aufgeführt ist. Im Beispiel

10

Kapitel II Regulierung als Problem der optimalen Kontrolle

"'2"'

.!!

:;

~

Abbildung 11.1: Systematik zum Begriff der Regulierung. Die Beschränkung der Rentabilität wird hier der Preisregulierung zugeordnet, da die Festlegung der zulässigen Rentabilität selbst nur ein Zwischenschritt bei der Fixierung der zulässigen Preise ist (vgl. die Seite 19.) Unter Anreizsystemen werden Regulierungen verstanden, die statt zwingender Vorschriften zum Beispiel durch entsprechende Subventionen Ameize geben, sich im Einklang mit den gesellschaftlich erwünschten Zielen zu verhalten. Beispiele hierfür sind die Modelle von Loeb, Magat (1979) und Sappington, Sibley (1988). Die öffentlich Lizenzvergabe erfolgt mit dem Ziel, den Wettbewerb im Markt durch einen Wettbewerb um einen Markt, etwa durch Versteigerungen von Lizenzen, zu ersetzen.

der Versteigerung von UMTS-Lizenzen liegt auf der einen Seite ein Angebotsmonopol vor. Der Staat bietet als einziger Marktteilnehmer Lizenzen an, während verschiedene Unternehmen um diese Lizenzen wie um einen Produktionsfaktor konkunieren. Auf diese Weise wird im Wege der Regulierung die Zahl der Unternehmen als Anbieter von Dienstleistungen auf dem Tele-

1 Theorie der Regulierung

11

kommunikationsmarkt begrenzt. Der Staat verhindert das befürchtete Monopol, indem er ein Oligopol schafft, wobei er gleichzeitig die Monopolrente auf dem vorgelagerten Markt für Lizenzen einstreicht. Hier legt der Staat die Regeln fest, nach der die Auktion verläuft, und die Bedingungen, die für den Erhalt einer Lizenz erfüllt werden müssen. Der Staat verfügt damit über eine Position, die er in seiner Funktion als Wettbewerbshüter, auf anderen Märkten bekämpft.

1.2

Argumente rür die Regulierung

Die Definition der allgemeinen Regulierung verlangt, eine Grundordnung zu schaffen, die einen möglichst reibungslosen Ablauf des Wirtschaftslebens garantiert. Während die allgemeine Regulierung im Prinzip jedes Wirtschaftssubjekt gleichermaßen trifft, sind spezielle Regulierungen dadurch charakterisiert, dass sie nur bestimmte Märkte beeinflussen und somit keine all-

gemeingültigen Regeln vorsehen. Als Beispiel für diese Unterscheidung ist das Gesetz gegen Wettbewerbsbeschränkungen (GWB) anzuführen. Zunächst existiert ein allgemeines Kartellverbot (GWB §l), das alle Unternehmen gleichermaßen trifft. Darüber hinaus gibt es aber bestimmte Kartellarten, die von dieser generellen Regelung ausgenommen sind und die lediglich einer Anmeldepflicht oder einer Genehmigungspflicht unterliegen (§§2-8 GWB). Eine herausragende Stellung nehmen die sogenannten Sonderkartelle nach §8 GWB ein. Nach diesem Paragraphen kann der Bundesminister für Wirtschaft auf Antrag Kartelle erlauben, sofern diese Erlaubnis aus Gründen der Gesamtwirtschaft und des Gemeinwohls notwendig ist. Wie in diesem Beispiel stellt sich letztlich in allen Fällen einer speziellen Regulierung die Frage, was eine Sonderbehandlung von einzelnen Unternehmen beziehungsweise einzelnen Märkten rechtfertigt. Um diese Frage zu beantworten, werden im Folgenden wesentliche Argumente dargelegt, mit denen spezielle Regulierungen begründet werden. Zur Rechtfertigung von speziellen regulatorischen Eingriffen in das Marktgeschehen wird zumeist angeführt, dass der Markt in einigen Situationen versagt und nicht in der Lage ist, Güter und Produktionsfaktoren effizient zu allozieren, so dass sich keine pareto-optimale Allokation einstellt (Spulber (1989), Seite 3, Ledyard (1998) beziehungsweise Noll (1989)). In diesem Zusammenhang ist allerdings zu bedenken, dass ein solches Versagen für sich genommen zwar eine notwendige Bedingung für eine Regulierung sein mag, jedoch keineswegs hinreichend für einen erfolgreichen Eingriff in das Marktgeschehen ist. So sind auch die mit der Regulierung verbundenen Kosten im Sinne von Verwaltungskosten und Ineffizienzen, wie zum Beispiel eine Verzerrung der kostenminimalen Faktorallokation und die entsprechenden Kosten durch erforderliche Folgeeingriffe zu berücksichtigen (vgl. die Seite 23 ff.). Einen Überblick über verschiedene Regulierungskosten im Sinne von Verwaltungskosten der Behörde oder Kosten der

Kapitel II Regulierung als Problem der optimalen Kontrolle

12

Informationsaufdeckung findet sich zum Beispiel in Needham (1982), Seite 73 ff. Des Weiteren sind Rückwirkungen auf unregulierte Märkte zu beachten. Beispielsweise versuchen Mehrproduktunternehmen Marktrnacht durch Quersubventionen bei bestimmten Gütern aufzubauen oder zu verfestigen. In jedem Fall löst die Preisregulierung Kreuzpreiseffekte auf substitutive oder komplementäre Güter aus. Als Ursachen für Marktversagen werden die verschiedensten Tatbestände genannt. Beispielsweise können potenzielle Anbieter einen Markt auf Grund bestimmter Barrieren nicht betreten oder sie werden gezwungen, den Markt zu verlassen, weil die Produktionstechnik eines übermächtigen Konkurrenten die Produktion zu geringeren Durchschnittskosten erlaubt. Neben Markteintrittsschranken und natürlichen Monopolen werden fehlende Informationen oder auch die Existenz externer Effekte angeführt. Alle genannten Beispiele implizieren Resultate. in denen das allokative Marktergebnis die Bedingungen einer effizienten Marktlösung nicht erfüllt. In solchen Situationen wird regelmäßig der Ruf nach staatlichen Eingriffen laut. wobei keineswegs sichergestellt ist, dass die ergriffenen Maßnahmen zu einem besseren Ergebnis führen. Häufig scheitern die regulierenden Eingriffe schon daran. die korrekte Ursache für das Marktversagen zu diagnostizieren. Bei korrekter Analyse lassen sich jedoch eine Reihe von Argumenten für eine Regulierung anführen.

Marktmacht im natürlichen Monopol

Das Charakteristikum eines natürlichen Monopols

besteht darin. dass die gesamte Produktionsmenge x durch ein einziges Unternehmen zu geringeren Kosten hergestellt werden kann. als wenn die Produktion auf mehrere Unternehmen verteilt wird. Diese Eigenschaft der Kostenfunktion 2 c(x) heißt strenge Subadditivität und liegt vor. wenn für alle Outputmengen

Xl • ••••

x" mit xi #= x für

j

=

1..... k und L~;I xi

= x die

Relation c(x) < L~;I c(x i ) gilt (vgl. Baumol. Panzar. Willig (1982). Seite 17). Das Problem. ein natürliches Monopol nachzuweisen. liegt in dem Informationsbedarf. der erforderlich ist. um die Subadditivität einer Kostenfunktion zu überprüfen. So verlangt die Subaddititivität. dass die Produktion der Menge x durch ein Unternehmen weniger Kosten verursacht als jede andere mögliche Kombination von Produktionsmengen mehrerer Unternehmen. Um die Überprüfung dieser Bedingung zu erleichtern. versuchen Baumol. Panzar, Willig (1982) die Eigenschaft der Subadditivität der Kostenfunktion auf andere Eigenschaften der Kostenfunktion beziehungsweise auf Eigenschaften der Produktionsfunktion zurückzuführen. Ihre Analyse für den Fall des Einproduktunternehmens ergibt. dass steigende Skalenerträge bei to2

Die statische Kostenfunktion eines Unternehmens gibt die minimalen Kosten der Produktion einer Menge x bei gegebenen Faktorpreisen q an und wird üblicherweise mit c(q, x) bezeichnet. Im Folgenden wird die Abhängigkeit der Kostenfunktion von den Faktorpreisen q bei der Schreibweise der Funktion unterdrückt, da die Abhängigkeit der Funktion vom Output im Vordergrund der Diskussion steht und die Fakrorpreise nicht variiert werden.

13

I Theorie der Regulierung

taler Faktorvariation hinreichend (aber nicht notwendig) für fallende Durchschnittskosten und damit hinreichend (aber nicht notwendig) für die Existenz eines natürlichen Monopols sind. Mit anderen Worten kann ein Unternehmen ein natürliches Monopol sein, ohne dass die Produktion dieses Gutes mit fallenden Grenzkosten oder fallenden Durchschnittskosten verbunden ist. Liegen diese Eigenschaften jedoch vor, so ist die Kostenfunktion auf jeden Fall subadditiv, und es handelt sich bei dem Unternehmen um ein natürliches Monopol. Mit den obigen Ausführungen liegt zwar eine Ursache vor, wann ein Unternehmen ein natürliches Monopol innehat, allerdings ergibt sich damit noch keine Rechtfertigung für die Notwendigkeit eines regulatorischen Eingriffs. Immerhin fallen die durchschnittlichen Produktionskosten bei steigender Nachfrage, so dass die Konsumenten mit sinkenden Preisen rechnen dürfen. Geht man von einer subadditiven Kostenfunktion aus, dann wird die Versorgung der Haushalte im Monopol zu minimalen Durchschnittskosten sichergestellt. Regulierende Eingriffe zielen dann nicht darauf ab, diese Marktform zu verändern. Wenn der Monopolist jedoch die Preis-Absatz-Funktion p(x) kennt, impliziert das gewinnmaximierende Verhalten des Unternehmens eine Abweichung vom Marktergebnis bei vollständiger Konkurrenz, das durch die Gleichheit von Preis und Grenzkosten charakterisiert ist. 3 Da der Monopolist den Preis festlegen kann, wird das Unternehmen die notwendige Bedingung für ein Gewinnmaximum p/x(dp/dx

+ I) = dc/dx realisieren und damit den Cournot-Punkt C auf der Preis-Absatz-

Funktion in der Abbildung 11.2 (Seite 14) wählen. Als Marktergebnis stellt sich somit eine geringere Menge (x m < x*) und ein höherer Preis (Pm > pO) ein, als wenn der Preis entsprechend der Preis-Absatz-Funktion gleich den Grenzkosten gesetzt wird. Das Unternehmen erwirtschaftet dadurch eine Monopolrente, die der oberen schraffierten Fläche in der Abbildung II.2 entspricht. Aus Sicht der Regulierungsbehörde besteht ein möglicher Ansatz darin, das Unternehmen zu zwingen, sich so zu verhalten, als ob vollständige Konkurrenz herrscht. Das Unternehmen wird entsprechend dazu verpflichtet, den Preis in Höhe der Grenzkosten zu setzen und damit den Punkt (p*, x*) zu realisieren. Diese Lösung ist jedoch bei fallenden Durchschnittskosten mit dem Problem verbunden, dass die Unternehmung einen Verlust in der Höhe der unteren schraffierten Fläche in der Abbildung 11.2 erwirtschaftet und somit langfristig den Markt verlassen wird. Hingegen impliziert eine regulierte Preissetzung in Höhe der Durchschnittskosten, dass der Preis gegenüber der unregulierten Monopollösung so gesenkt wird, dass der Gewinn des Monopolisten Null ist (Punkt (p', J

x'».

Wie Machlup (1965) betont. stimmt die Kostenfunktion im Fall des Monopols nicht zwingend mit der Situation bei vollständiger Konkurrenz überein (vgl. Machlup (1965), Seite 439). Um die Vergleichbarkeit der Monopolsituation mit dem Fall der VOllständigen Konkurrenz sicherzustellen, wird angenommen, dass die aggregierte Grenzkostenkurve vieler kleiner Anbieter der Grenzkostenkurve des Monopolisten entspricht (vgl. Schumann, Meyer, Ströbele (1999), Seite 281.).

Kapitel Il Regulierung als Problem der optimalen Kontrolle

14 p,

dcjdx, cjx, dejdx,

o

x'

x'

x

Abbildung I1.2: Marktergebnis im Fall des natürlichen Monopols Die vorstehende traditionelle Sichtweise des Monopols basiert auf der Vorstellung, dass ein Unternehmen, das seine Preis-Absatz-Kurve kennt, eine hohe Monopolrente zu Lasten der Konsumenten erwirtschaften wird, sofern die Regulierungsbehörde nicht korrigierend in die Preissetzung eingreift. Eine gewinnlose Situation kann hier scheinbar nur durch die Regulierung, aber nicht durch die Marktkräfte selbst hergestellt werden. Geht man allerdings davon aus, dass auf einem Markt potenzielle Konkurrenz herrscht, so werden übermäßige Monopolrenten gegebenenfalls durch den Marktmechanismus selbst reduziert (vgl. Baumo!, Panzar, Willig (1982)). Ein vollkommen bestreitbarer Markt ist dadurch charakterisiert, dass der Markteintritt und der Austritt aus dem Markt einfach und kostenlos möglich ist. Ferner haben die eintretenden Unternehmen Zugriff auf die gleichen Produktionstechniken wie bereits etablierte Unternehmen, und sie stehen derselben Marktnachfrage gegenüber wie die etablierten Unternehmen. Unter diesen Annahmen ist jeder positive Stückgewinn mit der Drohung verbunden, dass potenzielle Konkurrenten in den Markt eintreten und das etablierte Unternehmen verdrängen, indem sie einen niedrigeren Preis realisieren. Der Monopolist kann dieser Gefahr nur entgehen, wenn er den Preis auf Dauer so niedrig setzt, dass keine übermäßigen Gewinne entstehen. Der Preis darf also nicht wesentlich über den Durchschnittskosten liegen. Anders formuliert ist eine Monopolrente auch im Fall eines natürlichen Monopols nur dann dauerhaft aufrechtzuhalten, wenn Markteintrittsschranken beziehungsweise Marktaustrittsbarrieren existieren, die eine potenzielle Konkurrenz ausschalten. Solche Barrieren werden dadurch hervorgerufen, dass der Markteintritt eines neuen Unternehmens mit Kosten verbunden

I Theorie der Regulierung

15

ist, die für ein bereits etabliertes Unternehmen nicht mehr anfallen (vgl. Spulber (1989), Seite 43). Angesichts alternativer Regulierungsmöglichkeiten von Monopolen ist somit festzuhalten, dass Eingriffe der Regulierungsbehörde in die Preissetzung keine marktkonformen Maßnahmen darstellen. Hingegen besteht eine ursachenadäquate Maßnahme darin, die Bestreitbarkeit des Marktes zu fördern, um so den Handlungsspielraum des Monopolisten durch potenzieIlen Wettbewerb indirekt einzuschränken. Dadurch wird dem Monopolisten keine unmittelbare Verhaltensregel vorgegeben, aber die potenzieIle Konkurrenz zwingt das Unternehmen, das von ihm präferierte Marktergebnis dem Resultat bei voIlständiger Konkurrenz anzunähern. Die Identifikation von Unternehmen als natürliche Monopole und die dadurch bedingte Kostensenkung durch die BereitsteIlung von Gütern durch ein Monopol im Vergleich zur Aufteilung der Produktion auf mehrere Unternehmen hat in der Vergangenheit dazu gedient, regulatorische Eingriffe in diese Märkte zu begründen. Diese Maßnahmen haben in der Vergangenheit zumeist nicht darauf abgezielt, den Wettbewerb in diesen Bereichen zu fördern, sondern bei gegebener Marktform die Preise, die Mengen und die Qualität der Güter zu beeinflussen. Die Regulierung wird hier als Mittel gesehen, die Effizienzvorteile des natürlichen Monopols zu wahren, wobei gleichzeitig versucht wird, den Missbrauch von Marktrnacht zu Lasten der Konsumenten zu vermeiden (vgl. Noll (1989), Seite 1256). Selbstverständlich darf in vielen Fällen bezweifelt werden, dass es sich bei einem Monopol tatsächlich um ein "natürliches" Monopol handelt. Ferner werden die Kostenersparnisse durch eine potenzielle Subadditivität angesichts der Verluste an Konsumentenrente im Monopol gegenüber dem Fall der vollständigen Konkurrenz in der heutigen Zeit verstärkt hinterfragt. In diesem Zusammenhang ist auch darauf hinzuweisen, dass bei Netzwerken zwischen dem Betrieb eines Netzwerkes und der Bereitstellung von Dienstleistungen durch Nutzung eines Netzes unterschieden werden kann. Wenn auch der Betrieb eines Netzwerkes durch Subadditivität gekennzeichnet sein kann und somit die Bereitstellung des Netzes selbst durch ein Monopol effizient ist, ist die Nutzung des bestehenden Netzes bei der Bereitstellung von Dienstleistungen wie Strom oder Telekommunikation gegebenenfalls nicht durch eine subadditive Kostenfunktion charakterisiert. Vielmehr kann die gemeinsame Nutzung eines Netzes durch mehrere Unternehmen einen effizienten Einsatz von vorhanden Kapazitäten ermöglichen. Einige traditionelle Monopolmärkte sind daher für den Wettbewerb geöffnet worden, oder man versucht, die Bestreitbarkeit dieser Märkte zu fördern. Dennoch ist zu beobachten, dass auf diesen Märkten weiterhin einzelne oder auch mehrere Unternehmen existieren, die über signifikante Marktrnacht verfügen. Entsprechend haben sie die Möglichkeit, die Preise und damit auch die Höhe ihres Gewinns zu ihren Gunsten zu gestalten.

Kapitel II Regulierung als Problem der optimalen KontroIle

16

Bei der Rechtfertigung regulatorischer Eingriffe zur Beeinflussung der Marktergebnisse ist allerdings zu beachten, dass die Marktmacht aus bestehenden Markteintrittsschranken resultiert und nicht die eigentliche Ursache für ein Versagen des Marktes darsteIlt. Entsprechend ist zu prufen, ob Maßnahmen, die mit der Einschränkung von Marktrnacht gerechtfertigt werden, lediglich versuchen, ein Symptom für eine Fehlfunktion zu heilen. Häufig wird man feststeIlen, dass die tatsächliche Ursache des Problems, nämlich die fehlende potenzieIle Konkurrenz, nicht korrigiert wird. Negative externe EtTekte

Ein traditioneIles Argument, das dazu dient, Maßnahmen der Re-

gulierung zu rechtfertigen, findet man in Breyer, MacAvoy (1998) beziehungsweise Noll (1989), Seite 1256. Die Autoren führen negative externe Effekte an, bei denen Kosten für unbeteiligte Dritte entstehen, die nicht im individuellen Entscheidungskalkül der anbietenden beziehungsweise nachfragenden Marktteilnehmer berucksichtigt werden. Häufig muss die gesamte Gesellschaft solche zusätzlichen Kosten tragen, so dass der Marktpreis bei Vernachlässigung dieser Kosten unter dem Preis liegt, der im Sinne des Wohlstands optimal ist. Solche Argumente werden regelmäßig angeführt, um Eingriffe auf dem Gebiet der Umweltökonomik zu rechtfertigen. Eine ursachenadäquate Regulierung muss an dem individuellen Entscheidungsproblem ansetzen, so dass die tasächlichen Kosten bei der Preisfindung berucksichtigt werden. Stellt man fest, dass die Internalisierung der Kosten zu prohibitiv hohen Marktpreisen führt, dann lassen sich auch direkte Eingriffe wie etwa Verbote rechtfertigen. Unvollkommene Information und hohes Risiko

Eine andere Begrundung für Regulierun-

gen hebt darauf ab, dass Entscheidungen bei unvollkommener beziehungsweise asymmetrischer Information getroffen werden und gegebenenfalls mit einem sehr hohen Risiko verbunden sind. Das Argument der asymmetrischen Information bezieht sich zum einen auf Situationen, in denen eine Vertragspartei einen Informationsvorteil bezüglich der Art des angebotenen Gutes besitzt, den sie zu ihren Gunsten ausnutzen kann. Die Gefahr, dass sich eine Vertrags partei wider die guten Sitten verhält, bezeichnet man im Englischen als moral hazard. Betrifft das Informationsdefizit die Eigenschaften der angebotenen Güter, so ergibt sich das Problem der adversen Selektion. Wie Akerlof (1974) darstellt, können solche Informationsdefizite bis hin zu einem Zusammenbruch des Marktes führen. Entsprechend werden regulatorische Eingriffe damit begründet, die Informationsdefizite und damit das Risiko der Wirtschaftsakteure zu begrenzen. Der Staat tritt in solchen Fällen zum Teil als Informant auf (Stiftung Warentest) oder verpflichtet die Marktteilnehmer, bestimmte Informationen offenzulegen. Darüber hinaus lassen sich Informationsdefizite über Mindeststandards und Zulassungsverfahren mildern, die dem Nachweis der Befahigung der Akteure dienen.

1 Theorie der Regulierung

17

Schließlich wird die bewusste Ausnutzung interner Information im Wege der Produkthaftung unter Strafe gestellt, so dass ein desinformierter Vertragspartner vor einem willkürlichen Risiko geschützt wird (vgl. Noll (1989), Seite 1256). In anderen Bereichen wird unterstellt, dass Individuen selbst nicht in der Lage sind, einige Risiken korrekt einzuschätzen, wie zum Beipiel im Bereich der Krankenversicherung oder der Rentenversicherung. Statt die Entscheidung über den Versicherungsschutz dem Individuum selbst zu überlassen, wird den Individuen eine Versicherungspflicht auferlegt. Fazit

Die vorgestellten Aspekte liefern einen Überblick über verschiedene Argumente, die zur

Rechtfertigungen für regulierende Eingriffe in das Marktgeschehen herangezogen werden. Beschrieben werden jeweils Eigenschaften der Produktionsprozesse, der Güter und der Entscheidungssituationen, die implizieren, dass das Marktergebnis ohne einen regulatorischen Eingriff von dem wohlstandsmaximierenden Resultat abweicht. Wie bereits angesprochen worden ist, stellt ein solches Markversagen keine hinreichende Bedingung für den Erfolg eines staatlichen Eingriffes dar (vgl. Noll (1989), Seite 1258 ff. sowie Posner (1974), Seite 336). Vielmehr sind den Ineffizienzen der Marktlösung die Kosten der staatlichen Eingriffe gegenüber zu stellen, die ebenso mit Unvollkommenheiten verbunden sind. So sind je nach Ausgestaltung einer Regulierungsmaßnahme Rückwirkungen auf die Wahl der eingesetzten Faktormengen, die Anreize zur Innovation und Kosteneffizienz sowie die Effekte auf Märkten für komplementäre und substutionale Güter einzubeziehen. Die zuvor diskutierten Aspekte dienen dazu, die Regulierung mit dem allgemeinen öffentlichen Interesse zu rechtfertigen. Die Regulierung soll ein Marktversagen korrigieren und somit zur Steigerung des gesellschaftlichen Wohlstands beitragen. Eine andere Sichtweise wird zum Beispiel von Stigler, Friedland (1962), Stigler (1971) beziehungsweise Peltzman (1976) vertreten. Sie gehen davon aus, dass staatliche Regulierung dort entsteht, wo organisierte Interessengruppen durch die Regulierung eine Umverteilung zu ihren Gunsten bewirken können. Regulierungen werden dann nicht maßgeblich durch die Interessen der Allgemeinheit, sondern der jeweiligen Interessengruppe und damit gegebenenfalls auch durch die regulierten Unternehmen selbst geprägt. Während Stigler (1971) das Interesse der regulierten Unternehmen an der Ausgestaltung der Reguliemng in den Vordergrund stellt, wird in anderen Ansätzen dargelegt, dass die Regulierungsbehörde selbst Eigeninteressen verfolgt, die nicht mit der Maximierung des gesellschaftlichen Wohlstandes übereinstimmen (vgl. Niskanen (1971), Seite 36 ff.). Einen Überblick über die hier angesprochenen Zielsetzungen der verschiedenen Akteure in regulierten Märkten bieten zum Beispiel Posner (1974), Mitnick (1980), Noll (1989) sowie Graack (1997), Seite 90 ff.

18

Kapitelll Regulierung als Problem der optimalen Kontrolle

1.3 Instrumente der Regulierung 1.3.1

Überblick über die Instrumente

Vor dem Hintergrund der dargelegten Argumente für eine Regulierung werden nun verschiedene Instrumente vorgestellt, die bereits in der Abbildung 11.1 auf der Seite 10 benannt worden sind. Zum Verständnis der zu Grunde liegenden Systematik ist daran zu erinnern, dass das jeweilige Gliederungsmerkmal (Marktergebnis, Marktform und Marktverhalten) und die untergeordneten Punkte (Preis, Menge, ... ) das vorrangige Objekt der Regulierung bezeichnet. Darüber hinaus können Rückwirkungen auf die jeweils anderen Aspekte auftreten. Beginnt man mit der Beeinflussung des Marktergebnisses bei einer gegebenen Marktform, so ist zwischen solchen Instrumenten zu unterscheiden, die bei den Preisen ansetzen und denjenigen, die die produzierten beziehungsweise angebotenen Mengen beziehungsweise ihre Qualität betreffen. Wie im Rahmen des Abschnitts 1.2 erläutert worden ist, werden Regulierungen insbesondere damit begründet, dass die beobachteten Marktergebnisse von den theoretischen Resultaten bei vollständiger Konkurrenz abweichen. Ist der Markt im Fall des Monopols nicht bestreitbar, so wird der Cournot-Punkt realisiert. Damit werden die Konsumenten mit einer geringeren Menge zu einem höheren Preis als bei vollständiger Konkurrenz versorgt. 4 Regulatorische Eingriffe versuchen daher, den Monopolisten dazu zu bewegen, eine größere Menge zu einem niedrigeren Preis anzubieten. Damit nähert man sich dem Marktergebnis bei vollständiger Konkurrenz und reduziert gleichzeitig die Monopolrente, die sich das Unternehmen auf Kosten der Konsumenten angeeignet hat. Vor diesem Hintergrund versuchen Regulierungsbehörden zum Beispiel Preise zu setzen, die sich an bestimmten Kostengrößen orientieren. Damit befindet sich die Behörde in einer typischen Prinzipal-Agent-Situation; die Behörde besitzt als regulierende Instanz keine Informationen über die wahren Kosten der Unternehmung. Die Unternehmung hat selbst aber keinen Anreiz, die tatsächlichen Kosten offenzulegen. Entsprechend setzen sich einige theoretische Arbeiten mit den Versuchen auseinander, einen Anreizmechanismus zu etablieren, so dass das Unternehmen freiwillig die tatsächlichen Kosten aufdeckt (vgl. Seite 20). Ein weiteres Problem besteht darin, dass die Regulierungsmaßnahme selbst Rückwirkungen auf das Verhalten des regulierten Unternehmen hat. Ein Unternehmen, das durch eine Regulierung gezwungen ist, kostenorientierte Preise zu setzen, besitzt einen verminderten Anreiz zur Kostenminimierung und wird gegebenenfalls keine effiziente Produktionsaktivität realisieren beziehungsweise keine kostenminimierende Technologie einsetzen (vgl. Spulber (1989), Seite 134 ff.). Werden die Preise zum Beispiel nicht kontinuierlich, sondern in diskreten Zeitabständen festgelegt, besitzt das Unternehmen im Zeitraum zwischen zwei Preisänderungen zu"Um die Vergleichbarkeit der beiden Situationen sicherzustellen. wird angenommen, dass die aggregierte Grenzkostenkurve vieler kleiner Anbieter mit der Grenzkostenkurve des Monopols übereinstimmt.

1 Theorie der Regulierung

19

nächst einen Anreiz, sein Verhalten unter Berücksichtigung der jeweils geltenden Regulierungsmaßnahme zu ändern. So kann es vorteilhaft sein, in der Zeit unmittelbar nach einer Preisanpassung kostenminimierend zu arbeiten. Kurz vor der nächsten Verhandlungsrunde mit der Behörde wird der Anreiz, kostenminimal zu produzieren, nachlassen, denn die Unternehmung versucht für die nächste Periode einen Preis durchzusetzen, der über den durchschnittlichen Kosten und möglichst nah beim Cournotschen Punkt liegt. Das Unternehmen kann auf diese Weise für einen jeweils begrenzten Zeitraum eine höhere Produzentenrente abschöpfen (vgl. zum Beispiel Sappington (1973». Diese dynamischen Effekte einer Regulierung, die nicht kontinuierlich, sondern in diskreten Abständen an das Verhalten der Unternehmung angepasst wird, werden an späterer Stelle detailliert diskutiert. Ein traditionelles Kriterium, das bei der Festlegung von Preisen angewendet wird, bezieht sich auf die faire Rentabilität. Dieses Instrument stellt die Standardform der Regulierung von Versorgungsunternehmen in den USA dar (vgl. OECD (1998a), Seite 185). Die Behörde ist im Fall der Regulierung der Rentabilität bestrebt, einerseits einen Preis zu setzen, der es dem Unternehmen als Kapitaleigentümer zwar ermöglicht, eine zureichende Verzinsung des eingesetzten Kapitals zu erwirtschaften, und andererseits zu hohe Monopolrenten zu vermeiden. Die Funktionsweise und die besondere Problematik dieser Regulierung, die sich aus der resultierenden Verzerrung des Faktoreinsatzes ergibt, wird im Abschnitt 1.3.2 erläutert. Diese Regulierungsform bildet später den Ausgangspunkt für die ModelIierung der Regulierung im dynamischen Kontext. Hinsichtlich der Einordnung des Instrumentes zur Beschränkung der Rentabilität in die Abbildung 11.1 auf der Seite 10 ist anzumerken, dass die Eliminierung der Monopolrente durch eine beschränkte Rentabilität umgesetzt wird, indem Preise festgelegt werden, die gerade die faire Rentabilität verwirklichen sollen. Das Instrument stellt also keine Regulierung des Betriebsapparates und damit der Kapitalintensität dar, wie es die ModelIierung der zugehörigen etabilierten Modelle nahelegt, sondern ist vielmehr eine Spielform der Preisregulierung. Diese Kritik an der üblichen ModelIierung wird beispielsweise von Klevorick (1971) hervorgebracht. Dennoch impliziert die konkrete Ausgestaltung dieser Regulierungsform Auswirkungen auf das Verhältnis der eingesetzten Produktionsfaktoren, wie sie bereits in Averch, Johnson (1962) diskutiert werden. Eine weitere Form der Preisregulierung besteht in der Vorgabe von Preisobergrenzen, die sich an den Kosten orientieren oder an die Inflationsrate gekoppelt sind. Gemäß OECD (1998a), Seite 185, stellt die Koppelung der zulässigen Preisobergrenze an die Inflationsrate das übliche Instrument zur Regulierung von Versorgungsunternehmen in Großbritannien dar. Das Ziel besteht darin, Nachfrager vor übermäßigen Preissteigerungen zu schützen, wobei die maximale Preiserhöhung von Änderungen der Faktorkosten beziehungsweise der Inflationsrate abhängt (vgl. hierzu Kalt (1981) und Joskow (1981)). Auch diese Maßnahme zielt darauf ab, dem Un-

20

Kapitel 11 Regulierung als Problem der optimalen Kontrolle

ternehmen eine faire Produzentenrente zu ermöglichen, ohne die Preise zu stark zu Lasten der Konsumenten zu erhöhen. Die regulierende Preissetzung erfolgt zumeist mit der Zielsetzung, solche Preise zu realisieren, die sich in einer Situation der Als-ob-Konkurrenz gebildet hätten. Dieses Vorgehen ist mit dem Problem behaftet, dass solche Marktergebnisse rein fiktiv sind. Als Ausweg bezieht man sich zum Beispiel auf Richtwerte, die sich aus einern entsprechenden Ländervergleich ergeben. Dabei ist für eine sinnvolle Anwendung solcher Richtwerte vorauszusetzen, dass in den betrachteten Ländern ähnliche Produktionstechniken und Nachfrageverhältnisse vorliegen. Wie bereits erwähnt worden ist, stellt sich bei einer Regulierung des Preises regelmäßig das Problem, wie die Regulierungsbehörden die Informationen über die Kostenfunktion der Unternehmung erlangt. Denn das Unternehmen hat bei den diskutierten Regulierungsinstrumenten keinen Anreiz, die wahren Kosten offenzulegen. Angesichts dieser Problematik sind in der Literatur verschiedene Regulierungsverfahren diskutiert worden, die auf das Unternehmen einen Anreiz ausüben, sich im Einklang mit gesellschaftlichen Zielsetzungen zu verhalten. Dieses Ziel soll jeweils dadurch erreicht werden, dass die Preissetzung dem Unternehmen überlassen ist. Gleichzeitig wird das Unternehmen durch eine Subvention belohnt, wenn es den Wohlstand der Konsumenten verbessert, der über die Konsumentenrente gemessen wird. Um die Finanzierbarkeit einer solchen Lösung zu gewährleisten, schlagen zum Beispiel Loeb, Magat (1979) vor, die Produktionsrechte mittels einer Auktion zu vergeben, durch die die Rente des Unternehmens zuvor abgeschöpft wird. Die Diskussion dieser Ansätze geht zurück auf den bereits angesprochenen Aufsatz von Loeb, Magat (1979) sowie Sappington, Sibley (1988) und Finsinger, Vogelsang (1981), beziehungsweise Finsinger, Vogelsang (1985). Eine Übersicht über diese Verfahren wird in Train (1991), Seite 175 ff. gegeben. Die bisher vorgestellten Verfahren zielen einerseits darauf ab, die Preise, die aus der Sicht der Regulierungsbehörde zu hoch sind, zu reduzieren. Andererseits wird versucht, zu starke Preiserhöhungen einzuschränken. Eine entgegengesetzte Zielsetzung wird durch Mindestpreise verfolgt, deren Aufgabe darin gesehen wird, die Angebotsseite zu schützen, indern Preise oberhalb des unregulierten Marktgleichgewichtes festgelegt werden. Analog implizieren diese Eingriffe, dass der Markt nun nicht mehr geräumt wird. Die entsprechenden Angebotsüberschüsse muss der Staat abschöpfen, damit der Preis bestehen bleiben kann und nicht unterboten wird. Ergänzend ist anzumerken, dass die jeweiligen Instrumente bislang losgelöst von einern Optimierungskalkül der Regulierungsbehörde vorgestellt worden sind. Verfolgt die Regulierungsbehörde das Ziel, den Wohlstand zu maximieren, dann können sich die optimalen Preise für ein Unternehmen, das mit steigenden Skalenerträge produziert, nicht mehr an den Grenzkosten orientieren. Die optimalen Preise müssen vielmehr oberhalb der Durchschnittskosten liegen. Nur

I Theorie der Regulierung

21

so lässt sich sicherstellen, dass das Unternehmen keine Verluste erwirtschaftet. Diese Preise stellen die Lösung eines recht komplexen Optimierungskalküls dar, das der Theorie des Zweitbesten zuzuordnen ist. Zu dieser Theorie existiert eine umfangreiche Literatur, die in Spulber (1989), Seite 159 ff., zusammengefasst wird. Leider sind die Möglichkeiten der Regulierungsbehörde, wohlstandsmaximierende Preise zu ermitteln, durch die eingeschränkten Informationen sehr beschränkt. Die angesprochenen Verfahren wie die Setzung kostenorientierter Preise, die Orientierung an Ländervergleichen und die Regulierung durch die Beschränkung der Rentabilität sind heuristischer Natur. Die Ansätze helfen der Behörde, ihre Informationsdefizite zu überwinden. Man hofft, auf diese Weise die Folgen eines Marktversagens abmildern zu können. Ob und inwieweit die Regulierung in der Lage ist, die vorgefundene Situation zu verbessern, bleibt ungeklärt. Während die zuvor diskutierten Instrumente der Regulierung des Preises zuzurechnen sind, betreffen die folgenden Ausführungen die Regulierung der angebotenen beziehungsweise nachgefragten Menge eines Gutes. Solche Maßnahmen zur mengenmäßigen Regulierung umfassen zunächst Beschränkungen der jeweiligen Mengen, zum Beispiel durch Vorgabe von Quoten, die die Marktteilnehmer nicht überschreiten dürfen. Eine andere Form der Mengenregulierung stellt die Verpflichtung zu einer Grundversorgung aller Teilnehmer dar. Mengenmäßige Vorgaben werden häufig begleitend zu anderen Instrumenten eingesetzt und zwar insbesondere in Kombination mit Maßnahmen zur Preisregulierung. So sind Preisregulierungen bei Monopolen in der Regel mit der Auflage verbunden, die resultierende Nachfrage zu decken. Ein traditionelles Beispiel bezieht sich auf die Grundversorgung von Teilnehmern mit Netzwerkleistungen (Elektrizität, Telekommunikation, Post, ... ), die der Betreiber auch außerhalb von Ballungsräumen sicherstellen muss. Neben der Menge und dem Preis eines Gutes wird außerdem versucht. die Qualität eines Gutes zu korrigieren. Diese Form der Regulierung wird regelmäßig mit Informationsnachteilen einer Marktseite, insbesondere der Konsumenten, begründet. Von herausragender Bedeutung sind hier Güter, deren Qualität von den Konsumenten nicht ex ante eingeschätzt werden kann, wobei die Auswirkungen einer minderen Qualität auf die Sicherheit, die Gesundheit oder auch die Haltbarkeit der Güter zu betonen sind. Um ein bestimmtes Qualitätsniveau zu erreichen, werden daher verpflichtende Gütenormen aufgestellt, die das Angebot minderwertiger Güter direkt beschränken. Solche Normen ermöglichen es dem Konsumenten, bestimmte Eigenschaften eines Gutes gegebenenfalls einzuklagen, sofern diese Normen trotz einer entsprechenden Bezeichnung nicht erfüllt sind. Die Zulassungsverfahren verfolgen indirekt das gleiche Ziel, nämlich eine gewünschte Qualität von Gütern sicherzustellen. In diesem Fall wird von den Anbietern verlangt, genau definierte Befähigungen nachzuweisen. Statt direkt exakte Eigenschaften für einzelne Güter vorzuschreiben und zu kontrollieren, werden hier also Eigenschaf-

Kapitel II Regulierung als Problem der optimalen Kontrolle

22

ten der Anbieter festgelegt, um so die gewünschte Mindestqualität der angebotenen Güter zu gewährleisten. Im Folgenden werden Instrumente vorgestellt, die das Ziel haben, die Marktform selbst zu beeinflussen. Dabei ist zwischen solchen Maßnahmen zu unterscheiden. die die Zahl der Marktteilnehmer. insbesondere der Anbieter. begrenzen und solchen Instrumenten. die dazu dienen. diese Zahl Anbieter zu erhöhen. Hinsichtlich der Beschränkung der Zahl der Marktteilnehmer ist wiederum auf die zuvor diskutierten Zulassungsverfahren zu verweisen, in denen der Anbieter seine Qualifikation nachweisen muss. Wenn solche Maßnahmen auch dazu dienen sollen, die Qualität eines angebotenen Gutes sicherzustellen, so implizieren sie jedoch eine Begrenzung der Zahl der Anbieter. Ein besonderer Fall ist die Auktion von Lizenzen. bei der das Recht. auf einem Markt als Anbieter zu agieren. versteigert wird. Ein Beispiel hierfür ist die Versteigerung der UMTS-Lizenzen. Die Notwendigkeit, die Zahl der Anbieter auf diesem Markt zu begrenzen. ergibt sich aus der Knappheit der Frequenzen. Dabei ist nicht nur die Zahl der Frequenzen. sondern auch die Kapazität jeder einzelnen Frequenz beschränkt. Zudem kann die unkontrollierte Nutzung der Frequenzen zu Interferenzen führen, die die Qualität der angebotenen Dienstleistungen mindern. Durch die Auktion der Lizenzen wird die Zahl der Marktteilnehmer begrenzt und die Verteilung der Frequenzen auf die meistbietenden Unternehmen festgelegt. Um in dem so entstandenen Oligopol eine aus Sicht der Regulierungsbehörde effiziente Nutzung der Frequenzen sicherzustellen, wird die Lizenzvergabe an bestimmte Anforderungen gekoppelt. So ist die Lizenzvergabe in der BRD zum Beispiel mit Auflagen bezüglich der Versorgungsdichte und der Versorgungsgüte verbunden. Im Gegensatz zur Begrenzung der Marktteilnehmer wird häufig das Ziel verfolgt, die Zahl der Anbieter zu erhöhen, um auf diese Weise ein gegebenes Monopol oder Oligopol der Marktform der vollständigen Konkurrenz anzunähern. Beispiele hierfür sind die Förderung der Bestreitbarkeit von Märkten durch den Abbau von Hemmnissen für den Markteintritt oder Marktaustritt, oder auch die Schaffung von Investitionsanreizen in bestimmten Sektoren. In diesem Zusammenhang sind Erziehungszölle oder entsprechende Subventionen zu nennen, durch die junge Marktteilnehmer zeitlich befristet vor der Konkurrenz geschützt werden, um ihnen den Markteinstieg zu erleichtern. Einen besonderen Fall bei der Beeinflussung der Marktform stellt der Bereich der Forschung und Entwicklung dar. Forschungstätigkeiten und Entwicklungen verursachen in der Regel sehr hohe Kosten. Dagegen lassen sich einmal gefundene Ergebnisse nahezu kostenlos reproduzieren. Sofern vollständige Konkurrenz herrscht und die jeweiligen Produktionstechniken frei zugänglich sind, haben die Unternehmen im Extremfall keine Möglichkeit, eine entsprechende Produzentenrente zu erwirtschaften, die sie für ihre Aufwendungen entschädigt. Also stellen die Unternehmen ihre Bemühungen auf dem Gebiet der Forschung und Entwicklung ein und kon-

23

I Theorie der Regulierung

zentrieren sich auf die Tätigkeit der bloßen Reproduktion. Ein Instrument, das diesem Effekt entgegenwirkt, besteht in der Gewährung von Patentrechten, die zeitlich befristete Monopolrechte darstellen. Sie ermöglichen einem Unternehmen, für einen begrenzten Zeitraum eine Monopolrente zu erwirtschaften. Erst in der Folgezeit steht die Technik auch allen anderen Wettbewerbern zur Verfügung. Die Patente implizieren somit zwei Effekte. Zum einen führen sie dazu, dass mehr Unternehmen auf dem Bereich der Forschung und Entwicklung tätig sind. Zum anderen stellen sie zeitlich begrenzte Monopolrechte mit Bezug zu dem jeweils entwickelten Produkt dar. Damit beschränken sie zumindest für einen vorgegebenen Zeitraum die Anzahl der Marktteilnehmer auf dem entsprechenden Outputmarkt. Eine Analyse der optimalen Dauer von Patenten findet man zum Beispiel in Kamien, Schwartz (1974). Neben der Korrektur des Marktergebnisses und der Beeinflussung der Marktforrn versucht die Regulierung außerdem, das Verhalten der Teilnehmer bei einer gegebenen Marktform zu steuern. Beispielsweise verhindert das Kartellrecht nicht die Existenz von Oligopolen, verbietet aber den Marktteilnehmern, ihre Marktmacht auszunutzen, indem sie sich absprechen. Der Staat versucht jedoch nicht nur über Verbote oder Gebote, sondern auch im Wege von Anreizsystemen das Verhalten der Marktteilnehmer zu beeinflussen. Mit Hilfe von Steuern oder Subventionen werden monetäre Anreize gesetzt, die das Verhalten der Marktteilnehmer in die gewünschte Richtung lenken. Als Beispiel ist die Pigou-Steuer zu nennen, die dazu dient, externe Kosten zu internalisieren (vgl. Mas-eolell, Whinston (1995), Seite 355). Die konkrete Ausgestaltung der Regulierungsinstrumente wird in der Theorie häufig aus der Sicht eines wohlwollenden Diktators abgeleitet, der als übergeordnete Instanz der Maximierung des gesellschaftlichen Wohlstands verpflichtet ist. Diese idealisierte Rolle übernimmt in der Realität eine Regulierungsbehörde. Neben der Komplexität des Entscheidungsproblems muss sie im Wesentlichen das Informationsproblem überwinden. Daher verwundert es kaum, dass sich die theoretischen Ergebnisse einer idealisierten Welt in der Realität häufig nur unzureichend umsetzen lassen. Entsprechend versuchen die Regulierungsbehörden die Komplexität der Probleme zu überwinden, indem sie bloße Daumenregeln anwenden. Da sie zudem auf die Informationen der Unternehmen angewiesen sind, wirkt ihr Verhalten teilweise wie ein Reflex auf lobbyistische Aktivitäten. Damit kann nur in seltenen Fällen von einer Umsetzung einer wohlstandsoptimierenden Politik gesprochen werden. 1.3.2

Analyse ausgewählter Instrumente

Beschränkung der Rentabilität

Ein traditionelles Verfahren zur Regulierung von Preisen

für Versorgungsunternehmen ist die Beschränkung der Rentabilität. Obwohl diese Bezeichnung den Eindruck vermittelt, dass hierbei direkt die Rentabilität, also die Verzinsung des eingesetzten Kapitals, beschränkt wird, weist Klevorick (1971) zu Recht darauf hin, dass es

24

Kapitel II Regulierung als Problem der optimalen Kontrolle

sich eigentlich um eine besondere Form der Preisregulierung handelt. Sie basiert einerseits auf dem Grundsatz, dass das Unternehmen keine übermäßige Kapitalverzinsung erzielen darf, also seine Marktrnacht ausnutzt. Die Kapitalverzinsung ist dabei definiert als das Verhältnis des Bruttogewinns, nämlich die Erlöse abzüglich der variablen Kosten, bezogen auf den Wert des eingesetzten Kapitalstocks. Andererseits muss dem Unternehmen eine angemessene Verzinsung des eingesetzten Kapitals gewährt werden, damit es in der Lage ist, wenigstens die Kosten zu decken. Darüber hinaus verweist Joskow (1972) auf die Notwendigkeit, dass die zulässige Kapitalverzinsung es dem Unternehmen erlaubt, das benötigte Kapital zu attrahieren. Die angemessene Verzinsung oder auch faire Rentabilität versucht die Regulierungsbehörde im Rahmen von öffentlichen Anhörungsverfahren zu ermitteln. Das Resultat wird anschließend per Beschluss durch die Regulierungsbehörde oder durch eine richterliche Instanz festgesetzt. Die sogenannte faire Rentabilität wird im zweiten Schritt dazu verwendet, die jeweiligen Preise festzulegen. Übersteigt die realisierte Bruttorentabilität die angemessene Kapitalverzinsung, so wird das Unternehmen gezwungen, die Preise zu senken. Anderenfalls gesteht man dem Unternehmen zu, die Preise beizubehalten oder sogar zu erhöhen (vgl. zum Beispiel Graack (1997), Seite 118 ff., Klevorick (1971) beziehungsweise Spulber (1989), Seite 269 ff.). Die Anhörungsverfahren über die Höhe der fairen Rentabilitätsrate entsprechen einer Verhandlungssituation. in der die Behörde und die Unternehmen entgegengesetzte Interessen verfolgen. Zudem sind die Informationen asymmetrisch verteilt. Die Anhörungen haben den Zweck, die benötigten Informationen über die Kosten der Unternehmung aufzudecken, um so die angemessene Höhe der zulässigen Rentabilität festzulegen. Die Unternehmung selbst besitzt keinen Anreiz, ihre wahren Kosten offenzulegen. Sie wird vielmehr versuchen, höhere Kosten vorzutäuschen. In der Folge resultieren weitere Probleme, die über die reinen Einkommenseffekte der nun festgelegten Rentabilitätsrate und der entsprechenden Preise hinausgehen. Da die Unternehmung die zulässige Rentabilitätsrate als Nebenbedingung ihres Optimierungskalküls berücksichtigt, werden sich nicht nur Rückwirkungen auf die kostenminimale Faktorkombination ergeben. Weil sich auch die gewinnmaximierende Gütermenge verändert, werden nicht unerhebliche Reallokationen sowohl auf den Faktormärkten als auch auf den Gütermärkten zu beobachten sein. Mit Bezug zu dem betrachteten Monopol wird die Festlegung der Rentabilitätsrate unmittelbar den Preis und die angebotene Menge beeinflussen. Dabei ist die Umverteilung von Produzentenrente und Konsumentenrente zu analysieren. Gleichzeitig wird sich das Wohlstandsmaß, das sich aus den bei den Renten zusammensetzt, verändern. Darüber hinaus wird unmittelbar die Entlohnung des Faktors Kapital beschnitten. Also ist mit Rückwirkungen auf das Lohneinkommen zu rechnen, sofern die ursprünglich eingesetzte Menge Arbeit auf Grund der Regulierung verändert wird. Letztlich werden sich auf der Seite des Unternehmens neue Werte für den Erlös, die Kosten sowie die Faktoreinkommen einstellen. Folglich wird durch die Regulierung auch

I Theorie der Regulierung

25

die Summe der Einkommen verändert. Wie bereits angesprochen worden ist, wird die Regulierung im eigentlichen Sinne nicht durch die Beschränkung der Rentabilitätsrate umgesetzt. Die zulässige Rentabilitätsrate ist vielmehr ein Hilfsmittel bei der Festlegung der regulierten Preise. Diese Preise werden von der Regulierungsbehörde in regelmäßigen Abständen daraufhin überprüft, ob sie weiterhin das Kriterium der fairen Rentabilität erfüllen oder angepasst werden müssen. In diesem Zusammenhang ist darauf zu verweisen, dass die Regulierung häufig auch automatische Anpassungsregeln in Abhängigkeit von den Faktorpreisen vorsieht. Damit wird der Güterpreis an die Preise für wesentliche Inputs des regulierten Unternehmens gekoppelt. Eine Diskussion dieser Anpassungsregeln erfolgt zu einem späteren Zeitpunkt. Zur Wirkungsweise der Regulierung mittels einer beschränkten Rentabilität existieren eine Vielzahl theoretischer Beiträge, da es sich um das Standardinstrument bei der Regulierung von Versorgungsunternehmen in vielen Ländern, insbesondere den USA, handelt. Die grundlegenden Arbeiten gehen auf Averch, Johnson (1962), Takayama (1969) und Bailey (1973) zurück. Die traditionellen Modelle lassen sich als deterministische und statische Ansätze charakterisieren, wobei die Analyse im Rahmen von Partialmodellen erfolgt. Zunächst wird davon ausgegangen, dass ein Angebotsmonopol ein Gut in der Menge x unter Verwendung der Einsatzfaktoren Arbeit Va und Kapitalvk produziert. Auf der Faktorseite verhält sich das Unternehmen als Mengenanpasser und betrachtet die zugehörigen Faktorpreise qa und rqk als exogen gegeben. Das Unternehmen verfolgt das Ziel der Gewinnmaximierung, wobei zunächst die Produktionsfunktion x

= /(v a , Vk) als Nebenbedingung zu berücksichtigen ist. Als weitere Restriktion darf die s

erwirtschaftete Kapitalverzinsung (px - qaVa)/qkvk die maximal zulässige Rentabilitätsrate nicht überschreiten.

Ein erstes Resultat besagt, dass die Unternehmung einen Anreiz besitzt, die Kapitalintensität gegenüber der unregulierten Lösung zu verzerren, indem sie relativ mehr Kapital einsetzt, um auf diese Weise die Bezugsgröße der Rentabilität, also den Nenner qkvko zu erhöhen. Dieser Effekt wird in der Literatur als Averch-Johnson-Effekt bezeichnet. Insbesondere lassen sich folgende Auswirkungen der Regulierung der Rentabilität zeigen (vgl. Baumol, Klevorick (1970), Bailey (1973) Averch (1987) beziehungsweise Spulber (1989), Seite 289 ff.): • Übersteigt der zulässige Kapitalertrag SqkVk die Zinskosten für den Faktor Kapital rqkvko so ist die gewinnmaximale Kapitalintensität vk!va durch die Beschränkung der Rentabilität größer als die für das Outputniveau kostenminimale Kapitalintensität. Die Regulierungsform führt somit zu einem Anreiz, den Faktor Arbeit durch Kapital zu substitutieren.

Kapitel II Regulierung als Problem der optimalen Kontrolle

26

• Ferner kann gezeigt werden, dass der Output mit der zulässigen Rentabilität fallt, wenn die Grenzrate der Substitution zwischen den Produktionsfaktoren abnimmt (vgl. Spulber (1989), Seite 291). Weitere verzerrende Effekte treten im Fall des Mehrproduktunternehmens auf. So wird das Unternehmen relativ mehr kapitalintensive Güter produzieren, die damit zur Erhöhung der Bezugsgröße für die Rentabilität beitragen (vgl. Sherman (1989), Seite 201 ff.). Ergänzende Analysen werden von Klevorick (1966,1971. 1973).

Sheshinski (1971) sowie

Callen, Mathewson. Mohring (1976) durchgeführt, die sich anhand eines statischen Partialmodells mit den Wohlstandseffekten dieser Regulierungsform auseinandersetzen. Als Optimalitätskriterium wird dabei die Summe aus Konsumentenrente und Produzentenrente herangezogen. Andere Ansätze berücksichtigen die Tatsache, dass die zulässige Bruttorentabilitätsrate nicht kontinuierlich, sondern nur in diskreten Zeitabständen angepasst wird, obwohl sich Faktorkosten ändern oder technischer Fortschritt zu berücksichtigen ist. Diese Vorgehensweise ermöglicht es dem Unternehmen, für begrenzte Zeit eine Rentabilität zu erwirtschaften, die oberhalb der fairen Rate liegt. Theoretische Arbeiten, die sich mit diesem Sachverhalt auseinandersetzen, sind zum Beispiel Baumol, Klevorick (1970) oder Davis (1973). In den Arbeiten von Bailey, Malone (1970), Bailey, Coleman (1971), Klevorick (1973) sowie Bawa, Sibley (1980) wird ferner berücksichtigt, dass die Wahrscheinlichkeit eines erneuten regulatorischen Eingriffs vom Verhalten des Unternehmen abhängt. In diesem Zusammenhang ist des Weiteren darauf zu verweisen, dass die Regulierungsbehörde in der Regel erst zeitverzögert auf geänderte Rahmenbedingungen wie technischen Fortschritt, Änderungen auf dem Faktormarkt oder ähnliches reagiert. Diese und weitere dynamische Effekte einer Regulierung werden im Rahmen des Abschnitts 1.4 aufgegriffen. Einer der wesentlichen Kritikpunkte an den bisherigen traditionellen Ansätzen besteht darin, dass die Restriktion einer maximal zulässigen Rentabilität den tatsächlichen Regulierungsprozess nur unzureichend abbildet (Klevorick (1971». Diese Unzulänglichkeit der traditionellen Averch-Johnson-Theorie zeigt sich insbesondere in folgenden Aspekten: • Die Forderung, dass die tatsächliche Rentabilität die zulässige Rentabilität nicht überschreiten darf, lässt vermuten, dass die Gewinne direkt reguliert werden. Dieser Eindruck wird durch die ModelIierung verstärkt, indem unterstellt wird, dass das Unternehmen unter Berücksichtigung der Beschränkung der Rentabilität den Preis frei wählen kann. In der praktischen Umsetzung dieser Regulierungsform beeinflusst die Beschränkung der Rentabilität jedoch nur indirekt den Gewinn. In erster Linie findet eine Unterform der Preisregulierung statt.

27

I Theorie der Regulierung

• Die angesprochenen Modelle vernachlässigen das Problem der Regulierungsbehörde, die Kostenstruktur der Unternehmung zu ermitteln. Tatsächlich besitzt die Behörde ein fundamentales Informationsdefizit bei der Festlegung der fairen Rentabilität, da sie auf die von der Unternehmung selbst offenzulegenden Angaben über die Produktionstechnik angewiesen ist. Neben den vorgestellten theoretischen Analysen existieren verschiedene Arbeiten, die den Averch-Johnson-Effekt empirisch untersuchen. Während Boyes (1976), McKay (1976) und Spulber, Becker (1983) keinen Beweis für eine kapitalintensive Verzerrung des Faktoreinsatzes finden, bestätigen die Analysen von Spann (1974), Courville (1974), Baron, Taggart (1977), Smithson (1978), Hayashi, Trapani (1976), Schmalensee (1977), Peterson (1975) sowie PeIes, Whittred (1996), dass in Sektoren, die einer Beschränkung der Rentabilität unterliegen, eine ineffiziente, zu kapitalintensive Faktornutzung vorliegt. Bewahrung des Anreizes zur Kostenminimierung

Die zuvor diskutierte Regulierungsmaß-

nahme besteht darin, dass der Preis eines regulierten Unternehmens so festgelegt wird, dass eine bestimmte maximal zulässige Rentabilität nicht überschritten wird. Die wesentliche Kritik an der Wirkungsweise dieses Instrumentes bezieht sich auf den Tatbestand, dass das Unternehmen keinen Anreiz zur Kostenminimierung und damit zur effizienten Produktion besitzt. So wird durch die beschränkte Rentabilität nicht nur die aktuelle Ressourcenallokation gegenüber dem kostenminimierenden Einsatzverhältnis der Produktionsfaktoren verzerrt, sondern es besteht auch eine Tendenz, eher in arbeitssparenden technischen Fortschritt zu investieren, um so den Wert des Kapitalstocks, der die Bezugsgröße für die Rentabilität darstellt, relativ zu erhöhen (vgl. Magat (1976». Angesichts dieser Kritik gibt es Bestrebungen, die Preissetzung der betroffenen Unternehmen so zu regulieren, dass sie trotz der Regulierung einen Anreiz haben, den jeweiligen Output kostenminimal herzustellen. Um diese Zielsetzung zu stärken, werden von Braeutigam, Panzar (1993), Graack (1997), Crew, Kleindorfer (1996) sowie Sappington, Sibley (1992) verschiedene Regulierungsvarianten angeführt, die im Folgenden skizziert werden. Dabei ist zu betonen, dass diese Regulierungsformen nicht das Kriterium der fairen Rentabilität ablösen. Die Verfahren orientieren sich auch weiterhin an der Vorstellung von einer fairen Rentabilität oder sogar an einer expliziten Berücksichtigung der Beschränkung der Rentabilität. Diesen Fall interpretieren Braeutigam, Panzar (1993) nicht als Übergang zu einer vollständig neuen Philosophie der Regulierung, sondern als eine veränderte Gewichtung traditioneller Zielsetzungen. Auch Pint (1992) weist darauf hin, dass eine faire Rentabilität in der praktischen Umsetzung das erklärte Ziel bei der Regulierungsformen ist, sowohl unter der Bewahrung der Anreize für die Kostenminimierung als auch bei der traditionellen Regulierung durch die Beschränkung der Rentabilität.

Kapitel II Regulierung als Problem der optimalen Kontrolle

28

Vickers. Yarrow (1988) zeigen. dass beide Regulierungsformen in der praktischen Umsetzung äquivalent zueinander sind. (1) Die Regulierung bewahrt den Anreiz zur Kostenminimierung. wenn die Preisreduktion

nicht von der Kapitalverzinsung des Unternehmens abhängt. Daher werden Höchstpreise gesetzt. die sich an den Durchschnittskosten orientieren (vgl. Graack (1997). Seite 122 ff.• Laffont. Tirole (1993). Seite 17 ff.). Der Vorteil gegenüber einer maximal zulässigen Rentabilität besteht darin. dass das Unternehmen für eine Reduktion seiner Kosten nicht bestraft wird. Denn die Preissenkungen hängen nicht von den Änderungen der Produzentenrente ab. Insbesondere wird die Neigung zu einer ineffizienten Faktorkombination beseitigt. da das Unternehmen nicht seinen Gewinn erhöhen kann. indern es vorn kostenminimalen Verhältnis der eingesetzten Produktionsfaktoren abweicht. Allerdings ist zu beachten. dass die Probleme der asymmetrischen Information über die Kostensituation hier verschärft zu Tage treten. Letztlich ist nicht nur die Rentabilität des Unternehmens abzuschätzen. die Behörde muss vielmehr die tatsächlichen Informationen über die Kosten der Produktion erfahren und im Falle des Mehrproduktunternehmens das Problem der Kostenallokation lösen. Auch hier wendet die Behörde eine Daumenregel zur Lösung des Problems an. indern sie entsprechende Durchschnittspreise für das Güterbündel festlegt. (2) In einem alternativen Ansatz werden die genehmigten Preisänderungen an die Inflationsrate gekoppelt. wobei gegebenenfalls eine Korrektur durch die geschätzte Änderung der Produktivität im betrachteten Sektor vorgenommen wird (vgl. OECD (I998a). Seite 185. Laffont. Tirole (1993). Seite 17. beziehungsweise Beesley. Littlechild (1989». Auf diese Weise lässt sich vermeiden. dass der Preisindex für ein bestimmtes Güterbündel unter Überprüfung aller Kosten in jeder Periode neu festgelegt werden muss. Man setzt lediglich eine Obergrenze für den Preisanstieg fest. wobei der Preisindex für das Güterbündel eines regulierten Unternehmens in der Folgeperiode wie folgt berechnet wird: P,

= P,_I (I + 7r -

€I). Dabei bezeichnet 7r die Infla-

tionsrate und €I die Rate des technischen Fortschritts. Diese Form der Fortschreibung wird insbesondere zur Regulierung von Versorgungsunternehmen in Großbritannien angewendet (vgl. hierzu Xavier (1995). Graack (1997). Seite 124. OECD (1998a). Seite 185 beziehungsweise Dnes. Kodwani. Seaton, Wood (1998». Die Behörde nutzt dabei den Vorteil, dass sie einen relativ geringen Informationsbedarf hat, wenn sie die genehmigte Preisänderung an die Inflationsrate koppelt. Weil die Inflationsrate aus Sicht des Unternehmens exogen gegeben ist, lohnt es sich, die Produktionskosten zu minimieren, so dass die Anforderung einer kosteneffizienten Produktion durch die Unternehmung erfüllt ist. (3) Ergänzend ist auf eine besondere Variante der Regulierung der Rentabilität hinzuweisen, die ebenfalls den Anreiz zur Kostenminimierung erhält. Wie zuvor wird dem Unternehmen eine bestimmte Rentabilität gestattet. Liegt die tatsächlich erzielte Kapitalverzinsung oberhalb der

29

I Theorie der Regulierung

Jahr

Staaten mit Beschränkung der Anreizregulierung Rentabilität

Wechsel von Beschränkung der Anreizregulierung Rentabilität zu zu Beschränkung Anreizregulierung der Rentabilität

1984

48

0

0

1985

48

0

0

0

1986

44

4

4

0

1987

34

14

10

0

1988

33

15

3

2

1989

28

20

6

1

1990

22

26

9

3

1991

18

30

6

2

1992

17

31

1

0

0

1993

15

33

3

1

1994

19

29

2

6

1995

17

31

3

I

Tabelle II.l: Angewendete Regulierungsverfahren in 48 Staaten der USA (1984-1995): In dem Datenmaterial wird zwischen der Regulierung durch eine Beschränkung der Rentabilität und den Verfahren, die die Anreize zur Kostenminimierung aufrechthalten sollen (Anreizregulierung), unterschieden. Außerdem wird die Zahl der Wechsel zwischen den beiden Verfahren berücksichtigt. In die Betrachtung fließen alle Staaten der USA mit Ausnahme von Alaska und Hawai ein, da dort keine der regionalen Telekommunikationsunternehmen, die aus dem Bell-Konzern hervorgegangen sind, eine wesentliche MarktsteIlung einnehmen. Quelle: Donald, Sappington (1997).

vorgegebenen Rate, dann werden nicht die Preise reduziert, sondern die überschüssige Rente zwischen dem Produzenten und den Konsumenten aufgeteilt (vgl. Graack (1997), Seite 125). Den Nachfragern wird ein Teil ihrer Zahlung zurückerstattet, wobei das Unternehmen die entstehenden Kosten wie eine Strafe tragen muss. Um die Ausführungen zu den bei den Verfahren, nämlich die Beschränkung der Rentabilität und die Anreizregulierung abzuschließen, bietet es sich an, die empirische Bedeutung der beiden Regulierungsformen zu untersuchen. Wie bereits unter Bezugnahme auf den Bericht der OECD erläutert worden ist, stellt die Beschränkung der Rentabilität die gängige Regulierungsform in den USA dar, während die Begrenzung des Preisanstiegs in Abhängigkeit von der Inflationsrate und der Produktivitätsrate verstärkt in Großbritannien eingesetzt wird. Die Nachteile bei der Beschränkung der Rentabilität haben in den USA dazu geführt, die Regulierung vielerorts zu reformieren, um so die Anreize zur Kostenminimierung zu stärken. Die Tabellen H.l und H.2 sind den Ausführungen von Donald, Sappington (1997) entnommen. Sie zeigen, dass die Staaten der USA dazu neigen, die Beschränkung der Rentabilität aufzugeben,

30

Kapitel 11 Regulierung als Problem der optimalen Kontrolle Regulierungsverfahren durchgängige Regulierung durch Beschränkung der Rentabilität Wechsel von einer Beschränkung der Rentabilität auf ein Verfahren der Anreizregulierung

Wechsel zwischen den Verfahren mit der anschließenden Rückkehr zur Beschränkung der Rentabilität

Staaten JA, MA, MT, NH, NC, OK, UT, WY AL(87), CA(90), FL(87), 10(87), IN(94), KS(90), KY(89), LA(88), MD(89), MI(90), MN(90), MS(90), NE(87), NV(91), NJ(87), ND(90), OH(95), OR(92), PA(94), RI(87), TN(91), TX(91), VA(89), WV(88) AZ, AR, CT, DE, GA, n.., ME, MO, NM, NY, SC, SD, VT, WA, WI

Tabelle II.2: Anwendung der Regulierungsverfahren in den einzelnen Staaten der USA (1984- I 995). Die Angaben in Klammem hinter der Staatenbezeichnung bezeichnen das Jahr des Wechsels. Quelle: Donald, Sappington (1997)

um durch alternative Regulierungsformen den Anreiz zur Kostenminimierung (Anreizregulierung) zu stärken. Dabei werden die verschiedenen Arten der Anreizregulierung (kostenorientierte Preisobergrenze, Beschränkung der zulässigen Preisstreigerungsrate durch Koppelung an die Inflationsrate, Aufteilung einer übermäßigen Kapitalverzinsung zwischen Konsumenten und Produzenten, et cetera) nicht unterschieden. Der Übergang von der beschränkten Rentabilität hin zu einem Verfahren der Anreizregulierung lässt sich allerdings auch umkehren. So kehren sechzehn Staaten im Zeitraum von 1988 bis 1995 wieder zurück zur ursprünglichen Regulierungsform. Donald, Sappington (1997) versuchen Charakteristika der Staaten herauszufinden, um die Wechsel zwischen den angewendeten Regulierungsverfahren erklären zu können. Die Autoren zeigen beispielsweise auf, inwiefern sich eine demokratische oder republikanische Regierung auf die Wechsel der Regulierungsform auswirkt. Auch andere Ursachen, wie die Zahl der festangestellten Beamten der Regulierungsbehörden werden in die Untersuchung einbezogen.

1.4 Probleme der intertemporalen Regulierung Die bisherigen Ausführungen haben einen Überblick über die Gründe für eine Regulierung und die verschiedenen Instrumente geliefert. Dabei sind wesentliche Probleme der Regulierung angesprochen worden. Insbesondere muss die Behörde darauf achten, nicht den Anreiz zu einer kosteneffizienten Produktion zu zerstören. Daneben stellen Informationsdefizite hinsichtlich der eingesetzten Technik beziehungsweise der Kostenfunktion das größte Problem dar. Abgesehen von diesen Schwierigkeiten beschäftigen sich die dynamischen Ansätze zur Theorie der Regulierung mit weitere Fragen: Inwiefern spielen intertemporale Aspekte hinsichtlich der Regulierung von Unternehmen eine Rolle und welche zusätzlichen Effekte sind zu berücksich-

I Theorie der Regulierung

31

tigen, die nicht von einem statischen Modell abgebildet werden können. Beginnend mit der Unternehmung werden im Folgenden zunächst einige Rahmenbedingungen für das Problem der dynamischen Optimierung aufgezeigt. Damit liegt das entsprechende Problem der Behörde auf der Hand: Wie muss die Regulierung im Zeitablauf gestaltet werden, um dem Ziel eines maximalen Wohlstands gerecht zu werden? Zunächst wird das Investitionsverhalten des Unternehmens untersucht. Häufig kann das Unternehmen einen Teil der eingesetzten Produktionsfaktoren kurzfristig nicht anpassen. So verhindern einmal getätigte irreversible Investitionen, dass der Kapitalstock beliebig schnell reduziert wird (vgl. hierzu Dixit (1991». Die maximale Geschwindigkeit, mit der der Kapitalstock zurückgeführt werden kann, wird durch den Kapitalverschleiß beziehungsweise die Abschreibung vorgegeben. Damit ist das Unternehmen durch die Investitionsentscheidungen in der Vergangenheit nicht nur für die Gegenwart, sondern auch für die Zukunft gebunden. Dieser Effekt zeigt sich auch bei der Analyse neoklassischer Investitionsprobleme, die konvexe Anpassungskosten auf Grund von Investitionen berücksichtigen. Verhält sich das Unternehmen optimal, dann passt es den Kapitalstock nur ganz allmählich an, wobei die Art der Anpassungkosten das Investitionsverhalten des Unternehmens bestimmen. Das Unternehmen ..springt" also nicht von einem optimalen Gleichgewicht ohne Regulierung in ein neues Gleichgewicht mit Regulierung, sondern durchläuft einen Anpassungsprozess, bei dem sich die Faktorausstattung sowie die resultierenden Marktergebnisse kontinuierlich ändern. El-Hodiri. Takayama (1981), Spulber. Becker (1983) und Dechert (1984) analysieren solche Investitionsprobleme unter Berücksichtigung von Regulierungsbeschränkungen, wobei die entsprechenden Optimierungsprobleme lediglich aus der Sicht der Unternehmung betrachtet werden. Ein weiterer Grund, dynamische Modellansätze zu verwenden, sind Änderungen der Faktorpreise sowie des technischen Fortschritts, die zu Rückwirkungen auf die Wahl der Inputmengen durch die Unternehmung führen. Selbst wenn man unterstellt, dass die Behörde für gegebene Faktorpreise und einen gegebenen Stand der Technik in der Lage ist, eine Regulierung vorzugeben. bei der sich das Unternehmen im Einklang mit der Zielsetzung der Wohlstandsmaximierung verhält, so wird das Ergebnis auf die Dauer nicht optimal bleiben. Ändern sich die Faktorpreise oder findet technischer Fortschritt statt, dann muss die zuvor abgeleitete Regulierung revidiert werden. Allerdings wird eine kontinuierliche Korrektur der Regulierung in der Regel suboptimal sein, denn mit der Zahl der Eingriffe steigen beispielsweise die Kosten der Informationsbeschaffung sowie die Kosten zur Verarbeitung dieser Informationen. Angesichts dieser Problematik gibt es in der Literatur einige Ausführungen, die sich mit der Wirkung einer diskontinuierlichen und verzögerten Anpassung der Regulierungsparameter bei geänderten Rahmenbedingungen auseinandersetzen. In diesem Zusammenhang sind insbesondere die Arbeiten von Bailey, Coleman (1971), Baumol, Klevorick (1970), Davis (1973) und

Kapitel II Regulierung als Problem der optimalen Kontrolle

32

Bailey (1974) zu nennen. Ein weiterer Beitrag, der sich mit der diskontinuierlichen Korrektur der Regulierungsparameter beschäftigt, ist die Arbeit von Sibley, Bailey (1978). Die Autoren ermitteln für eine exogen gegebene Änderung der Faktorpreise und einen exogenen arbeitssparenden technischen Fortschritt die optimale Zahl der Preisanpassungen und die jeweils optimale Preissetzungsstrategie. Zur Würdigung dieses Ansatzes ist anzumerken, dass die Dynamik des Modells auf exogenen Änderungen der Rahmenbedingungen beruht. Intertemporale endogene Effekte, die das Unternehmen durch sein geändertes Verhalten induziert, werden nicht berücksichtigt. Wie Waterson (1988), Seite 88 ff. darlegt, stellen sich durch die zeitlich verzögerte Anpassung der Regulierungsparameter unter anderem folgende Effekte ein . • Technischer Fortschritt ermöglicht es dem Unternehmen, im Zeitraum zwischen zwei Anpassungen der Regulierungsparameter, effizienter zu produzieren und damit zumindest für einen begrenzten Zeitraum eine höhere Produzentenrente zu erwirtschaften. Mit der erneuten Korrektur der Regulierungsparameter geht dieser Anreiz verloren . • Erhöht das Unternehmen im Zeitablauf seinen Kapitalstock, so kann es zwischen zwei Anpassungen der Regulierungsparameter noch nicht von der eigentlich erhöhten Basis der Rentabilitätsberechnung profitieren, da die Regulierungsparameter für diesen Zeitraum festgelegt sind. Inwieweit diese Effekte zu Tage treten, hängt von der Länge des Zeitraums ab, in dem die Regulierungsparameter fixiert sind und von dem Ausmaß, mit dem die Technik in dem jeweiligen Sektor fortschreitet. Eine Diskussion, wie das Intervall der Preisanpassung und der Anreiz zu technischem Fortschritt zusammenhängen, findet man in Klevorick (1973) oder Bawa, Sibley (1980). Bei der Ermittlung der optimalen Länge des Zeitintervalls sind somit zwei gegenläufige Effekte zu berücksichtigen. Zum einen steigt der Anreiz der Unternehmung, technisch effizient zu produzieren und technischen Fortschritt zu betreiben, um auf diese Weise für einen begrenzten Zeitraum die Produzentenrente zu erhöhen. Zum anderen profitieren die Konsumenten von dieser Effizienzsteigerung erst im Zuge der nächsten Regulierungsrunde. Analog zum Problem der optimalen Laufzeit von Patenten muss der unter dem Aspekt der Wohlstandsmaximierung beste Zeitpunkt für eine Korrektur des Preises aus einer Abwägung der Interessen des Unternehmens sowie der Konsumenten abgeleitet werden. In diesem Kalkül ist wiederum zu beachten, dass sich eine Anpassung des Kapitalstocks erst verzögert auf den Preis auswirkt. Der Grund liegt darin, dass die Investitionen unter der Berücksichtigung von konvexen Anpassungskosten zeitlich verteilt werden. Entsprechend argumentieren auch Joskow, Noll (1981), dass das Intervall, in dem die Unternehmen durch eine

I Theorie der Regulierung

33

Kapitalinvestition gebunden sind, länger als der Zeitraum zwischen den Anpassungen der Regulierungsparameter sein kann. Darüber hinaus wird häufig untersteHt, dass das Unternehmen die Zahl der Überprüfungen seiner Kostensituation durch die Regulierungsbehörde als gegeben annimmt und die Zeitpunkte jeweils ex ante kennt. Die Form der Regulierung übt auf die Unternehmung einen Anreiz aus, insbesondere in dem Zeitraum vor einer Überprüfung, die Kosten in die Höhe zu treiben. Auf diese Weise versucht die Unternehmung, die Entscheidung der Behörde zu ihren Gunsten zu manipulieren. Sappington (1973), Laffont, Tirole (1993), Seite 375 bis 436, sowie Freixas, Guesnerie, Tirole (1985) untersuchen in diesem Zusammenhang den sogenannten Ratcheteffekt. Dabei wird die Wirkung einer Regulierung analysiert, die als Sequenz einzelner Maßnahmen durchgeführt wird und bei der sich die Behörde in der aktueJIen Periode an den Erfahrungen aus der Vergangenheit orientiert. Hier verspürt das Unternehmen einen Anreiz, in der jeweiligen Referenzperiode eine schlechtere Leistungsfähigkeit vorzutäuschen, um so die Ansprüche der Behörde an das Unternehmen zu senken. Die Bedeutung der Laufzeit von Regulierungsbestimmungen in Anbetracht der Möglichkeit, die Parameter an aktueJIe Rahmenbedingungen anzupassen, aber auch hinsichtlich der dadurch entstehenden Anreizeffekte, wird unter anderem von Baron, Besanko (1984), Baron, Myerson (1982) und Sappington (1982) behandelt. Spiegel, Spulber (1994) und Spiegel (1994, 1996) untersuchen weitere Auswirkungen der Regulierungsform, beispielsweise auf die Art der Technologie. Darüber hinaus wird an Hand eines MehrperiodenmodeJIs der Effekt der Rentabilitätsbeschränkung auf die Kapitalstruktur und damit den Verschuldungsgrad des Unternehmens betrachtet. Bei der Erläuterung der beschränkten Rentabilität ist bereits angesprochen worden, dass die Zielsetzung der Regulierung darin besteht, dem Unternehmen einejaire Rentabilität zuzugestehen, so dass sich das Unternehmen vom Markt zurückzieht. Um auch bei steigenden Inputpreisen eine faire Rentabilität sicherzusteJIen, sind entsprechende Anpassungen der Regulierungsparameter vorzunehmen. Da die Anhörungsverfahren und die entsprechende Korrektur der Parameter relativ langwierig ablaufen, sind automatische Anpassungsregeln eingeführt worden. Obwohl diese Anpassungsregeln die verzögerte Reaktion der Regulierungsbehörden vermeiden und sichersteJIen, dass das Unternehmen die faire Rentabilität auch bei steigenden Faktorpreisen erwirtschaften kann, ist dennoch zu beachten, dass auch automatische Anpassungsregeln ineffizient sein können. Während ein unreguliertes Unternehmen auf eine Änderung der relativen Faktorpreise mit einer Korrektur der kostenminimalen Faktormengen reagiert, besteht der Anreiz für ein reguliertes Unternehmen nur bedingt. Wird das Unternehmen bei variierenden Faktorpreisen durch eine entsprechende Änderung des Outputpreises entschädigt, dann besteht kein Anlass, die eingesetzten Fakormengen an das Kostenminimum anzupassen. Eine Diskussi-

Kapitel II Regulierung als Problem der optimalen Kontrolle

34

on aut-omatischer Anpassungsregeln findet man in Kendrick (1975), Joskow, MacAvoy (1975), GoIlop, Karlson (1978), Baron, Oe Bondt (1979), Stewart (1982) beziehungsweise Schmidt (1981). Abschließend ist auf einige Anbieter zu verweisen, die sich mit den Informationsproblemen und dem Verhältnis zwischen der Regulierungsbehörde und der Unternehmung im Zeitablauf auseinandersetzen (vgl. zum Beispiel Baron, Myerson (1982), Baron (1984) und Baron, Besanko (1987». Wie bereits erörtert worden ist, besteht ein Grundproblem der Regulierung darin, die wahren Informationen über das Verhalten des Unternehmens und insbesondere die Produktionskosten aufzudecken. Entsprechende Mechanismen werden zum Beispiel von Baron (1984) diskutiert. Die Regulierung von Unternehmen wird dabei als dynamischer Lernprozess aufgefasst, in dem die Behörde das Unternehmen beobachtet, um so mehr Informationen über das Verhalten aufzudecken. Im gleichen Zug lassen sich Vermutungen über die Reaktionen der Unternehmung auf verschiedene Maßnahmen ableiten.

2

Theorie der optimalen Kontrolle

2.1

Grundlagen der Kontrolltheorie

Die Entscheidungsprobleme sind häufig dynamischer Natur. Damit betreffen einzelne Entscheidungen nicht nur die Systemzustände in einem isolierten Zeitpunkt. Vielmehr zielen sie darauf ab, die Entwicklung eines Systems im Zeitablauf, also einen dynamischen Prozess, in geeigneter Weise zu gestalten beziehungsweise zu beeinflussen. Die Verfahren, die zur Optimierung dynamischer Prozesse herangezogen werden, bilden den Gegenstand der Theorie der optimalen Kontrolle. Bevor diese Methoden einschließlich der mit ihnen verbundenen Voraussetzungen für eine sinnvolle Anwendung diskutiert werden, erfolgt zunächst eine kurze Erläuterung der Grundelemente eines Kontrollproblems. Dem Kontollproblem liegt ein dynamisches System zu Grunde. Darunter versteht man eine Gesamtheit von interdependenten zeitveränderlichen Größen, die durch Funktionalbeziehungen wie Differentialgleichungen oder Differenzengleichungen miteinander verbunden sind (FölIinger (1994b), Seite 2). Im Rahmen dieser Arbeit wird die Zeit als kontinuierliche Variable aufgefasst, so dass die Funktionalbeziehungen, die das dynamische System abbilden, hier die Form von Differentialgleichungen besitzen. Im Fall einer diskontinuierlichen ModelIierung der Zeit wird das dynamische System hingegen mit Hilfe von Differenzengleichungen angegeben. Die Werte, die die Systemgrößen in einem Zeitpunkt t bedingt durch die vorhergehende Systementwicklung annehmen, bezeichnet man als Zustände des Systems. Sie werden im Folgenden mit x(t)

= (XI (t), ... , x.(t) f

symbolisiert. Die Zustände im jeweiligen Zeitpunkt können nicht

35

2 Theorie der optimalen Kontrolle

vollkommen frei gewählt werden. Zunächst müssen Randbedingungen wie die vorgegebenen Anfangswerte der Zustandsgrößen Xo

= (Xto, X20,""

xoO)T

== x(O) beachtet werden.

Ausge-

hend von diesen Größen ergeben sich die jeweiligen Zustände zu einem späteren Zeitpunkt aus dem interdependenten System von Differentialgleichungen, das die Entwicklung der Zustandsgrößen über die Zeit hinweg beschreibt. Das Differentialgleichungssystem wird in der Kontrolltheorie auch als dynamischer Prozess bezeichnet, die einzelnen Differentialgleichungen heißen Bewegungsgleichungen oder Zustandsgleichungen. Für das Kontrollproblem ist charakteristisch, dass die Veränderung der Systemgrößen im Zeitablauf nicht nur von den Zuständen abhängt. Die Dynamik lässt sich vielmehr mitHilfe von Kontrollgrößen U

= (Ut (t), ... , um(t»T

beeinflussen, die unter Beachtung bestimmter Restriktionen frei gewählt werden können. Man spricht auch von Steuergrößen beziehungsweise Reglergrößen. Die Entwicklung des Systems wird durch die Zustandsgleichungen beschrieben und besitzt die Form

x = f(x, u, t) = (ft (x, u, t), ... , f.(x, u, t»

T.

Die Änderung des Zustands hängt vom Zustand des Systems x selbst, von den Steuergrößen U und vom Zeitpunkt t ab. Ergänzend ist anzumerken, dass im Rahmen dieser Arbeit nur autonome Differentialgleichungssysteme behandelt werden, bei denen die Funktionen f nicht explizit

von t, sondern nur indirekt über x und

U

von der Zeit tabhängen (Boyce, DiPrima (1976),

Seite 558 ff.). Die Theorie der optimalen Kontrolle verfolgt das Ziel, durch eine geeignete Wahl der Kontroll größen

U

die Entwicklung des Systems bestmöglich zu gestalten. Das steuernde oder re-

gelnde Individuum wählt einen dynamischen Prozess, dessen Verlauf seinen Wünschen optimal angepasst ist. Man unterscheidet dabei zwei Verfahren der Kontrolle, die Steuerung und die Regelung. Welches der Verfahren für die Optimierung anzuwenden ist, hängt - wie im Rahmen

der folgenden Abschnitte deutlich wird - vom Grad der Information über den dynamischen Prozess und der Art des Prozesses ab. Dabei ist zwischen vollständiger und unvollständiger Information sowie zwischen deterministischen und stochastischen Prozessen zu unterscheiden. Man beachte, dass die Vorstellung einer optimalen Kontrolle nicht gleichbedeutend mit einer optimalen Beherrschung des Prozesses ist, wie es vielleicht die deutsche Übersetzung des englischen Wortes control durch Kontrolle nahelegt. 5 Betrachtet man zum Beispiel einen unvollständig bekannten, stochastischen Prozess, so lässt sich auch mit Hilfe der Theorie der optimalen Kontrolle nicht sicherstellen, dass der Soll verlauf und die Istentwicklung des Systems für den gesamten Zeitraum der Planung übereinstimmen. Allerdings ermöglicht die optimale Kontroll

Vgl. hierzu auch Föllinger (1994b), Seite 9, der darauf hinweist, dass eine treffendere Übersetzung der angelsächsischen Begriffe control,feedforward control, feedback control zum Beispiel die Verwendung des Wortes Steuerung als Oberbegriff, sowie Vorwänssteuerung und Rück/ührsteuerung, anstelle der üblichen Bezeichnungsweise mit Kontrolle als Oberbegriff und der Unterscheidung in Steuerung und Regelung ist.

Kapitel 11 Regulierung als Problem der optimalen Kontrolle

36

le, dass die 1stentwicklung nach einer Störung bestmöglich an den Sollverlauf angepasst wird, wobei verschiedene Optimalitätskriterien verwendet werden.

2.2

Kontrolle eines Prozesses durch Steuerung

Als erstes Verfahren der optimalen Kontrolle wird die optimale Steuerung behandelt. Wie Föllinger (I994a), Seite 44 ff., darlegt, setzt die sinnvolle Anwendung einer Steuerung voraus, dass 1. während des Zeitraumes, für den die Optimierung erfolgt, keine Störungen des (vollständig bekannten) Prozesses auftreten und 2. der Anfangszustand des Systems bekannt ist. Ist eine der beiden Voraussetzungen nicht gegeben, kann die Steuerung keine optimale Entwicklung des Systems in der Zeit gewährleisten. Zur Erklärung wird die Funktionsweise einer Steuerung an hand der Abbildung 11.3 beschrieben. Dabei wird zunächst angenommen, dass die beiden zuvor genannten Voraussetzungen erfüllt sind. Das Ziel der Steuerung besteht darin, den Prozess

x=

f(x. u. t) und damit letztlich die

Zustände des Systems x zu beeinflussen. Die Abbildung 11.3 illustriert die charakteristische Eigenschaft einer Steuerung. So erfolgt der Informationsfluss bei einer Steuerung nur in eine Richtung: von den Steuergrößen u' zum gesteuerten Prozess X. Eine Rückkoppelllng. bei der

xo

u' = u'(xo, t)

optimale Steuerung

u'

X = f(x', u', t)

x'

optimaler Prozess

Abbildung II.3: Optimale Steuerung: Die optimale Steuerung u' zum Zeitpunkt t ergibt sich in Abhängigkeit vom Anfangszustand Xo des Systems. Eine Rückmeldung über das Ergebnis der Steuerung im Zeitablauf. nämlich den Zustand x(t), erfolgt nicht.

37

2 Theorie der optimalen Kontrolle

die Informationen über den durch die Steuerung jeweils realisierten Zustand x(t) des Systems an die steuernde Stelle zurückgemeldet und weiterverarbeitet werden, findet nicht statt. Eine derartige Signalübertragung, die in nur eine Richtung, nämlich von der steuernden Stelle hin zum gesteuerten Prozess, erfolgt, bezeichnet man als offene Wirkungskette. Formal spiegelt sich diese Eigenschaft darin wider, dass der Vektor der optimalen Steuervariablen u' nur eine Funktion vom Anfangszustand des Systems "0 und von der Zeit t ist, also u' = u'("o, t). Die optimale Wahl der Steuervariablen hängt nicht vom tatsächlichen Zustand des Systems im Zeitpunkt t ab, so wie es bei einer Rückkoppelung der Fall ist. Gleichzeitig wird damit deutlich, dass bereits im Anfangszustand des Systems der gesamte optimale Zeitpfad der Steuergröße u·

eindeutig festliegt. Entsprechend ist die Entwicklung des Systems xfür alle t und folglich der Zeitpfad der Zustände x(t) für den gesamten Planungszeitraum t punkt t

E

[0,

n schon im Startzeit-

= 0 eindeutig bestimmt. Zwar erscheint der Zustand des Systems x als Argument in der x = fex, u, t), da jedoch keine stochastischen Störungen auftreten und

Bewegungsgleichung

der Prozess einschließlich des Anfangszustands vollständig bekannt ist, kann der Zeitpfad x in t

= 0 vollständig berechnet werden. Der Vektor der Steuervariablen u ist in der Abbildung 11.3 als optimale Steuerung u' ge-

kennzeichnet. Nimmt man an, dass die bei den Voraussetzungen I und 2 erfüllt sind, so besteht ein eindeutiger, bekannter Zusammenhang zwischen dem Vektor der Steuervariablen u und dem zu steuernden Prozess X. Die Aufgabe der optimalen Steuerung liegt darin, den Pfad der Steuergrößen zu ermitteln, so dass eine Zielfunktion, die jeder Entwicklung des Systems ein Gütemaß zuordnet, optimiert wird. Als ökonomisches Beispiel ist auf das intertemporale Gewinnmaximierungsproblem eines Unternehmens zu verweisen, bei dem der kumulierte Barwert des Gewinns das Gütemaß darstellt und die Bruttoinvestition als Steuergröße dazu dient, den KapitaJstock in der Zeit fortzuschreiben. Das Unternehmen wählt also den Zeitpfad für die Investitionen, der den kumulierten Barwert des Gewinnes maxintiert. 6 Dabei sind insbesondere die Bewegungsgleichungen des Systems, die zum Beispiel die Fortschreibung des Kapitalstocks über die Bruttoinvestitionen beschreibt, und mögliche Randbedingungen für die Zustandsgrößen als Nebenbedingungen zu berücksichtigen. Darüber hinaus können weitere Restriktionen der Steuergrößen auftreten, wie zum Beispiel eine Beschränkung der zulässigen Rentabilität durch eine Regulierungsbehörde. Wird die Zeit als kontinuierliche Größe aufgefasst, so erfolgt die Lösung des Problems mit Hilfe des Maximumprinzips von Ponujagin, das im Anhang 1.3 (Seite 310 ff.) erläutert wird. 7 Sie liefert den optimalen Steuervektor u' und die optimale 6Die Übertragung des hier vorgestellten Instrumentariums der Kontrolltheorie auf ökonomische Anwendungen, insbesondere das Problem der Regulierung von Unternehmen, erfolgt im Rahmen des Abschnitts 3. 7 Auf eine Erläuterung dieses Lösungsalgorithmus wird an dieser Stelle verzichtet, da das Ziel des Abschnitts darin besteht, die Voraussetzungen für eine sinnvolle Anwendung des Kontrollverfahrens der optimalen Steue· rung zu erörtern.

38

Kapitel II Regulierung als Problem der optimalen Kontrolle

Trajektorie des Zustands vektors x· in Abhängigkeit vom Anfangszustand des Systems Xo. Um die Abgrenzung der Steuerung von der nachfolgend dargestellten Regelung noch einmal zu unterstreichen, ist zu beachten, dass die Berechnung des gesamten optimalen Zeitpfades für das System im Startzeitpunkt erfolgt. Eine nachträgliche Kontrolle und eine eventuelle Korrektur des Verhaltens durch den Steuerungsmechanismus ist nicht vorgesehen. Die obigen Ausführungen über die Funktionsweise der Steuerung veranschaulichen bereits, warum die Voraussetzung eines bekannten Anfangszustandes notwendigerweise erfüllt sein muss, um dieses Verfahren bei der Kontrolle eines Prozesses sinnvoll anwenden zu können. Ohne den Anfangszustand lässt sich der optimale Vektor der Steuergrößen und somit auch die optimale Entwicklung des Systems nicht ermitteln. Im Folgenden werden die Schwierigkeiten erläutert, die mit einer Steuerung verbunden sind, wenn der Prozess nicht bekannt ist. Werden die zeitlichen Vorgänge von zufalligen Störungen überlagert, dann kann das zeitliche Verhalten nicht exakt antizipiert werden. Folglich wird das tatsächliche Verhalten des Systems vom erwarteten Verhalten abweichen, so dass der durch die Steuerung beabsichtigte, optimale Zustand nicht eintritt (Föllinger (1994b), Seite I). Damit stellt sich die Frage, inwiefern Störungen eine optimale Steuerung verhindern. Zunächst ist festzuhalten, dass die Steuerung keine Rückkoppelung vorsieht. Entsprechend wird der Steuervektor bei einer störungsbedingten Abweichung der tatsächlichen Entwicklung vom gewünschten Verhalten nicht korrigiert. Eine etwas detailliertere Beurteilung der Steuerung ergibt sich, wenn man die folgenden Varianten stochastischer Prozesse unterscheidet. I. Betrachtet man den Fall einzelner Störungen, die die Parameter über einen längeren Zeitraum unverändert lassen, dann kann die Steuerung zumindest für den Zeitabschnitt zwischen zwei Störungen ein optimales Verhalten ermöglichen. Hier schaffen die Störungen jeweils neue Anfangszustände, für die der optimale Steuervektor und das optimale Systemverhalten neu zu ermitteln ist. 2. Treten Störungen mit einem regelmäßigen Muster auf, ist es unter Umständen möglich, sie mit Hilfe entsprechender Differentialgleichungen auf Einflüsse der Anfangsbedingungen zurückzuführen. Das Problem kann mit Hilfe einer Steuerung optimiert werden, indem man das dynamische System um diese Differentialgleichungen erweitert (Föllinger (l994a), Seite 45). 3. Unter Umständen ist der Prozess nicht vollständig bekannt, dennoch besitzt man Vorstellungen, mit welcher Wahrscheinlichkeit Störungen auftreten und mit welcher Wahrscheinlichkeit ein bestimmtes Verhalten der Systemgrößen auftritt. In diesem Fall ist es möglich, eine stochastische Optimierung durchzuführen, indem man den Erwartungswert der Zielfunktion optimiert. Wendet man das Verfahren der Steuerung an, dann dürfen

2 Theorie der optimalen Kontrolle

39

sich die Wahrscheinlichkeiten im Zeitablauf nicht ändern. Außerdem wird die erwartete Systementwicklung nachträglich nicht mehr auf die tatsächliche Systementwicklung abgestimmt. Ob die Vorgehensweise optimal ist, bleibt fraglich. 4. Treten Störungen vollkommen zufällig und ohne Muster auf, dann scheidet die Steuerung zur optimalen Kontrolle des Prozesses aus. Stattdessen bietet sich die Regelung an, die im nachfolgenden Abschnitt beschrieben wird. Ein Spezialfall der Steuerung, der auch als Steuerung mit Rückführung bezeichnet wird (Föllinger (1994b), Seite 9 ff.), stellt eine Übergangsform zwischen der Steuerung und der Regelung dar. Dieser Fall wird jedoch der Steuerung zugerechnet, da nur eine Abfrage binärer Informationen und keine laufende Beobachtung des Systems erfolgt. Eine genauere Erläuterung dieses Kontrollverfahrens und die Abgrenzung gegenüber der Regelung wird im Anschluss an die Regelung nachgereicht. Zusammenfassend kann festgehalten werden:

Definition 2.1 Eine optimale Steuerung ist eine Beeinflussung eines dynamischen Systems in der Form einer offenen Wirkungskette, bei der für einen vollständig bekannten Prozess und für einen bekannten Anfangszustand des Systems bereits zum Zeitpunkt t = 0 der optimale Steuervektor und die optimale Entwicklung des Systems für den gesamten Planungszeitraum ermittelt wird. In der Folgezeit wird nicht überprüft, ob die Istentwicklung der Sollentwicklung des Systems entspricht. Damit gibt es auch keine Möglichkeit, die Steuergrößen im Zeitablauf zu korrigieren.

2.3

Kontrolle eines Prozesses durch Regelung

(a) Charakterisierung einer Regelung Im vorhergehenden Abschnitt ist dargelegt worden, dass die Steuerung durch ihren einfachen Aufbau nicht geeignet ist, Prozesse zu kontrollieren, die nur unvollständig bekannt sind. Die entscheidende Erweiterung bei der Regelung besteht nun darin, dass der Informationsftuss von der steuernden Stelle zum Prozess ergänzt wird um ständige Informationen über den tatsächlichen Systemzustand an eine korrigierende Stelle. Dieser Regler wird in der Abbildung H.4 dargestellt. Der aktuelle Zustand des Prozesses wird fortlaufend beobachtet und die Informationen ftießen jederzeit in die Festlegung der optimalen Kontrollgröße u* für die Folgezeit ein. Die Kontrolle des Prozesses berücksichtigt die tatsächliche Entwicklung und wird daher als

Wirkungskreislauf, Regelkreis beziehungsweise geschlossener Regelkreis bezeichnet (Orlowski (1994), Seite 3).

40

Kapitel II Regulierung als Problem der optimalen Kontrolle

x= f(x, ü',~, t) Prozess

Ü·

-v

x

x

= ü'(x, t)

optimaler Regler Abbildung H.4: Regelung: In jedem Zeitpunkt t wird das aktuelle Ergebnis des Prozesses x(r) bei der Bestimmung des Reglers ü'(t) berücksichtigt. Das Resultat der Regelung wird ferner durch eine stochastische Größe t; beeinflusst.

Formal ist die Reglergröße eine Funktion der Zeit und des aktuellen Zustandes des Systems, das heißt ü

= ü(x, 1).

In der Abbildung II.4 wird von einer optimalen Größe ü' ausgegangen,

wobei die Forderungen an eine optimale Reglergröße im Abschnitt (b) näher erläutert werden. Zunächst fällt jedoch auf, dass das Ergebnis der Regelung in der Abbildung II.4 nicht als optimaler Zustand x· dargestellt ist. Der Grund hierfür liegt darin, dass der Prozess nicht vollständig bekannt ist beziehungsweise Störungen ausgesetzt ist. Somit kann das resultierende Ergebnis x der Regelung in einem Zeitpunkt t von dem erwarteten optimalen Ergebnis x· abweichen. In der Abbildung II.4 wird dieser Aspekt dadurch symbolisiert, dass der Prozess von einer zusätzlichen stochastischen Größe

~

beeinflusst wird.

Da es unsicher ist, ob die Sollentwicklung tatsächlich erreicht wird, lassen sich die Steuerung und die Regelung wie folgt beurteilen: Die Steuerung erscheint als ein sehr starres Kontrollverfahren, da sie bei unvorhergesehenen Abweichungen des Systemverhaltens vom Sollverhalten nicht reagieren kann. Die optimale Steuergröße u'

= (xo, t) hängt zu keinem Zeitpunkt vom

aktuellen Zustand des Systems ab, sondern nur vom Anfangszustand Xo. Dagegen beobachtet die Regelung das System fortlaufend und die Kontrollgrößen werden kontinuierlich mit Hilfe der beobachteten Daten angepasst. Die optimale Reglergröße ü'(x, t) hängt somit nicht mehr vom Anfangszustand, sondern vom aktuellen Systemzustand ab. Da die Steuerung vom An-

2 Theorie der optimalen Kontrolle

41

fangszustand abhängt, wird sie als vergangenheitsorientierte Kontrolle bezeichnet. Dagegen berücksichtigt die Regelung den jeweils aktuellen Zustand des Systems; sie entspricht daher einer gegenwartsorientierten Kontrolle. Bevor mögliche Probleme einer Regelung und Kriterien der Optimierung erläutert werden, ist noch einmal die Flexibilität der Regelung hervorzuheben. Mit dem ständigen Vergleich von Sollzustand und Istzustand verbindet sich die Vorstellung eines Automatismus. Ist der Sollzustand gleich dem Istzustand, besteht keine Notwendigkeit, den Prozess zu korrigieren. Weichen hingegen die beiden Größen voneinander ab, wird die Regelung wirksam, wobei die Intensität, mit der die Regelung ü eingesetzt wird, im Wesentlichen von der Differenz zwischen dem Sollzustand und dem Istzustand determiniert wird. Die Abbildung 11.4 veranschaulicht diesen Zusammenhang in der Form eines Regelkreises. Allerdings ist zu beachten, dass die Effekte der regelnden Einrichtung unter Umständen erst mit einer Zeitverzögerung - sogenannten Totzeiten - zu beobachten sind (Bobzin (1999». Die notwendigen Voraussetzungen 1 (bekannter Prozess) und 2 (bekannter Anfangszustand) für eine Anwendung der Steuerung sind für die Regelung ohne Belang. So ist für t > 0 der Anfangszustand des Systems nicht mehr von Bedeutung, da der Steuervektor immer in Abhängigkeit vom tatsächlichen Zustand des Systems im aktuellen Zeitpunkt bestimmt wird. Ferner ist die Regelung so konzipiert, dass sie zur Kontrolle eines unvollständig bekannten Prozesses und bei stochastischen Störungen angewendet werden kann, da sie einen ständigen Vergleich der Istentwicklung mit dem Sollzustand vorsieht. Dafür erfordert die Regelung, dass der Zustand des Systems entweder direkt beobachtet werden kann, oder dass man auf den Zustand des Systems zurückschließen kann, indem man anderer Größen (sogenannte Signale) auswertet. Die Regelung lässt die Idee einer optimalen ex ante-Steuerung eines Prozesses fallen. Sie versucht statt dessen im Sinne einer Korrektureinrichtung bei Abweichungen vom gewünschten Verhalten des Systems, die Istgröße an eine SolIgröße anzupassen. Entsprechend bezieht sich der Begriff einer optimalen Regelung auf die Optimierung eines Gütekriteriums, das die Anpassung der tatsächlichen Entwicklung des Systems an einen gewünschten Verlauf bewertet. Beispiele für entsprechende Gütekriterien werden im Abschnitt (b) diskutiert. Zusammenfassend kann die Regelung und ihre Optimierung wie folgt definiert werden (Föllinger (I 994b ), Seite 4): Definition 2.2 Eine Regelung ist eine Korrektur eines unvollständig bekannten dynamischen

Systems in der Form eines Wirkungskreislaufes, der dadurch gekennzeichnet ist, dass Abweichungen zwischen der zu regelnden Größe und der Sollgröße laufend beobachtet werden und die Kontrollvariablenjeweils unter Berücksichtigung dieser Informationfestgelegt werden. Die Regelung ist optimal, wenn eine hinsichtlich eines Kriteriums, das die Güte der Anpassung bewertet, optimale Angleichung der Istentwicklung an den Sollverlauf erfolgt.

42

Kapitel II Regulierung als Problem der optimalen Kontrolle

(b) Forderungen an eine optimale Regelung

Im Folgenden wird ein Prozess unterstellt, der nur unvollständig bekannt ist oder Störungen unterliegt. Dadurch ist es nicht möglich, die sich als Reaktion auf eine Störung durch die Regelung ergibt, ex ante zu untersuchen. Um trotzdem einen Vergleich verschiedener Regelungen und so die Wahl der optimalen Regelung zu ermöglichen, wird analysiert, wie sich die Regelung auf den Prozess auswirkt, wenn eine einmalige fiktive Störung auftritt. Ferner wird angenommen, dass sich das System vor der Störung in Ruhe befindet, das heißt, der Istzustand stimmt mit dem Soll zustand des Systems überein. Die fiktive Störung kann entweder als Veränderung des Systemverhaltens oder als Änderung der Soll größe modelliert werden. Die entstehende Differenz zwischen dem Sollzustand und der Istgröße ruft dann Änderungen der Regiergrößen ü hervor, wobei die resultierende Anpassung des tatsächlichen Zeitpfades an die gewünschte Entwicklung auch als Einschwingvorgang bezeichnet wird. Diese Wortwahl illustriert die Vorstellung, dass das ruhende System gestört wird und sich mit Hilfe der Regelung wieder beruhigen soll, sich also erneut einschwingt. Im Rahmen der Ingenieurwissenschaften werden im Allgemeinen folgende Forderungen an eine Regelung gestellt. I. Die Systemgrößen, die durch die Störung angeregt worden sind, sollen nach endlicher Zeit wieder in einen Ruhezustand übergehen (Forderungen nach Stabilität des Regelkreises).

2. Die Differenz zwischen Soll- und Istgrößen soll nach dem Abklingen des Einschwingvorgangs möglichst gering sein (Forderung nach hinreichender stationärer Genauigkeit). 3. Die Anpassung der Istgröße an die Sollgröße soll möglichst schnell erfolgen (Forderung nach einer schnellen Anpassung).

4. Während des Anpassungsvorgangs sollen nicht zu hohe Differenzen zwischen den Istgrößen und den Sollgrößen auftreten (Forderung nach gedämpften Schwingungen, beziehungsweise nach geringer Überschwingweite). Die Bedeutung dieser Forderungen für die Beurteilung einer Regelung ist verständlich. Wird zum Beispiel ein Einschwingvorgang hervorgerufen, der im Zeitablauf nicht abklingt, so ist die Regelung instabil und nach der Störung ist eine dauerhafte Fortsetzung des Eingriffs notwendig. Die genannten Forderungen können zumeist nicht gleichzeitig erfüllt werden. So widersprechen sich beispielsweise die Forderung einer schnellen Anpassung und einer geringen Überschwingweite beziehungsweise Stabilität. Ein relativ starker Eingriff impliziert zwar eine sehr schnelle Anpassung an die gewünschte Entwicklung, er ist aber häufig mit der Gefahr verbunden, dass er über das Ziel hinausschießt. Welche Gewichtungen die Forderungen erhalten, hängt zum Teil

43

2 Theorie der optimalen Kontrolle

von den Präferenzen des Regelnden ab und wird zudem von den dynamischen Eigenschaften des Prozesses, insbesondere der Sensibilität bezüglich der Stärke der Eingriffe, bestimmt. In der Ökonomik wird die anfängliche Entwicklung im Allgemeinen stärker gewichtet, was sich in einer Diskontierung in der jeweiligen Zielfunktion niederschlägt. Im Folgenden werden Gütekriterien zur Beurteilung der Qualität einer Anpassung vorgestellt, wie sie in der Theorie der optimalen Kontrolle im Rahmen der Ingenieurwissenschaften verwendet werden. Die Bedeutung dieser Aspekte für die ökonomische Anwendung der Kontrolltheorie wird im Anschluss erörtert. Ansatzpunkt ist die im Zeitablauf jeweils realisierte Differenz zwischen der Sollgröße und der Istgröße, wobei die Bewertung davon abhängt, wie stark beziehungsweise wie schnell oder wie dauerhaft die Annäherung an die gewünschte Größe erfolgt. Hängt die Entwicklung des Istzustandes von Parametern der Regelung ab, so wird versucht, den besten Regler durch eine Optimierung der Parameter zu bestimmen. Unter allen denkbaren Reglern wird deIjenige gewählt, der den Wert des jeweiligen Gütekriteriums optimiert (Föllinger (1994b), Seite 253 ff.). Statt die tatsächliche Entwicklung festzulegen, wird also ein Regler installiert, der das beste Anpassungsverhalten an eine gewünschte Entwicklung aufweist. Diese Vorgehensweise wird später bei der Anwendung der Theorie der optimalen Kontrolle auf das Problem der Regulierung eines Monopols mittels einer fall weisen Preisreduktion aufgegriffen (Seite 249 ff.). Ein mögliches Kriterium, die Regelung zu beurteilen, ist das Integral über der Abweichung zwischen der Sollgröße x,(t) und der Istgröße x(t), bezogen auf den Betrachtungszeitraum. Auf Grund

x

xo

der funktionalen Form wird dieses Integral in der Kontrolltheorie lineare Regeljläche genannt. Die Regelung ist dann optimal, wenn der Wert des Integrals minimiert wird. Formal lautet der Optimie-

0

rungsansatz

l'O

[x(t) - x,(t)) dt

~ min,

Abbildung

n.s: Lineare Regelfläche

(2.1)

wobei die Nebenbedingungen durch die Bewegungsgleichungen für die Zustandsgrößen sowie sonstige Restriktionen für Zustände und Steuergrößen gegeben sind. Die Abbildung n.5 zeigt die Entwicklung einer Istgröße x im Zeitablauf. Beispielhaft wird angenommen, dass der Soll verlauf der Größe x, im Betrachtungszeitraum konstant X, ist. In t

=

0 nimmt die Istgröße den Wert Xo > X, an. Auf Grund der Regelung schwingt sich

der Istwert x(t) im Zeitablauf in der Nähe des Sollwertes ein. Diese Anpassung erfolgt in gedämpften Schwingungen. Das Integral aus (2.1) entspricht der schraffierten Fläche, wobei

Kapitel 11 Regulierung als Problem der optimalen Kontrolle

44

die Bereiche mit x(t) > i. mit positivem, die Flächen mit x(t) < i. mit negativem Vorzeichen eingehen. Das Vorgehen hat den Nachteil, dass das Integral null ist, falls konstante Dauerschwingungen um den Sollzustand ausgelöst werden, so dass sich positive und negative Differenzen autbeben. Ferner wird der Wert des Integrals um so niedriger, je häufiger x(t) die Sollgröße x.(t) unterschreitet. Dominiert die Unterschreitung des Sollwertes, ist der Wert des Integrals kleiner null. Die Minimierung führt in diesem Fall dazu, dass der Regler als optimal erscheint, der die Sollgröße am stärksten unterschreitet. Das Ziel besteht jedoch in den meisten Fällen darin, sowohl positive als auch negative Abweichungen vom Sollwert zu vermeiden. Das Kriterium der linearen Regelftäche ist deshalb im Allgemeinen ungeeignet, einen optimalen Regler zu bestimmen. Verfolgt die Regelung das Ziel, einen Sollwert dauerhaft und exakt zu erreichen, so muss ein Kriterium verwendet werden, das negative Abweichungen genauso bewertet wie eine Überschreitung des Sollwertes. Aus diesem Grund bietet es sich an, statt der Differenz x(t) - x.(t) den Betrag der Abweichung Ix(t) - x.(t)1 zu belÜcksichtigen. Analog zur linearen Regelftäche lautet die zu minimierende Ziel funktion

L'"

(2.2)

Ix(t) - x.(t)ldt.

Eine weitere Forderung an eine "gute" Regelung verlangt. dass sich die tatsächliche Entwicklung möglichst schnell an die Sollentwicklung anpasst. Ferner wird gefordert, dass die Annäherung auch dauerhaft erhalten bleibt. In Bezug auf das Gütekriterium einer Regelung sind Abweichungen um so mehr zu vermeiden, je weiter sie in der Zukunft liegen. Die entsprechende zeitbeschwerte betragslineare Regeljläche

1

00

(2.3)

tlx(t) - x.(t)ldt

wird auch als lTAE-Kriterium bezeichnet, wobei ITAE für integral 0/ time multiplied absolute

value 0/ error steht. Man beachte, dass es in der Ökonomik üblich ist, solche Effekte, die weit in der Zukunft liegen, weniger stark als kurzfristige Effekte zu gewichten. Dabei wird die hier vorgenommene Gewichtung mit dem Faktor t durch e- rt ersetzt, so dass solche Regelungsparameter bevorzugt werden, die eine gute Zielerreichung in der Anfangszeit implizieren, während eine dauerhafte Annäherung von untergeordneter Bedeutung ist. In der Regel beobachtet man, dass die Istgröße um so weiter über das Ziel hinausschießt, je schneller die Anpassung vonstatten geht. Dieser Effekt wird durch die quadratische Regeljläche erfasst (FölIinger (1994b), Seite 254 ff.), bei der das Integral der quadratischen Abweichung minimiert wird.

1

00

[x(t) - x.(t)]2 dt

-+

min.

(2.4)

2 Theorie der optimalen Kontrolle

45

Legt man dieses Kriterium zu Grunde, werden - wie auch bei dem Betrag der linearen Regelfläche - positive und negative Differenzen zwischen Sollwert und Istgröße gleich bewertet. Ferner führen hohe Amplituden der Schwankungen durch die Quadratur zu hohen und damit zu schlechten Werten des Güternaßes. Zur Beurteilung der Regelung sind abschließend folgende Aussagen festzuhalten. 8 • Die Optimierung der Regelung erfolgt anhand von qualitativen Forderungen, die mit Hilfe der vorgestellten Gütekriterien in quantifizierbare Größen umgesetzt werden können. Je nach Wahl des Gütemaßes kann die Betonung auf unterschiedlichen Kriterien liegen. • Der Vorteil der Regelung besteht darin, dass das System auf unvorhergesehene Störungen reagieren kann. Bei einer optimalen Regelung wird ein solcher Regler gewählt, der in Bezug auf das jeweils gewählte Güternaß die bestmögliche Anpassung an den gewünschten Pfad gewährleistet.

2.4 Steuerung mit Rückführung als Übergangsform von der Steuerung zur Regelung In der Tabelle 11.3 sind die Charakteristika einer Steuerung und einer Regelung zusammengefasst. Auf der Grundlage dieser Abgrenzung wird im Folgenden ein Spezialfall der Steuerung angesprochen - die Steuerung mit Rückführung -, der eine Übergangsform von der Steuerung hin zur Regelung darstellt, jedoch der Steuerung zugeordnet wird (Föllinger (I 994b), Seite 810).

Wie die Tabelle 11.3 zeigt, verlangt die Steuerung insbesondere, dass der zu kontrollierende Prozess vollständig bekannt ist. Daher genügt die Information über den Zustand Xo, eine optimale Lenkung des Prozesses zu berechnen. Eine kontinuierliche Beobachtung der Systementwicklung entflillt. Ist der Prozess hingegen zufälligen Störungen unterworfen, so muss die tatsächliche Systementwicklung beobachtet werden, wobei der Regler gegebenenfalls korrigierend eingreift. Statt den Kontrollmechanismus als einfache Wirkungskette aufzubauen, wird hier ein Wirkungskreislauf gewählt, bei dem kontinuierlich die Daten über die aktuelle Entwicklung bei der Festlegung der momentanen Steuergrößen berücksichtigt werden. Obwohl es sinnvoll zu sein scheint, gestörte Prozesse ständig zu überwachen, ist dennoch zu berücksichtigen, dass eine derartige Beobachtung und die Verarbeitung der entsprechenden Informationen sehr aufwendig sein kann. Übersteigen die Kosten der Überwachung den zu erwartenden Nutzen, dann stellt sich die Frage, ob es nicht sinnvoller ist, den Zustand des Systems 8

Vgl. Föllinger (1994b), Seite 257 ff.

46

Kapitel II Regulierung als Problem der optimalen Kontrolle Steuerung vollständig bekannt, deterministisch

Regelung unvollständig bekannt mit stochastischen Störungen

Anfangszustand Beobachtung des Prozesses

vollständig bekannt nicht notwendig

muss nicht bekannt sein notwendig

optimale Kontrolle



Aufbau des Kontrollmechanismus

Wirkungskette, keine Rückkoppelung

Wirkungskreislauf mit Rückkoppelung

Ergebnis der Optimierung

optimale Entwicklung des Systems im gesamten Planungszeitraum

optimale Anpassung der Istentwicklung an eine Sollentwicklung des Systems nach einer Störung

Probleme des Verfahrens

Korrektur des Prozesses bei Fehlentwicklungen auf Grund von nicht erwarteten Störungen nicht möglich

nicht alle Anforderungen an eine optimale Anpassung gleichzeitig erfüllbar (trade-offs), Zustand des Systems muss beobachtbar sein

Prozess

= u·("o, t)

ü·

=ü·(x(t), t)

Tabelle 113: Charakteristika einer Steuerung und einer Regelung

nur gelegentlich zu überprüfen. Dieser Weg zwischen der Steuerung und der Regelung wird bei der Steuerung mit Rückführung beschritten. Die Abgrenzung wird deutlich, wenn man sich dem Grad der Unkenntnis bezüglich des Prozesses und der Art der Informationen zuwendet, die zu verarbeiten sind. So wird unterstellt, dass sich die Informationsdefizite auf bestimmte Bedingungen beschränken. Allerdings ist der Prozess, der diesen Bedingungen unterliegt, vollständig bekannt und nicht gestört. Damit ist es unnötig, den Prozess fortlaufend zu beobachten; es reicht aus, von Zeit zu Zeit zu überprüfen, ob die angesprochenen Bedingungen erfüllt sind oder nicht. Diese binären Informationen werden an die lenkende Stelle zurückgeführt. Da der Prozess selbst für beide Fälle vollständig bekannt ist, lässt sich die Systementwicklung lückenlos berechnen. Folglich wird dieses Verfahren der Steuerung zugerechnet. Eine detailliertere Darstellung findet sich zum Beispiel in Föllinger (1994b), Seite 8 ff.

3 Übertragung der Kontrolltheorie auf die Theorie der Regulierung

47

3 Übertragung der Theorie der optimalen Kontrolle auf die intertemporale Theorie der Regulierung 3.1

Regulierung als Problem der optimalen Steuerung

In den beiden vorhergehenden Abschnitten sind zwei Themenbereiche behandelt worden. Zunächst führt der Abschnitt I in die ökonomische Theorie der Regulierung ein, wobei die Argumente für eine Regulierung von Unternehmen sowie diverse Instrumente in ihrer Wirkungsweise diskutiert werden. Anschließend setzt sich der Abschnitt 2 mit den Verfahren der Kontrolltheorie auseinander, die für eine optimale Lenkung dynamischer Prozesse zur Verfügung stehen. Darauf aufbauend wird in diesem Kapitel eine Synthese erarbeitet, indem die Methoden der Kontrolltheorie - die Steuerung und die Regelung - auf das Problem der Regulierung von Unternehmen angewendet werden. Zum einen wird der dynamische Prozess skizziert. der reguliert werden soll, zum anderen werden unterschiedliche Inforrnationsvoraussetzungen der Regulierungsbehörde und damit die Anwendbarkeit der verschiedenen Kontrollverfahren angesprochen. Eine explizite ModelIierung und die Lösung des Optimierungsansatzes wird erst im dritten Kapitel vorgenommen. Betrachtet wird die Regulierung eines Monopols, das unter Verwendung zweier Produktionsfaktoren, dem Faktor Arbeit

Va

und dem Kapitalstock

Vb

ein Gut in der Menge x herstellt.

Der Kapitalstock bezeichnet eine Zustandsgröße, die im Zeitablauf über Investitionen fortgeschrieben wird. Das Unternehmen verfolgt dabei das Ziel, den intertemporalen Gewinn zu maximieren. Das Verhalten des Unternehmens lässt sich als dynamischer Prozess darstellen, der die Veränderung des Kapitalstocks Vk sowie die resultierende Änderung des Arbeitseinsatzes

Va, des Outputs i, des momentanen Gewinns

Gund der Rentabilität s im Zeitablauf beschreibt.

Wie im Abschnitt 1.4 dargestellt worden ist, ergeben sich weitere dynamische Aspekte durch die Berücksichtigung von technischem Fortschritt oder auch durch Änderungen der Faktorpreise im Zeitablauf. Wenn das Unternehmen als Monopol über Marktrnacht verfügt. kann es in der Regel eine hohe Monopolrente zu Lasten der Konsumenten erwirtschaften. Damit stellt sich ein Marktergebnis ein. das aus Wohlstandssicht suboptimal ist. Die Regulierungsbehörde verfolgt daher das Ziel, den dynamischen Prozess beziehungsweise das Verhalten des Unternehmens im Zeitablauf so zu lenken, dass der gesamtwirtschaftliche kumulierte Wohlstand W maximiert wird. Beispielhaft wird hier davon ausgegangen, dass die Behörde den Preis reguliert. Damit entspricht der Preis pet) der Steuergröße des Kontrollproblems. Die Abbildung 1I.6 illustriert das Optimierungsproblem der Regulierungsbehörde. das hier als Steuerungsproblem aufgefasst wird. Dabei ist zu beachten, dass das Verhalten des Unter-

48

Kapitel 11 Regulierung als Problem der optimalen Kontrolle

Prozess:

bekannte Anfangszustände

• intertemporale Maximierung des Gewinns durch das Unternehmen,

'·"~'r"o optimaler Preis p' (VkO, VaO. xo. Go. So. t)

p'

Vh Va,

x, (;, s

vZ(t), v:(t), x'(t), G'(t), s'(t)

• technischer Fortschri tt • Änderung der Faktorpreise

Abbildung 11.6: Optimale Regulierung in der Form einer Wirkungskette (optimale Steuerung)

nehmens selbst die Lösung eines Kontrollproblems darstellt. nämlich das der intertemporalen Maximierung des Gewinns durch das Unternehmen. Wie im Abschnitt 2.2 argumentiert worden ist, setzt die Optimierung per Steuerung voraus. dass die Regulierungsbehörde den Anfangszustand des Systems und dessen Dynamik kennt. In Bezug auf das vorliegende Problem erfordert eine optimale Steuerung. dass die Behörde eine vollständige Information über die Startsituation, also die eingesetzten Mengen der Produktionsfaktoren im Zeitpunkt t

= 0 und somit den zuge-

hörigen Gewinn beziehungsweise die Rentabilität besitzt. Zudem muss die Entwicklung für den gesamten Planungszeitraum bekannt sein. Die Regulierungsbehörde kennt also die Lösung des intertemporalen Gewinnmaximierungsproblems der Unternehmung und damit die Änderung der eingesetzten Menge an Arbeit Va und Kapital Vk sowie die resultierenden Änderungen des Gewinnes

G und der Rentabilität S. Lässt man außerdem technischen Fortschritt und Änderun-

gen der Faktorpreise zu. dann muss die Behörde außerdem wissen, wie die Unternehmung auf veränderte Randbedingungen reagiert. Auf dieser Basis ist es möglich. das Steuerungsprob1em im Zeitpunkt

t

= 0 zu lösen und den optimalen Zeitpfad des Preises p'(t) für den gesamten

Planungszeitraum zu ermitteln. so dass der Barwert des kumulierten aggregierten Wohlstandes maximiert wird. Die Regulierung erfolgt hier in der Form einer \Virkungskette. wie sie in der Abbildung 11.6 dargestellt worden ist. Der von der Behörde zu Beginn ermittelte Zeitpfad für die Steuergröße p*(t) wird auf den Prozess angewendet. ohne dass das Ergebnis der Regulierung im Zeitablauf kontrolliert wird. Allerdings ist eine derartige Kontrolle gemäß den Modellannahmen auch nicht notwendig. weil der Prozess bei der Festlegung der optimalen Steuergrößen vollständig bekannt ist und keinen stochastischen Störungen unterliegt.

3 Übertragung der Kontrolltheorie auf die Theorie der Regulierung

49

Die Diskussion der vorausgesetzten Informationen legt bereits nahe, dass die Annahme vollständiger Information unrealistisch ist. Der Ansatz eignet sich jedoch als Referenzszenario. Insbesondere der technische Fortschritt lässt sich analog zu den in Abschnitt 2.2 diskutierten Varianten einer ModelIierung stochastischer Prozesse wie folgt einbeziehen.

I. Wenn die Behörde die Produktionstechnik des Unternehmens in der Ausgangssituation kennt, kann sie die Entwicklung des Faktoreinsatzes und damit die Entwicklung des Gewinns beziehungsweise der Rentabilität für die gegebene Produktionstechnik antizipieren. Der technische Fortschritt tritt nun in der Form von diskreten exogenen Schocks auf, die beobachtbar sind. Die Steuerung ermöglicht ein optimales Systemverhalten für den Zeitraum zwischen zwei Schocks. Die technische Entwicklung wird als Schaffung neuer Anfangsbedingungen interpretiert, für die ein neues Steuerungsproblem zu lösen ist.

2. Ein alternativer Ansatz erfasst den technischen Fortschritt als endogene Größe des dynamischen Systems. Hier werden Informationen benötigt, wie die technische Entwicklung von den anderen Größen des Modells abhängt. Häufig wird arbeitssparender technischer Fortschritt unterstellt, bei dem sich die Effizienz des Faktors Arbeit über die Zeit hinweg erhöht. Das dynamische System kann dann um eine weitere Bewegungsgleichung erweitert werden, die als Nebenbedingung des Optimierungsproblems zu berücksichtigen ist. 3. Falls die Regulierungsbehörde den technischen Fortschritt nicht exakt antizipieren kann, aber eine Vorstellung über die Wahrscheinlichkeitsverteilung besitzt, kann die optimale Steuerung als Lösung eines Optimierungsproblems betrachtet werden, bei dem der Barwert des erwarteten Wohlstandes maximiert wird. Die Änderungen der Faktorpreise und sonstige dynamische Effekte können analog in die Modellierung integriert werden. Um die Steuerung als Verfahren zur optimalen Regulierung im dynamischen Kontext zusammenfassend zu beurteilen, ist darauf zu verweisen, dass die Kenntnisse der Behörde über das zu lenkende dynamische System im Gegensatz zur Realität sehr umfangreich sein müssen. Im Idealfall liefert die Steuerung eine optimale Strategie für den zu Grunde liegenden Planungszeitraum. Allerdings wird die Lösung nur dann ihrer Optimalitätseigenschaft gerecht, wenn der ablaufende Prozess tatsächlich dem antizipierten Verhalten entspricht. Hinsichtlich der Möglichkeiten, weitere dynamische Zusammenhänge in Form von zusätzlichen Bewegungsgleichungen zu berücksichtigen, ist zu beachten, dass komplexere Differentialgleichungssysteme nur selten analytisch lösbar sind. Damit steht die Handhabbarkeit der vollständigen Abbildung des dynamischen Systems entgegen.

Kapitel II Regulierung als Problem der optimalen Kontrolle

50

Darüber hinaus ist zu beachten, dass die Unternehmung auf jede Regulierungsrnaßnahme reagieren wird, so dass sich das Verhalten nach Einführung der Regulierung ändert. Über die Art und das Ausmaß der Anpassungen wird die Behörde im Startzeitpunkt zwar Vermutungen

haben, allerdings wird sie nur selten in der Lage sein, das Verhalten der Unternehmung für den gesamten Planungszeitraum zu antizipieren.

3.2

Regulierung als Problem der optimalen Regelung

Geht man davon aus, dass die Regulierungsbehörde keine vollständigen Informationen über das Verhalten einer Unternehmung hat, ist das Instrument der Steuerung nicht in der Lage, den Prozess optimal zu kontrollieren. Angesichts dieses Problems kann die Regulierungsbehörde zunächst versuchen, die Informationsdefizite zu beheben, indem sie Anreize für das Unternehmen schafft, die wirklichen Tatbestände offenzulegen. Das Unternehmen soll bereits in der Ausgangssituation freiwillig alle relevanten Informationen an die Regulierungsbehörde weiterleiten, so dass die Regulierung mit Hilfe der Steuerung optimiert werden kann. Ein anderer Weg besteht darin, statt der Steuerung das im Abschnitt 2.3 diskutierte Verfahren der optimalen Regelung anzuwenden. bekannte Anfangszustände

gewünschtes Verhalten

Beeinflussung durch die Regulierungsbehörde

Maßnahmen zur Regulierung

unvollständig bekannte Einflüsse

Gewinnmaximierung durch das Unternehmen (dynamisches System)

Information über das Systemverhalten im Zeitablauf

Systemverhalten im Zeitablauf

Systemverhalten im Zeitablauf Beobachtung durch die Regulierungsbehörde

Abbildung II.7: Regulierung als Regelkreis im Zeitablauf

3 Übertragung der Kontrolltheorie auf die Theorie der Regulierung

51

Entsprechend Abschnitt 2.3 ist das grundlegende Merkmal der Regelung, den Prozess durch einen Regelkreis statt einer Wirkungskette zu lenken. Die Abbildung n.7 stellt dieses Konzept für den Fall der Regulierung eines gewinnmaximierenden Unternehmens dar. Während bei der Steuerung die Informationen von der Regulierungsbehörde zum Unternehmen fließen und das Ergebnis nicht mehr kontrolliert wird, beobachtet die Behörde nun kontinuierlich, wie sich das Unternehmen verhält. Die gewonnenen Informationen über die tatsächliche Systementwicklung werden von der Regulierungsbehörde weiter verarbeitet und fließen bei der Festlegung der Kontrollgrößen für den folgenden Zeitraum ein. Damit lassen sich Regulierungsmaßnahmen anpassen, falls das resultierende Systemverhalten nicht mit der erwarteten Entwicklung übereinstimmt. Auf der Seite 42 sind verschiedene Anforderungen präsentiert worden, die in den Ingenieurwissenschaften an Regelungen gestellt werden. Im Hinblick auf das hier diskutierte ökonomische Problem der optimalen Regulierung eines Unternehmens sind diese Tatbestände wie folgt zu kommentieren. • Die Forderung nach einem stabilen Regelkreis ist bezogen auf die Regulierung eines Unternehmens insofern von Bedeutung, als jeder Eingriff in das unternehmerische Verhalten Kosten verursachen kann. Derartige Kosten vermindern den gesamtwirtschaftlichen Nutzen der jeweiligen Maßnahme. Somit ist zu prüfen, ob die Regulierung in der Lage ist, eine gewünschte Situation dauerhaft zu gewährleisten oder ob auf lange Sicht immer neue Eingriffe notwendig sind. Im Idealfall reicht die Vorgabe einer einzigen Verhaltensregel aus, den gewünschten Zustand auf lange Sicht zu realisieren. • Die Forderungen nach einer hinreichenden stationären Genauigkeit und einer schnellen Anpassung entsprechen der Vorgabe eines als wünschenswert erachteten Zeitpfads oder Zielzustandes. Die Regulierungsmaßnahmen müssen also danach beurteilt werden, wie gut die tatsächliche Entwicklung mit der gewünschten Entwicklung übereinstimmt. Die geforderte schnelle Anpassung in der ökonomischen Anwendung wird in der Diskontierung zukünftiger Ereignisse umgesetzt. Entsprechend wird die kurzfristige Entwicklung stark gewichtet. • Auch die Forderung nach einer geringen Überschwingweite lässt sich auf die Steuerung eines Unternehmens übertragen. So darf die Regulierung der Rentabilität nicht dazu führen, dass das induzierte Verhalten des Unternehmens zu extremen Schwankungen der Rentabilität beziehungsweise des Preises führt. Dem entsprechend erscheint es sinnvoll, die zuvor dargestellten Optimalitätskriterien der Regelungstechnik auf das vorliegende ökonomische Problem zu übertragen. Da die angegebenen Regelftächen jedoch entweder indifferent zwischen der kurzfristigen und der langfristigen

52

Kapitel II Regulierung als Problem der optimalen Kontrolle

Entwicklung sind oder - wie im Falle der zeitbeschwerten betragslinearen Regelfläche (Gleichung 2.3, Seite 44) - sogar eine im Zeitablauf zunehmende Gewichtung vorsehen, spielen sie in der Ökonomik eine eher untergeordnete Rolle. Stattdessen wird in wirtschaftlichen Problemen im Allgemeinen eine Diskontierung vorgenommen. Neben dieser im Zeitablauf abnehmenden Gewichtung zukünftiger Tatbestände ist die Unterschreitung der Zielvorgabe, also der fairen Rentabilität, für die Behörde ohne Belang. Abgesehen von der zeitlichen Gewichtung lassen sich die Gütemaße auf ökonomische Probleme übertragen. Man muss lediglich Vorstellungen darüber haben, wie sich das System entwickeln soll. Im Rahmen ökonomischer Modellierungen ist es durchaus üblich, Abweichungen mit Hilfe von quadratischen Schadensfunktionen zu bewerten. Beispielsweise untersuchen Sibley, Bailey (1978) eine Regulierung des Preises. Dabei wird die Abweichung der Rentabilitätsrate s(t) von einer vorgegebenen fairen Rate s(t) gemessen. Die Zielfunktion umfasst neben den Kosten, die durch einen regulatorischen Eingriff entstehen. den Barwert des kumulierten Schadens. der über die quadratische Abweichung der tatsächlichen Rentabilität von der Sollgröße, approximiert wird,

Man beachte. das Sibley, Bailey (1978) im Gegensatz zu der hier vorgestellten ModelIierung eine exogene Dynamik vorgeben. Die Entwicklung des Systems resultiert unter der Voraussetzung eines exogenen technischen Fortschritts und einer exogenen Änderung der Faktorpreise. In den folgenden Ansätzen stellt sich die Dynamik modellendogen aus der Lösung eines Optimierungsproblems ein.

4 Zusammenfassung Für die dynamischen Ansätze zur Theorie der Regulierung sind insbesondere zwei Theoriegebiete von herausragender Bedeutung. Dabei steht der ökonomischen Theorie der Regulierung die mathematische Theorie der optimalen Kontrolle gegenüber, wobei hier zwischen der Steuerung und der Regelung zu unterscheiden ist. Den Ausgangspunkt bildet die Beobachtung, dass sich bestimmte Marktergebnisse, Marktformen oder auch Marktverhalten nicht wie gewünscht einstellen. Damit stellt sich die Frage, inwiefern eine übergeordnete Instanz in der Lage ist, etwa durch Auflagen in Bezug auf das Verhalten der Unternehmung. bestimmte Zielvorstellungen zu realisieren. Zu diesem Zweck muss analysiert werden, wie sich das Unternehmen ohne Beeinflussung von außen verhält und wie sich dieses Verhalten ändert, wenn eine Behörde die Handlungsmöglichkeiten einschränkt. An dieser Stelle wird auf das Instrument der optimalen

4 Zusammenfassung

53

Kontrolle zurückgegriffen. Damit lassen sich die Abläufe dynamischer Prozesse analysieren und die Wirkungen verschiedener Eingriffe gegeneinander abwägen. Die Ausführungen verdeutlichen, dass die Regulierung von Unternehmen ein komplexer Prozess ist. So prägen asymmetrische Informationen das Verhältnis zwischen der Regulierungsbehörde und der Unternehmung. Erschwerend treten dynamische Veränderungen der Rahmenbedingungen auf den Faktormärkten hinzu. Darüber hinaus sind dynamische Effekte zu berücksichtigen, die sich aus dem Verhalten des Unternehmens und seiner Reaktion auf die Vorgaben der Regulierungsbehörde ergeben. Diese Tatbestände erschweren es, das regulierte Verhalten der Unternehmung optimal zu gestalten oder überhaupt den Wohlstand gegenüber der Laissezfaire-Situation zu verbessern. Die Kontrolltheorie liefert einen Einblick, unter welchen Bedingungen die Regulierung einer optimalen Steuerung beziehungsweise einer optimalen Regelung entspricht.

Im Rahmen der folgenden theoretischen Analyse werden beide Verfahren der Kontrolltheorie angewendet. Das Optimierungsproblem des Unternehmens wird jeweils in der Form einer optimalen Steuerung modelliert. Hier maximiert das Unternehmen seinen Gewinn unter der Annahme der vollständigen Information. Die Art der Regulierung, die die Behörde zur Lenkung des unternehmerischen Verhaltens wählt, wird hingegen auch in der Form einer Regelung modelliert. So wird im Kapitel III (Teil 2.2 beziehungsweise 3.3) eine Regulierung des Preises betrachtet, bei der die Stärke des Eingriffs der Regulierungsbehörde im jeweiligen Zeitpunkt I

vom aktuellen Verhalten des Unternehmens abhängt. In diesem Zusammenhang werden die

Forderungen, die an eine optimale Regelung zu stellen sind, erneut aufgegriffen und diskutiert.

Kapitel 111

Optimale Regulierung eines Angebotsmonopols bei intertemporaler Maximierung des Gewinns 1 Modellierung der Ausgangssituation 1.1 1.1.1

Vorstellung des Grundmodells Problemstellung

Den Gegenstand der folgenden Ausführungen bildet die Analyse einer Regulierung im dynamischen Kontext. Um eine geeignete Ausgangssituation für die Regulierung zu schaffen, wird zunächst das Verhalten eines unregulierten Monopols analysiert, das bestrebt ist, den Barwert seines Gewinns über den Planungszeitraum t

E

[0,00] zu maximieren. Hier wird gezeigt,

wie sich das Unternehmen bei optimalem intertemporalen Verhalten langfristig einem Gleichgewicht nähert. Dieses Gleichgewicht ist dadurch charakterisiert, dass der Kapitalstock des Unternehmens konstant ist und das Unternehmen dauerhaft einen positiven und konstanten momentanen Gewinn erwirtschaftet. Das ermittelte Gleichgewicht stellt den Endpunkt einer optimalen Entwicklung dar, die die Lösung des intertemporalen Gewinnmaximierungsproblem des

Unternehmens liefert. Hat das Unternehmen das Gleichgewicht einmal erreicht, so ist es ohne eine exogene Störung optimal, diesen Ruhezustand nicht zu verlassen. Die Motivation für die im Folgenden eingeführte Regulierung ergibt sich durch die unterstellte Produktionstechnik und die daraus resultierende Marktform. So wird angenommen, dass das Unternehmen über eine Produktionstechnik verfügt, die steigende Skalenerträge aufweist. Damit ist das Unternehmen in der Lage, ein Monopol und folglich Marktrnacht aufzubauen (Baumol, Panzar, Willig (1982), Seite 17 ff.). Als Resultat stellt sich eine Situation ein, die insbesondere aus der Sicht

KapitelllI Optimale Regulierung

56

der Konsumenten, aber auch hinsichtlich des gesamtwirtschaftlichen Wohlstands schlechter als das Marktergebnis bei vollständiger Konkurrenz ist. Ausgehend von dem oben beschriebenen langfristigen Gleichgewicht des unregulierten Monopolfalls werden anschließend die Implikationen der Regulierung für das optimale Verhalten des Unternehmens im Zeitablauf diskutiert. Durch die Einführung der jeweiligen Regulierungsmaßnahme verliert das ursprüngliche Gleichgewicht des unregulierten Monopols seine Gleichgewichtseigenschaft. Vielmehr erweist es sich für das Unternehmen als optimal, diesen Punkt zu verlassen, und auf eine andere Trajektorie überzuwechseln, die die optimale Entwicklung des Unternehmens bei Regulierung beschreibt. In diesem Zusammenhang wird untersucht, welche Entwicklung das Unternehmen nach Einführung der Regulierung wählt, und wie sich diese Entwicklung auf die eingesetzten Faktormengen und den Gewinn beziehungsweise die Konsumentenrente auswirken. Ferner stellt sich die Frage, ob das Unternehmen bei bindender Regulierung in der Lage ist, einen neuen Ruhezustand, also ein reguliertes Gleichgewicht zu erreichen. Die Regulierung wird zunächst in der Form einer direkten Beschränkung der Rentabilität vorgenommen. wie sie im statischen Sinne entsprechend Averch, Johnson (1962) auf der Seite 23 vorgestellt worden ist. Hier wird die Beschränkung jedoch als Nebenbedingung in einem dynamischen Problem der Gewinnmaximierung analysiert. Durch die verwendete Produktionstechnik mit steigenden Skalenerträgen wird explizit eine Situation geschaffen, die hinreichend für die Existenz eines Monopols ist (Baumol, Panzar, Willig (1982), Seite 17 ff.). Wie beim unregulierten Monopol werden die notwendigen und hinreichenden Bedingungen gemäß dem Maximumprinzip hergeleitet und die resultierenden Phasendiagramme untersucht. Dabei erfolgt in Ergänzung zu Dechert (1984) eine detaillierte Analyse der Diagramme unter Berücksichtigung verschiedener Annahmen über die Investitionskosten sowie die Auswirkung unterschiedlich hoher Skalenerträge. Die direkte Beschränkung der Rentabilität stellt als Regulierung ein relativ starres Instrument dar. Zieht man die empirische Beschreibung des Verfahrens hinzu (Seite 27), so zeigt sich, dass die Rentabilität nicht - wie in dem oben beschriebenen Ansatz theoretisch unterstellt wird für einen unendlichen oder zumindest sehr langen Zeitraum fixiert und unverändert beibehalten wird. Vielmehr finden in regelmäßigen Abständen Anhörungsverfahren durch die jeweilige Regulierungsbehörde statt, in denen die "faire" Höhe der Ertragsrate beziehungsweise die zugehörigen Preise, die diese Rentabilität gewährleisten soHen, fixiert werden (vgl. Spulber (1989), Seite 268 ff.). Diese Methode erweist sich als problematisch, da weitere Sanktionen als Reaktion auf ein Fehlverhalten des Unternehmens nicht berücksichtigt werden. Der zweite Ansatz modelliert die Regulierung durch einen Prozess der Preisanpassung statt durch eine starre Nebenbedingung. Dieser Prozess wird damit den Ansprüchen einer dynami-

1 Modellierung der Ausgangssituation

57

schen Regulierung im Sinne einer Regelung (Seite 39) gerecht, mit der die Behörde auf ein Verhalten des Unternehmens in jedem einzelnen Zeitpunkt reagiert. In der Realität werden automatische Anpassungsmechanismen unter anderem herangezogen, um auf Änderungen der Faktorpreise reagieren zu können. Damit lässt sich eine ständige gerichtliche Festlegung der zulässigen Bruttorentabilität beziehungsweise des zugehörigen Preises vermeiden (Berg, Tschirhart (1988), Seite 365). Von exogenen Schwankungen der Faktorpreise wird hier abgesehen. Vielmehr wird die Preisanpassung als Sanktion aufgefasst, über die unter der Berücksichtigung des dynamischen Verhaltens der Unternehmung - schrittweise der erwünschte Zustand der Als-ob-Konkurrenz erreicht werden kann. Erwirtschaftet das Unternehmen eine zu hohe Rentabilität, so erfolgt eine kontinuierliche Reduktion des Preises, bis die Rentabilität schließlich dem von der Regulierungsbehörde als fair erachteten Wert entspricht. Im Idealfall verharrt das Unternehmen in dieser Situation, so dass der regulierte Preis und die Rentabilität unverändert beibehalten werden. Fällt die Rentabilität unter die von der Regulierungsbehörde vorgegebene und als fair erachtete Schranke, ist die Regulierung überflüssig und wird aufgehoben. Dieses Vorgehen gewährleistet, dass die Regulierung nur dann angewendet wird, wenn sie tatsächlich notwendig ist. Allerdings weiß die Unternehmung, dass die Behörde wieder aktiv wird, sobald gegen das Regulierungskriterium verstoßen wird. Bei der Herleitung, wie sich das Unternehmen optimal verhält, ergibt sich ein nichtlineares interdependentes System von Differentialgleichungen. Da sich keine rein analytische Lösung bestimmen lässt, wird auch hier das Verhalten der Unternehmung zunächst anhand von Phasendiagrammen diskutiert. Allerdings stößt diese Methode wegen der vier endogenen Variablen an die Grenzen des menschlichen Vorstellungsvermögens. Daher wird sie durch eine numerische Lösung ergänzt. Aufbauend auf diese Analyse stellt sich die Frage, wie eine optimale Regulierung zu gestalten ist, wenn die Behörde das Ziel verfolgt, den kumulierten diskontierten Wohlstand, gemessen als Summe der Konsumentenrente und des Gewinns, zu maximieren (vgl. die Seite 238). Im Abschnitt 3 werden erneut die beiden zuvor diskutierten Verfahren der Regulierung aufgegriffen. Sie stellen nun ein Teilproblem dar, dessen Lösung die Behörde bei der Ermittlung ihrer optimalen Strategie als Nebenbedingung zu berücksichtigen hat. So ergibt sich die Dynamik im Optimierungsproblem der Behörde aus den jeweiligen Bewegungsgleichungen der Unternehmung und den zugehörigen Kozustandsgleichungen. Zur Lösung des Optimierungsproblems der Behörde werden für die bei den Ansätze unterschiedliche Methoden herangezogen. Die direkte Beschränkung der Rentabilität wird als dynamisches Spiel interpretiert. Speziell wird hier die Form eines von Stackelberg-Spieles gewählt, um die hierarchische Struktur des Problems explizit abzubilden. Hier kann die Unternehmung lediglich auf die vorgegebene Strategie der Behörde reagieren. während die Behörde diese Re-

Kapitel m Optimale Regulierung

58 aktion bei der Wahl ihrer Steuergrößen antizipiert.

Im Hinblick auf das zweite Modell wird - in Anlehung an die Ausführungen zur optimalen Regelung - die "beste" Form der Preisanpassung gesucht. Die Lösung dieses Problems erfolgt wiederum numerisch und bezieht sich auf die optimale Wahl der Parameter, die in der Differentialgleichung für die Preisanpassung auftreten. Damit wird zwar nicht der beste aller Regler bestimmt, aber zumindest die beste Gestaltung einer proportionalen Preisanpassung in Abhängigkeit von der Differenz der durch die Behörde vorgegebenen und der tatsächlichen Rentabilität. Auf diese Weise wird sowohl der optimale Wert der zulässigen Rentabilität als auch die optimale Geschwindigkeit bei der Anpassung des Preises ermittelt.

1.1.2 Annahmen des Modells Das gesamte Kapitel basiert - unabhängig davon, welches konkrete Regulierungsinstrument unterstellt wird - auf einer einheitlichen Modellierung der Unternehmung. So stimmen die Annahmen über die Produktionstechnik und die damit implizierten Kosten, sowie die Beschreibung der Nachfrage in allen Ansätzen überein. Ferner bildet das langfristige Gleichgewicht des unregulierten Monopols, das sich auf Grund der Gewinnmaximierung einstellt, den Ausgangspunkt für die Analyse der Regulierung. Betrachtet wird ein dynamisches Entscheidungsproblem. Dabei wird die Zeit t - wie auch schon im vorhergehenden Kapitel - als kontinuierliche Größe aufgefasst. Diese Modellierung besitzt gegenüber der Verwendung der Zeit als diskrete Größe den Vorteil. dass man qualitative Einsichten in das dynamische Verhalten erlangen kann, ohne eine explizite analytische Lösung des Modells ermitteln zu müssen. Der Planungszeitraum der Unternehmung, wie auch später der Behörde, reicht bis ins Unendliche, t E [0,00[. Bereits die Annahme eines extrem langen Planungshorizontes von etwa 100 Jahren ist empirisch schon fragwürdig. Allerdings vereinfacht der unendliche Planungshorizont die Analyse erheblich und bietet auf diese Weise wertvolle Einblicke in das optimale Verhalten des Unternehmens. Das betrachtete Unternehmen produziert in jedem Zeitpunkt t unter Verwendung der bei den Inputs Arbeit va(t) und Kapital Vk(t) ein Gut in der Menge x(t): Speziell wird unterstellt, dass die Produktionstechnik für alle t durch die folgende Cobb-Douglas-Produktionsfunktion beschrieben wird:

x

= ev~vZ

mit

e> 0,

a > 0,

K

> 0,

a

+K >

(1.1)

1.

Diese Technik verlangt, dass beide Inputs eingesetzt werden müssen, um einen positiven Output herzustellen. Der Homogenitätsgrad der Cobb-Douglas-Produktionsfunktion a I

Im Folgenden wird die Abhängigkeit der Mengen x, Darstellung möglichst übersichtlich zu halten.

Va

und

Vt

von der Zeit

1

+K

> I

häufig unterdrückt, um die

59

1 Modellierung der Ausgangssituation

gewährleistet steigende Skalenerträge. Damit ist nach Baumol, Panzar, Willig (1982), Seite 17, zumindest im statischen Fall eine hinreichende Bedingung für ein natürliches Monopol erfüllt. Eine genauere Darstellung dieses Sachverhaltes findet man auf der Seite 13. Im Zuge der folgenden Rechnungen erweist es sich als hilfreich, zumindest den Parameter Cl genauer zu spezifizieren. Als konkreter Wert wird deshalb

Cl

= \Il gesetzt, um so die erhaltenen Gleichun-

gen zu vereinfachen. Entsprechend wird" > \Il als Bedingung für zunehmende Skalenerträge verwendet. Während das Unternehmen auf dem Absatzmarkt als Angebotsmonopol agiert und damit zumindest im unregulierten Fall den Preis festlegen kann, sind die Faktormärkte für Arbeit und Investitionsgüter durch vollständige Konkurrenz charakterisiert. Entsprechend nimmt das Unternehmen die Faktorpreise als gegeben hin und verhält sich auf diesen Märkten als Mengenanpasser. Bezüglich der eingesetzten Arbeitsmenge ist das Unternehmen nicht durch die Entscheidungen in der Vergangenheit gebunden. Vielmehr kann es zu jedem Zeitpunkt t die Arbeitsmenge Va ~

0 bei gegebenem Lohnsatz

qa

frei wählen. Anpassungskosten im Hinblick auf eine Ver-

änderung der Arbeitsmenge in der Zeit existieren nicht. Die momentanen Lohnkosten, die dem Unternehmen in t bei einem Einsatz der Arbeitsmenge

Va

entstehen, lauten damit

qaVa'

Von zentraler Bedeutung für die Dynamik des Entscheidungsproblems ist hingegen der Kapitalstock

Vk

beziehungsweise die Bruttoinvestition

ten Kapitalstock

Vk

jb.

So kann das Unternehmen den eingesetz-

nicht nach Belieben im Zeitpunkt t wählen. Der bestehende Kapitalstock

ist vielmehr auf die Entscheidungen in der Vergangenheit zurückzuführen. Alle betrachteten Ansätze stimmen darin überein, dass der Kapitalstock eine Zustandsgröße ist, die nur indirekt, nämlich über die Bruttoinvestitionen

jb,

im Zeitablauf gesteuert werden kann. Lediglich im

Modell zur Regulierung des Preises (Seite 145) muss das Unternehmen eine weitere Bewegungsgleichung, nämlich die Anpassung des Preises, berücksichtigen. Die Änderung des Kapitalstocks im Zeitpunkt t ergibt sich aus der gewählten Bruttoinvestition

jb

vermindert um die Abschreibungen auf den vorhandenen Kapitalstock 8vb also

wobei der Kapitalstock in der Ausgangssituation t

= 0 mit Vk(O)

> 0 gegeben ist. Ferner wird

unterstellt, dass die Abschreibungsrate 8 mit 0 ~ 8 < 1 konstant ist. Die Höhe der nichtnegativen Bruttoinvestition

jb

wird vom Unternehmen festgelegt. Gleichzeitig wird damit eine be-

deutende Asymmetrie in das Investitionsverhalten eingeführt. Auf Grund der Annahme

jb ~

0

kann die Unternehmung zwar mit Hilfe der Bruttoinvestition frei über die Geschwindigkeit entscheiden, mit der der Kapitalstock wächst. Jedoch kann eine Reduktion von Umfang der Abschreibungen stattfinden.

Vk

höchstens im

Kapitel m Optimale Regulierung

60

Im Folgenden wird angenommen, dass das Unternehmen die Wirkungsweise der Investition und den Anfangswert für den Kapitalstock

VlQ

kennt. Ohne diese Voraussetzung macht die

Maximierung des Gewinns als Problem der optimalen Steuerung keinen Sinn (vgl. Seite 45). Auf Grund der vollständigen Konkurrenz auf den Faktormärkten ist neben dem Lohnsatz auch der Anschaffungspreis qk je Einheit Kapital exogen gegeben und wird als konstant unterstellt. Die Gesamtkosten für den Faktor Kapital setzen sich wie folgt zusammen: • Zunächst entstehen in jedem Zeitpunkt t durch die Nutzung des aktuellen Kapitalstocks Opportunitätskosten rqkvk, wobei die Rate r mit dem konstanten Zinssatz übereinstimmt, der auf dem vollkommenen Kapitalmarkt herrscht. Gehört dem Unternehmen der Kapitalstock, so entsprechen diese Kosten der entgangenen Verzinsung, die es erwirtschaften könnte, wenn es das Kapital am Kapitalmarkt anlegt. • Ferner wird der Kapitalstock verschlissen, wobei die resultierenden Kosten mit Hilfe der konstanten Abschreibungsrate 8 mit 0

~

8 < I modelliert werden. Damit entsteht in

jedem Zeitpunkt tein Wertverlust in Höhe von 8qkVko wobei qkVk den Wiederbeschaffungswert des Kapitalstocks bezeichnet. 2 • Des Weiteren verursacht die Installation des Kapitals Anpassungskosten c(lb). Diese 0 ist. Speziell wird steigen progressiv in Ib. dc/dl b > 0, d2c/(dlb)2 > O. wobei c(O)

=

hier eine quadratische Funktion rür die Anpassungskosten unterstellt. nämlich Cqk[/bf mit einem konstanten Parameter c > O. Unter Berücksichtigung dieser Aspekte betragen die Gesamtkosten für den Faktor Kapital [r + 8]Qkvk

+ c(lb).

wobei man bei [r

+ 8]Qk auch vom Nutzungspreis einer Kapitalgütereinheit

spricht. Die Anpassungskosten sind von besonderer Bedeutung für die Dynamik des Modells; sie werden zu gegebener Zeit (Seite 81) ausführlich diskutiert und mit linearen Anpassungskosten der Form c(lb)

= cqklb verglichen.

Letztlich determinieren die Anpassungkosten die Geschwin-

digkeit. mit der das Unternehmen den gegebenen Kapitalstock an ein gewünschtes Niveau anpasst. Fehlt eine solche Kostenkategorie. so ist die sofortige Anpassung optimal. Entsprechend wird die Betrachtung eines dynamischen Modells überflüssig, da sich das Unternehmen jeweils mit unendlich hoher Geschwindigkeit dem langfristig optimalen Wert nähert, der bereits mit Hilfe des statischen Ansatzes ermittelt worden ist. Sind die Anpassungskosten linear. so ergibt sich eine sogenannte Bang·Bang-Lösung (vgl. Feichtinger. Hart! (1986). Seite 55). Eine solche Lösung ist dadurch charakterisiert. dass die optimale Steuergröße. also hier die Bruttoinvesti(ion. eine Randlösung darstellt. Sie wird somit einen von zwei extremen Werten annehmen. 2

Alternativ kann man [r + c5]QtVk auch als Mietpreis interpretieren.

61

1 Modellierung der Ausgangssituation entweder

[b

= 0 oder die maximal mögliche Bruttoinvestition [b ~ 00. Auch in diesem Fall

linearer Anpassungskosten ist die Geschwindigkeit der Anpassung somit unendlich groß, es sei denn die Bruttoinvestition ist in jedem Zeitpunkt exogen nach oben beschränkt. Die hier unterstellte streng konvexe Form c(lb)

= CQk[lb]2 impliziert hingegen, dass die optimale Ge-

schwindigkeit der Anpassung modellendogen bestimmt wird, da steigende Bruttoinvestitionen mit überproportional wachsenden Anpassungskosten verbunden sind. Während die Bruttoinvestition hier nicht negativ werden darf, betrachtet Dechert (1984) einen Fall, in dem auch die Entnahme von Kapitalgütern möglich ist. Eine solche negative Bruttoinvestition kann ebenfalls Anpassungskosten verursachen, die dann als Kosten der Deinstallation zu interpretieren sind. Gleichzeitig ist es sinnvoll, auch eine Veräußerung der deinstallierten Kapi tal güter und die zugehörigen Erlöse einzubeziehen. Eine entsprechende Modellierung führt allerdings dazu, dass die Komplexität des Modells erheblich zunimmt. Aus Gründen der Übersicht verzichtet dieser Ansatz auf die Möglichkeit, den Kapitalstock über die Abschreibungen hinaus abzubauen. Nachdem die Angebotsseite vorgestellt worden ist, kann man sich nun der Nachfrage zuwenden. Hier wird unterstellt, dass die Nachfrage im Zeitpunkt t nur vom momentanen Preis, nicht jedoch von möglichen Preisänderungen abhängt, die die Konsumenten antizipieren. Speziell wird angenommen, dass die in t nachgefragte Menge xf eine lineare Funktion des Preises ist, wobei die Parameter der Preis-Absatz-Funktion über die Zeit konstant sind. p(xd )

= _YIXd + Y2

mit

YI, Y2

> 0

Das regulierte Unternehmen hat die Auflage, zum jeweiligen Preis die Nachfrage zu decken, so dass x ~ xf gelten muss. Durch Substitution von xf erhält man damit die Preis-AbsatzGleichung des Unternehmens in Abhängigkeit von der gewählten Produktionsmenge, p(x)

= -YIX + Y2

mit x

= BV~Vk'

(1.2)

die die implizite Preissetzung des Monopols beschreibt. Wie bereits die statische Darstellung des Monopolfalls (Seite 14) zeigt, stellt sich eine Marktlösung ein, die mit einem höheren Preis und einer geringeren Menge als bei vollständiger Konkurrenz verbunden ist. Diese Lösung impliziert eine überhöhte Monopolrente zu Lasten der Konsumenten. Die Regulierung verfolgt das Ziel, die Marktmacht des Monopols zu korrigieren, so dass eine bessere Versorgung der Konsumenten und eine Erhöhung des aggregierten Wohlstandes gewährleistet ist. Als Ansatzpunkt für die Regulierung werden, in Anlehnung an die Ausführungen auf der Seite 55, zwei Wege gewählt: zum einen die direkte Beschränkung der Rentabilität, zum anderen die Anpassung des Preises in Abhängigkeit von der erwirtschafteten Rentabilität, um so "indirekt" die von der Behörde angestrebte Rentabilität zu erreichen. Beide Instrumente basieren

Kapitel

62

m Optimale Regulierung

letztlich auf der Vorstellung, dass eine "faire" Rentabilitätsrate festgelegt werden kann, die folgende Eigenschaften besitzt. Sie muss einerseits gewährleisten, dass das Unternehmen keinen Verlust erwirtschaftet, so dass es im Markt überlebt und die Versorgung der Konsumenten mit dem Gut sicherstellt. Andererseits soll die maximal zulässige Rentabilität verhindern, dass das Unternehmen eine zu hohe Monopolrente zu Lasten der Konsumenten erzielt. Die Rentabilität s als Bruttorentabilität wird dabei in Analogie zum statischen Averch-lohnson-Modell (Seite 23) wie folgt definiert

._ pOv:v'k - qava

$.-

qkVk

(1.3)

,

wobei die nachgefragte Menge x mit Hilfe der Produktionsfunktion substitutiert worden ist. Demnach wird das Verhältnis des Erlöses vermindert um die Entlohnung des Faktors Arbeit bezogen auf den Wert des Kapitalstocks als relevantes Kriterium betrachtet. Zur Interpretation dieses Quotienten ist anzuführen, dass der Zähler den Bruttogewinn einschließlich der Kapitalkosten angibt. Unterstellt man, dass dem Unternehmen der Kapitalstock gehört, so gibt dieser Bruttogewinn die Entlohnung des Faktors Kapital an, dessen Wert dem Nenner zu entnehmen ist. Die Rentabilität s steht der bereits erwähnten fairen Rentabilität s gegenüber, die von der Regulierungsbehörde exogen als obere Schranke festgelegt wird. Damit ein positiver Kapitalstock langfristig aufrecht erhalten wird, muss die zulässige Rentabilität zumindest so hoch sein, dass sie die Opportunitätskosten je Kapitaleinheit, die Abschreibung und die Anpassungkosten für die Bruttoinvestitionen deckt. Auf eine detaillierte Darstellung der Regulierung in ihrer jeweils konkreten Ausgestaltung wird hier verzichtet. Die entsprechenden Ausführungen werden auf den Seiten 97 beziehungsweise 145 ff. gemacht. Das Unternehmen verfolgt in allen betrachteten Ansätzen das Ziel, den Barwert seines Gewinnes bezogen auf den gesamten Planungszeitraum t ßen stehen der Arbeitseinsatz

Va

E

[0, oc[ zu maximieren. Als Steuergrö-

und die Bruttoinvestition

jb

zur Verfügung. Während I b als

strategisches Instrument eingesetzt wird, um die Zustandsgröße des langfristig optimal zu steuern, kann man

Va

~Iodells,

den Kapitalstock,

als taktisches Instrument ansehen, das in jedem

Zeitpunkt t frei gewählt wird, um so den momentan gewünschten Output zu realisieren. Die zu optimierende Zielfunktion lautet

1

00

e-r-r G(r)dr

=

1

00

e- rr [p(x)x - qava - [r + 8]qkL'i - cqd1bf]dr,

wobei die Preis-Absatz-Funktion p(x) und die Produktionsfunktion x zu berücksichtigen sind. Der Barwert des momentanen Gewinns ergibt sich aus der Multiplikation von G(r) mit dem Diskontfaktor e- rr , wobei unterstellt wird, dass die Diskontrate gleich dem Marktzinssatz rist.

63

I ModelIierung der Ausgangssituation

Da das Unternehmen den Kapitalstock Vk(O). die zugehörige Bewegungsgleichung für Vk und im Fall der Preisregulierung auch die Vorschrift kennt, nach der die Behörde den Preis anpasst. kann das Optimierungsproblem als Problem der optimalen Steuerung aufgefasst werden. Das entsprechende Optimierungsproblem der Regulierungsbehörde wird im Rahmen des Kapitels 3 erläutert. Gleichzeitig werden auch die Auswirkungen auf die Optimalität der Regulierung untersucht.

1.2

Verhalten des Monopols ohne Regulierung

1.2.1

Darstellung des Optimierungsansatzes

Um eine geeignete Referenzsituation für die dynamische Analyse der Regulierung zu schaffen. wird zunächst das optimale Verhalten des unregulierten Monopols ermittelt. So wird ein Gleichgewicht hergeleitet, das - ausgehend von einer gegebenen Anfangssituation - den langfristig stabilen Endpunkt einer gewinnmaximierenden Entwicklung darstellt und durch einen konstanten Kapitalstock charakterisiert ist. In diesem Gleichgewicht ist zwar eine Versorgung der Konsumenten mit dem betrachteten Gut sichergestellt, 3 sie ist aber im Vergleich zur Lösung bei vollständiger Konkurrenz aus wohlstandstheoretischer Sicht suboptimal. Dabei werden die zuvor erläuterten Annahmen über die Produktionsfunktion. die Kosten der Produktionsfaktoren und die Nachfrage zu Grunde gelegt. Die Unternehmung verfolgt das Ziel, den Barwert ihres kumulierten Gewinnes

r(Vb

mit

Va, I b, t):=

G(Vb Va, I b, t)

l'

e- rr G(Vb Va. I b• t) dt'

= [-yIOV:Vk + Y2]OV:V k -

(1.4)

qava - [r + 8]qkVk - Cqk[lbf

für den Planungszeitraum t E [0, oo[ zu maximieren. wobei sie die Bewegungsgleichung für den Kapitalstock Vk, die zugehörige Anfangsbedingung und die Nichtnegativitätsbedingung für die Steuergrößen Va und I b berücksichtigen muss. Zur Vereinfachung wird für den Barwert des kumulierten Gewinns bezogen auf den Zeitraum von t

= 0 bis t gegen unendlich die Schreib-

weise

J

Eine Situation, in der es für das Unternehmen bereits ohne Regulierung optimal ist, die Produktion einzustellen, stellt keine geeignete Ausgangssituation für die folgenden Modelle der Regulierung dar.

Kapitel III Optimale Regulierung

64 eingeführt. Das Optimierungsproblem lautet somit

(1.5a) unter den Nebenbedingungen

= [b - BVk> Vk(O) = VkO,

(1.5b)

Vk

(1.5c)

[b ~

0,

(1.5d)

Va ~

O.

(1.5e)

Der Preis p und die nachgefragte Menge x! sind bereits mit Hilfe der Preis-Absatz-Gleichung beziehungsweise der Cobb-Douglas-Produktionsfunktion substituiert worden. Im Hinblick auf die Parameter ct und

gelten die zuvor diskutierten Annahmen (Seite 58). Der Vergleich des

K

hier gewählten dynamischen Modells mit einem entsprechenden statischen Problem erfolgt im Kapitel 1.3 auf den Seiten 78 ff. Die Optimierungsaufgabe entspricht einem Standardproblem der optimalen Kontrolle, das in allgemeiner Form im Anhang 1.3 erörtert wird. So liegt hier ein Maximierungsproblem mit zwei Steuergrößen, dem Arbeitseinsatz

Va

und der Bruttoinvestition

[b,

sowie einer Zustands-

variablen, dem Kapitalstock Vk, vor. Die Dynamik des Systems wird durch die Bewegungsgleichung für den Kapitalstock (1.5b) beschrieben, wobei als Startwert ein hier noch nicht näher spezifizierter Wert

VkO

> 0 vorliegt. Die Bedingungen (1.5d) und (1.5e) bilden zusammen den

Bereich der zulässigen Steuergrößen, aus dem die optimalen Aktionsparameter zu wählen sind. Das Ziel besteht darin, einen Zeitpfad für die Steuergrößen so zu wählen, dass das Güternaß, mit dem die Entwicklung bewertet wird, also hier der Barwert des kumulierten Gewinns bezogen auf den gesamten Planungszeitraum, maximal wird. Zunächst fällt auf, dass eine der beiden Steuergrößen, nämlich die eingesetzte Arbeitsmenge Va,

nicht in die eigentliche Systemdynamik (1.5b) einfließt. Wie die folgenden Ausführungen

zeigen, vereinfacht sich die Bestimmung der optimalen Steuergrößen ferner dadurch, dass die Optimumbedingungen für

Va

und

[b

unabhängig voneinander sind. Entsprechend bilden die

beiden zugehörigen Optimumbedingungen kein interdependentes Gleichungssystem. Die optimalen Pfade

v: und

Ibo

können vielmehr getrennt voneinander ermittelt werden.

Die Lösung von Problemen der dynamischen Optimierung, in denen die Zeit als kontinuierliche Größe aufgefasst wird, erfolgt mit Hilfe des Maximumprinzips (Anhang 1.3). Im Folgenden wird dieses Lösungsverfahren auf das vorliegende Problem übertragen. Um dem Leser einen leichteren Zugang zu verschaffen, wird anhand des hier betrachteten unregulierten Monopols eine ökonomische Interpretation der jeweiligen Bedingungen gegeben, die sich an Dorfman (1969) und Feichtinger, Hartl (1986), Seite 28 ff. orientiert.

65

I Modellierung der Ausgangssituation

Zentral für den gewählten Lösungsansatz ist zunächst die Vorstellung, die dem Bellmannschen-Funktionalprinzip entspricht. So kann sich ein System nur dann optimal entwickeln, wenn jede Teilpolitik und somit die Entscheidung über die Steuergrößen in jedem einzelnen Zeitpunkt t optimal ist. Die Umsetzung dieser Idee erfolgt durch die Aufstellung der sogenannten Harnilton-Funktion, die dann für alle t über die Steuergrößen zu maximieren ist. Für das vorliegende Problem lautet diese Funktion

Je(Vt, Va, I b, AI)

= _Yltrv~aV~K + Y2eV~V~ -

qava - [r + .slq.v. - cq.[/bl2

+ AI[/b -

.svkl. (1.6)

Die Hamilton-Funktion besteht somit aus zwei Teilen: • Zum einen umfasst sie den Zeitwert des Integranden der Zielfunktion in t, also hier den momentanen Gewinn GO des Unternehmens. • Zum anderen enthält sie die mit AI multiplizierte Änderung des Kapitalstocks im jeweiligen Zeitpunkt t. Die Variable AI wird als adjungierte Zustandsvariable bezeichnet und gibt den Schattenpreis einer Änderung der Zustandsvariablen Vk um eine infinitesimal kleine Einheit an. Sie stellt also dar, wie die Unternehmung im Zeitpunkt t eine Änderung des Kapitalstocks im Hinblick auf die Zielfunktion bewertet (AI

= aJe lauk).

Die Hamilton-Funktion spiegelt zwei Effekte wider, die mit der Festlegung der Steuervariablen verbunden sind: • Direkter Effekt: Eine bestimmte Wahl der Steuergrößen in t, also des Arbeitseinsatzes Va und der Bruttoinvestition I b, legt den momentanen Gewinn fest, der im Zeitpunkt t erwirtschaftet wird. • Indirekter Effekt: Die Steuergrößen verändern darüber hinaus die Entwicklung der Zustandsvariablen und beeinflussen damit den Gewinn in der Folgezeit. Die hier verwendete Hamilton-Funktion wird auch als Zeitwert-Hamilton-Funktion beziehungsweise als Hamilton-Funktion in laufender Bewertung bezeichnet (Feichtinger, Hartl (1986), Seite 19). Eine alternative Form ist die Hamilton-Funktion in der Schreibweise des Barwertes, Je

= e- n Je.

Sie enthält statt des momentanen Gewinns den auf den Zeitpunkt t

=0

diskontierten Gewinn. Auch die Bewertung einer Änderung des Kapitalstocks wird durch den diskontierten Wert der adjungierten Variablen AI

=

AI e- n berücksichtigt. Der Vorteil der

hier unterstellten Definition liegt darin, dass die Hamilton-Funktion und damit auch die noch

66

Kapitel III Optimale Regulierung

herzuleitende Kozustandsgleichung nicht explizit von t abhängen. Das resultierende Differentialgleichungssystem, das die Entwicklung des Unternehmens beschreibt, ist damit autonom, hängt also ebenfalls nicht explizit von tab. Die Optimierung der zeitlichen Entwicklung erfordert zunächst die bereits angesprochene Maximierung der Hamilton-Funktion über die Steuervariablen

Va

und

Zeitpunkt t. Dabei ist zu berücksichtigen, dass die Zustandsvariable

Vk,

[b

in jedem einzelnen

aber auch die Bewer-

tung einer Änderung des Kapitalstocks A.I in jedem Zeitpunkt als gegebene Größen zu betrachten sind, obwohl sie sich im Zeitablauf ändern. Im Folgenden werden die Ableitungen der Hamilton-Funktion nach den beiden Steuergrößen gebildet und ausgewertet. Da die beiden Ableitungen in dem hier vorliegenden Fall unabhängig von der jeweils anderen Variablen sind, können sie getrennt voneinander behandelt werden. Zunächst wird der optimale Arbeitseinsatz ton-Funktion nach

Va

v: ermittelt, indem man die Ableitung der Hamil-

bildet und - sofern eine innere Lösung existiert - gleich Null setzt.

Die Bedingung gibt den optimalen Arbeitseinsatz

v: als implizite Funktion des Kapitalstocks

an, kann aber ohne eine Spezifikation der Parameter nicht weiter aufgelöst werden. Eine vollständige analytische Lösung lässt sich aber ohnehin nicht herleiten. Vielmehr werden eine detaillierte qualitative Analyse und numerische Berechnungen vorgenommen, die ebenso auf konkreteren Angaben über die Parameter beruhen. Entsprechend wird bereits hier der Parameter IX mit VI vorgegeben. Dadurch verkürzt sich die Bedingung für steigende Skalenerträge IX+IC> IzuIC> VI.

Für IX

= VI folgt speziell (1.7)

und somit (1.8)

Für Vk

= 0 ergibt sich aJt laVa = -qa < O.

In diesem Fall ist es optimal, den Arbeitseinsatz

auf null zu reduzieren, was auf Grund der verwendeten Cobb-Douglas-Produktionstechnik verständlich ist. Ein positiver Output kann nur unter Verwendung bei der Produktionsfaktoren hergestellt werden, und die Erzeugung des Outputs Null erfolgt zu minimalen Kosten für Va

= O.

67

1 Modellierung der Ausgangssituation Da der Fall

Vk

= 0 gleichbedeutend mit einer Einstellung der Produktion ist, die keine geeig-

nete Ausgangssituation für die folgende Analyse der Regulierung bietet, wird er im Folgenden vernachlässigt. Wendet man sich nun der zweiten Steuergröße, der Bruttoinvestition I b zu, so ergibt sich aJf(Vb v:' Ibo, alb

Ad

z-

= - Cqk

[bo

+AI·

Bei der Auswertung dieser Bedingung ist zu berücksichtigen, dass I b einerseits nichtnegativ ist, andererseits keine Vorzeichenbeschränkung für die adjungierte Variable AI existiert. Im Sinne der Maximierung von Jf (.) folgt AI < 0,

falls

(1.9)

sonst.

Zur Überprüfung der hinreichenden Bedingungen für den Fall einer inneren Lösung, werden nun die zweiten Ableitungen der Hamilton-Funktion nach den Steuergrößen herangezogen. Man erhält a2Jf(Vb v:' Ibo, AI) __ ~ e[ .]-3/2 K 0 Y2 Va Vk < aVa2 4 a2 Jf(v .. V:' I b., A.) a[lbF cqk < 0

=-

z-

a2 Jf(v .. V:' I b., AI) a2 Jf(Vb V:' I b., AI) avaalb = albav a = O.

Da die bei den Ausdrücke aJf 2 / av~ und aJf 2 /[al b] negativ sind und ferner

a2 Jf(.)

a2 Jf(.)

a2 Jf(.)

albava = a2 Jf(.) a2 Jf(.) > 0 a2 Jf(.) av~ a[lbF a[lbF

---aT avaal b

gilt, sind die hinreichenden Bedingungen für ein Maximum der Hamilton-Funktion erfüllt (Simon, Blume (1994), Seite 398 ff.). Neben der Maximierung der Hamilton-Funktion bezüglich Va und I b erfordert das Maximumprinzip, dass die Entwicklung des Schattenpreises AI im Zeitablauf gemäß der adjungierten Zustandsgleichung erfolgt (Seite 310). Diese Differentialgleichung lautet: .

AI

= rA I -

v:'

aJf(v .. I b., A.) ---'--'--"----'aVk

Zur Interpretation dieser Gleichung bietet es sich an, statt der hier verwendeten Schreibweise des Momentanwertes auf den Barwert Jf

=

e-rrJf mit AI

=

e-rrAI überzugehen, wobei

Kapitel m Optimale Regulierung

68

A, =

e- rt [).,

-

rAd ist. Die Kozustandsgleichung entspricht dann

e

~ ~

-rt . ] [A,-rA,

oJl (. ) = -e-rt OVt

A,

=_oJlO OVt . rt oG OUt -A,=e- -+A,-. OVt OVt

Der Barwert des direkten Grenzgewinns e-rtoGlovk auf Grund einer marginalen Erhöhung des Kapitalstocks zuzüglich des indirekten Grenzgewinns, nämlich der Wertschätzung einer marginalen Änderung des Kapitalstocks A, oilt/ovt (vgl. die Seite 65), ist somit gleich der Verminderung des Schattenpreises A ,. Die Wertschätzung einer Änderung des Kapitalstocks im Zeitablauf sinkt also mit der gleichen Rate, mit der die Änderung des Kapitalstocks zum Barwert des (direkten und indirekten) Gewinnes beiträgt. Man kann diese Gleichung auch als Beschreibung eines positiven, aber abnehmenden Nettogrenzgewinns verstehen. Falls oJl lovt positiv ist, bedeutet eine Erhöhung von Vb dass zwar ein positiver Nettogrenzgewinn erzielt wird, aber gleichzeitig das Bedürfnis sinkt, Vk noch weiter zu erhöhen; der Schattenpreis, mit dem eine Änderung des Kapitalstocks bewertet wird, fallt. Berechnet man in der Kozustandsgleichung die partielle Ableitung oJl lovk für fasst die Terme für A, und

0 gilt (1.15)

Somit besitzt die Isokline für 5.. 1 = 0 ein relatives Extremum für

Kapitel III Optimale Regulierung

72 beziehungsweise Vk =

[

-

q -,1.-~ 71+K O.

(1.16)

Wird ferner berücksichtigt, dass K wegen der Annahme steigender Skalenerträge größer als 1/2 ist, so folgt

vZ

> O.

Ergänzend ist anzumerken, dass für den Spezialfall gene Produktionsfunktion,

vZ = 0 gilt.

K

gleich 1/2, also für eine linear-homo-

Das bedeutet, dass die Isokline für

i , = 0 für einen

positiven Kapitalstock monoton fallt und der ansteigende Ast der Isokline verschwindet. Die zweite Ableitung d2AI/dv~ lautet d2A21 dV k

= 6D I

Vi

-

dVk

Wertet man diese Ableitung an der ExtremsteIle dDz/dvk

2D I d2D2 D~ dv~'

[dD2]2

= O. Entsprechend folgt

vZ aus, entfällt zunächst der erste Term wegen

2D, d 2 D 2 - D~ dv~ = - 2D I D~

Unter Beachtung von Stelle

K]

i,

[VI-

K]

'l!:.v- 3/ 2- K+

e

[-VI +

k

> 1/2 besitzt die Isokline für i

K

v%.

Die Isokline für

[[-VI _

K]

[VI +

K]

y,ev- 3/2+K] k

< O.

, = 0 ein Maximum bezüglich Vk an der

= 0 verläuft folglich wie es die Abbildung IIl.l

angibt, die mit Hilfe

von },fATIfEMATICA' für gegebene Parameterwerte erstellt worden ist. 4 Die Isokline nimmt ihr Maximum an der Stelle von rechts

(Vk {.

v% an und konvergiert für Vk

~ 00

und bei Annäherung von

Vk

an Null

0) gegen den Wert -qk'

Abschließend ist darauf zu verweisen, dass die Wahl der Parameter im Vergleich zu alternativen Spezifikationen geeignet ist, eine sinnvolle Ausgangssituation für die Modelle der Regulierung zu generieren. Beispielsweise wird sich zeigen, dass das langfristige Gleichgewicht durch eine hohe Rentabilität und einen hohen Gewinn charakterisiert ist (vgl. Seite 199). Die Isokline für i

l

= 0 teilt das Phasendiagramm für Vk und AI in zwei Bereiche, die oberhalb

und unterhalb der Isoklinen liegen. Um zu ermitteln, wie sich die adjungierte Zustandsvariable in den bei den Bereichen über die Zeit ändert, wird die adjungierte Zustandsgleichung (1.13) partiell nach AI abgeleitet.

ai l

-

aAl

=r+S > O.

( 1.17)

" Der gezeigte Verlauf entspricht den Ergebnissen, die zuvor in allgemeiner Form unter Verwendung der Spezi. fikation K > y, hergeleitet worden sind. Die mit ,\i4lliEMATIG\.' erstellten Grafiken beruhen allerdings auf der Angabe numerischer Werte für die Parameter: K = 11/20, IJ = I, r = 5'7c. 8 = 10%, YI = I, Y2 = 100, qa = 10, qk = 100.

73

I Modellierung der Ausgangssituation

o ~------------_

Vk

Abbildung ID.2: Verlauf der (Vk = O)-Isokline für die gleichgewichtige Entwicklung des Kapitalstocks Die Änderung von AI in der Zeit ist somit für einen parametrisch gegebenen Kapitalstock eine steigende Funktion von AI. Um diese Erkenntnis auf das Phasendiagramm zu übertragen, wird unterstellt, dass man sich zunächst in einem Punkt auf der Isokline für}..1 man sich für konstantes

Vk

= 0 befindet. Bewegt

senkrecht nach oben, wobei AI steigt, so muss auch )..1 zunehmen.

Demnach ist }..I für alle Punkte oberhalb der Isoklinen positiv und die adjungierte Variable AI wächst. Durch die analoge Argumentation kann man zeigen, dass}..1 unterhalb der Isokline negativ ist. Die zugehörigen Punkte des Phasendiagrammes sind also durch einen fallenden Schattenpreis AI gekennzeichnet. Beide Ergebnisse werden in der Abbildung III.I durch entsprechende Pfeile wiedergegeben, die in die jeweilige Bewegungsrichtung zeigen. Auf ähnliche Weise wird nun die Isokline für Vk

= 0 diskutiert. Aus der Bewegungsgleichung

für den Kapitalstock erhält man durch die Substitution von

.I -

Ibo

mit Hilfe von (1.9) die optimale

Änderung des Kapitalstocks als

Vk

~

=

~ 0,

c5Vk

falls

AI

-c5Vk

falls

AI < O.

(1.18)

= 0 erfordert ein konstanter Kapitalstock Vk = 0 = O)-Isokline lautet

Bis auf den vernachlässigten Grenzfall mit Vk die Bedingung AI > O. Die zugehörige (Vk

.

Vk

=

0

{=:=}

Vk

Diese Ursprungsgerade mit der Steigung dAI/dvk

=

AI

2c5cQk·

(1.19)

= 2c5cQk ist der Abbildung III.2 zu entneh-

men. Die Isokline für den gleichgewichtigen Kapitalstock grenzt im Phasendiagramm wiederum zwei Bereiche ab, die durch unterschiedliche Änderungen des Kapitalstocks in der Zeit charakterisiert sind. Für jedes

Vk >

0 lässt sich die Bewegungsrichtung bei gegebenem AI über die

Kapitel m Optimale Regulierung

74

----1""---'''''-------. o

Vk

Abbildung m.3: Phasendiagramm für den unregulienen Monopolfall

partielle Ableitung von Vk nach

Vk

gemäß (1.18) berechnen: (}Vk

(1.20)

-=-8 0 gekennzeichnet sind. Dieses Änderungsverhalten wird mit Hilfe

der horizontalen Pfeile in der Abbildung III.2 dargestellt. Durch die Kombination der beiden Isoklinen erhält man die Abbildung III.3. Da die beiden Differentialgleichungen (1.18) und (1.13) ein interdependentes simultanes Gleichungssystem beschreiben, wird die Entwicklung des Systems in jedem Punkt durch die gleichzeitige Änderung bei der Größen bestimmt. Die Schnittpunkte der bei den Isoklinen repräsentieren stationäre

= 0 und j.1 = 0 erfüllt sind. = 0 im dargestellten Quadranten des Phasendiagramms ein Ma-

Punkte, also Gleichgewichte, in denen simultan Vk Weil die Isokline für j.1 ximum besitzt und für

Vk

~

0 und

Vk

~ 00

Gleichgewichte, wenn das Maximum der (j.1 Vk

= 0 liegt.

gegen

-qk läuft, existieren genau dann zwei

= O)-Isokline oberhalb der Ursprungsgerade für

Bevor der qualitative Verlauf von Trajektorien im Phasendiagramm diskutiert

wird, bietet es sich an, eine Stabilitätsanalyse der Gleichgewichte durchzuführen. Wie im Anhang 1.2.2 (b) beschrieben wird, kann man Aussagen über die Stabilität eines Gleichgewichtes treffen, indem man die Vorzeichen der Eigenwerte des Systems untersucht, das an der Stelle des Gleichgewichtes linearisiert worden ist. Für den hier vorliegenden zweidimensionalen Fall mit der Zustandsvariable

Vk

und dem Kozustand AI lautet das linearisierte

System

( ~k) = (~ ~) (Vk =~k) + R. ÄI

Dabei bezeichnen Restglied.

Vk

und

il

8Vk

aAl

ÄI

ÄI

die jeweiligen gleichgewichtigen Werte und R das Taylorsche

75

1 Modellierung der Ausgangssituation

Zwar wird an dieser Stelle auf eine konkrete Berechnung der Eigenwerte verzichtet, aber es können anhand des Vorzeichens der Determinante der Jacobi-Matrix5 J Aussagen über die Eigenwerte und damit die Stabilität der betrachteten Punkte gewonnen werden. Gemäß Feichtinger, Hart! (1986), Satz 4.6, kann für ein zweidimensionales System von einer negativen Determinante der Jacobi-Matrix detJ auf einen positiven und einen negativen Eigenwert geschlossen werden; das Gleichgewicht stellt dann einen Satte1punkt dar. Ist das Vorzeichen der Determinante hingegen positiv, so ist das Gleichgewicht total instabil; es handelt sich entweder um einen instabilen Knoten oder einen instabilen Strudelpunkt (Seite 295). Im instabilen Fall gibt es keine Trajektorien, die von außen in das Gleichgewicht führen (Feichtinger, Hartl (1986), Seite 105). Das Gleichgewicht kann dann nicht den Endpunkt einer optimalen Entwicklung darstellen. Um das Vorzeichen der Determinante für die beiden hier hergeleiteten Gleichgewichte zu bestimmen, werden zum einen die Ableitungen (1.20) und (1.17), zum anderen

und 0j,1 OVk

=

KYiqa oD2

D~

a;;;

benötigt. Berücksichtigt man ferner, dass wegen (1.15) in Verbindung mit (1.16) oD2 ~ 0 OVk > gilt, so ist

Damit folgt für das Gleichgewicht, das durch den fallenden Ast der (j,2 = O)-Isokline und somit durch Vk > v k bestimmt ist .

.

2

OVk OAI OAI OVk O[ 0] KY2Qa oD2 I detJ= - - - - - =-0 r+o - - - - - -

IiVk

steigt, so dreht sich

die Kurve der Grenzkosten bei unveränderter Lage der Preis-Absatz-Kurve und der Grenzerlöskurve nach unten. Diese Änderung impliziert eine höhere optimale Produktionsmenge

Xm

und einen entsprechend niedrigeren Monopolpreis Pm (mittlerer Teil der Abbildung III.9). Hingegen bewirkt eine kontinuierliche Reduktion des Kapitalstocks

Vk

in einem Zeitraum [t, t']

eine Drehung der Grenzkostenkurve nach oben und ist entsprechend mit einer Reduktion der Produktionsmenge X m und einer Erhöhung des Monopolpreises Pm verbunden (rechter Teil der Grafik III.9). Beispielhaft ist zudem auch die Änderung der durchschnittlichen Kosten dargestellt worden, die sich auf Grund der Änderung des Kapitalstocks ergibt. Dieser Effekt ist allerdings nicht eindeutig, sondern beruht auf zwei gegenläufigen Tendenzen. Zum einen erhöhen sich mit einer Ausweitung des Kapitalstocks die fixen Kosten bezogen auf einen Zeitpunkt t, zum anderen wird durch eine Erhöhung des Kapitalstocks eine Substitution von Arbeit durch

Kapital hervorgerufen, so dass die durchschnittlichen Arbeitskosten sinken. Auf eine analytische Diskussion des resultierenden Gesamteffektes so wie des Gewinns in Abhängigkeit von den Spezifikationen der Parameter wird hier verzichtet. Abschließend ist darauf zu verweisen, dass neben den bereits diskutierten Kosten noch die Anpassungskosten c(lb) zu berücksichtigen sind. Auf Grund der konvexen ModelIierung mit c(lb)

= Cqk[lbf beeinflussen diese Kosten die Geschwindigkeit, mit der der Kapitalstock aus-

geweitet wird und determinieren ferner - wie im Rahmen der vorherigen Abschnitte diskutiert worden ist - das langfristig optimale Niveau des Kapitalstocks.

I Modellierung der Ausgangssituation

93

In diesem Zusammenhang ist zu beachten, dass die in der statischen Theorie übliche Vorstellung vom langfristigen Gleichgewicht, das auf der Formulierung einer Funktion der langfristigen Durchschnittskosten basiert, hier nicht zutrifft (vgl. Schumann, Meyer, Ströbele (1999), Seite 289). Dort wird die Kurve der langfristigen Durchschnittskosten als Umhüllende der Kurven der kurzfristigen Durchschnittskosten dargestellt, die sich für alternative Größen des Kapitalstocks ergeben. Diese Konstruktion geht von der Annahme aus, dass zu Beginn des Planungszeitraums eine langfristig optimale Betriebsgröße gewählt werden kann, die dann über den gesamten Zeitraum konstant bleibt. Ist die Betriebsgröße einmal festgelegt, so gilt die jeweilige zugehörige kurzfristige Kostenkurve. Bei der intertemporalen Gewinnmaximierung wird hingegen der Kapitalstock im Zeitablauf optimal angepasst. Im Zuge dieser Anpassung werden zeitpunktbezogene Zustände durchlaufen, die - in Abhängigkeit vom jeweiligen Kapital stock - durch die Verläufe der momentanen Kostenkurven gemäß der Abbildung III.9 charakterisiert sind. Statt einer langfristigen Kostenkurve gibt es hier lediglich einen Zeitpfad 2(t) := c(q, x,

v~(t» für die jeweiligen Kosten. Das langfristige Gleichgewicht stellt schließ-

lich den Endpunkt einer optimalen Entwicklung dar. Dieser Punkt ist definiert als gleichgewichtige Lösung des Systems von Differentialgleichungen. welches das optimale Verhalten des Unternehmens im Zeitablauf beschreibt. Der Begriff langfristiges Gleichgewicht bezieht sich darauf, dass es für das Unternehmen ohne eine exogene Störung optimal ist, dauerhaft in diesem Gleichgewicht zu verbleiben und den Kapitalstock sowie die übrigen Systemgrößen konstant zu halten.

1.3.6

Subadditivität der Kostenfunktion im statischen und im dynamischen Fall

Unter dem Aspekt, dass der Kapitalstock bezogen auf einen Zeitpunkt t als gegebene Größe behandelt wird und eine Faktorsubstitution nur im Zeitablauf möglich ist, muss geprüft werden, ob die Annahme einer monopolistischen Marktstruktur angesichts der unterstellten Produktionstechnik aufrechtgehalten werden kann. Im statischen Fall implizieren steigende Skalenerträge bei totaler Faktorvariation die Subadditivität der Kostenfunktion, was gemäß Baumol, Panzar, Willig (1982) hinreichend dafür ist, dass ein natürliches Monopol vorliegt. Hingegen ist im dynamischen Fall der Kapitalstock nur im Zeitablauf veränderlich und die entsprechenden Bruttoinvestitionen sind zudem mit Anpassungskosten verbunden. In diesem Zusammenhang ist darauf zu verweisen, dass die Übertragung der grafischen Darstellung des statischen Monopols auf den dynamischen Ansatz und die zugehörige Analyse der momentanen Kosten eine Erklärung für bestehende Markteintrittsschranken liefert. So impliziert die unterstellte Produktionstechnik, dass ein bereits etabliertes Unternehmen mit bestehendem Kapitalstock Kostenvorteile in der Produktion gegenüber einem neu eintretenden Unternehmen besitzt, da es im vorhergehenden Zeitraum bereits eine optimale Menge an Kapital akkumuliert hat und damit

94

Kapitel I1I Optimale Regulierung

auch in geringerem Ausmaß durch Installationskosten für den Kapitalstock belastet wird. Um die Eigenschaft der Subadditivität der Kostenfunktion auf eine intertemporale Modellierung zu übertragen, bietet es sich zunächst an, die statische Kostenfunktion und ihre Entsprechung im dynamischen Kontext gegenüberzustellen. Im statischen Ansatz gibt die Kostenfunktion die minimalen Kosten der Produktion einer Gütermenge i bei gegebenen Faktorpreisen an.

Wie im Rahmen des Abschnitt 1.2 diskutiert worden ist, heiBt die statische Kostenfunktion subadditiv, wenn sie die Eigenschaft k

c(·, x)
L!(vi(t»

i=1

für alle

Lvi (t) i=1

= v(t)

und

vi (t)

=F v(t)

gilt. Werden die Inputs somit auf mehrere Unternehmen verteilt, so kann weniger produziert werden, als wenn die Produktionsmenge durch ein Unternehmen produziert wird. Alternativ formuliert, müssen mehrere Unternehmen gemeinsam größere Faktormengen als ein Monopol aufwenden, um den gleichen Output in einem Zeitpunkt zu erzeugen, was entsprechend höhere momentane Kosten verursacht. Da diese Beziehung jederzeit zutrifft, kann auf einen höheren Barwert der Kosten bei verteilter Produktion geschlossen werden. Alternativ lässt sich die Subadditivität nachweisen, wenn man die Produktion eines Gutes zu verschiedenen Zeitpunkten als die Produktion unterschiedlicher Güter betrachtet. Die Subadditivität kann dann analog zu einem Mehrproduktunternehmen nachgewiesen werden. Eine

Kapitel III Optimale Regulierung

96

Möglichkeit hierzu besteht darin zu zeigen, dass neben Skaleneruägen bei der Produktion eines einzelnen Gutes in einem Zeitpunkt zusätzlich Kostenvorteile dadurch entstehen, dass die Herstellung des Gutes im gesamten Zeitraum durch ein einziges Unternehmen erfolgt, statt die Produktion zu verschiedenen Zeitpunkten auf unterschiedliche Unternehmen zu verteilen. Bezogen auf das hier diskutierte Modell ist anzuführen, dass die Produktion des gesamten Zeitpfades durch ein Unternehmen insofern Kostenvorteile impliziert, als dass bei einem Wechsel des Unternehmens im Zeitablauf der bereits vorhandene Kapitalstock durch das neue Unternehmen nicht übernommen werden kann. Entsprechend sind die Investitionen und die dadurch hervorgerufenen Anpassungskosten des neuen Unternehmens höher als die notwendigen Investitionen und resultierenden Kosten, die bei einer Fortsetzung der Produktion durch das ursprüngliche Unternehmen anfallen. 1.3.7

Ergebnisse des Vergleichs zwischen der statischen und der dynamischen Analyse

Der Vergleich zwischen dem statischen und dem dynamischen Ansatz der Gewinnmaximierung zeigt, dass die Ergebnisse des statischen Optimierungsproblems von der Lösung des dynamischen Ansatzes teilweise reflektiert werden. So ist die Amoroso-Robinson-Bedingung für den Faktor Arbeit in jedem einzelnen Zeitpunkt erfüllt und die Entscheidung über den jeweiligen Output x zu einem Zeitpunkt t lässt sich mittels der üblichen grafischen Darstellung der statischen Monopollösung illustrieren. Allerdings impliziert die intertemporale ModelIierung, dass der Faktor Kapital bezogen auf einen Zeitpunkt t nicht vollständig variabel ist. So ist eine Substitution der Produktionsfaktoren zu einem Zeitpunkt nicht möglich und die Realisierung des optimalen Kapitalstocks kann nur im Zeitablauf erfolgen. Die gewählte ModelIierung der konvexen Anpassungskosten auf Grund von Bruttoinvestitionen ruft im Vergleich zum statischen Ansatz zwei Effekte hervor. Zum einen weicht das langfristig optimale Niveau des Kapitalstocks vom optimalen Wert im statischen Fall ab, denn um den Kapitalstock aufrechtzuhalten, muss eine kontinuierliche Reinvestition in Höhe der jeweiligen Abschreibungen erfolgen. Diese Investitionen verursachen wiederum Anpassungskosten und wirken damit wie zusätzliche Kapitalkosten. Zum anderen implizieren konvexe Anpassungskosten, dass die optimale Annäherung an das langfristig gewünschte Niveau des Kapitalstocks mit endlicher Geschwindigkeit vollzogen wird. Der zusätzliche Erklärungswert des dynamischen Ansatzes beruht entscheidend auf der gewählten Form der Anpassungskosten c(lb). So resultiert im Fall linearer Anpassungskosten ohne Obergrenze jb, dass das Unternehmen seinen Kapitalstock unendlich schnell an das langfristige Gleichgewicht anpassen kann. Die realistische Abbildung einer allmählichen Annäherung an ein langfristiges Gleichgewicht kann dann nur mittels exogener Restriktionen abgebildet werden. Dagegen ermöglichen überproportional steigende Anpassungskosten eine endogene

2 Verhalten des Angebotsmonopols bei Regulierung

97

Erklärung dafür, dass ein Unternehmen seinen Kapitalstock nur langsam an ein langfristig optimales Niveau angleicht. Der Erklärungswert eines Ansatzes mit linearen Anpassungskosten ist also im Vergleich zum streng konvexen Fall erheblich beschränkt. In diesem Zusammenhang ist allerdings darauf zu verweisen, dass die Modellierung linearer Anpassungskosten insbesondere in Problemen mit mehreren Zustandsvariablen vorteilhaft sein kann, da dann zumindest eine Bewegungsgleichung technisch relativ leicht zu behandeln ist und die Option eröffnet, sogar ein Problem mit zwei Zustandsvariablen, also zwei Bewegungsgleichungen und zwei Kozustandsgleichungen in einem Phasendiagramm abzubilden (vgl. Leonard, Long (1992), Seite 277). Bei dem Versuch, Eigenschaften der Funktionen aus dem statischen Kontext auf den intertemporalen Zusammenhang zu übertragen, ist jedoch gezeigt worden, dass eine sorgfältige Begriffswahl und eine revidierte Definition einiger Eigenschaften der Funktionen im dynamischen Fall notwendig ist. Wie die Diskussion der allmählichen Fortschreibung des Kapitalstocks und die dadurch bedingte Veränderung der momentanen Kosten nahe legt, können allerdings durch die ModelIierung als dynamisches Problem Markteintrittsbarrieren, die in der Realität durch bereits aufgebaute Kapitalstöcke etablierter Unternehmen durchaus auftreten, in geeigneter Form abgebildet werden.

2 Verhalten des Angebotsmonopols bei Regulierung 2.1 2.1.1

Beschränkung der Rentabilität Darstellung des Optimierungsansatzes

Im Kapitel 1.2 ist das Verhalten des unregulierten Monopols untersucht worden, das das Ziel verfolgt, den Barwert seines Gewinnes bezogen auf den Planungszeitraum t E [0,00] zu maximieren. Die dynamische Eigenschaft des Problems beruht darauf, dass das Unternehmen bei der Wahl seiner Faktormengen nicht völlig frei entscheiden kann, sondern im Hinblick auf den Faktor Kapital durch die Entscheidungen in der Vergangenheit gebunden ist. Auf Grund von konvexen Anpassungskosten zeigt sich zudem, dass nur eine allmähliche Annäherung an den langfristig optimalen Kapitalstock erfolgt. Im Rahmen dieser Analyse ist ein langfristiges Gleichgewicht für den unregulierten Monopolfall sowie der zugehörige Sattelpfad hergeleitet worden, der beschreibt, wie sich das unregulierte Unternehmen dem Gleichgewicht nähert. Die gewonnenen Erkenntnisse über das Verhalten des unregulierten Monopols im Zeitablauf bilden nun die Basis für die Analyse einer Regulierung im dynamischen Kontext. So wird insbesondere unterstellt, dass das langfristige Gleichgewicht des unregulierten Monopols, den Zustand des dy5namischen Systems vor der Einführung der Regulierung beschreibt. Damit stellt sich die Frage, ob ein Anlass für das Unternehmen besteht, durch die jeweilige Regulierung

Kapitel III Optimale Regulierung

98

von dem Gleichgewicht des unregulierten Monopols abzuweichen. Außerdem ist zu klären, wie sich diese Abweichung auf den Gewinn des Unternehmens, die Versorgung der Konsumenten mit dem betrachteten Gut und das Verhältnis der eingesetzten Produktionsfaktoren auswirkt. Diese Untersuchung wird beispielhaft anhand von zwei Instrumenten durchgeführt: eine direkte Beschränkung der Rentabilität - die Auswirkung dieses Instruments bildet den Gegenstand des vorliegenden Kapitels 2.1 - und eine Preisanpassung orientiert an der Differenz der tatsächlichen gegenüber der fairen Rentabilität (Kapitel 2.2). Die Beurteilung der durchgeführten Regulierungen aus der Sicht einer wohlstandsmaximierenden Behörde erfolgt im Rahmen des Kapitels 3. Die hier betrachtete Regulierung durch eine beschränkte Rentabilität entspricht dem Problem, das Averch, Johnson (1962) im statischen Fall analysiert haben (Kapitel 1.3.2), wobei die Regulierung nun allerdings in einen dynamischen Optimierungsansatz eingebettet worden ist. Die Dynamik des Problems beruht - wie im unregulierten Monopolfall - auf der ModelIierung des Kapitalstocks als Zustandsgröße, die nicht direkt, sondern nur im Zeitablauf über die Bruttoinvestition gesteuert werden kann, wobei der Startwert speziell durch den Kapitalstock im langfristigen Gleichgewicht des unregulierten Monopolfalls vorgegeben ist. Der hier diskutierte Ansatz basiert auf EI-Hodiri, Takayama (1981) und Dechert (1984). Ein Vorteil der gewählten ModelIierung im Vergleich zu den genannten Aufsätzen besteht allerdings darin, dass durch die unterstellte Produktionsfunktion - eine Cobb-Douglas-Funktion mit einem Homogenitätsgrad, der größer als eins ist und somit steigende Skalenerträge impliziert, - eine Situation unterstellt wird, die zu einem natürlichen Monopol führt. Ergänzend wird zudem die Bedeutung von Anpassungskosten in Bezug auf die Investitionen erläutert. Die Analyse der Phasendiagramme bietet für unterschiedliche Parameterkonstellationen Erkenntnisse darüber, wie vielf:iltig und konträr die Auswirkungen auf die Höhe des langfristigen Kapitalstocks sein können. Eine wichtige Erweiterung gegenüber den genannten Ansätzen von EI-Hodiri, Takayama (1981) und Dechert (1984) erfolgt im Kapitel 3.2, wo der hier gelöste Ansatz als Teil eines übergeordneten Optimierungsproblems der Regulierungsbehörde aufgefasst wird. Eine ausführliche Abgrenzung der Modellierung und der Ergebnisse gegenüber den genannten Artikeln wird im Rahmen der kritischen Würdigung durchgeführt (Kapitel I). Der Ansatz basiert nach wie vor auf den Annahmen über die Produktionsfunktion, die Kosten der Produktionsfaktoren und die Preis-Absatz-Funktion, wie sie im Kapitel 1.1 auf den Seiten 58 ff. eingeführt worden sind. Das Modell entspricht damit in seinem Grundaufbau der Darstellung des unregulierten Monopolfalls, wird nun aber ergänzt durch den Tatbestand der Regulierung, die durch eine (exogen von der Regulierungsbehörde vorgegebene) maximal zulässige Rentabilität § dargestellt wird. Im Rahmen des vorliegenden Kapitels wird ferner unterstellt, dass diese von der Regulierungsbehörde detenninierte Rentabilität im betrachteten

2 Verhalten des Angebotsmonopols bei Regulierung

99

Zeitraum konstant ist, wobei von der Problematik sich ändernder Faktorkosten abgesehen wird. Das Konzept der Regulierung durch eine maximal zulässige Rentabilität ist bereits im Rahmen der Diskussion des statischen Falls erläutert worden. Das Kriterium für einen Eingriff der Behörde wird mit Hilfe einer Bruttorentabilität des Unternehmens beschrieben, die gemäß der Gleichung (1.3) auf der Seite 62 als p(x)x - q.v. s:= ;"",:"-,-_,,:,,:,,,,:, qkvk

definiert ist. Sie enthält im Zähler den Bruttogewinn einschließlich der Kapitalkosten und im Nenner den Wert des Kapitalstocks und bildet damit ein Maß für die realisierte Entlohnung des Kapitals. Vergleicht man die hier verwendete Definition mit der entsprechenden Größe des statischen Ansatzes, so ist festzustellen, dass das Kriterium unverändert in den dynamischen Kontext übernommen worden ist, obwohl sich durch den Übergang zum dynamischen Problem die Erfassung der Kapitalkosten ändert. So werden bei der statischen ModelIierung nur die Kapitalkosten rqkvk herangezogen, die den Zins- beziehungsweise Opportunitätskosten entsprechen. Die Ab-

schreibungen und Installationskosten werden im statischen Modell hingegen vernachlässigt. Sie werden erst im dynamischen Zusammenhang explizit einbezogen. Somit stellt sich die Frage, ob es sinnvoll ist, die Bruttorentabilität s unverändert in das dynamische Modell zu übernehmen. Dazu ist es hilfreich, auf die allgemeine Definition der Rentabilität s zurückzugreifen, wie sie in der empirischen Umsetzung der Regulierung zu Grunde gelegt wird. Dort wählt man den Quotienten aus den Erlösen vermindert um die variablen Kosten bezogen auf den Wert des eingesetzten Kapitals als Maß (Klevorick (1966». Dabei ist zu berücksichtigen, dass der Kapitalstock im Rahmen des hier betrachteten dynamischen Modells in jedem einzelnen Zeitpunkt als gegebene (fixe) Größe behandelt wird, die nur über die Zeit hinweg gesteuert werden kann. Entsprechend sind die Kosten, die durch den Kapitalstock hervorgerufen werden, in jedem Zeitpunkt t als fixe Kosten zu interpretieren. Hingegen kann der Faktor Arbeit für alle Zeitpunkte t frei gewählt werden. Somit verursacht der Arbeitslohn variable Kosten. Die Installationskosten werden dem Faktor Kapital zugeordnet, dennoch sind sie nicht exogen gegeben. Vielmehr wird die Höhe dieser Kostengröße durch die Bruttoinvestitionen in jedem einzelnen Zeitpunkt determiniert. Die Aufgabe der Regulierung besteht darin, korrigierend in das Verhalten eines Unternehmens einzugreifen, das als Monopol über Marktrnacht verfügt. Die Möglichkeit, eine hohe Monopolrente zu erwirtschaften, verschlechtert das Marktergebnis aus der Sicht der Konsumenten gegenüber der Situation bei vollständiger Konkurrenz. Gleichzeitig ist zu beachten, dass im Fall positiver Skalenerträge eine Preissetzung in der Höhe der Grenzkosten zu Verlusten des Unternehmens führen kann. Vor diesem Hintergrund besteht das Ziel der Regulierung

100

Kapitel

m Optimale Regulierung

darin, die Monopolmacht so weit einzuschränken, dass eine faire Rendite erzielt wird. Wie die Ausführungen zu den empirischen Regulierungsverfahren zeigen (Kapitel 1.3.2), wird der Begriff ,,fair" durch gerichtliche Verfahren konkretisiert, in denen die regulierten Unternehmen die Möglichkeit haben, ihre Kostensituation zu schildern. Im Folgenden wird unter dem fairen Wert i eine obere Schranke für die Rentabilität verstanden, die zwei Aspekten genügt. Zum einen kann das Unternehmen einen Kapitalstock installieren und aufrecht erhalten, der eine angemessene Versorgung des Marktes sicherstellt. Zum anderen schließt die faire Rentabilität eine angemessene Entlohnung für das eingegangene Investitionsrisiko ein (Klevorick (1971». Eine Analyse der optimalen Höhe dieses Wertes erfolgt im Rahmen des Kapitels 3. Die Regulierung durch die Beschränkung der Rentabilität wird wie im statischen Ansatz von Averch, Johnson (1962) dadurch berücksichtigt, dass das Unternehmen jederzeit einer zusätzlichen Nebenbedingung der Form

s~i unterliegt. Darin stellt p(x)

mit

= -YIX + Y2 mit x = ev:vz die Preis-Absatz-Funktion (1.2) dar,

die die implizite Preissetzung des Unternehmens in Abhängigkeit von der Produktionsmenge beschreibt (Seite 61). Für die Parameter der Produktionsfunktion wird weiterhin a K

= \12 und

> \12 unterstellt (Seite 66).

Für die Regulierung in der Form einer maximal zulässigen Rentabilität, lautet das zugehörige Optimierungsproblem des Unternehmens (2.la) unter den Nebenbedingungen

Vk

= [b -

= vZ,

(2.lc)

s~i

mit

(2.ld)

mit

G(Vko Va' [b, t)

l

0

T

0,

(2.lg)

Va ~ 0,

(2.lh)

e-rr G(Vko Va, [b, r)dr

= p(X(Va• Vk»

(2.le) (2.lf)

[b ~

T ....... oo

= -YIX + Y2

= ev~vZ

X

f' oo(Vk, Va. [b):= lim

(2.lb)

Vk(O)

p(X)

wobei

8Vk

X(V a• Vk) - qava - [r..,. 8]qkVk - Cqk[lb]2

101

2 Verhalten des Angebotsmonopols bei Regulierung den kumulierten Barwert des Gewinnes für den Planungszeitraum

v

t E

[0, oc[ bezeichnet. Die

Größe k symbolisiert den Kapitalstock im langfristigen Gleichgewicht des unregulierten Monopols, der den Startwert für das hier betrachtete Problem bildet. Wie auf den Seiten 77 ff. erläutert worden ist, darf von einem positiven Kapitalstock ausgegangen werden, der auf Grund der unterstellten Produktionstechnik eine geeignete Ausgangsituation für die Analyse einer Regulierung gewährleistet. Die Struktur des Problems entspricht dem Ansatz des unregulierten Monopols und wird lediglich durch die Auflage (2.ld) der Regulierung ergänzt. So verfolgt das Unternehmen weiterhin das Ziel, den kumulierten Barwert seines Gewinnes durch die Wahl geeigneter Zeitpfade für die beiden Steuergrößen

Va

und

jb

zu maximieren. Diese Variablen

können in jedem Zeitpunkt frei gewählt werden, dürfen jedoch nicht negativ werden. Der Kapitalstock stellt wie zuvor die einzige Zustandsgröße des Problems dar, die nur über die strategische Steuergröße

jb

direkt beeinflusst werden kann.

Im Hinblick auf den anschließend dargestellten Lösungsweg ist anzumerken, dass die Nebenbedingung (2.1 d) eine sogenannte "gemischte Nebenbedingung" ist, da sie sowohl eine Steuergröße, nämlich den Arbeitseinsatz

Va,

als auch eine Zustandsvariable - den Kapitalstock

Vk -

enthält. 14 Berücksichtigt man, dass der Wert der Zustands variable in jedem Zeitpunkt t durch die vorherige Systementwicklung determiniert ist, kann diese Ungleichung als zusätzliche Einschränkung für die Steuergröße

Va

interpretiert werden. Die Lösung von Optimierungspro-

blemen mit Nebenbedingungen wird in allgemeiner Form im Anhang 1.3.2 auf der Seite 316 erläutert. 2.1.2

Diskussion der Optimumbedingungen

Zunächst wird die Hamilton-Funktion aufgestellt. Bezieht man sich auf den Zeitwert, so enthält sie den momentanen Gewinn G(t) ergänzt um die bewertete Änderung des Kapitalstocks im jeweiligen Zeitpunkt, A.I [/b - ,svd:

Gemäß dem Maximumprinzip ist diese Funktion nun für alle t über dem zulässigen Bereich der Steuergrößen zu maximieren. Hier wird der zulässige Bereich einerseits durch die Nichtnegativitätsbedingung, andererseits durch die zusätzliche Ungleichung (2.ld) eingeschränkt. Das Optimierungsproblem entspricht damit einer gewöhnlichen Maximierung unter Nebenbedingungen, das hier ganz analog zum statischen Fall unter der Verwendung der Lagrange-Funktion 14

Der Klasse der gemischten Nebenbedingungen steht die Gruppe der sogenannten reinen Zustandsnebenbedingungen gegenüber, die nur Zustandsgrößen, nicht aber Steuergrößen enthält. Da die Zustandsgrößen nur indirekt über die Steuergrößen beeinflusst werden können, sind sie im Allgemeinen schwieriger zu behandeln. Eine Darstellung des Lösungswegs bei reinen Zustandsnebenbedingungen findet sich in Feichtinger, Hartl (1986).

KapitelllI Optimale Regulierung

102

und den zugehörigen Kuhn-Tucker-Bedingungen gelöst wird. Bezeichnet man den LagrangeMultiplikator mit J.L I, so lautet die Lagrange-Funktion

Im Optimum genügen die Größen v:' Ibo und J.Li den Kuhn-Tucker-Bedingungen 'S

a.t.° < 0 aVa = , a.t.0 - 0 aJ.L1

wobei

= ,

a.t.* va° = 0 , -aVa a.t.° Ibo = 0 alb ' a.t." a-J.Li=O, J.LI

v:

~ 0,

Ibo

~

(2.3a)

0,

(2.3b)

J.Li ~ 0,

(2.3c)

.t." den Wert der Lagrange-Funktion bei optimaler Wahl der Steuergrößen und des La.t." := .t.(vt, v:' Ibo, Ä1, J.Lj). Für die hier zu diskutierende

grange-Multiplikators bezeichnet,

Lagrange-Funktion erhält man entsprechend

(2.4a) (2.4b) (2.4c) Zunächst fallt auf, dass die Ableitung nach lb unabhängig von

v: und J.L i ist und somit getrennt

von den beiden anderen Bedingungen ausgewertet werden kann. Ferner liefert ein Vergleich der Ableitungen der Lagrange-Funktion mit den entsprechenden Ableitungen der Hamilton-Funktion des unregulierten Monopols, dass aJ:.* laIb mit der Ableitung ax* I alb für den unregulierten Monopolfall übereinstimmt (Seite 67). Vergleicht man außerdem aJ:.* lava mit der betreffenden Ableitung der Hamilton-Funktion im unregulierten Monopolfall (Seite 66), so zeigt sich, dass sich die bei den Ableitungen wegen a

= 'Izlediglich um den Faktor [I -

J.Lil unterscheiden. Des

Weiteren entspricht die Bedingung (2.4c) der Beschränkung der Rentabilität (2.1d), die durch die Regulierung eingeführt worden ist. Da die Ableitung (2.4b) unabhängig von

v: und J.Li

ist, bietet es sich an, mit der Diskussion der zugehörigen Bedingungen in (2.3b) zu beginnen. Wegen

15

Die hier unterstellten Funktionen gewährleisten, dass die mit Hilfe der Kuhn-Tucker-Bedingungen ennittelten optimalen Steuergrößen auch die hinreichenden Bedingungen für ein Ma~imum der Lagrange-Funktion erfüllen.

103

2 Verhalten des Angebotsmonopols bei Regulierung

= Ai/[2cqk]' falls /b. > 0 ist. Ferner erfordert -2Cqk/b• + Al

folgt zunächst /b. Ibo

= 0, was wiederum Al

< 0 zwingend

< 0 impliziert. Damit ergibt sich die optimale Bruttoinvestition für

den regulierten Monopolfall als

/~=I~

Al < 0,

falls

(1.9)

sonst,

2Cqk

deren funktionale Fonn mit dem unregulierten Fall übereinstimmt. Die Investition hängt nur von der momentanen Bewertung einer Änderung des Kapitalstocks und den Parametern der Funktion der Anpassungskosten ab. Hinsichtlich der Übereinstimmung mit der Optimumbedingung des unregulierten Monopols ist allerdings anzumerken, dass sich - wie noch gezeigt wird - durch eine bindende Regulierung der Zeitpfad von Al ändert, was wiederum Abweichungen in der zeitlichen Entwicklung von /b. impliziert. Die Ableitungen der Lagrange-Funktion nach Va beziehungsweise J1.l enthalten jeweils beide Größen und bilden ein System interdependenter Bedingungen. Für die Analyse werden zunächst die Kuhn-Tucker-Bedingungen in (2.3c) herangezogen. Dabei impliziert die Ableitung der Lagrange-Funktion nach

J1.i

> O. dass

J1.i gleich null sein muss: (2.5a)

Demnach ist die Regulierungsbeschränkung für

J1.i

> 0 in Gleichheit erfüllt und die erwirt-

schaftete Rentabilität entspricht exakt der maximal zulässigen Rentabilität s. Gleichzeitig determiniert (2.5a) für den im jeweiligen Zeitpunkt t gegebenen Kapitalstock Vk den Arbeitseinsatz Dagegen bedeutet

a.r:

-

aJ1.1

> 0

-ylfiv:viK

+ Y28[V:t"vZ -

qav:.

(2.5b)

dass die erwirtschaftete Rentabilität kleiner als die maximal zulässige Rendite ist. Die Regulierung wird hinfallig und für den zugehörigen Lagrange-Multiplikator erhält man auf Grund der Optimumbedingung [a.c· /aJ1.IlJ1.i

= 0 den Wert J1.i = O.

Ganz analog besagt die Bedingung (2.3a) (2.6a) Im Fall einer positiven Arbeitsmenge erhält man also für das im jeweiligen Zeitpunkt gegebene Vk eine Gleichung in v: und

J1.i. Entsprechend folgt. a.c· -

aVa

< 0

=:}

v: = o.

(2.6b)

Kapitel III Optimale Regulierung

104

Führt man nun die Ergebnisse der bisher isoliert behandelten Kuhn-Tucker-Bedingungen zusammen, so können die optimalen Werte der bei den Variablen ermittelt werden. Die Betrachtung beginnt mit dem Fall

/-Lf

(2.5a) mit der maximal zulässigen Größe

> 0, so dass die erwirtschaftete Rentabilität nach

s übereinstimmt.

Geht man ferner davon aus, dass

v: > 0 ist, so muss auch (2.6a) erfüllt sein. Damit ist das folgende Gleichungssystem in den

Variablen

/-Lf

> 0 und v: > 0 zu lösen, wobei der Kapitalstock Vk gegeben ist.

- y,OZv:vf + Y2B[V:]IOVZ - qav: = SqkVko [1 -

(2.7a)

/-Lm -y,OZvf + Y2Y2B[V:rlOvZ - qa] = O.

Für dieses Gleichungssystem sind zwei Fälle zu unterscheiden, die sich durch

/-L i

=1= I charakterisieren lassen. Im unwichtigen Fall mit

chungen, die nur noch von

/-L f

(2.7b)

/-Lf

=

1 und

=1= I ergeben sich zwei Glei-

v: abhängen. Sofern sich die beiden Gleichungen nicht widerspre-

chen, erhält man einen Randfall, in dem zum einen die Regulierungsbeschränkung in Gleichheit erfüllt ist, vgl. (2.7a), und zum anderen die Bedingung für das unreglierte Monopol

-y,tPVzK + V1Y2B[V:rlOvZ

= qa eintritt.

Im relevanten Fall gilt in der Gleichung (2.7b)

so dass nun

erfüllt sein muss. Damit verbleibt die Bedingung (2.7a) zur Bestimmung der optimalen Arbeitsmenge, die

v: als eine implizite Funktion des gegebenen Kapitalstocks liefert. Demnach ist der

optimale Arbeitseinsatz

v: dem gegebenen Kapitalstock Vk so anzupassen, dass die erwirtschaf-

tete Rentabilität gerade der maximal zulässigen Größe

s entspricht.

Die implizite Lösung der

Gleichung (2.7a) wird im Weiteren als (2.8)

bezeichnet. Während die zuvor diskutierten Fälle auf der Auswertung der Kuhn-Tucker-Bedingungen (2.3a) und (2.3c) für

obehandelt.

/-Li, v:

> 0 beruhen, wird nun ß.c.* / ß/-L i > 0 und anschließend ß.c.* / ßv:
0, dass die Regulierung unwirksam ist, da die Rentabilität bei optimalem Arbeitseinsatz geringer als der maximal zulässige Wert s ist. Damit erfordert die Bedingung (2.3c)

/-Li

= 0, und (2.4a) vereinfacht sich zu

-ß.c.* = -YJO V2 kann. Folglich impliziert

°

erstellt werden

v: = 0, dass neben dem Output auch die Erlöse des Unternehmens

im jeweiligen Betrachtungszeitpunkt gleich null sind, so dass die erwirtschaftete Rentabilität ebenfalls null beträgt. Das Regulierungskriterium ist nicht verletzt. Dieser irrelevante Fall wird im Folgenden vernachlässigt. Fasst man die Ergebnisse der Optimierung der Hamilton-Funktion über den Steuergrößen unter Berücksichtigung der beschränkten Rentabilität zusammen, so erhält man 16 A.I < 0,

falls sonst, falls

(2.lOa)

a.t.* lava< 0,

gemäß (2.9) im unregulierten Fall,

(2.lOb)

gemäß (2.8) mit beschränkender Regulierung, ohne aktive Regulierung, mit aktiver Regulierung.

(2.1 Oc)

Neben der Maximierung der Hamilton-Funktion erfordert das Maximumprinzip, dass die Änderung der Kozustandsvariablen in der Zeit der Differentialgleichung

genügt. Wie im Anhang auf den Seiten 316 erläutert wird, enthält diese Kozustandsgleichung für ein Optimierungsproblem mit Nebenbedingungen statt der Ableitung der Hamilton-Funktion nun die Ableitung der Lagrange-Funktion nach der Zustands variablen. 16

Der Fall eines positiven Wertes

MT mit MT #

I wird wegen der geschilderten Problematik vernachlässigt.

KapitelllI Optimale Regulierung

106 Wegen

* k2c-1 + K)12 8[Va*l\oi·JC-' -aJ:.* = - 2",'1. KYW-VaV Uk - [r + 01 qk aVk 0

mit

+ J.Lr [Sqk + 2KYlrflV:V~-1 - K)I28[v:l\oi vi- '] =[1 - J.LrlD3 - [r + 81qk - >"18 + J.Lrsqk D3:= - 2Ky, rflv:vic - ' + K)I28[v:l\oivi- '

'0

11010

(2.11)

ergibt sich die Kozustandsgleichung als

Berücksichtigt man die Erkenntnisse über den optimalen Wert J.Lt gemäß den Gleichung (2.1 Oe), so kann die Differentialgleichung umgeformt werden zu: ohne aktive Regulierung, mit aktiver Regulierung.

(2.12)

v;, der nach (2. lOb) der v; = V:(Vk) entspricht. Damit stimmt die

Im ersten unregulierten Fall enthält D 3 den optimalen Arbeitseinsatz optimalen Arbeitsmenge des unregulierten Monopols

Änderung des Schattenpreises i, exakt mit der adjungierten Zustandsgleichung des unregulierten Monopols (1.10) auf der Seite 68 überein. Im zweiten Fall mit aktiver Regulierung fällt auf, dass die Änderung des Schattenpreis bezüglich

Vk

konstant ist. So hängt

i,

nur vom Schattenpreis A, und den Parametern r, Ö,

i, qk

undsab.'7 Die optimale Systementwicklung ergibt sich somit durch das kanonische System, das aus der Bewegungsgleichung für den Kapitalstock (2.1b) und der Kozustandsgleichung (2.12) besteht, wobei die Steuergrößen

IbO

und

v: durch ihre optimalen Werte aus (2.1 Oa) und (2.1 Ob) zu

ersetzen sind. Die allgemeine Darstellung des Optimierungsproblems schließt mit der Feststellung, dass aus der Schar der Trajektorien, die die Lösung dieses Differentialgleichungssystems darstellen, laut Maximumprinzip nur diejenigen optimal sind, die für den gegebenen Anfangswert des Kapitalstocks (2.1c) die Grenztransversalitätsbedingung !im e-rtA, (t)[Vk(t) - vZ(t))

~

0

' .... 00

erfüllen. 17

Auch im Randfall eines positiven /Li", 1 ergibl sich die zweite Bedingung aus (2.12).

(2.13)

107

2 Verhalten des Angebotsmonopols bei Regulierung

2.1.3

Fallunterscheidung für den Bruttogewinn

Wie die Kozustandsgleichung (2.12) zeigt, wird die Systementwicklung entscheidend dadurch bestimmt, ob die Regulierung im jeweiligen Betrachtungszeitpunkt das Unternehmen tatsächlich einschränkt oder nicht. Da der optimale Arbeitseinsatz

v; des unregulierten Monopols

gemäß (2. lOb) vom Kapitalstock Vk abhängt, kann der Bruttogewinn, also der Erlös vermindert um die Arbeitskosten, und damit auch die Rentabilität s = [p(x)x - qav;l/[qkvkl als Funktion von Vk behandelt werden. Im Folgenden wird untersucht, für welche Werte des Kapitalstocks die Regulierung beschränkend wirkt. Den Ausgangspunkt bildet die Betrachtung des Bruttogewinns p(x)x-qav; des unregulierten und des regulierten Monopols, der sich durch die folgenden Gleichungen beschreiben lässt: s < S,

falls

(2.14)

sonst. Darin kann der unregulierte Bruttogewinn umgeformt werden zu

Um den Verlauf des unregulierten Bruttogewinns bezüglich Vk zu diskutieren, wird die Ableitung

dJT

-d Vk

= -2KYle2v~(Vk)V~K-1 + KY2e[v~(vk)lY,vr-1 ,.

+ [-yIO2 v/2 + V2Y2e[V~(vdr"vr -

dv"(vd qul-da- Vk

benötigt. Die Auswertung der Optimumbedingungen (2.3a) für die eingesetzte Arbeitsmenge impliziert, dass im Falle einer inneren Lösung, also für

V~(Vk)

> 0, die Gleichung

resultiert (Gleichung (1.7), Seite 66). Folglich gilt -2KYle2V~(Vk)VZK-1

+ KY2e[v~(vdlY,vZ-1

~

°

Y2[V~(VkWY, ~ 2y10vZ.

Für spätere Rechnungen ist es hilfreich zu beachten, dass dJT/dvk unregulierten Monopolfall anzupassen ist, (2.9), so ergibt sich

v~

= V~(Vk)'

= D 3 ist, wobei D 3 für den

Ersetzt man nun

V~(Vk)

mit Hilfe von

Kapitel m Optimale Regulierung

108

s

1C /'

/

I

I

o Abbildung m.lO: Ennittlung des Bruttogewinns des regulierten Unternehmens in Abhängigkeit vom Kapitalstock Da Qa/[8vZl für alle

Vk

> 0 positiv ist, resultiert dJr/dvk > O. Der Bruttogewinn des Unterneh-

mens besitzt somit eine positive Steigung bezüglich des Kapitalstocks. Für v~

= 0 optimal, sondern auch

Jr

= 0, so dass die Kurve für

Jr

Vk

= 0 ist nicht nur

als Funktion von

Vk

im Ursprung

beginnt. Berechnet man die zweite Ableitung des unregulierten Bruttogewinns

Jr

nach

Vb

ergibt sich

ein relativ komplizierter Ausdruck, der ohne weitere Spezifikationen der Parameter nicht eindeutig bestimmt werden kann. Auf eine ausführliche Herleitung wird daher verzichtet. Stattdessen wird auf die grafische Darstellung III.1O verwiesen, die mit Hilfe von AfAlliEMATIGr ermittelt worden ist. Man beachte, dass die Untergrenze .!Lk für einen Homogenitätsgrad Ci

+K

> 1,

der nahe bei eins liegt, sehr klein ist und unter Umständen sogar verschwindet. Die numerischen Ergebnisse liefern in diesem Fall eine vollständig konkave Kurve für Werte von

K

steigt

Jr

Jr.

Für sehr große

zunächst progressiv, bevor die Kurve in den konkaven Bereich übergeht.

Wie bereits im Rahmen des Kapitels 1.2 erörtert worden ist, befindet sich die Ausgangssituation des betrachteten Optimierungsproblems im konkaven Bereich der Hamilton-Funktion und damit auch des Bruttogewinns, wobei der Kapitalstock im langfristigen Gleichgewicht des unregulierten Monopols positiv ist. Dementsprechend konzentriert sich die Betrachtung auf den konkaven Bereich der Kurve. Die Kurve für den maximal zulässigen Bruttogewinn folgt aus ir = sqkVk. Diese Ursprungsgerade mit der Steigung dir /dvk = sqk verläuft um so steiler, je höher die zulässige Rentabilität

s ist. Die entsprechende Drehung ist der Abbildung m.l 0 zu entnehmen. Für den im jeweiligen Zeitpunkt t gegebenen Kapitalstock wirkt die Regulierung gen au dann beschränkend, wenn der Bruttogewinn des unregulierten Monopols

Jr

die obere Schranke ir

109

2 Verhalten des Angebotsmonopols bei Regulierung

überschreitet. Im Fall der Abbildung III.lO stellt die Regulierung somit eine Einschränkung dar, solange.!!k
Uk beziehungsweise




11:

zu, so

lh mit der

Kozustandsgleichung des unregulierten Monopols übereinstimmt. Wird D 3 gemäß (2.11) und

v: =

V~(Vk)

nach (2.9) substituiert, so erhält man analog zu (1.13) auf der Seite 70 die Kozu-

stands gleichung des unregulierten Monopols mit der Lösung (1.14). Eine äquivalente Darstel-

Kapitel m Optimale Regulierung

110 lung ergibt sich unter Beachtung von dn'/dvk

. AI Entsprechend wird die Isokline für

= DJ mit v: = V:(Vk) gemäß (2.9):18

= [r + 8][AI + qk] -

d1r -d

(2.16)

Vk

= 0 in dem Bereich Vk

il

> Vt durch die Isokline des

unregulierten Monopols (1.14) beschrieben. Sie lautet in der alternativen Schreibweise A -

dn' - - [r+8]qk

1-

dVk

(2.17)

r+8

Der Verlauf dieser Kurve im (Vk, AI )-Phasendiagramm ist im Rahmen des Kapitels 1.2, Abbildung m.l, bereits diskutiert worden. Zusammenfassend ist festzuhalten, dass sich im Bereich >

Vk

Vk

keine Änderungen gegenüber dem Verhalten des unregulierten Monopols ergeben.

Liegt der momentane Kapitalstock jedoch im regulierten Bereich Vk < Vh so weicht die Änderung von AI gemäß (2.12) von der Kozustandsgleichung des unregulierten Monopols ab, (2.18) Um das Phasendiagramm im Bereich Vk


Vk

Vk


O. __~___________________ OAI

=

Zur Überprüfung dieser Schreibweise ist darauf zu verweisen, dass i..; = rÄ 1 - a.c·laVt gilt, wobei .c' 7r-[r+o]qkvk-c(lbo)-qaV~+ÄI[Ib·-ovkJ+/Li[.fqkvk-7r] ist. Ohne bindende Regulierung ist der LagrangeMultiplikator /Li gleich null. Somit vereinfacht sich die Ableitung der Lagrange-Funktion bei optimaler Wahl der Steuergößen v~, Ib. für einen Kapitalstock im Bereich Vk rt l.!!., iit] zu a.c·1 aVk d7r/dvk-[r+o]qk-oÄI.

=

111

2 Verhalten des Angebotsmonopols bei Regulierung

I

/ "

I

X:I

0 gekennzeichnet; in diesem Bereich steigt die Wertschätzung einer

Änderung des Kapitalstocks im Zeitablauf. Hingegen gilt unterhalb der Isokline).,1 < 0, so dass die Bewertung einer Änderung des Kapitalstocks im Zeitablauf fällt. In der Abbildung m.ll sind die entsprechenden Bewegungsrichtungen von AI für das regulierte Monopol, al-

so mit Bezug zur ().,I

= O)-Kurve, eingezeichnet worden.

Dabei ist zu beachten, dass sich

durch die Regulierung die Bewegungsrichtungen in den Bereichen zur Abbildung

m.1

CD , (g) und @ im Vergleich CD und @ oberhalb der

in ihr Gegenteil verkehrt. So liegen die Bereiche

= 0 des = 0, aber

gestrichelten Kurve des unregulierten Monopols, aber unterhalb der Isokline für).,1 regulierten Monopols. Analog befindet sich die Fläche (g) unterhalb der Kurve ).,~ oberhalb der Kurve mit j,1

= O.

Um die Effekte einer Änderung des Parameters zu diskutieren, wird erneut auf die Abbildung von

s auf den Verlauf der Isokline für).,1 = 0

m.1O

(Seite 108) verwiesen. Eine Erhöhung

s dreht die Ursprungsgerade iT nach oben, wodurch sich der Bereich, in dem die Regulie-

rung bindet, verkleinert; die Grenze des regulierten Bereiches Vk verschiebt sich nach links. 19 Die Auswirkung auf die ().,I

= O)-Isokline wird in der Abbildung 111.12 dargestellt.

Insbe-

sondere der Bereich, in dem die Isokline horizontal verläuft, schrumpft. Zieht man ferner die Bestimmungsgleichung (2.19) für den Wert XI heran, der den Ordinatenabschnitt des horizontal verlaufenden Isoklinenstücks angibt, so folgt

aXI / as >

O. Der waagerechte Teil der Isokline

des regulierten Monopols verschiebt sich somit durch eine Erhöhung von

s nach oben.

Beide

Effekte werden in der Abbildung m.12 durch Pfeile angedeutet, die in die Richtung zeigen, in die sich Vk beziehungsweise XI auf Grund einer Erhöhung von 19

s verschieben.

Nach wie vor wird von ~ "" 0 und einem konvexen Verlauf der 1l'-Kurve ausgegangen.

Kapitel III Optimale Regulierung

112

I

"

,-

~

/ ist

IrI

",

\

\ \

\ \

\ \ \

:

\:

V

Abbildung m.12: Wirkung einer Variation der maximal zulässigen Rentabilität Die folgenden Ausführungen konzentrieren sich auf die zusätzlichen Effekte, die zu beobachten sind, wenn.Y.k > 0 im Fall großer Skalenerträge (a Kozustandsgleichung

I [r

AI =

+ Il]P'1 + qk] -

dlT

falls

+K »

I) gilt. Entsprechend der

Vk < .!::k

+ 1l][AI + qk] _ ::kk dlT [r + O][AI + qd - dVk [r

= 0 des regulierten Monopols nicht nur im Bereich Vk > Vb sondern = 0 (vgl. die Abbildung m.13). Eine Erhöhung der zulässigen Rentabilität s impliziert ähnliche Effekte für den Verlauf der

verläuft die Isokline für ij

auch für Vk < .Y.k deckungsgleich mit der Kurve i'l

Isokline für ij = 0, wie sie zuvor in der Abbildung m.12 skizziert worden sind. Der einzige Unterschied besteht darin, dass nun die untere Grenze .Y.k des regulierten Bereichs zu berücksichtigen ist. Analog zur oberen Grenze des regulierten Bereiches Vb die sich mit steigendem s nach links verschiebt, wird die untere Grenze .Y.k nach rechts gerückt. Der Bereich, einer aktiven Regulierung wird in diesem Fall also bei wachsendem s durch eine simultane Veränderung der Obergrenze und der Untergrenze verkleinert. Wie zuvor verlagert sich der Wert

a5:.j I as >

5:.j

wegen

0 nach oben.

Abschließend ist noch zu klären, wie sich der Schattenpreis im Zeitablauf ändert, wenn der Kapitalstock in einem Zeitpunkt t gerade den Wert V k oder .Y.k annimmt. Da die Argumentation für beide Stellen analog verläuft, kann man sich hier auf den Wert Vk konzentrieren. Dieser Kapitalstock bezeichnet die Grenze zwischen dem Intervall mit aktiver Regulierung und dem Bereich, in dem der Bruttogewinn lT des unregulierten Monopols den zulässigen Bruttogewinn ii nicht überschreitet. Entsprechend der Gleichung (2.IOc) auf der Seite 105 gilt links von Vk

113

2 Verhalten des Angebotsmonopols bei Regulierung

"-

\

\

i

\ \

\ \

\

:

\:

\"

Abbildung m.13: Verlauf der ().,

= O)-Isokline für einen Homogenitätsgrad a + K »

der optimale Lagrange-Multiplikator J.Lr

= 1, da die Regulierung bindet.

1

Dagegen gilt J.Lr

=0

rechts von Vk. An der Stelle Vk entwickelt sich J.Lr somit nicht kontinuierlich, sondern springt von null auf eins. Auch der Arbeitseinsatz

v: wird links und rechts von Vk durch unterschied-

liche Funktionsvorschriften abgebildet (Gleichung (2.IOb». Allerdings springt der Wert nicht, denn beide Vorschriften liefern denselben Arbeitseinsatz

v: an der Stelle Vk' Die unterschiedli-

chen Werte von J.Lr, die links beziehungsweise rechts von Vk gelten, implizieren aber, dass sich die linksseitige und die rechtsseitige Ableitung aaC.· / aVk an der Stelle Vk unterscheiden. Damit repräsentiert der Kapitalstock Vk eine Stelle, an der die Lagrange-Funktion (2.2) nicht differenzierbar ist. Grafisch spiegelt sich die Änderung der optimalen Werte in der Abbildung III.10 als Knickstelle des Bruttogewinns unter Berücksichtigung der Regulierung wider. Solange eine solche Stelle der Lagrange-Funktion nur endlich oft durchlaufen wird, ist sie unproblematisch (Feichtinger, Hartl (1986), Seite 511 ff.). Das Standardmaximumprinzip kann unverändert beibehalten werden. Verweilt das System allerdings mit endlicher Dauer in einer solchen nicht differenzierbaren Stelle, so muss die Kozustandsgleichung für diese Zeitpunkte durch 20

)..1

E r)'-! -

au,aC.· = [D 4, D s]

mit

D 4 := [r

+ a]P.'1 + qk] -

Sqk

und

D s := [r

+ a]p_1 + qk] -

drr -

dVk

(2.20)

ersetzt werden (Feichtinger, Hartl (1986), Seite 513). Dabei wird die Ableitung aaC.· / aVk durch ein Intervall ersetzt, dessen Begrenzung durch die linksseitige beziehungsweise rechtsseitige Ableitung der Lagrange-Funktion nach Vk determiniert ist. Die Geschwindigkeit, mit der sich 20

Analog zu Rockafellar (1972), Seite 242, enthält das sogenannte Superdifferential a""c bei Differenzierbarkeit der Funktion J:.* einen einzigen Supergradienten, nämlich aJ:." / aVb und man erhält die eigenlliche Kozustandsgleichung Al = rAI - aJ:.* /aVk·

Kapitel m Optimale Regulierung

114

AI ändert, ist dann nicht mehr eindeutig gegeben. Die Darstellung kann analog auf die untere Grenze .!!.k = 0 übertragen werden. Nachdem das Verhalten der adjungierten Variablen im

(Vk,

Ad-Phasendiagramm erörtert

worden ist, lässt sich nun die Änderung des Kapitalstocks in Abhängigkeit von AI darstellen. Die Entwicklung des Kapitalstocks ergibt sich aus der Bewegungsgleichung (2.lb), wobei die Bruttoinvestition gemäß (2.IOa) gewählt wird, also

Durch die Regulierung ändert sich die Optimumbedingung für die Bruttoinvestition nicht, so dass die Differentialgleichung mit der des unregulierten Monopols übereinstimmt (Gleichung (1.18), Seite 73). Entsprechend verläuft die Isokline für Vk

= 0 so, wie es in der Abbildung

III.2, Seite 73, dargestellt worden ist. Der entscheidende Unterschied hinsichtlich der zeitlichen Entwicklung besteht nun darin, dass im Bereich.!!.k
0 für den regulierten Bereich zu berücksich· tigen ist. Allerdings werden sich nur dann zusätzliche Erkenntnisse einstellen, wenn sich die Untergrenze .!!.k wesentlich von null unterscheidet. Als Vorgriff ist ferner darauf zu verweisen, dass sich insbesondere die Obergrenze Vk für die unterstellte Anfangssituation - nämlich

115

2 Verhalten des Angebotsmonopols bei Regulierung das langfristige Gleichgewicht des unregulierten Monopols (v k'

An - als bedeutsam erweist.

Hingegen rückt die Untergrenze .!!k eher in den Mittelpunkt des Interesses, wenn das unreguIierte Unternehmen noch über einen relativ kleinen Kapitalstock verfügt, so dass es sich noch nicht in seinem langfristigen Gleichgewicht befindet, sondern auf dem Sattelpfad. der in diesen Punkt führt. Da im Rahmen dieser Arbeit vom langfristigen Gleichgewicht eines Monopols mit Marktrnacht ausgegangen wird. erscheint es plausibel. einen relativ großen Kapitalstock zu unterstellen. Damit spielt die Behandlung der Untergrenze .!!k lediglich eine untergeordnete Rolle. Entsprechend wird sie in den zunächst betrachteten Grafiken nicht explizit berücksichtigt. Die einzige hier bedeutsame Abweichung gegenüber den Ergebnissen unter Vernachlässigung der Untergrenze ergibt sich in einem speziellen Fall mit sehr kleiner Rentabilität S, in dem das einzige mögliche Gleichgewicht durch die Untergrenze .!!k determiniert wird. Für eine Diskussion dieser Situation ist auf die Seite 136 zu verweisen. Im Abschnitt 2.1.6 wird die Auswirkung einer parametrischen Variation der maximal zulässigen Rentabilität

s für gegebene Werte der übrigen Parameter diskutiert.

Da das Ziel darin

besteht. qualitative Einsichten in die Auswirkung einer beschränkten Rentabilität zu gewinnen. wird von einer exakten numerischen Spezifikation abgesehen und auf die schematische Darstellung anhand der Phasendiagramme zurückgegriffen. Ausgehend vom Fall des unregulierten Monopols, der ausführlich auf den Seiten 76 ff. diskutiert worden ist, wird hier zunächst das Phasendiagramm für eine sehr niedrige zulässige Rentabilität behandelt. Anschließend wird diese Rate erhöht und die dadurch implizierte Veränderung des Gleichgewichtes und des zugehörigen Sattelpfades analysiert. Wichtig sind die beiden Effekte, die mit einer Lockerung der

s einhergehen, nämlich eine Verkleinerung des Bereiches, in dem die Regulierung einschränkend wirkt. und eine Verschiebung des horizontalen Teils der 0", = O)-Isokline. Je nach Höhe von s ergeben sich unterschiedliche Fälle, die von einer extremen Einschränkung Schranke

bis hin zu dem Fall reichen, dass das unregulierte Gleichgewicht trotz der Regulierung unverändert beibehalten werden kann. Entsprechend sind auch die Ergebnisse hinsichtlich der resultierenden Veränderung des langfristig gleichgewichtigen Kapitalstocks sowie des zugehörigen Sattelpfades, der in dieses Gleichgewicht führt, sehr unterschiedlich. Die Betrachtung beginnt mit dem Phasendiagramm m.14, in dem ein sehr niedriger Wert für die maximal zulässige Rentabilität vorliegt. Entsprechend ist die Obergrenze für den regulierten Bereich "ih relativ hoch, während ~I relativ niedrig ist. Diese Situation wird im Folgenden als Referenzfall bei Regulierung bezeichnet. Die Abbildung zeigt zunächst die Situation ohne Regulierung, also die Isokline für )..~ 0, das zugehörige langfristige Gleichgewicht

(vZ, 5..~),

sowie eine Skizze des entsprechenden

Sattelpfades. Der dargestellte Fall ist dadurch gekennzeichnet, dass sich zum einen "ih sehr weit

v

rechts von k befindet. und zum anderen der horizontale Teil der Isokline für

)..1 = 0 unterhalb

Kapitel III Optimale Regulierung

116

>"1 =

U/

/

0

/,--,

/

'

I

CD \

\ \

I

I

).u .. 1,

I ............... .

>"1 =0 s..1~~~~~----~~7-~~~-------1

/./

Abbildung III.J4: Phasendiagramm im Referenzfall bei Regulierung

des unregulierten Gleichgewichtes

AI liegt.

Das Phasendiagramm für den regulierten Monopolfall wird durch die Isoklinen für lik und für >"1

=0

= 0 in vier Bereiche eingeteilt. Der Bereich CD liegt oberhalb der Isokline mit >"1 = 0

und links von der Kurve mit lik Werte von AI und

Vk

= 0; Punkte in diesem Gebiet weisen entsprechend wachsende (>"1 = O)-Kurve und rechts von der

auf. Der Bereich @ liegt oberhalb der

Isokline für den gleichgewichtigen Kapitalstock. Damit steigt zwar AJ, aber der Kapitalstock sinkt. Die Teilfläche @ befindet sich unterhalb der Isokline für >"1 = 0 und rechts von Vk = O. so dass die zugehörigen Punkte mit fallenden Werten von AI und Vk verbunden sind. Im Bereich @ wächst der Kapitalstock und der Schattenpreis für eine Änderung von

Somit wird deutlich. dass der Punkt (vI:,

Vk

fällt.

in seine Eigenschaft als Gleichgewicht verliert. Er

liegt damit auf einer Trajektorie, auf der der Kapitalstock Vk und der Schattenpreis AI für t ...... 00 gegen unendlich streben. Ein solcher Zeitpfad ist suboptimal, da er die Grenztransversalitätsbedingung nicht erfüllt. Als intuitive Erklärung ist auf die quadratischen Anpassungskosten zu verweisen, die wegen der erforderlichen Investitionen sehr schnell wachsen. Das neue Gleichgewicht des regulierten Systems wird vielmehr durch den Schnittpunkt der (Vk

= O)-Isokline und des horizontalen Teils der (i l = O)-Isokline determiniert, der die Ko-

ordinaten (v k' 5.1) besitzt. Da die Isokline für den gleichgewichtigen Kapitalstock eine Ur-

sprungsgerade ist und der horizontale Ast der Isokline für den gleichgewichtigen Schattenpreis unterhalb des alten Gleichgewichtes verläuft, muss bei dieser Parameterkonstellation das neue Gleichgewicht zwangsläufig einen niedrigeren Kapitalstock und einen geringeren Schattenpreis aufweisen. Um die Stabilität des Gleichgewichtes zu untersuchen, wird erneut die lacobi-Matrix des linearisierten Systems herangezogen (Seite 74). Hier ergibt sich wegen

ail/avk = 0 folgende

117

2 Verhalten des Angebotsmonopols bei Regulierung Determinante der Jacobi-Matrix

aVk ai)

ai) aVk

detJ= - - - - - = -cS[r+cS]-O < O. aVk aAl aVk aAl Wie im Gleichgewicht

(vI:, Äj) des unregulierten Monopolfalls ist auch hier die Determinante

der Jacobi-Matrix negativ, so dass auf einen Sattelpunkt geschlossen werden kann. Mit Blick auf das Phasendiagramm ill.14 wird deutlich, dass der zugehörige Sattelpfad deckungsgleich mit dem waagerechten Teil der (i) = O)-Isokline verläuft. Auf allen Trajektorien, die oberhalb des Schattenpreises ~) starten, wachsen der Kapitalstock und der Schattenpreis kontinuierlich. Die Trajektorien, die unterhalb von ~) beginnen, implizieren, dass beide Größen kontinuierlich fallen. Nun stellt sich die Frage, wie sich das Unternehmen bei Einführung der Regulierung verhält. Gemäß den Annahmen befindet sich das Unternehmen in der Ausgangssituation im langfristigen Gleichgewicht des unregulierten Monopols. Der Kapitalstock ist damit durch den Wert

vI:

gegeben und kann nur kontinuierlich angepasst werden. Wie erläutert worden ist, kann beziehungsweise will das Unternehmen durch die Regulierung nicht mehr in dem Gleichgewicht des unregulierten Monopols verbleiben, weil sich die Dynamik des Systems verändert hat. Der ermittelte neue Sattelpunkt

(vA:, il) stellt als stationärer Punkt wie im Standardfall den Endpunkt

der optimalen Trajektorie dar. Das Unternehmen wird den Wert für die Kozustandsvariable so wählen, dass es auf dem neuen Sattelpfad startet. Da der Sattelpfad hier unterhalb des früheren Gleichgewichtes liegt, wird das Monopol seinen alten gleichgewichtigen Wert

5..j

nach unten

auf den neuen Anfangswert für die adjungierte Variable ~) korrigieren. Von nun an konvergiert das Unternehmen entlang des Sattelpfades, also bei konstantem Schattenpreis AI und fallendem Kapitalstock

Vb

gegen das neue langfristige Gleichgewicht.

Wie im statischen Ansatz von Averch, Johnson (1962) verändert die Regulierung auch im dynamischen Modell das Verhältnis der eingesetzten Faktormengen. Ohne eine vollständige analytische Lösung durchführen zu müssen, können hierzu anhand des Phasendiagramms III.14 einige Aussagen getroffen werden: • Zunächst ist festzuhalten, dass vA:
0

{:::::>

S> r +8

(2.21)

Kapitel III Optimale Regulierung

118

aus (2.19) folgt. Ferner ist anzumerken, dass in einern solchen Gleichgewicht nur dann ein nichtnegativer Gewinn erzielt werden kann, wenn die zulässige Rentabilität den Wert r +.5 genügend übersteigt, um die zugehörigen Anpassungskosten Cqk( .5vk)2 abzudecken,

die zum Erhalt des Kapitalstocks notwendig sind. Anderenfalls kann das Unternehmen auf Dauer nicht überleben . • Um von der Startsituation mit

v~

in das neue langfristige Gleichgewicht zu gelangen,

bewertet das Unternehmen eine Änderung des Kapitalstocks mit dem Schattenpreis X'j und behält diesen Wert entlang des Sattelpfades unverändert bei. In diesem Zusammenhang stellt sich die Frage, wie die Wahl der adjungierten Variablen AI

= X'j die Investition beeinflusst.

eine lineare Funktion I b'

Die Bruttoinvestition I b • bezeichnet gemäß (2.lOa)

= AI/2cqk' sofern AI

?; 0 ist. Entsprechend 5..~ > X'j reduziert

das Unternehmen die Bruttoinvestition und hält sie entlang des Sattelpfades konstant auf dem Niveau X'j /2Cqk. Da I b• zunächst kleiner als die momentane Abschreibung ist, sinkt

v

der Kapitalstock so lange, bis schließlich der langfristig gleichgewichtige Kapitalstock k erreicht ist, bei dem sich die Abschreibungen und die Bruttoinvestitionen wiederum die Waage halten. Ergänzend ist anzumerken, dass der neue Sattel pfad auch für jeden Kapitalstock Vk
r

+ ö erfordert.

Eine weitere Information, wann der Parameter s eine Reduktion des Kapitalstocks induziert,

erhält man durch einen Vergleich der Schattenpreise im langfristigen Gleichgewicht des regulierten beziehungsweise des unregulierten Monopols. Wie bereits erörtert worden ist, fallt der Kapitalstock genau dann, wenn der horizontale Teil der (~~

= O)-Isokline, und damit der

Schattenpreis einer zusätzlichen Kapitaleinheit im langfristigen Gleichgewicht des regulierten Unternehmens, unterhalb des gleichgewichtigen Schattenpreises des unregulierten Monopols liegt, also X~ < i~. Substituiert man in dieser Ungleichung

X;

durch (2.19), Seite 110, und

i~ unter Verwendung der Gleichung für die Isokline des unregulierten Monopols (2.19), Sei-

te 110, ausgewertet an der Stelle des Gleichgewichtes (v~, i~), so erhält man eine äquivalente Bedingung für den Parameter s:

(2.23) Die Interpretation dieser Bedingung ist leichter, wenn die mit qk multiplizierte Ungleichung betrachtet wird. Ein geringerer Wert des langfristig gleichgewichtigen Kapitalstocks tritt somit auf, wenn der maximal zulässige Bruttogewinn bezogen auf eine Kapitaleinheit Sqk niedriger als der entsprechende Bruttogrenzgewinn dJT/ dVk im langfristigen Gleichgewicht des unregulierten Monopols, also an der Stelle vk' ist.

Ein weiteres Kennzeichen für den Referenzfall besteht darin, dass der unterstellte Wert sauch

v~

< Vk impliziert. Dieses Größenverhältnis ist zwingend dafür, dass überhaupt eine Verzer-

rung auftritt. Sofern die maximal zulässige Rentabilität s bereits so groß ist, dass im unregulier22

Die Größenverhältnisse basieren auf einem Vergleich von vdv~j mit VdV~(t'k). Allerdings ist es hier nichl möglich, eine Aussage darüber zu treffen, inwiefern die Kapitalintensität v;! V~j von dem Faktoreinsatzverhältnis im langfristigen Gleichgewicht iiklv~(iJk) des unregulierten Monopols abweicht, da dann sowohl die Änderung des Kapitalstacks als auch der eingesetzten Arbeilsmenge zu berücksichtigen sind.

121

2 Verhalten des Angebotsmonopols bei Regulierung

ten Gleichgewicht keine Regulierung mehr erforderlich ist, besteht für das Unternehmen kein Anlass, von

(vZ, ir)

abzuweichen. Dieser Aspekt wird im Rahmen des Falls (d), Seite 131,

aufgegriffen. Da der hier behandelte Fall auf relativ kleinen Werten von s basiert, darf Vk < ih unterstellt werden, um keine triviale Situation zu analysieren.

2.1.6

Variation der zulässigen Rentabilität s

Fall (a)

Erhöht man S, verschiebt sich - wie bereits erläutert worden ist - der horizontale

Ast der Isokline für i~

= 0 nach oben; gleichzeitig rückt der Grenzwert Vk nach links.

im Referenzfall wird auch hier unterstellt, dass

vZ

Wie

< Vk gilt. Sofern der horizontale Teil der

Isokline für i~ = 0 durch das langfristige Gleichgewicht des regulierten Monopols verläuft, ergibt sich das Phasendiagramm III.15.

,

/

/

\

I

Li



-

r

I

CD

, \

I

\

,,

\

I

Al=A~~~--~~----~~~--~--------

o

J

~

k -

·u V

',J~=o~

v' r , k

" .....

Vk

------ - - -

).1=).~=O

@

Abbildung IIUS: Phasendiagramm im Fall (a)

Diese Situation tritt genau dann auf, wenn analog zu (2.23)

,r_,u

11.1 -11.1

{==>

__ ldlTl

s --qk dVk

mit

v~

~

(2.24)

< Vk gilt.

Wie im Referenzfall ergeben sich die vier Bereiche CD -

® . Die Bewegungsrichtung der Va-

riablen stimmt mit der Entwicklung in den gleichnamigen Bereichen der Grafik III.I4 überein; lediglich die Größe der einzelnen Gebiete hat sich auf Grund der Erhöhung von s geändert. Analysiert man erneut die Auswirkung auf die Faktormengen, so sind folgende Ergebnisse festzuhalten: • Das auffaIIigste Resultat besteht darin, dass das langfristige Gleichgewicht des unregulierten Monopols auch unter Berücksichtigung der beschränkten Rentabilität ein Gleichgewicht bleibt, obwohl wegen

v~

< ih die Regulierung aktiv ist. Eine Verzerrung des

Kapitel III Optimale Regulierung

122

langfristig gleichgewichtigen Kapitalstocks tritt folglich nicht auf, so dass auch die Investitionen - sofern das Unternehmen im langfristigen Gleichgewicht (v~, i ~) startet - in unveränderter Höhe beibehalten werden. • Da das Gleichgewicht im Bereich der einschränkenden Regulierung liegt, ist der zulässige Bruttogewinn geringer als

7r.

Bei einem konstanten Kapitalstock

minderung des Bruttogewinns nur über den Arbeitseinsatz v: I oder

Vk

kann diese Ver-

2

resultieren, der

v:

sich aus (2.22) bestimmt. Damit wird das regulierte Monopol in seinem langfristigen Gleichgewicht bei unverändertem Kapitalstock len, die von dem gewinnmaximierenden Wert

v~

=

vkeine Arbeitsmenge v:(vk> wäh-

v: (vn ohne Regulierung abweicht, was

entsprechend zu einer Verzerrung der Kapitalintensität vk/v:(vi) gegenüber dem Faktorverhältnis vk/v:(v k) ohne Regulierung führt . • Ergänzend wird der Fall betrachtet, dass das Unternehmen in der Augsgangssituation

v

einen positiven Kapitalstock mit Vk < k besitzt und sich auf dem zugehörigen Sattelpfad, aber noch nicht im langfristigen Gleichgewicht ohne Regulierung, befindet. 23 Dieser Pfad ist in der Abbildung III. I 5 wiederum als gestrichelte Trajektorie eingezeichnet. die in den Sattelpunkt (v k' i~) mündet. Wie aus der Abbildung zu entnehmen ist, erreicht das Unternehmen ohne Regulierung den Sattel punkt bei fallendem AI. Berücksichtigt man wiederum, dass I b•

= AJ/cqk ist, so wählt das Unternehmen zunächst eine höhere

Bruttoinvestition, die im Zeitablauf mit AI fallt, bis sie schließlich der Abschreibung gleicht. Obwohl in diesem Fall der langfristig gleichgewichtige Kapitalstock bei Regulierung mit dem Kapitalstock ohne Regulierung übereinstimmt, ergeben sich dennoch Unterschiede bezüglich des Sattelpfades. Bei bindender Regulierung, entspricht der Pfad wie im Referenzfall der horizontal verlaufenden Isokline für ,i.~

= O.

Befindet sich das Unternehmen in der Ausgangssituation auf dem Sattelpfad des unreguIierten Monopols links von seinem langfristigen Gleichgewicht, so muss es durch die Regulierung den Schattenpreis auf 5:~ reduzieren und dann konstant halten, um - angesichts der veränderten Dynamik - in das Gleichgewicht zu gelangen. Obwohl der Sattelpunkt selbst dem Gleichgewicht im unregulierten Monopolfall entspricht, erfolgt die Annäherung an diesen Punkt damit über eine konstante und im Vergleich zum unregulierten Monopol niedrigere Bewertung einer Änderung des Kapitalstocks. Wegen I b • = 5:~ /[2cqd 23

Die Möglichkeit, dass der Kapitalstock extrem klein ist, so dass das Unternehmen den Sattelpfad wegen möglicher Markteintrittsschranken nicht erreichen kann (vgl. Decher! (1984». wird hier nicht berücksichtigt, da eine Modellierung, in der das Unternehmen bereits ohne Regulierung die Produktion langfristig einstellt, keine vernünftige Ausgangssituation für die Regulierung bildet.

123

2 Verhalten des Angebotsmonopols bei Regulierung

wird damit eine konstante und im Vergleich zur unregulierten Vergleichssituation auch geringere Bruttoinvestition impliziert. Das regulierte Unternehmen hebt seinen Kapitalstock zwar langfristig auf das gleiche Niveau wie das unregulierte Monopol (u k = uk), aber die Erhöhung erfolgt wegen der für




uk' so liegt der Sattelpfad bei Regulierung über dem entsprechenden Pfad

des unregulierten Monopols. Die größeren Werte von Al implizieren im Vergleich zum unregulierten Sattel pfad somit höhere Bruttoinvestitionen. Da die Investition rechts von der Isokline für Vk

= 0 kleiner als die momentane Abschreibung ist, fällt der Kapitalstock

in diesem Bereich sowohl bei Regulierung als auch für den unregulierten Ansatz, wobei die Reduktion des Kapitalstocks bei bindender Beschränkung der Rentabilität wegen der höheren Bruttoinvestition langsamer als ohne Regulierung erfolgt. Ferner ist der bereits erläuterte Effekt zu berücksichtigen, dass für alle Kapitalstöcke Vk

< th mit aktiver Regulierung der Arbeitseinsatz

menge des unregulierten Monopols

v~ (Vk)

V~(Vk)

von der optimalen Arbeits-

abweicht. Entsprechend tritt zusätzlich zu der

hier diskutierten langsameren Annäherung an den gleichgewichtigen Kapitalstock für alle Zeitpunkte mit Vk < th eine Verzerrung der Kapitalintensität vdv~( Vk) gegenüber dem Wert Fall (b)

vdv~(vd

auf.

Im Folgenden wird die Auswirkung einer maximal zulässigen Rentabilität

s disku-

tiert, die über dem in der Relation (2.24) angegebenen Niveau liegt. Diese Rentabilität impliziert erneut eine Verzerrung des langfristig optimalen Kapitalstocks, es sei denn sie besitzt bereits einen so hohen Wert, dass der dadurch maximal zulässige Bruttogewinn über dem Bruttogewinn des unregulierten Monopols liegt (Fall (d)). Der Fall (b) wird in der Abbildung 111.16 grafisch veranschaulicht und lässt sich durch zwei Tatbestände charakterisieren. Zum einen gilt -r

'u

Al > Al

{=:}

_

IdJrI

S> - qk dVk

ük

(2.25a)

,

so dass der horizontale Teil der (),I = O)-Isokline oberhalb des unregulierten Gleichgewichtes verläuft, zum anderen liegt das unregulierte Gleichgewicht noch immer im Bereich

Vk

< th.

Ein weiteres Kennzeichen besteht darin, dass auch das neue langfristige Gleichgewicht (u~,

5:1)

im Inneren des regulierten Bereiches liegt,24 (2.25b) 24

Die Bedeulung dieser Eigenschaft wird sich erst im Laufe der Diskussion des Falls (c), Seile 126, herausstellen.

Kapitel I1I Optimale Regulierung

124

,L--.. '\ i~ =0

,

I

,

i r1

....

i = 0............

I

\

r

.......

"

j,uI . .r~ ~ ... ,

@ ....

~ I..\

I I

......

:\ : \

' ....

@

Abbildung m.16: Phasendiagramm im Fall (b) Eine Diskussion, für welche Parameterwerte diese Bedingung erfüllt ist, folgt an späterer Stelle (Seite 125). Hier werden zunächst die Auswirkungen auf die eingesetzen Faktormengen erörtert. • Berücksichtigt man, dass die Isokline für Vk

= 0 eine Ursprungsgerade ist, so folgt zwin= O)-Isokline oberhalb

gend für alle Fälle, in denen der horizontale Abschnitt der (j.~

des langfristigen Gleichgewichtes des unregulierten Monopols verläuft, dass das Gleichgewicht des regulierten Monopols bei einem höheren Kapitalstock liegt. Da das langfristige Gleichgewicht außerdem vj: < lh erfüllt, weicht nicht nur der gleichgewichtige Kapitalstock vj: von

vk ab. Wegen vj: < ih tritt außerdem eine Abweichung des optima-

len Arbeitseinsatzes v~(vj:) gegenüber dem gewinnmaximierenden Arbeitseinsatz v~(vk) ohne Regulierung auf. Demnach wird im neuen langfristigen Gleichgewicht eine Verzerrung der Kapitalintensität vklv~(vk> im Vergleich zu dem Faktorverhältnis vj:/v~(vk> hervorgerufen, das das Unternehmen ohne Regulierung bei dem Kapitalstock vI; bevorzugt. • Der Sattelpfad in das regulierte Gleichgewicht ist wie in den vorhergehenden Fällen durch den horizontalen Abschnitt der ().. ~

= O)-Isokline gegeben. Im Startzeitpunkt befindet (v::' ~~), so dass mit der Einführung der Regu-

sich das Unternehmen annahmegemäß in

lierung der Schattenpreis auf I~ korrigiert und von da an konstant gehalten wird. Entsprechend investiert das Unternehmen wegen I~ > ~~ mehr als im ursprünglichen Gleichgewicht und nähert sich bei konstanter Bruttoinvestition

Ibo

= IU[2cqkl

dem neuen

Gleichgewicht. Die resultierende Nettoinvestition ist somit zunächst positiv, nimmt aber auf Grund der simultan steigenden Abschreibung in ihrem Umfang ab, bis schließlich das neue Gleichgewicht erreicht worden ist.

125

2 Verhalten des Angebotsmonopols bei Regulierung

• Ein weiteres interessantes Ergebnis wird deutlich, wenn man wiederum annimmt, dass das Monopol bei Einführung der Regulierung zwar über einen ausreichend großen Kapitalstock verfügt, aber noch nicht sein langfristiges Gleichgewicht erreicht hat. Während sich der unregulierte Sattel pfad in den zuvor betrachteten Fällen jeweils oberhalb des regulierten Sattelpfades befindet, zeigt die Abbildung III.16 nun, dass die unregulierte Trajektorie zumindest teilweise unterhalb des regulierten Sattelpfades liegt. Bezieht man diese Beobachtung wiederum auf die Bruttoinvestition, so ist

Ibo

in dem Bereich, in dem

);.\ unterhalb des unregulierten Sattelpfades liegt, geringer als ohne Regulierung. Obwohl das Unternehmen also langfristig eine Ausweitung des Kapitalstocks anstrebt - schließlich ist

v~

>

vk - investiert es in diesem Bereich dennoch weniger als ohne Regulierung.

Allerdings schlägt diese Beziehung mit wachsendem Vk um; der Sattelpfad des regulierten

v

Monopols verläuft in der Umgebung von k und auch im Zuge der weiteren Annäherung an k oberhalb des unregulierten Pfades, so dass auch hier die Bruttoinvestition höher als

v

ohne Regulierung ist. Diese Entwicklung wird - wie bereits diskutiert worden ist - im Bereich [v k' vk] beibehalten. Da der diskutierte Sattelpfad innerhalb des regulierten Bereiches liegt, unterscheidet sich die Kapitalintensität vdv~(vd für alle durchlaufenen Werte nis

vdv~( Vk),

das bei dem jeweiligen Kapitalstock

Vk

t'k

vom Faktoreinsatzverhält-

ohne Regulierung realisiert wird.

Nach Abbildung III.I7 steigt die beschriebene Verzerrung des langfristigen Kapitalstocks zunächst bei einer Erhöhung von S, da sich );.\ nach oben verschiebt. Gleichzeitig wandert der langfristig optimale Kapitalstock

vk entlang der (Vk =

Q)-Isokline nach rechts. Dieser Effekt

wird jedoch durch den simultan sinkenden Wert lh begrenzt. Fällt das langfristige Gleichge-

v

wicht k schließlich mit llt zusammen, ist ein höherer langfristiger Kapitalstock ausgeschlossen. Der Effekt einer solchen Randlösung stellt den Gegenstand von Fall (c) dar. Eine Bedingung dafür, dass der langfristige gleichgewichtige Kapitalstock bei Regulierung

vk gegenüber dem unregulierten Fall steigt, ist bereits in (2.25a) angeführt worden. Eine weitere Einschränkung der Parameterwerte S, die den diskutierten Fall (b) kennzeichnen, liegt bislang Al

If ... si

'ni

X\~----+-------~----~~~----

o Abbildung III.17: Darstellung einer inneren Lösung für das regulierte langfristige Gleichgewicht

Kapitel m Optimale Regulierung

126 nur indirekt vor, nämlich über die Ungleichung

s

vi

< Vk gemäß (2.25b). Um diese Bedingung

in Abhängigkeit vom Parameter zu formulieren, wird die Abbildung m.17, die Gleichung für die (Vk

=O)-Isokline sowie die Definition von 1'i aus (2.19) auf der Seite 110 herangezogen.

Zunächst ist darauf zu verweisen, dass vi aus dem Schnittpunkt der waagerechten Isokline für

j,'i

= 0 bei 1'i mit der Ursprungsgeraden für Vk = 0 resultiert. während Vk die Stelle angibt, für

die der Bruttogewinn 1C des unregulierten Monopols mit dem maximal zulässigen Bruttogewinn Sqk Vk

übereinstimmt. Ferner bietet es sich an, den Schattenpreis I~ > 0 einzuführen, bei dem Vk

den gleichgewichtigen KapitaIstock bezeichnet. Berücksichtigt man Ibo

If die Beziehung

Da quadratische Anpassungskosten c(lb)

= )..J/2Cqh so erfüllt

= cqk[/b]2 unterstellt worden sind und Vk = 0 die

Gleichheit von Bruttoinvestition und Abschreibung impliziert, stellt 2cqklb die Grenzkosten für die Installation von Kapitalgütern dar. Wegen I b•

= ÖVk gilt im Punkt lvk, I~)

Wie die Abbildung m.17 zeigt, kann eine innere Lösung mit

vk < v. nur dann vorliegen. wenn (2.26)

erfüllt ist. Diese Bedingung verlangt, dass der zulässige Bruttogewinn pro Einheit Sachkapital niedriger als die momentanen Grenzkosten25 ist, die am Rande des regulierten Bereiches Vk bei einer Ausweitung des Kapitalstocks auftreten. Aus (2.25a) in Verbindung mit (2.26) ergibt sich der in der Abbildung m.16 dargestellte Fall genau dann, wenn die zulässige Rentabilität im Intervall (2.27)

s

liegt. Dabei ist zu beachten, dass Vk selbst von abhängt (vgl. die Abbildung III.lO).

Fall (c)

Alle zuvor betrachteten Parameterkonstellationen bewirken einen langfristig gleich-

gewichtigen Kapitalstock, der sich im Inneren des regulierten Bereiches befindet. Betrachtet man hingegen Parameterwerte S, für die (2.28)

2 Verhalten des Angebotsmonopols bei Regulierung

L/. . --"\

Vk

Vk

bestimmt, so dass Zeitpfade an der SprungsteIle entweder selber springen oder

zumindest einen Knick aufweisen. Solch ein Knick ist in der Abbildung m.18 beispielhaft anhand des Pfeils illustriert, der die Bewegungsrichtung der Trajektorien in der Umgebung der SprungsteIle unterhalb der (Vk = O)-Isokline darstellt. Überträgt man diese Entwicklung auf die Bruttoinvestition Ibo = At/[2cqd, so weist auch der zugehörige Zeitpfad für I b* einen Knick auf. Der spezielle Punkt die (Vk 25

(Vk,

5.D bezeichnet einen möglichen Gleichgewichtspunkt. Hier passiert

= O)-Isokline die Sprungs teile,

so dass sich der Kapitalstock in der Zeit nicht mehr

Die Grenzkosten einer Ausweitung des Kapitalstocks setzen sich zusammen aus den Opportunitätskosten und den Abschreibungen auf Grund einer weiteren Kapitaleinheit sowie den zusätzlichen Investitionskosten, um netto eine weitere Einheit v, zu installieren.

Kapitel III Optimale Regulierung

128

ändert. Folglich wird eine Trajektorie, die in diesen Punkt mündet, die SprungsteIle nicht mehr verlassen, wenn zusätzlich auch

i'i gleich null ist.

Ob ein solches Verhalten möglich ist, kann

mit Hilfe der allgemeineren Fassung der Kozustandsgleichung geprüft werden. Gemäß (2.20), Seite 113, ist die Änderung

i'i

an der Stelle Vk durch das Intervall [D 4 , D s] gegeben, dessen

Grenzen durch die linksseitige und die rechtsseitige Ableitung von Ä'i nach der Zeit an der Stelle (Vb Ä 1 ) bestimmt werden. Um zu zeigen, dass an der konkreten Stelle

(Vb

11) die Vorzeichen

D4 < 0 und Ds > 0 gelten, sind einige Rechenschritte notwendig. Dabei ist zu berücksichtigen, dass im Hinblick auf die linksseitige Steigung lif!} i'j

VttV.l:

= D4 = [r + o][Ä + qk] 1

Sqk

an der Stelle (Vb XI) wegen (2.19)

gilt. Beachtet man weiter lim

air

_I

".tu. aÄ'j

= r + /) >

0,

so ist die linksseitige Ableitung an der Stelle Vk für alle Punkte mit Ä 1 < X'j negativ. Entsprechend erfüllt die linksseitige Ableitung i'j im Punkt (Vb 1'j) wegen 1'j < X'j lif!} i'jl.

~t~

l~

= D41.

l~




D51 A. = O. (üJ;, ~)

129

2 Verhalten des Angebotsmonopols bei Regulierung Damit ist gezeigt worden, dass für (iik,

it>

die linksseitige Ableitung D 4 negativ und die

i'i = 0 an der Stelle (iiko it> mit X'i in dem Intervall möglicher Steigungen enthalten, das über die verallgemeinerte Kozustandsgleichung i'i E [D4 , Dsl vorgeschrieben wird. Da der betrachtete Punkt als ein-

rechtsseitige Ableitung Ds positiv ist. Entsprechend ist

Xi


0 als

= O)-Isokline (vgl. (1.18), Seite 73). Entsprechend verläuft die zugehö= O)-Isokline um so steiler, je größer c ist, was -

rige Gerade bei unveränderter Lage der (}..~

wie auch im Fall ohne Regulierung - eine Reduktion des langfristigen Kapitalstocks impliziert. Auf eine ausführlichere Behandlung dieses Sachverhaltes wird verzichtet, da er keine zusätzlichen Einsichten im Hinblick auf die analysierte Regulierung liefert. Vielmehr wird in diesem Abschnitt erneut auf den Spezialfalllinearer Anpassungskosten der Form

Bezug genommen. Im Rahmen des Kapitels 1.3 ist dargelegt worden, dass diese Kostenfunk-

138

Kapitel III Optimale Regulierung

tion keine modellendogene langsame Anpassung des Kapitalstocks liefert, sondern zu einer sogenannten Bang-Bang-Lösung führt (vgl. die Seite 85), die impliziert, dass das Unternehmen sich dem jeweiligen Gleichgewicht unendlich schnell nähert. Diese Eigenschaft der optimalen Lösung bleibt auch im Falle der Regulierung erhalten. Durch die Regulierung ergeben sich nun jedoch interessante Auswirkungen bezüglich der jeweils existierenden Gleichgewichte. Die optimale Bruttoinvestition des Unternehmens bei linearen Anpassungskosten lautet

woraus für die (Vk

falls

AI < Cqh

falls

AI

falls

AI > Cqk,

= Cqh

= O)-Isokline

"'-[~/'

mit

I b• E [0, jb],

jb IB,

falls

AI < Cqk'

falls

AI

falls

AI > Cqk

= Cqk'

folgt (vgl. die Seite 85). Hinsichtlich der Obergrenze für die Bruttoinvestitionen bietet es sich an, einen ausreichend hohen Wert zu unterstellen, der die Produktionsmöglichkeiten des Unternehmens nicht beschränkt, um so die Annahme aufrechthalten zu können, dass das Unternehmen eine MonopolsteIlung besitzt. Ferner wird die je nach Höhe des Homogenitätsgrades existierende Untergrenze Mk des regulierten Bereiches vernachlässigt. Betrachtet man zunächst den Fall eines sehr kleinen

s, so ergibt sich das Phasendiagramm

der Abbildung I1I.24. Diese Darstellung und die durch sie implizierten Ergebnisse treten auf,

s sind

hingegen zwei Differentialgleichungen zu betrachten: die Bewegungsgleichung für den Kapitalstock (2.3lf) und die Änderung des Preises auf Grund des Sanktionsmechanismus (2.3ld). Das Optimierungsproblem ist also dadurch gekennzeichnet, dass je nach Wahl der Steuergrößen im Zeitablauf unterschiedlich viele Differentialgleichungen auftreten. Im Hinblick auf die Gültigkeit des Sanktionsmechanismus erscheint die Zuordnung des Falls

= s problematisch. Gilt zunächst s < S, und nähert man sich der Situation s = s an, besteht aus Sicht der Behörde kein Grund einzugreifen, wenn schließlich s erreicht wird, da das Unter-

s

nehmen freiwillig die gewünschte Rentabilität nicht überschreitet. Entsprechend liegt es nahe, den Falls s

= s der Situation ohne Regulierung zuzuordnen. Betrachtet man hingegen den Fall,

dass die Rentabilität zunächst über der fairen Rentabilität liegt und erst im Zuge der Regulierung s

= s auftritt, ist es vennutlich ineffizient, dem Unternehmen für s = s die freie Wahl

des Preises zu gewähren. So wird die Regulierung gerade in dem Moment aufgegeben, in dem ihr Ziel erreicht ist. Dadurch verändert sich das Verhalten der Unternehmung und entsprechend

= s erfüllt ist, muss die Regulierung beibehalten werEntsprechend ist es sinnvoll, s = s dem Bereich des wirksamen Sanktionsmechanismus

die Rentabilität. Damit auch weiterhin s den.

zuzuordnen. Um eine doppelte Zuweisung beziehungsweise eine zusätzliche Fallunterscheidungje nach-

Kapitel III Optimale Regulierung

150 dem, ob die Annäherung an

s von oben oder unten erfolgt, zu vermeiden, bietet es sich an,

die Relevanz der bei den Konvergenzrichtungen zu prüfen. Dabei ist zu beachten, dass das Gleichgewicht des unregulierten Monopols als Ausgangssituation gewählt worden ist. Eine Untersuchung, wie sich der Regulierungsmechanismus auswirkt, ist nur dann sinnvoll, wenn die Startsituation tatsächlich als unbefriedigend eingeschätzt wird, wenn also

$

>

s gilt.

Die

vorgeschlagene Regulierung reduziert dann nicht nur den Preis, sondern auch die Rentabilität,

s annähert. Da die Analyse auf dieser Ausgangslage s dem Gültigkeitsbereich des Sanktionsmechanismus zugeordnet.

so dass sich die Rentabilität von oben an basiert, wird der Fall $ =

Weil die Zahl der Differentialgleichungen mit der Höhe der Rentabilität $ variiert, bietet es sich an, die Lösung des Systems in Abhängigkeit von der Ausgangssituation und von möglichen Entwicklungen zu erläutern. Folgende Entwicklungen sind je nach Ausgangssituation denkbar: • Zunächst wird unterstellt, dass im Startzeitpunkt die erwirtschaftete Rentabilität unter der als fair erachteten Rentabilität liegt, $(0) < $. Damit sieht der Regulierungsmechanismus für den Zeitpunkt t

= 0 keinen Eingriff in die Preissetzung vor.

Die Hamilton-Funkti-

on und das System von Differentialgleichungen, dem sich das Unternehmen in diesem Moment gegenübersieht, entsprechen der Hamilton-Funktion und dem System für den unregulierten Monopolfall (Seite 65 beziehungsweise 68). Da sich das Unternehmen laut Annahme im langfristigen Gleichgewicht des unregulierten Monopols und damit auch des in diesem Moment gültigen Systems von Differentialgleichungen befindet, verharrt es auch weiterhin in diesem Gleichgewicht. Wird der beschriebene Regulierungsmechanismus eingeführt, so ändert das Unternehmen sein Verhalten nicht. Die ursprüngliche Gleichgewichtslösung bleibt weiter erhalten. Die Lösung des Optimierungsproblems ist somit durch das Verhalten des unregulierten Monopols (Kapitel 1.2) vollständig beschrieben. • Geht man von einem Startpunkt aus, in dem eine Rentabilität erwirtschaftet wird, die über der fairen Rentabilität liegt, s(O) > $, so ist zumindest in der Ausgangssituation die Bewegungsgleichung für den Preis wirksam. Das unregulierte Monopol wird gezwungen, sein ursprüngliches Gleichgewicht zu verlassen. In diesem Fall sind zwei Entwicklungen vorstellbar, in denen sich die Rentabilität s der fairen Rentabilität $ im Zeitablauf annähert:

[al Zunächst muss die Rentabilität nicht unter die als fair erachtete obere Schranke fallen. Bei einer solchen Entwicklung gilt also set)

~ $

für alle t, so dass der Preismechanis-

mus gemäß der Differentialgleichung (2.31d) während des gesamten Planungszeitraums zutrifft. Folglich liegt für den gesamten Betrachtungszeitraum ein Optimierungsproblem unter Berücksichtigung zweier Bewegungsgleichungen vor.

151

2 Verhalten des Angebotsmonopols bei Regulierung [b] Entsprechend ist es auch möglich, dass zwar s(O) >

s in der Ausgangssituation

gilt, die optimale Wahl der Steuergrößen aber schließlich eine Rentabilität impliziert, die niedriger als die faire Rentabilität ist. Dadurch wechselt das Unternehmen von einer Situation, in der sein Preis reguliert wird, hin zu einem System, in dem der Preis frei gewählt werden kann. Zunächst erscheint es fragwürdig, dass das Unternehmen auf Grund der Regulierung schließlich eine niedrigere Rentabilität wählt als zulässig ist. Im Hinblick auf diese Einschätzung ist jedoch anzumerken, dass die Unternehmung nicht ihre Rentabilität, sondern ihren Gewinn maximieren möchte. Damit muss die geschilderte Entwicklung, in der die maximal erlaubte Rentabilität nicht erreicht wird, durchaus in Betracht gezogen werden. Für das Problem der dynamischen Optimierung gilt demnach zunächst die Bewegungsgleichung für den Preis, bis die Rentabilität schließlich unter die faire Schranke gefallen ist. Von nun an wird die Bewegungsgleichung hinfällig, und das Unternehmen kann den Preis so lange frei wählen, bis unter Umständen wieder eine Situation mit s >

s er-

reicht wird. Das zugehörige System von Differentialgleichungen basiert also für gewisse Zeiträume auf zwei Bewegungsgleichungen, in anderen Zeitintervallen hingegen auf einer einzigen Bewegungsgleichung. Im Hinblick auf das Systemverhalten bedeutet ein solcher Wechsel, dass zunächst die Entwicklung des Systems durch die Differentialgleichungen des regulierten Unternehmens beschrieben wird, bis sich schließlich eine Rentabilität s < S einstellt. Dann wechselt man in das System des unregulierten Monopols, der mit dem zuletzt erreichten Kapitalstock des regulierten Systems fortfährt. Kommt es zu einem erneuten Wechsel in das System des regulierten Unternehmens, so ist mit dem zuvor realisierten Kapitalstock und dem zugehörigen Preis weiterzurechnen. Für die Lösung des Problems ist nicht nur zu prüfen, ob ein solcher Systemwechsel möglich ist, sondern auch ob er optimal ist. Falls das bestätigt wird, ist zu untersuchen, wie häufig und wann ein Systemwechsel aus der Sicht des Unternehmens optimal ist. Wie bereits erläutert worden ist, erübrigt sich die Betrachtung des Falls s(O) < S, da das Unternehmen dann im Gleichgewicht des unregulierten Monopols verharrt. Für die bei den übrigen Entwicklungen ist anzumerken, dass der Fall [al für alle t leichter als der Fall zu lösen ist, in dem Systemwechsel auftreten, da während des gesamten Zeitraums die Zahl der Differentialgleichungen konstant bleibt. Aus diesem Grund wird mit der Annahme begonnen, dass die Bewegungsgleichung für den regulierten Preis im gesamten Zeitraum zutrifft. Diese Vorgehensweise liefert darüber hinaus wichtige Informationen für den Fall, dass das Unternehmen im Zeitablauf zwischen dem regulierten und dem unregulierten System hin und her wechselt.

Kapitel III Optimale Regulierung

152

Zumindest die Aussagen über das Verhalten des Unternehmens während der Regulierung lassen sich übertragen.

2.2.2

Diskussion der Optimumbedingungen

Geht man davon aus, dass die Differentialgleichung (2.31 d) für den gesamten Planungszeitraum gilt, so vereinfacht sich das vorgestellte Optimierungsproblem (2.31 a) bis (2.3li) wie folgt. Die Bedingungen (2.31c) und (2.31d) werden für alle t durch (2.32) ersetzt. Die zugehörige Hamilton-Funktion lautet

und ist unter den Nebenbedingungen p

= -Ylev~vZ + Y2,

[b ~

O.

(2.3Ib) (2.3Ih) (2.3Ii)

über den Steuergrößen

Va

und

[b

zu maximieren. Dabei bezeichnen AI und A2 die Kozustands-

variablen für die Bewegungsgleichung des Kapitalstocks beziehungsweise des Preises. Der Preis ist in diesem Ansatz eine Zustands variable. die über die Differentialgleichung (2.32) fortgeschrieben wird. Der Preis muss deshalb explizit im Optimierungsproblem berücksichtigt werden und kann nicht mit Hilfe der Preis-Absatz-Funktion (2.3Ib) substituiert werden. Die Gleichung (2.3Ib) wird stattdessen als Nebenbedingung bei der Wahl des optimalen Arbeitseinsatzes und der Bruttoinvestition aufgefasst. 3o Die zugehörige Lagrange-Funktion mit J.L3

als Lagrange-Multiplikator für die Preis-Absatz-Funktion lautet

Die Optimierung über

Va, [b

und

J.L3

erfordert es, die Ableitungen der Lagrange-Funktion nach

diesen Größen zu bilden und auszuwerten. Da aJ:.o/a[b unabhängig von den bei den anderen Variablen ist. kann sie getrennt von den übrigen Optimumbedingungen betrachtet werden. 30

Für die Behandlung von Nebenbendingungen in Kontrollproblemen vgl. den Anhang 1.3.2.

153

2 Verhalten des Angebotsmonopols bei Regulierung Berücksichtigt man ferner, dass die Bruttoinvestition nicht negativ sein kann, so folgt

(2.33) falls

AI < O.

Die optimale Bruttoinvestition entspricht also derjenigen im unregulierten Monopolfall (Kapitel 1.2, Seite 67) beziehungsweise derjenigen Bruttoinvestition, die im Kapitel 2.1 (Seite 103) bei einer Regulierung durch Beschränkung der Rentabilität gewählt wird. Allerdings wird der Wert der adjungierten Zustandsvariablen für die Änderung des Kapitalstocks AI im Zeitablauf andere Werte als in den vorangegangenen Modellen annehmen. 31 Der optimale Arbeitseinsatz

v; und der optimale Lagrange-Multiplikator tL3 ergeben sich aus

den folgenden Bedingungen: (2.34a)

(2.34b) mit L*

:=

L(v;, I b*, AI, A2, tLi). Die Preis-Absatz-Gleichung in (2.34b) liefert sofort den opti-

malen Arbeitseinsatz (2.35) wobei die Größen p und

Vk

aus der Sicht des Unternehmens im Zeitpunkt t durch die Bewe-

gungsgleichungen und die Forderung der Behörde, die Nachfrage zu decken, gegeben sind. Der Preis p wird in jedem Zeitpunkt t durch die zugehörige Bewegungsgleichung bestimmt, womit auch die nachgefragte Menge über die Preis-Absatz-Funktion festliegt. Weil das Unternehmen die Nachfrage decken muss, aber nicht mehr produziert als nachgefragt wird,legt es die Produktionsmenge in Höhe der Nachfrage fest. Der Output ist jedoch eine Funktion des Kapitalstocks und des Arbeitseinsatzes. Berücksichtigt man wieder, dass in t der Kapitalstock durch die Bewegungsgleichung gegeben ist, dann muss

v; genau so groß sein, dass für diesen Kapitalstock

die durch den Preis vorgegebene Nachfragemenge produziert wird. Insofern scheint das Unternehmen keine Wahl zu haben, da auf Grund der jeweils vorgegebenen Preisänderung durch die Behörde und den gegebenen Kapitalstock die optimale Arbeitsmenge in t vorgeschrieben ist. Allerdings ist zu beachten, dass das Unternehmen den Kapitalstock im Zeitablauf steuern kann. Damit legt es den Arbeitseinsatz und letztlich die Rentabilität fest. die wiederum bestimmt, wie 31

Dieser Unterschied wird deutlich, wenn man die im Folgenden hergeleitete Kozustandsgleichung (2.39c) auf der Seite 156 mit der entsprechenden Gleichung (1.18) des unregulierten Monopols auf der Seite 73 vergleicht.

Kapitel III Optimale Regulierung

154

sich der Preis im Zeitablauf ändert. Während also die Entscheidungen des Unternehmens in jedem Zeitpunkt vollständig determiniert sind, kann das Unternehmen im Zeitablauf den Preis und damit die Nachfragemenge beziehungsweise die Produktionsmenge durch eine geeignete Wahl der Steuergrößen beeinflussen. Löst man nun die Bedingung (2.34a) nach 1L3 auf, so folgt

1L3 =

[1- ~::][~ - aY 9[:;)a- vzl l

I

Der optimale Wert für den Lagrange-Multiplikator 1L3 resultiert, nachdem man (2.35) substituiert hat: o 1L3

=

[

).2'1'] [p

I - qkVk

qa[Y2 - p](I-a l a[YI 9VZ) 1/11

YI -

/lI]

v: mit Hilfe von (2.36)



Die vorgestellten Lösungen erfüllen auch die hinreichenden Bedingungen für ein Maximum der Hamilton-Funktion (vgl. den Anhang 1.3.2). Das optimale Verhalten des Unternehmens im Zeitablauf ergibt sich durch die Lösung des nachstehenden Systems von Differentialgleichungen, das die Bewegungsgleichungen (2.31 f)

V.

= Ib -

p = 1/I[i -

8Vk und (2.32)

s) sowie die bei den Kozustandsgleichungen umfasst. 32

Dabei sind die optimalen Werte der Steuergrößen

v: und Ibo sowie des Lagrange-Multiplikators

ILj gemäß den Gleichungen (2.33), (2.35) und (2.36) zu berücksichtigen. Man erhält

= IbO -

Vk •

p

8Vko

(2.37a)

V Z= .1. [-s- p9[v:)"qkvk 'I'

qa V :]

(2.37b)

,

· = r).1 - a.e.·, aVk ·).2 = r).2 - a.e.°. ap

(2.37c)

).1

Die Differentiation der Lagrange-Funktion nach

(2.37d) Vk

und p bei optimaler Wahl der Steuergrößen

liefert

a.e.* = Kp ()[ va.]" VkK-I _ a~

[

r

+"] 0

qk

_"

AI"

_'

.1. Kp()[V:]"Vk-lqkVk - [p()[V:]"VZ - q.V:]qk

A2'1'

[

~~

]2

- KlLjYI()[V:]aVk-1

=Kp()[V:]"VZ- 1 J2

[r + 8]qk -

).18 -

).2~ [[K -

qkvk

l]p()[v:]"VZ

+ qaV:]

Bei der Optimierung unter Nebenbedingungen enthalten die Kozustandsgleichungen die entsprechende Ablei· tung der Lagrange·Funktion statt der Ableitung der Hamilton·Funktion nach der jeweiligen Zustandsvariablen. Vgl. den Anhang 1.3.2.

2 Verhalten des Angebotsmonopols bei Regulierung

155

sowie

Hier ist zu berucksichtigen, dass die Ableitungen der Steuergrößen nach Vk auf Grund des Umhüllendensatzes entfallen. Im nächsten Schritt werden a,r: lavk und a.l° lap in den Kozustandsgleichungen und

v:' [b

o

und J,Lj durch ihre optimalen Werte ersetzt. Dabei ist das mehrfach

auftretende Zwischenergebnis

zu berucksichtigen. Somit folgt

(2.38a) (2.38b) (2.38c)

(2.38d)

wobei sich die optimale Bruttoinvestition [bo aus der Fallunterscheidung (2.33) ergibt. Im Hinblick auf die Gleichung (2.38c) bietet es sich an, den ersten, dritten und vierten Summanden zusammenzufassen. Vereinfacht man weiter, indem die Terme mit )..21/11(qkv~) zusammenge-

Kapitel III Optimale Regulierung

156 fasst werden, so ergibt sich schließlich

+ A21/1

qkvi

[[I( _ l]pY2 - P + qa [Y2 - ;]l/a _ I( [pY2 - P _ qa [Y2 - p]l/a]] YI y I8vk YI a YI 8VZ

Y2 - P Y2 - P + qa [ Y2 _ P ]l/a] - I( [ P YIVk - P YIVk aVk [Yl8vkll/a

=[r + .s][AI + qk] + A21/1 [- p[Y2 qkvi

YI

p]

+ [I +!:] qa [Y2 -

p] I/a] YI 8VZ

a

I(qa [Y2 _ p]l/a aVk YI 8VZ Entsprechend kann auch die Gleichung (2.38d) geschrieben werden als

).2

= rA2 +

[I _

A21/1] [_ Y2 - P +.e. _ qa [[Y2 - p]:I_a)]l/a]. qkVk YI YI a y I8vk

Spezifiziert man den Parameter a in Analogie zu den vorher betrachteten Modellen mit Yl, so lautet das obige Differentialgleichungssystem (2.39a) (2.39b) (2.39c)

(2.39d) Um das optimale Verhalten des Unternehmens im Zeitablauf zu beschreiben, sind neben diesem System von Differentialgleichungen, Randbedingungen zu berücksichtigen. Der Start ist durch die Anfangswerte für die Zustandsvariablen vorgegeben, also durch den Kapitalstock und den Preis im langfristigen Gleichgewicht des unregulierten Monopolfalls. Ferner ist der Endpunkt über die Grenztransversalitätsbedingung bestimmt; sie besagt allgemein, dass die adjungierten Variablen und damit die Trajektorie so zu wählen sind, dass sie für den Endzeitpunkt T mit T -+

00

der Ungleichung lim

T-+oo

l

0

T

e- rr [G(v a, jb, Vk> p, r) - G(v:,

jb.,

v;. p'. r)] dr

~0

2 Verhalten des Angebotsmonopols bei Regulierung

157

genügen, wobei G den momentanen Gewinn bezeichnet, der sich durch die Wahl der Steuergrößen im Zeitablauf einstellt. Diese Forderung besagt, dass sich das System nur dann optimal entwickelt, wenn es keine alternative Trajektorie gibt, die für t

~ 00

einen höheren Wert der

Zielfunktion realisiert. Die Ungleichung kann - wie im Anhang gezeigt worden ist - auf eine Bedingung an die adjungierten Variablen und die Zustandsvariablen reduziert werden. An dieser Stelle wird jedoch darauf verzichtet, da im folgenden Kapitel die hier gewählte Fonn zur Bestimmung der optimalen Anfangswerte für die adjungierten Variablen verwendet wird. Das System ist nichtlinear in den beiden Zustandsvariablen Vk und p. Damit ist eine analytische Lösung - wenn überhaupt - nur schwer möglich. Um dennoch unabhängig von bestimmten Pararneterkonstellationen einen Einblick in das Verhalten des Systems zu erlangen, lassen sich Phasen diagramme untersuchen. Dabei ist zu beachten, dass ein System von vier Variablen, hier

Vk,

p, AI und A2, das menschliche Vorstellungsvennögen sprengt. Eine Möglichkeit

der Darstellung besteht darin, das System auf eine geringere Zahl von Differentialgleichungen zu reduzieren, indem Variablen zunächst als Konstanten behandelt werden und anschließend parametrisch variiert werden. 33 Hier bietet es sich an, den Kapitalstock

Vk

als Parameter zu

behandeln. In der Notation wird dieser parametrisch gegebene Kapitalstock durch das Symbol

ih gekennzeichnet.

Auf diese Weise kann untersucht werden, ob überhaupt ein Gleichgewicht

des Systems existiert und ob es Trajektorien gibt, die zu einem solchen Gleichgewicht führen. Dazu wird zunächst für den parametrisch gegebenen Kapitalstock Vk ein Phasendiagramm im (p, A2, AI )-Raum konstruiert. Anschließend wird dann die Ebene hinzugefügt, die für den gege-

benen Kapitalstock die (Vk

= Q)-Isokline darstellt, für die also ~Vk = Ib* mit Ib* = AJ![2cQk]

gilt. Gibt es einen Schnittpunkt dieser Fläche mit den anderen Isoklinen, so ist ein Gleichgewicht des gesamten Systems gefunden. Für alle anderen Punkte des abgebildeten Raumes kann - je nachdem, ob sie vor oder hinter der (Vk

= Q)-Isoklinen liegen -

eindeutig darauf

geschlossen werden, wie sich der Kapitalstock im Zeitablauf verändert. Durch pararnetrische Variation des Kapitalstocks lässt sich dann die Veränderung des Phasendiagrarnms im Zeitablauf auf Grund der getätigten optimalen Bruttoinvestition untersuchen. Auf diese Weise ist es möglich, aus dem Verhalten des Systems im (p, A2, AI )-Raum auch Erkenntnisse über das Verhalten unter Berücksichtigung der Änderung des Kapitalstocks herzuleiten. Bevor das Phasendiagramm im (p, A2, Ad-Raum erstellt wird, ist ein Zwischenschritt hilfreich. Die Verläufe der jeweiligen Isoklinen, auf denen sich p, AI und A2 nicht ändern, werden zunächst in der (p, A2)-Ebene beziehungsweise (p, AI )-Ebene analysiert. 33

Auf diese Weise verfahren zum Beispiel Johansson, Wigren (1996). Sie betrachten ein System von Differentialgleichungen, dessen Variablen sich mit unterschiedlichen Geschwindigkeiten verändern. Die Entwicklung des Systems wird dann für einen mittelfristigen beziehungsweise kurzfristigen Zeitraum analysiert, wobei die sehr langsam reagierenden Variablen als Konstanten behandelt werden.

158

2.2.3

Kapitel III Optimale Regulierung Verlauf der Isokline für

p= 0

Die Untersuchung beginnt mit der Diskussion der Isokline für

p = O.

Die implizite Gleichung

dieser Isokline folgt für den parametrisch gegebenen Kapitalstock Vi aus der entsprechenden Differentialgleichung (2.39b), in der

p gleich

null gesetzt wird. Nach Umformungen erhält

man die Gleichung O

=YISqkVk A

P Y2 - P [

]

+ -qa YI

[Y2 - p]2 -(JA< vk

(2.40)

die quadratisch in p ist und weder AI noch A2 enthält. Folglich hängt der gleichgewichtige Preis 34 p nur vom parametrisch gegebenen Kapitalstock Vk ab. In der (p, A2)-Ebene verläuft die Isokline parallel zur Az-Achse. Entsprechendes gilt für den Verlauf in der (p, AI )-Ebene (vgl. die nachstehenden Abbildungen m.28 und m.29.). Zur Vereinfachung der Notation werden die Konstanten

und

[_I ]2

CI

:=

qa YI

C2

:=

YlsqkVk

(2.41 )

(JVk"

(2.42)

eingeführt. Damit geht die obige Gleichung über in

+ C I [Y2 - pf C2 + CI ~ 1 + 2CI PY2 I + CI + I + CI

0= C2 - P[Y2 - p]

0 _ 2 _ - P

Die Lösung der quadratischen Gleichung lautet: _ Y2[1 2[1

Pu -

+ 2Cd ± yif1 + 2CI F + Cd 4[1 + CIF

= Y2[1 + 2Cd ± Yi - 4C2[1 + Cd 2[1 + Cd 4[1 + CIF = 2[1

!

Cd [Y2[1

+ 2Cd ±

JYi -

4C2 [1

+ Cd] .

(2.43)

Dabei bezeichnet PI (P2) die Lösung, bei der die Wurzel mit positivem (negativen) Vorzeichen eingeht. Damit sichergestellt ist, dass der Preis einen reellen Wert annimmt, muss der Radikant positiv sein, also

Diese Bedingung ist erfüllt, wenn der Ordinatenabschnitt der Preis-Absatz-Funktion Y2 hinreichend groß ist, was im Folgenden unterstellt wird. 3.

Die Bezeichnung als gleichgewichtiger Preis bezieht sich darauf, dass dieser Preis für den gegebenen Kapitalstock p = 0 impliziert.

159

2 Verhalten des Angebotsmonopols bei Regulierung

p=o

p=o

o

PI

P2

P

Abbildung III.2S: Verlauf der Isokline für den gleichgewichtigen Preis bei parametrisch gegebenem Kapitalstock in der (p, A2)-Ebene

Im Hinblick auf das Größenverhältnis der beiden gleichgewichtigen Preise kann festgehalten werden, dass P2 < PI ist, solange die Wurzel einen positiven Wert besitzt. Ferner ist zu berücksichtigen, dass die beiden Werte PI und P2 nicht von ,1..2 abhängen, da bereits die Differentialgleichung für (p,

p unabhängig von ,1..2 ist. Somit nimmt die Isokline für p

= 0 im

A.2)-Raum für gegebenes fit die Form zweier vertikaler Geraden an. Beide Lösungen sind

der Abbildung II1.2S zu entnehmen. Die Isokline für

p = 0 teilt das Phasendiagramm in drei Bereiche ein. Um zu ermitteln, ob

der Preis in diesen Bereichen steigt oder fällt, wird

p aus der Differentialgleichung (2.39b) nach

P differenziert:

ap = ~ [2P-

ap

Y2

YI

qkvk

+ 2CI [p -

Y2]] ,

YI

wobei CI gemäß der Definition (2.41) verwendet wird. Folglich gilt

-ap;> 0 ap =
PI oder P < P2 steigt der Preis im Zeitablauf. Zusammengefasst gilt

I

> O.

falls

P < P2

V

P > PI.

P = 0,

falls

P = P2

V

P = Ph

< 0,

falls

P2 < P < PI·

(2.44)

Dieses Verhalten wird durch die drei Pfeile im Phasendiagramm der Abbildung III.28 beschrieben. Die Darstellung legt nahe. dass ein stabiles Gleichgewicht nur an der Stelle P2 vorliegen kann, da man sich von Preisen in der Umgebung von P2 in Richtung des Gleichgewichts bewegt. Dagegen kann das Gleichgewicht bei PI aus einer Umgebung von PI nicht erreicht werden. Allerdings ist zu berücksichtigen. dass die Argumentation auf einem parametrisch gegebenen Kapitalstock basiert. Variiert man den Kapitalstock, so verschiebt sich die Lage von P2 und PI. Solange sich das gesamte System. also auch der Kapitalstock, nicht im Gleichgewicht befindet, verändern sich nicht nur die Systemvariablen, sondern auch die Lage der Isoklinen kontinuierlich. Da der gleichgewichtige Preis PI vom Kapitalstock Vk abhängt, sich also durch eine Variation von Vk verschiebt, kann anhand der Abbildung III.28 nicht ausgeschlossen werden, dass dieses Gleichgewicht im Zeitablauf durch die simultane Veränderung von Vk realisiert wird. Geht man noch einmal auf die Interpretation der Differentialgleichung jJ ein, so ist zu berücksichtigen, dass jJ nach (2.44) genau dann negativ ist, wenn die Rentabilität, die das Unternehmen erwirtschaftet, größer als die von der Regulierungsbehörde als fair erachtete Rentabilität ist. Demnach enthält das Intervall ]P2, PI [ für den gegebenen Kapitalstock Vk alle Preise, bei denen die erwirtschaftete Rentabilität größer als die zulässige Rentabilität ist. so dass der Preis reguliert wird. Man beachte. dass damit die hier betrachteten Phasendiagramme nur relevant sind, sofern sich die Preise, die sich für den jeweiligen Kapitalstock Vk ergeben, im Intervall

[P2, pd befinden. 35 35

Auch die Intervallgrenzen pz und PI hängen gemäß (2.43) in Verbindung mit (2.41) und (2.42) von Vk ab; also muss zu Beginn ein Kapitalstock Vk(O) mit dem zugehörigen Preis p(O) vorliegen, so dass p(O) E [P2(Vk(O», PI (Vk(O))] gilt.

161

2 Verhalten des Angebotsmonopols bei Regulierung

p=o

p=o

- o

PI

P2

P

Abbildung III.29: Verlauf der Isokline flir den gleichgewichtigen Preis bei parametrisch gegebenem Kapitalstock in der (p, AI )-Ebene

Die implizite Gleichung (2.40) für die

(p

= O)-Isokline enthält weder A2 noch AI.

Somit

lassen sich die Ausführungen zum Verlauf der Isokline im (p, A2)-Raum entsprechend auf den Verlauf der Isokline in der (p, AI )-Ebene übertragen. Die Isokline determiniert wiederum zwei vertikale Geraden, die nun parallel zur AI-Achse verlaufen, wie es die Abbildung III.29 darstellt. Hinsichtlich der Änderung des Preises in dieser Ebene gilt weiterhin, dass

p ein

Minimum

besitzt, das im Intervall [p2, ptlliegt. Die Richtung, in die sich der Preis in den verschiedenen Bereichen des Phasendiagramms bewegt, wird wiederum durch (2.44) beschrieben. Kombiniert man die Ergebnisse hinsichtlich des Verlaufs der Isokline für

p

=

0 in der

(p, A2)-Ebene mit denjenigen bezüglich ihres Verlaufs in der (p, A.}-Ebene, so erhält man

die Isokline für

p

beziehungsweise p

= 0 im (p, A2, AI)-Raum in der Form zweier Ebenen, die durch p = P2 = PI

gekennzeichnet sind und parallel zu der (A2, AI)-Ebene liegen. Die

Abbildung 111.30 dient der Illustration dieses Ergebnisses. Dabei ist zu berücksichtigen, dass die Flächen bezüglich A2 und AI lediglich zu grafischen Zwecken beschränkt worden sind. Entsprechend den vorangegangenen Ausführungen ändert sich der Preis im Zeitablauf für alle Punkte des dargestellten Raumes gemäß der Gleichung (2.44), wobei

p weder von

A2 noch von AI

abhängt. Die Bewegungsrichtung von p wird durch Pfeile verdeutlicht, die in das Phasendiagramm der Abbildung III.30 eingetragen sind. Das Modell basiert auf der Annahme, dass die Rentabilität zu Beginn (t

= 0)

größer als

die faire Rentabilität ist und der Preis gesenkt werden muss. Damit liegt p(O) im Bereich ]P2, PI[. der gemäß Seite 160

p
0 zu betreten, so ist tatsächlich s

~ §

im gesamten Planungszeitraum erfüllt.

Ein Systemwechsel zwischen Regulierung und freier Wahl des Preises findet nicht statt. Sollte hingegen eine Situation mit s
0 ap 2


~

r

-

C4 C3 •

Folglich wechselt das Vorzeichen der zweiten Ableitung an der zuvor bestimmten Polstelle PP' Resubstituiert man C3 in der Beziehung r

~

C4 C3 und löst diese Ungleichung in Analogie zu

(2.48) nach p auf, so folgt

und damit

~A2 > 0

ap 2




=

r ~ C4 C3

P ~ Pp'

{=:>

(2.49)

0 im gesamten Bereich. Links von der Polstelle fallt

sie progressiv, rechts fallt sie degressiv. Um den Verlauf der Isokline in der (p, A2)-Ebene zu skizzieren, bleibt zu klären, welche Werte die Isokline links und rechts der Polstelle sowie in den Grenzbereichen für p

= 0 und p --+ 00 annimmt.

Ausgehend von (2.46) wird zunächst der Verlauf der Isokline in der Nähe der Polstelle Pp geprüft. In einem Zwischenschritt wird unter Berücksichtigung von (2.48) zunächst der Grenzwert der Konstanten C3 berechnet: lim C3

P-Pp

= P-Pp lim 2. [2p YI

Y2

+ 2C1[p -

= P--+Pp lim 2. [2p[1 + Cd YI

Y2[1

= -YII [r-CY14 + Y2[1 + 2Cd -

Y2J]

+ 2Cd]

Y2[I

+ 2Cd ]

r

(2.50)

Beachtet man ferner, dass unter Verwendung der Äquivalenzbeziehung (2.49) lim r - C4 C3 --+ +0

M~

und

!im r - C4 C3 --+ -0

~~

gilt, wird das Verlauf der Isokline in der Nähe der Polstelle durch die folgenden Grenzwerte beschrieben: und

2 Verhalten des Angebotsmonopols bei Regulierung Für den Bereich p < PP stellt der Randpunkt p

165

= 0 die relevante Grenze dar. 37 Ausgehend

von (2.46) erhält man als Randwert

A~ := 1..2 p=O= 1

r 1

-- + C4 C3

I

p=o

= --rr.y..---Y2[1

+ C4

I

+ 2CIl

Unter Berücksichtigung von lim C3 = lim

P-+OO

p-HXJ

.!. [2p[1 + CIl Yl

ergibt sich der Grenzwert der Isokline für p

~

Y2[1

+ 2CIl] ~ +00

00 als

Ein Vergleich der bei den Grenzwerte für 1.. 2 an den Stellen p = 0 und p ~

00

zeigt A~
-2

= 0 in der (p, A2)-Ebene.

Das Verhalten von 1.. 2 in den verschiedenen Bereichen des Phasendiagramms resultiert aus der Ableitung der Differentialgleichung (2.39d) für >-2 auf der Seite 156 nach 1.. 2 , nämlich

),.2

~---

o

:Pp

=0

P

Abbildung III.3I; Verlauf der Isokline für die gleichgewichtige Kozustandsvariable im Hinblick auf die Anpassungsgleichung des Preises bei parametrisch gegebenem Kapitalstock in der (p, A2)-Ebene 37

Da die Betrachtung negativer Preise nicht sinnvoll ist, stellt der Preis p gleich null den kleinsten zu untersuchenden Preis dar.

Kapitel m Optimale Regulierung

166

Damit gilt unter Berücksichtigung der Beziehung (2.49) auf der Seite 164

aa>"2> A2 ~ 0

>

{::::} r ~ C4 C3

{::::}


"2-Wert als im Fall P > Pp liegt. So haben die vorangegangenen Ausführungen gezeigt, dass die beiden Äste der Isokline fallen, die sich links beziehungsweise rechts von der Polstelle PP befinden, wobei der Grenzwert >..; im Fall P --+

00

etwas größer als der Wert >..~

für P = 0 ist (Seite 164 ff). Der Fall P = Pp ist bei der Erstellung der Grafiken vernachlässigt worden, da die Isokline für ~2

= 0 im Hinblick auf diesen Preis nicht definiert ist.

Abbildung III.33: Verlauf der Isokline für die gleichgewichtige Kozustandsvariable A2 im Hinblick auf die Anpassungsgleichung des Preises bei gegebener Bruttoinvestition im (p, A2, AI )-Raum

Verbindet man die Ergebnisse hinsichtlich der Lage der Isokline für ~2 = 0 in der (>"1, >"2)Ebene mit den Erkenntnissen über den Verlauf derselben Isokline in der (p, >"2)-Ebene, so resultiert die Abbildung III.33 in Bezug auf den dreidimensionalen (p, >"2, >"1 )-Raum. Dabei stellen die bei den hellen Flächen die Isokline für ~2

= 0 dar, während die schraffierte Fläche die Pol-

stelle der Isokline abbildet, also die Punkte des (p, >"2, ),,1 )-Raumes, für die die Isokline für

Kapitel III Optimale Regulierung

168

i2 =

0 nicht definiert ist. Wiederum ist zu berücksichtigen, dass die eingezeichneten Ebenen

nur zu grafischen Zwecken begrenzt sind. Insbesondere in der Umgebung der Polstelle Pp und für P _

00

ergibt sich die Darstellung aus der vorangegangenen Analyse. Die eingezeichneten

Pfeile geben wie üblich die Veränderung von A2 im Zeitablauf an.

2.2.4 Erweiterung der Analyse um die Isokline für i 2

=0

Nachdem nun die Änderung des Preises im Zeitablauf gemäß der Abbildung III.30 auf der Seite 162 und die Änderung der Kozustandsvariablen in der Abbildung III.33 analysiert worden sind, lassen sich nun beide Phasendiagramme zusammenfügen, um so das dynamische Zusammenwirken bei der Variablen und die Existenz und die Stabilität simultaner Gleichgewichte zu untersuchen. Aus Gründen der Übersicht bietet es sich zunächst wiederum an, das Verhalten der beiden Variablen P und A2 in der zweidimensionalen (p, A2}-Ebene zu betrachten und erst danach auf das dreidimensionale Phasendiagramm im (p, A2, AI }-Raum überzugehen. Den Ausgangspunkt bilden somit zunächst die beiden vorangegangenen zweidimensionalen Abbildungen 1II.28 und I1I.31. Vorab ist zu ermitteln, ob Pp größer oder kleiner als P2 beziehungsweise PI ist. Vergleicht man den Wert P2, der durch (2.43) der Seite 158 gegeben ist38 mit der Polstelle Pp, die durch die Gleichung (2.48) auf der Seite 163 bestimmt ist, so stellt man fest, dass einige Terme übereinstimmen. PI.2

= Pp -

rYI

C4 ±

Ji1- 4C2 [1 + Cd 2[1

+ Cd

.

Für den Fall, dass der Wurzelterm subtrahiert wird, erhält man pz < Pp' In Bezug auf das

r

Größenverhältnis von PI und Pp ist der Wurzelterm zu addieren, so dass PI > Pp

falls

Yi - 4C2 [l + Cd > [r~

4[1

+ Cd 2 .

Wie bereits auf der Seite 158 argumentiert worden ist, werden für den Parameter Y2 Werte unterstellt, die gewährleisten, dass der Term auf der linken Seite des Ungleichungszeichens positiv ist. Wenn auch ohne eine Spezifikation der übrigen Parameter keine eindeutige Aussage über das Größenverhältnis von PI und Pp getroffen werden kann, so ist festzuhalten, dass ein genügend großer Achsenabschnitt der Preis-Ab satz-Kurve Y2 die Beziehung PI > Pp sicherstellen kann. In der Abbildung III.34 wird zunächst ein hinreichend großes Y2 unterstellt, so dass PI > PP erfüllt ist. In diesem Fall liegt die zweite vertikale Isokline für

p = 0 rechts von der Polstelle.

Der Vollständigkeit halber wird der umgekehrte Fall mit PI < Pp in der Abbildung III.35 aufgegriffen. 38

Zu beachten ist, dass P2 die Lösung der quadratischen Gleichung ist, in die die Wurzel mit negativem Vorzeichen eingeht.

169

2 Verhalten des Angebotsmonopols bei Regulierung

A2 0 11

0 11

'CI,

'CI,

tL

~

Äf

V

R

VI

l.2=O

L o

vrr p

Pp

Abbildung III.34: Phasendiagramm für die Änderung des Preises p und der Kozustandsvariablen AZ in der (p. Az)-Ebene

Für hohes yz und somit pz < Pp < PI erhält man durch den ennittelten Verlauf der Isoklinen für

p

= 0 und >-2 = 0 das Phasendiagramm der Abbildung III.34.

für gegebene Werte von

Die Grafik weist

ih und AI zwei Gleichgewichte hinsichtlich der Änderung des Preises

und der Kozustandsvariablen aus. Das erste Gleichgewicht liegt links von der Polstelle in dem Punkt, in dem die Isokline für

>-2

= 0 die Kurve p = 0 an der Stelle pz schneidet. Das zweite

Gleichgewicht stellt sich entsprechend im Schnittpunkt der Isokline für

p = 0 mit der Isokline >-2 = 0 und

für >-z = 0 an der Stelle PI ein. In der Abbildung III.34 sind neben den Isoklinen

p = 0 Pfeile eingezeichnet, die die Bewegungsrichtung der einzelnen Variablen in der Zeit an-

zeigen. Horizontale Pfeile geben die Entwicklung des Preises im Zeitablauf an. Vertikale Pfeile verdeutlichen die Entwicklung von A2. Die verbleibenden Pfeile stellen schematisch den Verlauf der Trajektorien dar, die durch die simultanen Änderungen der beiden Variablen bestimmt werden. Zunächst wird das Gleichgewicht bezüglich P und A2 betrachtet, das links von der Polstelle liegt. Wie die eingezeichneten Trajektorien veranschaulichen, handelt es sich bei diesem Gleichgewicht um einen stabilen Sattelpunkt, sofern die Änderungen der bei den anderen Größen

Vk

und AI nicht berücksichtigt werden. Das Gleichgewicht kann entweder bei einem stei-

genden Preis und einer fallenden Kozustandsvariablen AZ ausgehend von Punkten aus dem Bereich 11 erreicht werden oder bei einem fallenden Preis und einer steigenden Kozustandsvariablen beginnend im Bereich IV. Startet man jedoch im Bereich I oder III, so führen alle Trajektorien weg vom Gleichgewicht. Insbesondere fällt auf, dass alle Trajektorien links der

Kapitel III Optimale Regulierung

170

Polstelle Pp zumindest gegen den gleichgewichtigen Preis konvergieren. Allerdings führt die Bewegungsrichtung der adjungierten Variablen dazu, dass sich die Trajektorien oberhalb des Sattelpfades immer weiter vom Sattelpunkt entfernen, da A2 kontinuierlich steigt. Entsprechend führen die Trajektorien unterhalb des Sattelpfades in den Bereichen 11 und III zu einer Reduktion von A2. Auch diese Trajektorien führen somit weg vom Sattelpunkt, obwohl sie gegen den Preis P2 streben. 39 Im Hinblick auf das zweite Gleichgewicht rechts der Polstelle fällt auf, dass man sich ausgehend von allen anliegenden Bereichen IV-VII des Phasendiagramms vom Gleichgewicht entfernt. Auch bei diesem Gleichgewicht in der (p, A2)-Ebene existiert ein Sattelpfad; er führt entlang der vertikalen Isokline für

p =0

an der Stelle PI in das Gleichgewicht. Also kann

das Gleichgewicht nur dann erreicht werden, wenn sich der Preis bereits im Startzeitpunkt im Gleichgewicht befindet. Für die Relevanz der ermittelten Gleichgewichte sind die unterstellten Voraussetzungen der Analyse heranzuziehen. So gilt das untersuchte Differentialgleichungssystem nur für den Fall, dass die Rentabilität s die faire Rentabilität

s nicht unterschreitet.

Insbesondere in der An-

fangssituation liegt sogar die strenge Ungleichung s > S vor, so dass sich der Startpunkt der Entwicklung in den Bereichen III-V befindet. Demnach kann das Gleichgewicht an der Stelle PI vernachlässigt werden, weil es ausgehend von der unterstellten Anfangssituation nicht er-

reicht werden kann. Damit kommt als gleichgewichtiger Endpunkt der Entwicklung nur der Sattelpunkt an der Stelle P2 in Frage. Wendet man sich dem Fall zu, in dem der Parameter Y2 nicht groß genug ist, um PI > Pp zu gewährleisten, so liegen beide vertikalen Kurven, die die

(p

= O)-Isokline darstellen,

links von der Polstelle Pp. und es gilt P2 < PI < pp. Entsprechend ergibt sich das in der Abbildung III.35 dargestellte Phasendiagramm. Aus der Gleichung (2.48) auf der Seite 163 folgt zudem app/aY2 > O. Demnach liegt auch die Polstelle PP in der Abbildung III.35 bei einem geringeren Preis als in der Grafik III.34.40 Ein weiterer Unterschied zwischen den beiden Grafiken besteht darin. dass sich das Intervall [p2' pd, in dem das Unternehmen reguliert wird, verkleinert. da a(p2 - PI)/aY2 > 0 nach (2.43) auf der Seite 158 gilt. Auch hier existieren zwei Gleichgewichte. die durch die Preise P2 und PI gekennzeichnet sind. Für das Gleichgewicht bei P2 hat sich qualitativ gegenüber dem zuvor betrachten Fall nichts verändert, denn es gilt weiterhin P2 < PP' Damit verhalten sich die Variablen P und

A2 in den Bereichen I-IV wie in den gleichnamigen Bereichen des Phasendiagramms III.34. Die obige Argumentation ist insofern zu relativieren, als hier f1ir konstantes V. und Ä) argumentiert wird. Solange sich diese Größen jedoch simultan ändern, verschieben sich auch die Isoklinen im Zeitablauf. .j() Ferner kann gezeigt werden, dass sich durch eine Variation von Y2 die beiden fallenden Kurven, die die Isokline f1ir j,2 0 beschreiben, durch eine Reduktion von Y2 nach unten verschieben. Da sich dadurch allerdings keine qualitativ bedeutsamen Änderungen im Phasendiagramm ergeben, wird diese Wirkung nicht weiter diskutiert. 39

=

171

2 Verhalten des Angebotsmonopols bei Regulierung o

0

11

11

IV

VI

~---~2=O

o

p

Abbildung [J1.35: Phasendiagramm für die Änderung des Preises p und der adjungierten Zustandsvariablen Az für geringeres

yz

Entsprechend existiert wieder ein Sauelpfad, der aus den Bereichen II beziehungsweise IV in das Gleichgewicht führt. Dagegen hat sich die Bewegungsrichtung von Az in der Umgebung des zweiten Gleichgewichts bei PI umgekehrt, weil nun PI < Pp gilt. Während es in der Abbildung III.34 einen Sattelpfad gibt, der bei konstantem PI durch die Veränderung von A2 in das Gleichgewicht führt, liegt bei niedrigem yz kein solcher Pfad vor. Vielmehr bewegt man sich ausgehend von Punkten mit P mit der Isokline für )..2

= PI. die sich oberhalb oder unterhalb des Schnittpunktes

= 0 befinden, von diesem Gleichgewicht weg.

Zusammenfassend kann festgehalten werden, dass sowohl für hohe als auch für niedrige Yr Werte Trajektorien im (p, Az)-Raum existieren, die durch sinkende Preise gekennzeichnet sind und in ein simultanes Gleichgewicht von P und A2 münden, das an der Stelle P2 liegt. Da nur der hier angesprochene Bereich P

E

[P2, PI [für die Regulierung relevant ist, konzentriert

sich die Betrachtung auf das hergeleitete Gleichgewicht bei P2 und die zugehörige Trajektorie. Das zweite Gleichgewicht bei PI kann hingegen in beiden Fällen nicht von Punkten erreicht werden, die mit einer Regulierung verbunden sind, und zwar mit der Ausnahme, dass bereits zu Beginn der gleichgewichtige Preis verwirklicht wird. Damit wird dieses Gleichgewicht für die folgende Analyse bedeutungslos. Entsprechend wird die Unterscheidung bezüglich der Höhe von Y2 im Weiteren vernachlässigt, und die folgenden Grafiken beziehen sich jeweils auf den Fall PI > pp. Nun werden die Erkenntnisse über den Verlauf der Isoklinen für jJ

= 0 und i.2 = 0 in den

dreidimensionalen (p, A2' AI)-Raum übertragen, wobei die Abbildung III.34 zu Grunde gelegt

Kapitel III Optimale Regulierung

172

wird. Wegen der erläuterten Unabhängigkeit der Isoklinen von AI erhält man das Phasendiagramm II1.36. Die vertikale Ebene bei der Polstelle Pp ist nicht eingetragen worden, da sie für die Entwicklung des Systems im dargestellten Raum nicht relevant ist und nur die Übersichtlichkeit beeinträchtigt.

Abbildung ill.36: Phasendiagramm im (p, .1.2, All-Raum unter Berücksichtigung der Isokline für den gleichgewichtigen Preis p und der Isokline für die gleichgewichtige Kozustandsvariable .1.2

Die Aussagen über die Bedeutung der jeweiligen Bereiche des Phasendiagramms für die betrachtete Problemstellung bleiben nach wie vor erhalten und die Anfangssituation ist durch einen Preis im Intervall ]P2, PI[ gekennzeichnet. Simultane Gleichgewichte bei der Variablen, also P und ,1,.2, müssen sowohl

p = 0 als auch ).2 = 0 gewährleisten.

Damit stellen die Gera-

den, die sich als Schnittfläche der bei den Ebenen ergeben, mögliche Gleichgewichte dar. Wie anhand der zweidimensionalen Darstellung im (p, A2)-Raum erläutert worden ist, führen alle Trajektorien, die in diesem Bereich starten, in die Richtung des gleichgewichtigen Preises, also hier die vertikale Ebene an der Stelle pz. Bezieht man nur die bei den Variablen P und ,1,.2 ein, so kann der für die Regulierung relevante Bereich [P2, PI [ bei konstantem

iit

nicht verlassen

werden, da die Trajektorien, auch wenn sie oberhalb oder unterhalb des Sattelpfades starten,

p = 0 streben. Gleichzeitig divergiert die adjungierte Variable vom Sattel pfad. Für alle Punkte auf der vertikalen (p = O)-Isokline bei P2 steigt ,1,.2 oberhalb der Schnittfläche, während

gegen

,1,.2 unterhalb der Schnittfläche fallt.

2 Verhalten des Angebotsmonopols bei Regulierung

2.2.5 Berücksichtigung der Isokline mr Vk

173

=0

Erweitert man die Analyse unter Berücksichtigung der Entwicklung des Kapitalstocks, so ist festzuhalten, dass eine Variation des Kapitalstocks Verschiebungen der gleichgewichtigen Isoklinen impliziert. Insofern ist zu prüfen, inwieweit das ennittelte Gleichgewicht von p und A2 mit einem Gleichgewicht des Kapitalstocks Vk vereinbar ist. Ein positiver gleichgewichtiger Kapitalstock erfordert Vk

= 0 und wird damit durch die Gleichung

beschrieben. Berücksichtigt man, dass die optimale Bruttoinvestition im Falle einer inneren Lösung gemäß (2.33) gleich

ist, so resultiert die Isokline für Vk

= 0 als (2.52)

o

Abbildung III.37: Darstellung der Voraussetzung der Isokline für einen positiven gleichgewichtigen Kapitalstock im (p, A2, Ad-Raum

Kapitel III Optimale Regulierung

174

Die Beziehung hängt weder von p noch von A2 ab und lässt sich im (p, A2, .AI}-Raum als Hyperebene darstellen, die parallel zur (.A2, P}-Ebene verläuft. Vergleiche hienu die Abbildung III.37. Wegen

0 -aAl = 28Cqk> aVk

liegt die Fläche bei einem um so höheren Wert für At. je gröBer der pararnetrisch gegebene Kapitalstock Vk ist. Hinsichtlich der Änderung von Vk in Bezug auf AI gilt aVk = _1_ > Cqk

aAl

o.

Das Voneichen dieser Ableitung ist intuitiv verständlich, wenn man AI als Bewertung einer Änderung des Kapitalstocks im Zeitpunkt so stärker wird der Kapitalstock in

1

1

interpretiert. Je höher diese Bewertung ist, um

verändert. Entsprechend besagen Punkte, die vor der

Isokline liegen, dass eine Erhöhung des Kapitalstocks geringer bewertet wird. Die optimale Bruttoinvestition reicht dann nicht aus, den Kapitalverschleiß auszugleichen; der Kapitalstock sinkt. Die Punkte, die sich hinter der Isokline befinden, sind hingegen durch höhere Werte von AI charakterisiert, als zum Erhalt des Kapitalstocks notwendig ist. Die Bruttoinvestition ist

größer als im Gleichgewicht, so dass der Kapitalstock steigt. Im Hinblick auf mögliche Randlösungen ist anzumerken, dass im Fall Vk = 0 ein gleichgewichtiger Kapitalstock zwangsläufig Punkte mit AI

~

IbO

= 0 erfordert.

Gemäß (2.33) ist I h = 0 für alle

0 erfüllt. Entsprechend implizieren alle Punkte des Phasendiagramms mit

AI> 0 einen wachsenden Kapitalstock. Der aus ökonomischer Sicht uninteressante Fall Vk

=0

wird bei der weiteren Analyse vernachlässigt. Fügt man die Ebene für den gleichgewichtigen Kapitalstock nun zu den Isoklinen für p

o und).2 =

=

0 im (p, A2, AI }-Raum hinzu, so erhält man das Phasendiagramm der Abbil-

dung III.38. 2.2.6

Verlauf der Isokline für).1

=0

Als letzte Fläche im (p, A2, AI )-Raum ist noch die Isokline für).1 = 0 zu diskutieren. Bevor der Verlauf dieser Isokline detaillierter analysiert wird, wird zunächst die weitere Vorgehensweise erläutert. Im Hinblick auf die Vervollständigung der Abbildung III.38 auf der Seite 175 durch den im Folgenden ermittelten Verlauf der Isokline für).1

= 0 (Abbildung III.4l) ist anzuführen,

dass die Ergänzung der Abbildung III.38 durch die Isokline für).1

= 0 auf Grund der Vielzahl

der eingetragenen Ebenen sehr unübersichtlich wird. Daher wird diese Ergänzung des Phasendiagramms vorerst nicht vorgenommen. Vielmehr wird zunächst ein Diagramm gezeichnet, das die Isokline für).1 = 0 und die Fläche mit).2

= 0 enthält (Abbildung III.42).

Auf diese

Weise lassen sich die geometrischen Orte aller Punkte ermitteln, die durch ein Gleichgewicht

2 Verhalten des Angebotsmonopols bei Regulierung

175

o

Abbildung lII.38: Phasendiagramm im (p, A2, AI )-Raum für einen gegebenen positiven Kapitalstock unter Berücksichtigung der Isokline für den gleichgewichtigen Preis p und der Isokline für die gleichgewichtige Kozustandsvariable A2 sowie der Isokline für den gleichgewichtigen Kapitalstock Vk

der beiden Kozustandsvariablen gekennzeichnet sind. Die resultierende Kurve im (p, Alo A2)Raum ist in der Abbildung III.43 dargestellt und wird anschließend mit den Isoklinen für jJ

=0

konfrontiert (Abbildung III.44). Der auf diese Weise ermittelte Schnittpunkt stellt ein Gleichgewicht der bei den Kozustandsvariablen und des Preises dar, das allerdings für einen parametrisch gegebenen Kapitalstock ermittelt worden ist. Verändert sich der Kapitalstock im Zeitablauf, so verschiebt sich die Lage des Gleichgewichtspunktes der drei anderen Variablen. Man kann sich die Systementwicklung entsprechend als eine Abfolge von dreidimensionalen Grafiken im (p, AI, Az)-Raum vorstellen, die jeweils die Kurve für die gleichgewichtigen Punkte der beiden

adjungierten Variablen und die Isokline für den gleichgewichtigen Preis enthält, deren Lage sich durch die Variation des Kapitalstocks verändert. Ein Gleichgewicht des gesamten Systems wird erreicht, falls die Entwicklung entlang einer Trajektorie erfolgt, die in dem beschriebenen Schnittpunkt mündet und zudem Vk

= 0 erfüllt.

Vor dem Hintergrund der oben beschriebenen Vorgehensweise wird nun der Verlauf der Isokline für

i

l

= 0 diskutiert. Die Gleichung für diese Isokline folgt aus der Differentialgleichung

(2.39c) auf der Seite 156, indem man i l gleich null setzt und die erhaltene implizite Gleichung

Kapitel III Optimale Regulierung

176 nach AI auflöst: AI

= [-CSA2 [-P[Y2 YI

p]

+ [1 + 2K] C I[Y2 -

+ 2KCI[Y2. -

pf]

YI

p]2] _1_ - qb

YI Vk

r

+ .5

(2.53) wobei CI = [Qa/YIl[OvZ]-2 wie in (2.41) und

1/1

(2.54)

Cs := ~ >0 Qkvk

verwendet werden. Während die zuvor untersuchten Isoklinen jeweils unabhängig von mindestens einer Variablen des Systems gewesen sind, enthält die Gleichung (2.53) sowohl die beiden Zustandsvariablen als auch die beiden adjungierten Variablen. Die Analyse ist entsprechend aufwendiger. Berechnet man den Verlauf der zugehörigen Ebene im (p, A2, AI)-Raum mit Hilfe von MITHEhMTICA", so erhält man die Abbildung III.41 auf der Seite 179. Damit dieses Gebilde leichter nachvollziehbar ist, werden zunächst verschiedene Schnittflächen der Kurve diskutiert, die zum einen die (A2, AI )-Ebene zeigen (Abbildung III.39), zum anderen die (p, AI )-Ebene (Abbildung III.40).

Die (1-2, AI )-Ebene stellt einen Schnitt durch den (p, A2' AI )-Raum für konstantes p dar. Um den Verlauf der Isokline zu ermitteln, wird zunächst die partielle Ableitung aAl aA2

= -C5 [-P[Y2 -

p]

YI

+ [I +2K{I[Y2 YI

pf] _1_ r

+ eS

gebildet. Diese Ableitung hängt nur vom Kapitalstock und dem Preis ab, so dass a2AI/aA~

=0

ist. Die Isokline stellt folglich in der (A2, Ad-Ebene eine Gerade dar. Für die Steigung dieser Geraden ergibt sich aAl ~ 0

aA2 ~ 0

. p ~ P3 ffilt

P3:=

gilt. Entsprechend zeigen Schnitte durch die Isokline für i

l

p], so dass

= 0 in der (A2, AI )-Ebene eine Ge-

rade mit positiver Steigung bezüglich der AI-Achse, sofern der Schnitt bei einem Preis p > P3 liegt. Hingegen handelt es sich für Preise p < P3 um eine fallende Gerade, wie es die Abbildung III.39 veranschaulicht. Ferner kann gezeigt werden, dass der Schnittpunkt der Isokline mit der AI-Achse bei einem um so geringeren Wert von AI liegt, je höher der Wert von p iSt. 41 ., Man erhält diesen Achsenabschnitt, indem in der Gleichung (2.53) A2 gleich null gesetzt wird. Bezeichnet man den Abschnitt als i l , so folgt wegen p < Y2 für die Änderung des Achsenabschnitts auf Grund einer Varitiaton von p schließlich ail/ap < o.

2 Verhalten des Angebotsmonopols bei Regulierung

177

B'

Fall: p < P3

Fall: P > P3

Abbildung m.39: Verlauf der Isokline flir die Kozustandsvariable AI im (A I, A2}-Raum bei gegebener Bruttoinvestition und gegebenem Preis

Auf der Grundlage dieser Aussagen ergibt sich der in der Abbildung III.39 dargestellte Ver= 0 im 0 ... A2)-Raum. Wegen42

lauf derlsokline für}..1

ist die Änderung }..I rechts von der (}..I

= O)-Isokline positiv, links von der Isokline dagegen

negativ. Die Kozustandsvariable AI bewegt sich folglich immer weg von ihrem Gleichgewicht. Dieses Ergebnis beruht wiederum auf einem konstantem Kapitalstock Vk. Damit lässt sich nicht ausschließen, dass die Isokline durch eine simultane Änderung aller Variablen im Zeitablauf erreichbar ist, denn die Isokline verschiebt sich bei einer Variation des Kapitalstocks ebenfalls. Der im Folgenden zu untersuchende Verlauf der Isokline für}..1

= 0 in der (p, AI )-Ebene

entspricht einem Schnitt durch den (p, 1..2, AI )-Raum für parametrisch gegebenes 1.. 2 . Den Ausgangspunkt bildet wieder die Gleichung (2.53), die zunächst nach p abgeleitet wird:

Obwohl man auf Grund der Preis-Absatz-Funktion weiß, dass p < Y2 erfüllt ist, kann über das Vorzeichen von 3A I /3p wenig gesagt werden. Zum einen ist das Vorzeichen von 1..2 unbekannt, zum anderen dürfte 2p - Y2 > 0 gelten, sofern man sich am Cournotschen Punkt orientiert, der im relativ elastischen Bereich der Preis-Absatz-Funktion liegt. Analytisch kann man zeigen, dass sich qualitativ die Kurvenverläufe der Abbildung III.40 in Abhängigkeit von der Höhe des ArWertes einstellen, wobei die Schwellenwerte kund X2 mit 42

Die folgende Ableitung berechnet sich aus der Differentialgleichung (2.39c) auf der Seite 156.

Kapitel III Optimale Regulierung

178

o

o

p

p

o

p

Abbildung m.40: Verlauf der Isokline für die gleichgewichtige Entwicklung der adjungierten Zustandsvariablen AI in der (p, AJ}-Ebene

o < b2 < I 2 wie folgt definiert sind: 2K

und

Da die zugehörige Rechnung keine weiteren ökonomischen Einsichten liefert, wird auf die umfangreiche Ableitung verzichtet. Stattdessen ist darauf hinzuweisen. dass die qualitativen Skizzen aus III.40 mit dem Verlauf der Isokline in der Abbildung III.41 übereinstimmen, die mit Hilfe von j\1A1HElvfATICA" berechnet worden ist und im Folgenden erörtert wird. Zunächst ist festzuhalten, dass die (.i. 1 = O)-Isokline für niedrige Werte von A2 in der (p,

).1)-

Ebene ein Minimum annimmt. Mit steigendem A2 geht sie in eine fallende Kurve über43 und weist schließlich für relativ große Werte von A2 ein Maximum bezüglich p auf. Die Abbildung III.41 stellt den Verlauf der Isokline für.i. 1 = 0 im (p, A2' AI )-Raum dar, der sich aus der Gleichung (2.53) ergibt. Um die zuvor erörterten Schnittflächen in der (AI, '\'2)Ebene (vgl. die Abbildung III.39) und der (p, Ad-Ebene (Abbildung III.40) leichter in der dreidimensionalen Grafik wiederzufinden. sind einige der Rasterlinien mit Buchstaben markiert. die den Kurven AB und A' B' der Abbildung III.39 und CD beziehungsweise C' D' der Abbildung III.40 entnommen sind. So beschreibt die mit B gekennzeichnete Gerade einen Schnitt bei einem Preis. der kleiner als P3 ist. Dieser Schnitt entspricht der fallenden Geraden

AB der Abbildung III.39 in der (A2. AI )-Ebene. Man beachte dabei, dass der Punkt A aus Sicht des Betrachters der dreidimensionalen Grafik allerdings verdeckt ist. Hingegen repräsentiert die Rasterlinie A' B' einen Schnitt für einen Preis. der größer als P3 ist und folglich zu einem steigenden Verlauf der Kurve in der (A2. AI)-Ebene führt. Ganz analog sind zwei Schnitte in .3

Analytisch kann abgeleitet werden, dass die Isokline für

A2

= ~2 für alle p fallt, während sie für ~2
-2 enthält, werden für die numerische Berechnung zusätzlich die Startwerte AI (0) und A2(O) benötigt. Gemäß den Optimumbedingungen müssen die bei den Werte so gewählt werden, dass die dadurch bewirkte Systementwicklung ferner die Grenztransversalitätsbedingung des Problems erfüllt (Seite 156). Diese Anfangswerte sind zunächst nicht bekannt; sie können erst durch Iterationen den optimalen Werten angenähert werden. Zu Beginn werden die beiden Startwerte also relativ willkürlich festgelegt. Diese Werte bilden dann den Ausgangspunkt für die weitere Approximation des dynamischen Systems und des damit verbundenen Wertes der Zielfunktion. Anschließend werden die Anfangswerte so lange variiert, bis sich schließlich optimale Startwerte im Hinblick auf den Wert der Zielfunktion für t

~ 00

einstellen (Seite 210 ff.).

Der nächste Schritt des Programmablaufplans III.45 besteht darin, die Veränderungen der Systemgrößen im Zeitablauf zu berechnen. Die Aufgabe übernimmt das bereits beschriebene Runge-Kutta-Fehlberg-Verfahren (Seite 304 ff.), wobei die Zeit als diskrete Größe behandelt wird. Mit dieser Methode werden ausgehend vom Zeitpunkt t die Werte für den Kapitalstock, den Preis und die beiden adjungierten Variablen für den Zeitpunkt t

+ h ermittelt.

Der resul-

tierende Fehler der Approximation wird so klein wie möglich gehalten, indem man die Schrittweite h in Abhängigkeit von einer Fehlerschätzung automatisch steuert. Die Schrittweite wird solange verringert, bis der geschätzte Fehler ausreichend klein ist. 51 Erst dann werden die Näherungen für die Systemvariablen akzeptiert. Anschließend wird der Zeitindex um herhöht. Die berechneten Zustände der Systemgrößen werden dann als Ausgangspunkt für die nächste Näherung gespeichert und die Schrittweite für die folgenden Berechnungen erneut auf das Ausgangsniveau gesetzt. Für die ermittelten Werte der Zustandsvariablen werden nun die momentane Rentabilität s(t) und der zugehörige Barwert des kumulierten Gewinns r(t) 51

:=

J~ e-rrG(r) dr berechnet. So-

Gleichzeitig darf die Schrittweile einen gewissen positiven Wert nichl unterschreiten, damit die Rechnung nicht .. stehen bleibt".

Kapitel m Optimale Regulierung

194

dann erfolgt die Abfrage, ob dieser Wert negativ ist. Spätestens zu diesem Zeitpunkt stellt das Unternehmen seine Produktion ein, was durch den Abbruch im Ablaufplan 1Il.45 erfasst wird. Anderenfalls ist zu prüfen, ob die Regulierung fortgesetzt wird. Solange die erwirtschaftete Rentabilität größer oder gleich der fairen Rentabilität ist, wird die Entwicklung des Unternehmens auch weiterhin durch das Differentialgleichungssystem (2.55) beschrieben. Entsprechend sind die vorhergehenden Schritte zur Berechnung der Näherungslösungen für die Systemgrößen zu wiederholen. Die Schleife wird solange durchlaufen, bis entweder der kumulierte diskontierte Gewinn negativ wird oder der Näherungswert für die Rentabilität s(t) unter die zulässige Rentabilität fallt. Im letztgenannten Fall stellt die Behörde die Regulierung ein, und die künftige Systementwicklung wird durch das Differentialgleichungssystem des unregulierten Monopols (2.56) beschrieben. Gemäß den Modellannahmen wird der Preis im System 2 nicht mehr vorgeschrieben und kann vom Unternehmen frei - lediglich unter Berücksichtigung der Preis-Absatz-Gleichung gewählt werden. Die Entwicklung des unregulierten Systems beginnt mit einer .. neuen Anfangssituation". Der Startwert des Kapitalstocks entspricht dem Kapitalstock vor dem Systemwechsei, da sich die Zustandsvariable kontinuierlich entwickelt. Der Wert wird im Sinne des Programmablaufplans III.46 an das System 2 übergeben. Problematisch ist jedoch der Startwert für die adjungierte Variable

)'1.

Hier liegt nicht fest, ob

sie im Zeitpunkt des Systemwechsels stetig ist, also ihren Wert beibehält. oder ob es optimal ist. bei einem Systemwechsel einen anderen Wert anzunehmen. Dieses Problem ist offensichtlich. wenn man die Interpretation der adjungierten Variablen AI als Schanenpreis einer Änderung des Kapitalstocks heranzieht. Während die adjungierte Variable AI sich innerhalb der bei den Systeme gemäß der jeweiligen Kozustandsgleichung kontinuierlich entwickelt, muss geprüft werden, ob nach der Aufhebung der Regulierung einer Änderung des Kapitalstocks weiterhin der gleiche Wert wie zuvor zugemessen wird. Weichen die Bewertungen vor und nach dem Systemwechsel voneinander ab, so ..springt" das Unternehmen auf eine andere Trajektorie und wählt eine andere Systementwicklung. Ein globales Optimum liegt aber nur dann vor, wenn der neue Startwert für AI so festgelegt wird, dass es keine alternative Trajektorie gibt, die einen höheren Barwert des kumulierten Gewinns impliziert. Da dieser optimale Wert für AI an der SprungsteIle ex ante nicht bekannt ist, wird im Folgenden eine analoge Vorgehensweise wie zum Zeitpunkt t

= 0 gewählt.

Zunächst wird der Wert exogen vorgegeben. Anschließend

variiert man diesen neuen Startwert parametrisch, um herauszufinden, ob ein alternativer Wert für AI zu einem höheren Wert der Zielfunktion führt. Speziell wird zunächst unterstellt, dass sich der Wert der adjungierten Variablen im System wechsel nicht sprunghaft verändert. Im Hinblick auf die adjungierte Variable A2 tritt bei einem Wechsel vom regulierten zum unregulierten System ein solches Entscheidungsproblem nicht auf. da mit der Streichung der

2 Verhalten des Angebotsmonopols bei Regulierung

195

Bewegungsgleichung für den Preis auch die adjungierte Variable entfällt. Wie der Programmablaufplan III.46 zeigt, wird ausgehend von den neuen Startwerten nun eine Schleife durchlaufen, in der die Werte für Vk(t) und AI (t) berechnet werden. In Analogie zum Ablaufplan III.45 wird auf der Grundlage dieser Ergebnisse schließlich wieder geprüft, ob der kumulierte diskontierte Gewinn nichtnegativ ist. Des Weiteren ist auch hier die Höhe der Rentabilität im Vergleich zur zulässigen Rentabilität s zu kontrollieren. Die Programmschleife

wird erneut durchlaufen, solange die Rentabilität kleiner als die zulässige Rentabilität ist. Wird diese Bedingung verletzt, kommt es zu einem weiteren Systemwechsel52 und die Unternehmung unterliegt erneut der Preisregulierung im System I, dessen Ablaufplan in der Abbildung III.45 dargestellt ist. Wieder stellt sich das Problem, mit welchen neuen Anfangswerten die folgenden Näherungslösungen ermittelt werden. Die Schwierigkeit liegt darin, dass bei einem Wechsel vom unregulierten System in das regulierte System zusätzliche Differentialgleichungen, nämlich die Bewegungsgleichung für den Preis und die zugehörige Kozustandsgleichung, zu berücksichtigen sind. Während für den Kapitalstock und für den Preis die Anfangswerte für das neue System gegeben sind - die Endwerte werden aus dem unregulierten System übernommen -, kennt man die Werte der bei den adjungierten Variablen nicht. Für die adjungierte Variable, die die Änderung des Kapitalstocks bewertet, liegt zwar ein Wert aus dem vorherigen System vor, allerdings gibt es auch hier keine Stetigkeitsbedingung, die eine Übernahme in das neue System vorschreibt. Als besonders problematisch erweist sich der neue Startwert für A2. Da der Preis vor dem Systemwechsel frei gewählt werden kann und nicht über eine Bewegungsgleichung gesteuert worden ist, existiert vor dem Systemwechsel kein Kozustandstand. Entsprechend liefert das System keinen Anhaltspunkt für den neuen Startwert dieser Größe. Um dennoch weiterrechnen zu können, muss erneut ein exogener Startwert angegeben werden, der anschließend im Wege der Iteration optimiert wird.

2.3.4 Wahl der Startwerte im Zeitpunkt der Systemwechsel Im Hinblick auf das zuvor geschilderte Problem, dass die optimalen Werte der adjungierten Variablen in t

= 0 und zu jedem Wechsel nicht bekannt sind, bietet es sich an, die Eignung

der verschiedenen numerischen Verfahren zu diskutieren, die im Anhang 1.2.3 auf der Seite 298 vorgestellt werden. Zunächst ist festzuhalten, dass das Problem fehlender Startwerte für die adjungierten Variablen sowohl bei einer Vorwärtsintegration als auch bei einer Rückwärtsintegration auftritt. Damit geht der Vorteil der Rückwärtsintegration verloren, der auf einem bekannten Endzeitpunkt des ursprünglichen Systems beruht. Hinsichtlich der verfügbaren Algorithmen scheinen die bereits angesprochenen Schießverfahren (Anhang A, Abschnitt 1.2.3, 52

Zur Zuordnung des Falls s = svgl. die Seite 149.

196

Kapitel m Optimale Regulierung

Seite 306) hilfreich zu sein. Allerdings ist zu beachten, dass im Falle mehrfacher Systemwechsel nicht nur die Anfangswerte für die adjungierten Variablen, sondern auch die Werte für AI und A2 in jedem Systemwechsel neu bestimmt werden müssen, so dass ein einmaliges einfaches Schießverfahren nicht ausreicht. Vielmehr erfordert jeder Systemwechsel eine erneute Anpassung der Startwerte. Die Problembeschreibung legt intuitiv nahe, ein sogenanntes Mehrfachschießverfahren (Seite 307) zu verwenden. Bei dieser Methode werden für vorab festgelegte Zeitpunkte jeweils neue Anfangswerte gewählt. Mit diesen Werten wird dann simultan die Systementwicklung für die jeweiligen Teilstücke berechnet. Anschließend werden diese Werte so angepasst, dass die Systementwicklung der Endbedingung genügt und zudem über die Teilstücke hinweg stetig ist. Im vorliegenden Fall besteht jedoch die Schwierigkeit, dass ex ante nicht gesagt werden kann, wann ein Systemwechsel eintritt und in welchem System man sich befindet. Beide Sachverhalte werden dadurch bestimmt, wie die adjungierten Variablen in allen vorangegangenen System wechseln gewählt werden; somit können sie nicht vorab festgelegt werden. Also können die Mehrfachschießverfahren das Problem der Systemwechsel nicht lösen; sie sind durch die simultane Vorgehensweise ausgehend von mehreren festen Zeitpunkten eher ungeeignet. Entsprechend ist auch das Differenzenverfahren (Seite 308) nicht anwendbar. Diese Technik beruht ebenfalls auf der Vorgabe fester Teilintervalle, während im vorliegenden System die Intervallgrenzen für die Gültigkeit der bei den Systeme von den jeweiligen Werten der adjungierten Variablen abhängen. Auch die Anwendung des Kollokationsverfahren (Seite 309) bereitet Schwierigkeiten. Bei diesem Verfahren wird die Systementwicklung näherungsweise durch eine Vielzahl von Polynomen beschrieben, die stückweise aneinander gereiht werden. Wie im Anhang beschrieben worden ist, kann diese Methode nur dann sinnvoll angewendet werden, wenn man bereits eine gute Vorstellung über das Systemverhalten besitzt. Da hier ex ante nicht gesagt werden kann, welches Differentialgleichungssystem in den jeweiligen Zeitpunkten die Entwicklung des Systems bestimmt, ist diese Voraussetzung offensichtlich nicht erfüllt. Somit kommt am ehesten eine Aneinanderreihung mehrerer Einfachschießverfahren in Frage, die jedoch nicht wie bei dem Mehrfachschießverfahren simultan. sondern sukzessive in der chronologischen Abfolge der jeweils auftretenden Systemwechsel durchgeführt werden. Demnach ist von einem bestimmten Anfangswert bis zum ersten Systemwechsel zu rechnen. anschließend sind neue Anfangswerte festzulegen. Mit diesen Werten wird nun die Entwicklung bis zum nächsten Wechsel bestimmt und so weiter. Abschließend ist zu prüfen, ob der Wert der Zielfunktion durch sukzessive Iterationen der Startwerte AI (0), '\1 (0) und dann der entsprechenden Wene in den Zeitpunkten der System wechsel verbessert werden kann. Speziell werden für den Referenzlauf die folgenden Annahmen eingeführt:

197

2 Verhalten des Angebotsmonopols bei Regulierung

• Beim Wechsel vom regulierten System in das unregulierte System wird der Wert der adjungierten Variablen für den Kapitalstock übernommen. Die adjungierte Variable für den Preis entfällt. • Beim Wechsel vom unregulierten System in die Regulierung wird ein stetiger Verlauf der adjungierten Variablen für den Kapitalstock unterstellt; hinsichtlich der adjungierten Variable für den Preis wird der Wert gesetzt. den die Variable vor dem Systemwechsel vom regulierten in das unregulierte System angenommen hat. Die getroffenen Annahmen über die Startwerte der adjungierten Variablen im Systemwechsel sind willkürlich. aber der einzige verfügbare Ansatz. um Aussagen über das Systemverhalten treffen zu können. Die so unterstellten Werte der adjungierten Variablen werden vermutlich nicht den optimalen Werten im Wechsel entsprechen. Allerdings lässt sich mit ihrer Hilfe das Verhalten des Unternehmens anfanglieh approximieren. um damit einen Ansatzpunkt für eine weitere Iteration und damit bessere Näherungen zu erhalten. Beispielsweise kann man versuchen. im Rahmen der Vorwärtsintegration mit Hilfe eines einfachen Schießverfahrens die optimalen Werte der adjungierten Variablen im Zeitpunkt t

= 0 zu finden.

Anschließend sind

die Werte der adjungierten Variablen in den Systemwechseln zu variieren. um so auch für diese Zeitpunkte die optimale Wahl der neuen Startwerte zu approximieren. Die gewählte Vorgehensweise kann die angesprochenen Schwierigkeiten der Systemwechsel nicht beseitigen. Dennoch veranschaulicht sie die Entwicklung des Systems und damit das Verhalten des Unternehmens im Zeitablauf. sofern man die Ergebnisse als "wenn-dann"-Aussagen versteht. die auf der Basis der zusätzlichen Annahmen über die Anfangssituation und die Wahl der adjungierten Variablen im Zeitpunkt des Wechsels gewonnen werden. Je nachdem, ob man als Ausgangssituation das langfristige Gleichgewicht des unregulierten Monopols oder ein noch unbestimmtes Gleichgewicht des regulierten Unternehmens wählt bietet das vorgestellte Programm die Möglichkeit. das Problem vorwärts oder rückwärts zu lösen. Da beide Wege zu wichtigen Implikationen führen. werden sie im Folgenden erläutert und die ermittelten Zeitpfade diskutiert. 2.3.5

Numerische Berechnung der Gleichgewichte

Den Ausgangspunkt der numerischen Lösung bilden die Gleichgewichte des unregulierten und des regulierten Monopols. Als Standardwerte für die Parameter werden zunächst die in der Tabelle III.4 aufgelisteten Werte unterstellt. Variationen der Regulierungsprameter sund

1t

werden im Rahmen des Kapitels 3.3 detaillierter betrachtet. Auf eine Diskussion von Variationen der übrigen Parameter wird im Rahmen dieser Arbeit allerdings verzichtet. da sie im Hinblick auf die Wirkungsweise der Regulierung von untergeordneter Bedeutung sind. 53 Un-

Kapitel m Optimale Regulierung

198 Faktorkosten Produktionsfunktion Preis-Absatz-Funktion Regulierung

r

q.

qk

IO

100 0,05

0

Q/

/(

1

0,5

0,55

YI 1

Y2 100

S

1/t

0,2

1

D

C

0,1

0,1

Tabelle lIlA: Standardwerte der Parameter

ter Verwendung der im Anhang vorgestellten MAlliEMATICA"-Programme ergeben sich damit für das Gleichgewicht des unregulierten Monopols die Werte, die in der mittleren Spalte der Tabelle III.5 angegeben worden sind. Diese Werte sind in zweifacher Hinsicht für die weitere Analyse relevant. Zum einen liefert das unregulierte Gleichgewicht die Startwerte für den Kapitalstock und den Preis, da sich das Unternehmen gemäß Annahme bei Einführung der Regulierung in diesem Zustand befindet. Zum anderen stellt dieser Zustand auch die Referenzsituation für eine Beurteilung der Regulierung aus der Sicht der Behörde dar. So muss die Behörde die Wirkung ihrer Politik daran messen, ob die durch die Regulierung hervorgerufene Entwickung eine Verbesserung gegenüber der Ausgangssituation darstellt (Seite 250). Da das Gleichgewicht des unregulierten Monopols stabil ist, wird das Unternehmen ohne eine Regulierung im gesamten Planungszeitraum in diesem Zustand verharren. Im Hinblick auf das Gleichgewicht des regulierten Monopols ist das zuvor abgeleitete Resultat zu beachten, dass die

(p

= O)-Isokline eine quadratische Gleichung mit zwei Nullstellen in

P ist (Seite 158). Bei der Ermittlung der Gleichgewichtswerte ist die kleinere der bei den Null-

stellen zu Grunde gelegt worden, also der Preis P2. Die Analyse des vorherigen Kapitels zeigt, dass es sich bei dieser Lösung um den relevanten Kandidaten für einen Sattel punkt handelt, der als Endpunkt der dynamischen Entwicklung in Frage kommt. Die größere der beiden Nullstellen, PI, wird im Weiteren vernachlässigt, da sie gemäß den Ausführungen auf der Seite 170 ff. von keinem Punkt des regulierten Bereichs erreicht werden kann. Die numerische Berechnung des Gleichgewichtes liefert die Werte, die in der rechten Spalte der Tabelle III.5 notiert sind. Aus der Sicht der Behörde ist das Gleichgewicht des regulierten Systems, das hier numerisch berechnet worden ist, intuitiv erstrebenswert: So ist dieser Zustand gemäß der Tabelle III.5 im 53

Hinsichtlich der speziellen Wahl der Parameterwerte ist anzumerken, dass die Werte der Produktionsfunktion steigende Skalenerträge sicherstellen. Der Parameter C, der die Anpassungskosten auf Grund von Bruttoinvestitionen determiniert, impliziert im Fall einer linearen Funktion der Anpassungskosten, dass die Anpassungskosten in Höhe von 10% des investitierten Wertes beim Aufbau eines Kapitalstocks entstehen.

199

2 Verhalten des Angebotsmonopols bei Regulierung (a)

(b)

unreguliert

reguliert

22,9884

38,8316

[b

2,2988

3,88316

Va

45,7606

103,702

p

62,0619

23,8017

X

37,9381

76,1983

)..1

45,9768

77,6631

-

1129,25

Vk

)..2

s

0,8252

0,2000

G

1499,2300

43,3688

Tabelle III.5: Gleichgewichtige Werte

Vergleich zum Gleichgewicht des unregulierten Monopols durch einen niedrigeren Preis und damit durch eine bessere Versorgung der Konsumenten gekennzeichnet. Ferner ist in dieser Situation der Gewinn weiterhin positiv, wenn auch sehr gering. Ein Wechsel vom unregulierten Gleichgewicht zu diesem Zustand ist somit durch eine Umverteilung des Wohlstandes zu Gunsten der Konsumenten gekennzeichnet. Vergleicht man die Werte der Bruttorentabilität s, so zeigt sich, dass die vorgegebene Rentabilität von

s = 0, 20 erheblich unter der Rentabis = 0, 8252 liegt. In diesem

lität im langfristigen Gleichgewicht des unregulierten Monopols

Zusammenhang ist allerdings auf die Analyse aus Sicht der Wohlstandsmaximierung zu verweisen (Kapitel 3.3). Hier zeigt sich, dass es aus Sicht der Behörde sogar optimal ist, einen noch niedrigeren Wert für

s zu setzen, um eine schnelle Reduktion des Monopolpreises zu bewirken

(Seite 257). Vergleicht man ferner die Kapitalintensität vk/v a im langfristigen Gleichgewicht des unregulierten Monopolfalls mit derjenigen, die das ermittelte langfristig Gleichgewicht des regulierten Monopolisten charakterisiert, so fällt auf, dass die Kapitalintensität im regulierten Gleichgewicht geringer ist. Sofern das Gleichgewicht ausgehend von der unterstellten Startsituation, dem langfristigen Gleichgewicht des unregulierten Monopolfalls, erreicht werden kann, wird also Kapital durch Arbeit substituiert, ein Ergebnis, das im Gegensatz zum Resultat des statischen Averch-lohnson-Modells steht. Vor diesem Hintergrund wird nun eine Stabilitätsanalyse des regulierten Gleichgewichtes durchgeführt, um so zumindest qualitative Aussagen darüber treffen zu können, ob es von Startsituationen außerhalb des Gleichgewichtes erreicht werden kann. Da eine analytische Untersuchung dieser Fragestellung auf Grund der Komplexität der Ausdrücke keine eindeutige Aussage liefert, bietet es sich an, diese Betrachtung wiederum für die hier gewählte numerische Spezi-

Kapitel m Optimale Regulierung

200

fikation der Parameter durchzuführen. Formal sind die Eigenwerte des Systems zu berechnen, das an der Stelle des Gleichgewichtes Iinearisiert worden ist. Die Vorzeichen der Eigenwerte geben an, ob es sich bei dem Gleichgewicht um einen Sattelpunkt, einen Strudelpunkt oder einen stabilen Knoten handelt. Bei Differentialgleichungssystemen höherer Ordnung zeigen negative Eigenwerte an, dass es sich um ein stabiles System handelt, und positive Eigenwerte, dass das System instabil ist. Eigenwerte mit entgegengesetzten Vorzeichen treten auf, wenn ein stabiler Sattelpfad vorliegt. Dabei entspricht der stabile Arm den Eigenvektoren, die mit negativem Vorzeichen der zugehörigen Eigenwerte verbunden sind. Die Zahl der Eigenwerte mit negativem Vorzeichen bestimmt somit die Dimension des stabilen Arms. Ferner führen komplex konjugierte Eigenwerte zu zyklischem Verhalten. 54 Die Eigenwerte geben damit Aufschluss darüber, ob und wie ein Gleichgewicht des Systems erreicht werden kann. Allerdings ist zu berücksichtigen, dass diese Untersuchung auf der Linearisierung des Systems beruht. Die Verfahrensweise ist ein geeignetes Hilfsmittel, da das linearisierte System in der unmittelbaren Umgebung des Gleichgewichtes näherungsweise das Verhalten des ursprünglichen Systems beschreibt und im Gleichgewicht selbst der nichtlineare Arm und die Ebene, die durch die negativen Eigenvektoren gebildet wird, übereinstimmen. Je weiter man sich jedoch vom Gleichgewicht entfernt, um so mehr kann das Verhalten des tatsächlichen Systems vom linearisierten System abweichen. Entsprechend sind die Aussagen über die Erreichbarkeit des Gleichgewichtes mit zunehmender Entfernung vom Gleichgewicht zu relativieren. Linearisiert man das Differentialgleichungssystem des regulierten Monopols an der Stelle des Gleichgewichtes (Vb

p, i" i 2 ), so erhält man

wobei R den Vektor der Taylorschen Restglieder bezeichnet und die partiellen Ableitungen an der Stelle des Gleichgewichtes auszuwerten sind. Die Matrix der partiellen Ableitungen ist als Jacobi-Matrix bekannt und wird im Weiteren mit J bezeichnet. Die benötigten Aussagen über die Vorzeichen der Eigenwerte können nun anhand der Determinante dieser Matrix ermittelt werden. Die Rechnungen sind wiederum mit Hilfe von AIATIIE.'vf..\.TICl." durchgeführt worden. Sie ergeben für die gewählte Parameterkonstellation eine positive Determinante der JacobiMatrix: detJ 54

= 0,0000939923.

Vgl. Barro, Sala-i-Martin (1995), Seite 482; Feichtinger, Hartl (1986), Seite 133 ff.

201

2 Verhalten des Angebotsmonopols bei Regulierung Gemäß Feichtinger, Hart! (1986), Seite 135, ist die Ungleichung 0 < det J ~ K 2 /4 mit

sowohl notwendig als auch hinreichend dafür, dass alle Eigenwerte von J reell sind, wobei zwei positive und zwei negative Eigenwerte auftreten. MATIIEMATICtr liefert für die gegebenen Parameterwerte K < 0 und für K 2 /4 den Wert 0,00108099 ist. Folglich ist die obige Ungleichung für das vorliegende Problem erfüllt. In der Tat liefert M4.lliEMATIGr die Eigenwerte 0,279794

- 0,229794

0,0706825

- 0,0206825.

Die Stabilitätsanalyse des regulierten Systems zeigt also, dass das regulierte Gleichgewicht die· Eigenschaften eines Sattelpunktes besitzt und dass es innerhalb dieses Systems eine zweidimensionale stabile Mannigfaltigkeit, also eine "Sattelfläche" im vierdimensionalen Raum existiert, die in dieses Gleichgewicht führt. Da die Eigenwerte reell sind, tritt kein zyklisches Verhalten auf. Das ermittelte Gleichgewicht kann somit als Kandidat für den Endpunkt einer optimalen Lösung des Problems betrachtet werden. Folglich ist nun zu prüfen, ob für die unterstellten Anfangswerte Vk(O) und p(O) die adjungierten Variablen so gewählt werden können. dass sich das System entlang einer Trajektorie entwickelt, die auf der stabilen Mannigfaltigkeit liegt und somit in den Sattel punkt mündet. Allerdings ist an dieser Stelle zu beachten, dass das langfristige Gleichgewicht definitionsgemäß durch

p = 0 und damit durch s =

s gekennzeichnet ist.

Es liegt also auf dem Rand des

Bereiches, der für die Regulierung überhaupt von Bedeutung ist. Somit ist es vorstellbar, dass die stabile Mannigfaltigkeit, die durch die negativen Eigenvektoren aufgespannt wird, nicht im relevanten Teil, sondern im Bereich mit

p

> 0 und damit außerhalb des Definitionsbereiches

des regulierten Systems liegt. In diesem Fall muss geprüft werden, ob eventuell Trajektorien des unregulierten Monopols in den Sattelpunkt führen. Eine weitere denkbare Entwicklung ist durch einen Pfad gekennzeichnet, der im regulierten Bereich beginnt, dann einen unregulierten mit s < S durchläuft und schließlich gegen das Gleichgewicht strebt. Für die bei den zuletzt genannten Fälle ist wiederum zu prüfen, ob die unterstellte Anfangssituation auf einer solchen Trajektorie liegen kann. Die Erreichbarkeit des Sattelpunktes wird im Folgenden mit Hilfe der Rückwärtsintegration geprüft. Dabei stellt sich heraus, dass es zwar einen Pfad gibt, der vorn regulierten Bereich in das Gleichgewicht führt, dass das ursprüngliche Gleichgewicht des unregulierten Monopols jedoch nie auf diesem Pfad liegt. Vernachlässigt man den unregulierten Bereich, liefert der folgende Abschnitt dennoch allgemeine Erkenntnisse über das Verhalten im regulierten Bereich und zu den Zeitpunkten der System wechsel. Allerdings kann die optimale Lösung bei einern

Kapitel m Optimale Regulierung

202

Start im langfristigen Gleichgewicht des unregulierten Monopols erst mit Hilfe der Vorwärtsintegration auf den Seiten 210 ff. ermittelt werden. 2.3.6

Berechnung der Rückwärtsintegration

Ausgehend vom langfristigen Gleichgewicht des regulierten Monopols wird nun das bereits angesprochene Verfahren der Rückwärtsintegration angewendet. um die Trajektorien zu ermitteln. die in den betreffenden Sattelpunkt führen. Da ex ante nicht ausgeschlossen werden kann. dass der regulierte Bereich zumindest zeitweise verlassen wird und sich das Unternehmen in diesen Zeitspannen wie ein unregulierter Monopols verhält. sind beide Systeme bei den numerischen Rechnungen zu berücksichtigen. Ferner müssen für die Systemwechsel auch die entsprechenden Angaben für die Startwerte der adjungierten Variablen einbezogen werden. die auf der Seite 196 dargestellt worden sind. Die Rückwärtsintegration ist dadurch gekennzeichnet. dass ein System in umgekehrter Zeitfolge beginnend im potenziellen Endzustand gelöst wird. also dem Gleichgewicht. dem sich das System langfristig nähert (Seite 323). Hier wird entsprechend das Gleichgewicht des regulierten Monopols zu Grunde gelegt. wobei die zugehörigen Werte der Variablen der rechten Spalte in der Tabelle IIL5 auf der Seite 199 zu entnehmen sind. Allerdings dürfen die Startwerte nicht mit den exakten Werten des Gleichgewichts übereinstimmen. da das System sonst definitionsgemäß in diesem Punkt verharrt. Vielmehr wird ein Punkt gewählt. der in der unmittelbaren Umgebung des Gleichgewichtes liegt. Dementsprechend werden für die Startsituation zwar die exakten Gleichgewichtswerte für den Kapitalstock Vk und die bei den adjungierten Variablen AI und A2 gemäß der Tabelle III.5 gesetzt. für den Preis wird hingegen P+E

= 23.8018 unterstellt.

Um zu gewährleisten. dass der gesuchte Pfad in umgekehrter Zeitfolge. also rückwärts. durchlaufen wird. ist es notwendig. die ursprünglichen Differentialgleichungssysteme (2.56) und (2.55) zu transformieren. wobei die rechten Seiten der Differentialgleichungen mit minus eins multipliziert werden. Man erhält als transformiertes System für den unregulierten Bereich mit s < S

und für den regulierten Bereich mit s

~

S

2 Verhalten des Angebotsmonopols bei Regulierung

Vk

= - [11»0 -

P=).1

=-

[..L qkUk

BUk]. [SqkUk - P

[[r + B][AI _ 2/Cqa Uk

).2

203

Yl YI- P + qa [YlYI _(J.:]2]] . "k

+ qk] + A21/! [- p[Yl - p] + [1 + 2K]qa [Y2 - p]2] qkui

[Y2 - ~J2J YI(JU k

.

YI(JU~

YI

= _ [rA 2+ [1 _A21/!] [2 P- Y2 _ 2qa[Yl - P]]] . qkuk

YI

[YI(J~]2

Auf diese Weise wird ein ursprünglich stabiler Arm des Sattelpfades, also ein Pfad, der in den Sattelpunkt hineinführt. in einen instabilen Arm des neuen Systems verwandelt. Diese Transformation des ursprünglichen Systems sowie die Begriffe stabiler und instabiler Arm werden im Anhang A auf den Seiten 323 ff. anhand des Phasendiagramms V. 12 erläutert. Hier genügt es festzuhalten, dass ein instabiler Arm zwar vom Sattel punkt wegführt. dass aber letztlich alle Trajektorien aus der Umgebung dieses Pfades gegen diesen Arm konvergieren. Sofern die gewählten Anfangswerte nicht zufällig auf dem instabilen Arm des ursprünglichen Systems, also dem stabilen Arm des transformierten Systems liegen, wird die Dynamik das System auf den gesuchten Sattelpfad zurückführen. Da die Veränderung der Systemgrößen jetzt mit entgegengesetztem Vorzeichen erfolgt, wird dieser Pfad in umgekehrter Zeitfolge durchlaufen. Berechnet man mit den zuvor gegebenen Anfangswerten die numerischen Näherungen für die Systementwicklung per Rilckwärtsintegration, so erhält man die in der Tabelle III.6 zusammengefassten Zeitreihen. Zum Verständnis dieser Zahlenreihen ist anzumerken, dass t die Zeit im Sinne der Rückwärtsintegration bezeichnet. Dem Startzeitpunkt des transformierten Systems

'i = 0 ist entsprechend der Endzeitpunkt des originären Systems zugeordnet, der hier zur

Vereinfachung mit T bezeichnet wird. Der Zeitindex t des transformierten Systems lässt sich also durch t = T - t in die ursprüngliche Zeitrechnung zurückverfolgen. Die Zeitreihen zeigen für kleinere Werte von 'i fast keine Veränderungen. da sich die Systemgrößen sehr nahe an ihren Gleichgewichten befinden und somit nur sehr langsam ändern. Ferner fallt auf, dass im Zeitpunkt 'i

= 60,0558 ein Systemwechsel stattfindet. Die Schwierig-

keit dieses Wechsels wird im Folgenden noch erläutert. Die Abbildung III.47 stellt die vier Zeitreihen für die beiden Zustandsvariablen, die Rentabilität und den Gewinn für den Zeitraum t ~ 65 grafisch dar. Um die Ergebnisse bezogen auf das originäre System leichter interpretieren zu können, enthalten die Grafiken zusätzlich zu der Zeitachse einen Pfeil, der den Zeitveriauf im ursprünglichen System betont.

204

Kapitel

i

Vk

P

Al

A2

S

G

m Optimale Regulierung

[b

va

System

0,0000

38,83

23,80

77,66

1129,25

0,20000

43,38

3,88

103,70

Regulierung

10,0000

38,83

23,80

77,66

1129,25

0,20000

43,38

3,88

103,70

Regulierung

20,0002

38,83

23,80

77,66

1129,25

0,20001

43,43

3,88

103,70

Regulierung

30,0002

38,85

23,80

77,61

1129,25

0,20060

43,90

3,88

103,64

Regulierung

40,0002

39,03

23,80

77,14

1129,27

0,20053

48,47

3,86

103,10

Regulierung

0,20424

89,64

50,0002

40,82

23,82

72,61

1129,41

3,63

98,10

Regulierung

55,0002

44,95

23,85

62,85

1129,56

0,20795

161,75

3,14

88,16

Regulierung

56,0002

46,46

23,86

59,51

1129,56

0,20809

181,35

2,98

85,01

Regulierung

57,0002

48,31

23,87

55,56

1129,53

0,20764

201,31

2,78

81,40

Regulierung

58,0002

50,59

23,88

50,94

1129,45

0,20635

220,18

2,55

77,37

Regulierung

59,0002

53,37

23,88

45,62

1129,32

0,20396

235,91

2,28

72,94

Regulierung Regulierung

60,0002

56,73

23,88

39,60

1129,10

0,20025

245,87

1,98

68,19

60,0558

56,94

23,88

39,24

1129,08

0,20000

246,19

1,96

67,92

ss

60,0560

56,94

55,25

39,24

0,39299

1345,09

1,96

23,48

Stanwerte

61,0002

60,85

55,42

30,16

1076,59

0,37040

1318,51

1,51

21,66

Regulierung

62,0002

65,92

55,58

20,31

1022,69

0,34465

1272,83

1,02

19,69

Regulierung

63,0002

72,04

55,71

10,37

970,43

0,31784

1206,53

0,52

17,75

Regulierung

64,0002

79,33

55,81

0,52

919,75

0,29084

1117,31

0,03

15,89

Regulierung

1129,08

Tabelle III.6: Numerischer Output für den Fall der Rückwänsintegration: Die vorliegende Tabelle enthält die Ergebnisse der Berechnungen für die Zustandsgrößen und die Kozustände sowie die Bruttorentabilität, den Gewinn, die Bruttoinvestition und den Arbeitseinsatz. Findet ein Systemwechsel vom regulierten System ins unregulierte System statt, so werden die Werte für den Kapitalstock Vk und den Kozustand AI als Ausgangswerte für die Berechnung innerhalb des unregulierten Systems übernommen. Beim Wechsel vom unregulierten zum regulienen System werden als Stanwerte flir die weiteren Berechnungen der Wert des Kapitalstocks Vb des Kozustands AI. der aktuelle Preis p sowie der zuletzt gespeicherte Wert für den Kozustand A2 gesetzt. Die jeweiligen Werte werden in der vorliegenden Tabelle als Stanwerte ausgewiesen.

Betrachtet man zunächst nur den Bereich

i
01 75 ~ 70 '" 65 ~ 60 ~55 50 45 40 35 0

) 10

20

1400 1200 c

60 55 50 ",45 ·e40 Il. 35 30 25 20 0

30

Zeit

40

50

60

30

Zeit

40

50

60

\

~O,34

.5800

:: 0,32

0

5i 0,28

~O,30

~600

400 200 00

20

0,40 0,38 0,36

1\

1000

10

~O,26

IO

20

30

Zeit

40

50

0,24 0,22 0,20 0

60

IO

20

30

Zeit

40

- 60

50

Abbildung III.47: Entwicklung des Kapitalstocks, des Preises, des Gewinns und der Rentabilität im Fall der Rückwärtsintegration

die Zeitreihen der Tabelle 111.6 beziehungsweise die Grafik 111.47 im Zeitverlauf des originären Systems, so wird der Sattelpunkt erreicht, während der Kapitalstock, der Preis und der Gewinn fallen. Gleichzeitig nimmt die Rentabilität ungefahr im Zeitpunkt i

= 56,0002 ein lokales Ma-

ximum an, sinkt dann jedoch bei ihrer Annäherung an das Gleichgewicht bis auf den Grenzwert

S=O,2. Bezieht man allerdings die Werte für

i ~ 60,0558 ein, so zeigt sich ein gravierender Wider-

spruch: Obwohl sich der Preis in diesem Zeitpunkt stetig entwickeln muss, springt er von 23,88 auf 55,25. Um die Ursache für diesen Sprung und die Unvereinbarkeit dieser Entwicklung mit den Modellannahmen aufzuzeigen, wird zunächst die Abfolge der Berechungen skizziert. Der Algorithmus überprüft in jedem Zeitpunkt die Bedingungen für einen Abbruch und er-

s

kennt in t = 60,0558, dass die Rentabilität kleiner als iSt. 56 Entsprechend wird in diesem Zeitpunkt ein Systemwechsel hervorgerufen, da die Notwendigkeit einer Regulierung nicht länger vorliegt. So ist zwar für

i

< 60,0558 der Regulierungsmechanismus aktiv und der Preis wird

über die Bewegungsgleichung verändert, für

'i

~

60,0558 kann das Unternehmen hingegen

den Preis frei wählen. Während der Wert für den Kapitalstock und annahmegemäß auch der 56

Der in der Tabelle notierte Wert für die Rentabilität s ist gerundet. Das Programm rechnet intern mit einer größeren Genauigkeit und stellt einen Wert fest, der marginal unter 20 Prozent liegt.

Kapitel III Optimale Regulierung

206

Wert für die adjungierte Variable A.I an das unregulierte System übergeben werden,57 entfällt die adjungierte Variable A.2. Die übrigen Systemgrößen, also der Arbeitseinsatz, die Bruttoinvestition, sowie der Preis, die Rentabilität und der Gewinn, ergeben sich auf Grund der Optimumbedingungen des unregulierten Monopols. Da diese Werte die neuen Startwerte für den Rechenalgorithmus darstellen, sind sie ebenfalls in die Tabelle

m.6 aufgenommen worden.S8

Berechnet man für diese Ausgangswerte nun den zugehörigen Preis des unregulierten Monopols, so springt er - wie bereits beschrieben worden ist - durch die Aufhebung der Regulierung auf den Wert 55,25. Entsprechend verändert sich auch die Rentabilität s. In dem Moment, in dem die Regulierung aufgehoben wird, endet die bis dahin kontinuierliche Entwicklung und s springt auf einen Wert, der über der fairen Rentabilität liegt, so dass die Regulierung - unmittelbar nachdem sie aufgehoben worden ist - wieder einsetzt.

[ I'S

I

"jVa

p

Vk-

jJ

I ".~ p-

v.

X

I

Abbildung III.48: Wirkungskreis lauf der Variablen für den Fall der Regulierung

Die Ursache für den beschriebenen Sprung in der Preisentwicklung kann anhand der Abbildungen 1Il.48 und III.49 erläutert werden, die die Bestimmung des Preises mit und ohne Regulierung skizzieren. Die Abbildung 1II.48 stellt dar, wie sich die Variablen im regulierten System beeinflussen, wobei die adjungierten Variablen aus Gründen der Vereinfachung vernachlässigt worden sind. 59 Die Änderung des Preises ergibt sich aus der zugehörigen Differentialgleichung Der Kapitalstock stellt in beiden Systemen eine Zustandsvariable dar und entwickelt sich stetig. Dass der Wert für AI übergeben wird, entspricht den Annahmen auf der Seite 196. 58 Die Tabelle m.6 enthält somit zwei Zeilen für den Zeitpunkt "i = 60,0558. Die obere Zeile gibt die Werte des regulierten Systems im Abbruchzeitpunkt an, die untere Zeile enthält die Werte, die sich für den aktuellen Kapitalstock bei Aufhebung der Regulierung ergeben. Entsprechend werden auch in den folgenden Tabellen für jeden Systemwechsel jeweils zwei Zeilen angegeben. 59 V gl. hierzu das interdependente Differentialgleichungssystem (2.55) auf der Seite 186. Die adjungierte Variable AI bestimmt dabei die Höhe der Bruttoinvestition Ibo. Die Änderung von AI in der Zeit hängt wiederum vom Kapitalstock Vb dem Preis p sowie der Variablen AI und der Variablen ;'1 ab. Die Änderung von A2 ist gleichzeitig eine Funktion von A2' dem Kapitalstock Vk und dem Preis p. Diese Beziehungen der adjungierten Variablen sind nicht in die Abbildung III.48 eingetragen worden, allerdings dem System (2.55) zu entnehmen. 57

207

2 Verhalten des Angebotsmonopols bei Regulierung

und ist eine Funktion des Preises. des Kapitalstocks und des Arbeitseinsatzes. 60 Dabei ist zu berücksichtigen, dass sich der Preis zwar im Zeitablauf gemäß der Differentialgleichung ändert. aber in jedem einzelnen Zeitpunkt selbst gegeben ist. Durch diesen in t gegebenen Preis ist gleichzeitig über die Preis-Absatz-Funktion auch die nachgefragte und damit die zu produzierende Menge x festgelegt. 61 Die analoge Argumentation gilt für den Kapitalstock. der sich im Zeitablauf zwar durch die Abschreibungen und die Bruttoinvestition ändert. in jedem Zeitpunkt jedoch gegeben ist. Zieht man nun die Produktionsfunktion des Unternehmens hinzu. also

x = ev~vZ, so sind in dieser Gleichung alle Größen mit Ausnahme von Va festgelegt.

Arbeitseinsatz

Va

Der

kann somit nicht wirklich im Sinne einer Optimierung frei geWählt werden.

sondern ist in jedem Zeitpunkt t über die Bestimmung des Kapitalstocks und des Preises in Verbindung mit der Preis-Absatz-Funktion und der Produktionstechnik zwingend festgelegt.

Vk-

Vk-

vaOJ- x -

p

[ Abbildung III.49: Wirkungskette der Variablen für den unregulierten

Fall

Ohne bindende Regulierung ergibt sich eine andere Wirkungskette, die der Abbildung III.49 zu entnehmen ist. Die Änderung des Kapitalstocks wird wie zuvor durch die Bruttoinvestition abzüglich der Abschreibungen 8Vk bestimmt. Allerdings ist jetzt der Preis keine Zustandsvariable mehr. Die Wahl des Preises vollzieht sich indirekt durch die Wahl des Arbeitseinsatzes bei einem gegebenen Kapitalstock. Mit der Festlegung des Arbeitseinsatzes bestimmt das Unternehmen gleichzeitig die Produktionsmenge. die dann wiederum über die Preis-Absatz-Funktion einen bestimmten Preis determiniert. Während bei Regulierung der Arbeitseinsatz residual für einen gegebenen Kapitalstock und einen gegebenen Preis ermittelt wird. wählt das Unternehmen hier für einen fixen Kapitalstock über den Arbeitseinsatz einen Punkt auf der Preis-AbsatzFunktion. Die Unterschiede zwischen den bei den Wirkungsketten ergeben sich auch aus den jeweiligen Optimumbedingungen für den Arbeitseinsatz. Gemäß (2.35) auf der Seite 153 ist der optimale 60

61

Aus dem Differentialgleichungssystem (2.55) auf der Seite 186 ist die Abhängigkeit vom Arbeitseinsatz nicht mehr ersichtlich, da er bereits durch den optimalen Wert in Abhängigkeit vom Kapitalstock substituiert worden ist. Hier bietet es sich jedoch an, auf die ursprüngliche Form der Differentialgleichung (2.37b) auf der Seite 154 zurückzugreifen, um die Unterschiede in den Bestimmungsfaktoren des Preises und dem damit eng verbundenen Unterschied in der Höhe des optimalen Arbeitseinsatzes zu verdeutlichen. Gemäß den Annahmen muss die nachgefragte Menge gedeckt werden, so dass die produzierte Menge bei optimalem Verhalten gerade der Nachfragemenge entspricht.

Kapitel m Optimale Regulierung

208 Arbeitseinsatz bei bindender Regulierung



Va(Vk, p) =

[Y2Y1 -t1pJ2 9

eine Funktion der beiden Zustandsvariablen Preis und Kapitaistock. Hingegen hängt der optimale Arbeitseinsatz des unregulierten Monopols gemäß der Gleichung

V:(Vk)

= (~ (9~k + YI9Vk)) -2 > 0

(1.8)

auf der Seite 66 nur vom Kapitaistock ab. Sofern die bei den Werte im Zeitpunkt des Systemwechsels voneinander abweichen, wird eine sprunghafte Veränderung des Arbeitseinsatzes zu beobachten sein. Daraus resultiert eine Abweichung der Produktionsmenge beziehungsweise der Nachfragemenge und somit des Preises. Das Unternehmen springt von einem durch die Regulierung über den Preis festgelegten Punkt der Preis-Absatz-Kurve hin zu einem anderen präferierten Punkt der Kurve. Nun ist zu prüfen, ob der hier im Rahmen der Rückwärtsintegration auftretende Sprung plausibel ist. Zunächst muss beachtet werden, dass der Sprung im Sinne der Rückwärtsintegration bei einem Wechsel vom regulierten in den unregulierten Bereich stattfindet. Überträgt man diese Aussage auf die Vorwärtsintegration, so liegt im eigentlichen Problem ein Wechsel vom unregulierten Bereich in den regulierten Bereich vor. In der chronologischen Abfolge der Regulierung darf in einer solchen Situation kein Sprung auftreten. Vielmehr sieht der Regulierungsmechanismus vor, dass der unregulierte Preis p

= 55,25 übernommen und dann kontinuierlich

gesenkt wird. Ausgehend von den Werten der Tabelle III.6 für irgendein t > 60,0558 kann der Preis p

= 23,88 im Wege der Vorwärtsrechnung niemals realisiert werden. Dass der Sprung in

der Rückwärtsintegration auftritt, ist aber kein Fehler in der Berechnung, sondern zeigt an, dass es keine Trajektorie gibt, die zu dem Tupel

Vk = 56,94 und p

= 23,88 führt.

Dieser Tatbestand für sich allein bedeutet nicht, dass das Gleichgewicht des regulierten Monopols überhaupt nicht erreicht werden kann. Man stelle sich eine Trajektorie vor, die aus einem unregulierten Bereich in einen Punkt

(Vb

p) des Sattelpfades führt, der per Rückwärtsintegra-

tion für den Zeitraum t < 60,0558 ermittelt worden ist. Um diese Möglichkeit auszuschließen, sind für die jeweiligen Werte des Kapitalstocks mit Hilfe der Gleichung (l.8) auf der Seite 208 der optimale Arbeitseinsatz ohne bindende Regulierung, die zugehörige Produktionsmenge und der sich daraus ergebende Preis berechnet worden. Die resultierende Kurve ist in die Abbildung 111.50 eingezeichnet worden. Zusätzlich enthält diese Abbildung die Entwicklung von Preis und Kapitalstock gemäß dem Sauelpfad, der für den regulierten Bereich mittels Rückwärtsintegration berechnet worden ist. Man erkennt, dass die Pfade bei der unterstellten Parameterkonstellation für keinen der betrachteten Werte des Kapitalstocks übereinstimmen. Damit

209

2 Verhalten des Angebotsmonopols bei Regulierung

p

65 55

- - - - - - optimaler Preis ohne bindende Regulierung

45 35

25

1=0

1=60,0558

t'---------'t pfad ins regulierte Gleichgewicht Vk

40

50

60

Abbildung III.50: Gegenüberstellung des Verlaufs des Sattelpfades im regulierten Bereich im (Vb p)Raum mit den optimalen Preisen aus der Sicht des unregulierten Monopols für den gegebenen Kapitalstock existiert kein stetiger Zeitpfad, der aus einem unregulierten Bereich in das Gleichgewicht des regulierten Monopols führt. Im Rahmen der Rückwärtsintegration sind folgende Ergebnisse hergeleitet worden: I. Die Rückwärtsintegration liefert innerhalb des regulierten Bereiches einen Pfad, der in das Gleichgewicht des regulierten Monopols führt. Da der Endpunkt als Gleichgewichtspunkt auch die Grenztransversalitätsbedingung des Optimierungsproblems erfüllt, ist die Entwicklung des Systems entlang dieses Pfades die optimale Lösung, sofern sich der Startpunkt des Optimierungsproblems auf diesem Teilstück der Trajektorie befindet. 2. Die Analyse zeigt, dass es keine Trajektorien gibt, die aus dem unregulierten Bereich auf den Sattel pfad im regulierten Bereich führen. Damit kann das Gleichgewicht nicht erreicht werden, wenn die Ausgangssituation nicht bereits auf dem ,,regulierten" Teilstück des Sattelpfades liegt. 3. Da sich das langfristige Gleichgewicht des unregulierten Monopols nicht auf dem "regulierten" Teil des Sattelpfades befindet, kann ausgeschlossen werden, dass dieses Gleichgewicht erreicht wird. Die gleichen Resultate stellen sich bei variierten Parameterkonstellationen ein. So führen alle untersuchten Programmläufe dazu, dass der durch die Rückwärtsintegration ermittelte Sattelpfad den Definitionsbereich des regulierten Systems verlässt, und dass es keine zulässige Trajektorie des unregulierten Monopols gibt, die auf diesen Pfad führt. Allerdings weicht der Preis

Kapitel m Optimale Regulierung

210

des Sattelpfades von dem des unregulierten Monopols um so geringer ab, je größer die zulässige Rentabilität ist. Diese Beobachtung ist intuitiv verständlich, da die Vorgabe einer höheren zulässigen Rentabilität das Verhalten des Unternehmens weniger einschränkt. Doch selbst bei einer maximal zulässigen Rentabilität von 80% kann kein unreguliener Pfad ermittelt werden, der auf den Sattelpfad führt.

2.3.7 Berechnung der Vorwärtslösung Da mit der Rückwärtsintegration kein Pfad ermittelt werden kann, der in ein langfristiges Gleichgewicht des regulierten Monopols führt, wird nun versucht, einen optimalen Pfad mit Hilfe der Vorwärtsintegration zu bestimmen. Hier werden die Schwierigkeiten dadurch hervorgerufen, dass die Startwerte der adjungierten Variablen in t

= 0 und zu jedem Systemwechsel

unbekannt sind. Die gewählte Lösungsmethode kann deswegen vermutlich nicht "den" wahren optimalen Pfad liefern. Dennoch ermöglicht sie es, eine Vorstellung über das Systemverhalten zu entwickeln, wobei die Dynamik auf den Annahmen über die Wahl der adjungierten Variablen zum Zeitpunkt der Systemwechsel (Seite 196) basiert. Durch eine anschließende Variation der jeweiligen Startwerte für AI und A2 erfolgt eine iterative Verbesserung des Lösungspfades. Änderungen der Annahmen über das Verhalten der adjungierten Variablen in den Systemsprüngen ermöglichen es ferner, ihre Plausibilität kritisch zu überprüfen. Legt man weiterhin die Standardwerte der Tabelle 1II.4 (Seite 198) zu Grunde, so ist zu Beginn der Kapitalstock Vk = 22,9884 und der Preis p = 62,0619 zu beobachten. Die genannten Werte ergeben sich aus dem langfristigen Gleichgewicht des unregulierten Monopols (Tabelle III.5, Seite 199). Sie sind entsprechend mit einer Rentabilität von s Die Rentabilität übersteigt damit die faire Rentabilität (s

= 0,8252 verbunden.

= 0,20), so dass die Entwicklung im

regulierten System startet. Die optimalen Startwerte für die adjungierten Variablen werden iterativ durch das bereits angesprochene Schieß verfahren bestimmt. So wird zunächst ein "beliebiges" Tupel (A 1(0), A2 (0» vorgegeben. Diese Werte bilden zusammen mit den beiden bekannten Startwerten Vk(O) und p(O) den Ausgangspunkt für das Computerprogramm. Die Vorwärtsintegration wird dann in

Übereinstimmung mit dem Programmablaufplan 1II.45 und III.46 durchgeführt. Anschließend sind die Anfangswerte für AI und )..2 zu variieren, bis schließlich durch eine Einschachtelung die besten Startwerte ermittelt worden sind, die sich am Kriterium des kumulierten diskontierten Gewinns orientieren. Hinsichtlich der Werte für die adjungierten Variablen in den Systemwechseln werden hier vorerst die Annahmen der Seite 196 unverändert beibehalten. Eine Variation dieser Werte wird später diskutiert (Seite 225). Zunächst ist festzustellen, dass für alle getesteten Startwerte Al (0) und A2(0) im Laufe der Entwicklung Systemwechsel auftreten. Allerdings ergeben sich zwei Klassen von Zeitreihen:

2 Verhalten des Angebotsmonopols bei Regulierung

211

• Eine Systementwicklung ist dadurch gekennzeichnet, dass der kumulierte Gewinn des Unternehmens durch die Regulierung negativ wird. Da sich das Unternehmen auch bei einer Fortsetzung der Berechnung aus dieser Situation nicht mehr erholt, kommt es zum Konkurs. • Die alternative Entwicklung ist durch ständige Systemwechsel charakterisiert, wobei der momentane Gewinn zwar immer kleiner, aber nie negativ wird. Die Ergebnisse der Iteration sind in der Tabelle m.7 zusammengefasst. Das Entscheidungskriterium fur die Optimalität eines Pfades ist der kumulierte diskontierte Gewinn nach 100 Jahren. Das Anfangstupel A\(O)

= 52,03 und A2(0) = 19,9 ist bereits durch eine grobere Abschät-

zung ermittelt worden, die hier nicht weiter erörtert wird. Alle Berechnungen beruhen auf einem Planungszeitraum von t

= [0, 100], da eine Verlängerung des Horizontes keine zusätz-

lichen Erkenntnisse liefert. Die dargestellten Ergebnisse enthalten Informationen dariiber, ab welchem Zeitpunkt ein negativer momentaner Gewinn (dritte Spalte) beziehungsweise ein negativer kumulierter Gewinn (vierte Spalte) auftritt, sowie die Zahl der Systemwechsel innerhalb der ersten 60 Jahre (fünfte Spalte). Die sechste Spalte enthält den maximalen Wert des kumulierten Gewinns, der im Zeitablauf erreicht wird. Für die Systemläufe, in denen der Gewinn nicht negativ wird, handelt es sich - wie auch die vorletzte Spalte zeigt - um den kumulierten Gewinn nach 100 Jahren. Bei den übrigen Systemläufen wird der kumulierte Gewinn angegeben, der sich einstellt, bevor der momentane Gewinn negativ wird. Diese Angabe ist als Vergleichsgröße relevant, weil das Unternehmen die Möglichkeit hat, in diesem Zeitpunkt die Produktion einzustellen, statt mit einem negativem Gewinn solange weiter zu produzieren, bis schließlich auch der kumulierte Gewinn negativ ist. Falls der maximale kumulierte Gewinn eines solchen Pfades größer ist als der, der durch eine alternative Entwicklung erreicht werden kann, so ist er entsprechend vorzuziehen. Da dieser Fall bei den Berechnungen nicht zu beobachten ist. entspricht der optimale Pfad einer Entwicklung, die zwar zu keiner Ruhesituation im Sinne eines Gleichgewichtes führt, aber für alle Zeitpunkte einen nichtnegativen momentanen Gewinn gewährleistet. Die folgenden Spalten geben die Werte für den Kapitalstock, den Preis, die Rentabilität, den momentanen und den kumulierten Gewinn an, die nach hundert Jahren erreicht werden. Da die Zeitreihen, die einen Konkurs des Unternehmens vermeiden, zu keinem Ruhezustand führen, sondern immer weitere Systemwechsel implizieren, enthalten die zugehörigen Zeilen jeweils die letzten beiden Werte, zwischen denen das System nach hundert Jahren wechselt. Für die Zeitpfade, die mit einem Konkurs des Unternehmens enden, sind die Angaben für den momentanen Gewinn und den kumulierten Gewinn nach 100 Jahren theoretischer Natur. Diese Werte werden nicht realisiert, denn das Unternehmen wird spätestens dann die Produktion einstellen,

~

ro

=

g-

i:;' -c:

m §

OQ

Q:I

§' er

~

~

=

ö"

~

~

~

ö' -

.f!: c: ~

~ .,

§

~

8.

c:

§

>-

§i

CI>

= =g

S" fD :;! .,

~.

3' ~ N.g

'"

= !!.o.

ro (") :r

3lE

~

.... !-' CI> -.I '< ..

_ ~ fr

N

~ ;l

19,9

"2(0)

19,9

-

3

52,1130552 19,9

52,030552 19,1!W997

52,030552 19,899996

52,030552 19,899995

-

-

-

52,030552 19,899994 51,0002 64,0002

4

4

2

2

3

3

3

32,0002 42,0002

3

3

3

3

3

2764855,72

325095,92

287272,63

211901,15

25829

25895

25935

26021

25152

24880

-66071638423,66

-51593536515,68

-28074920242,90

-756553090 Konkurs -1780586319 Konkurs

-1390391028 Konkurs

0,43 - 15,42

25829

25895

25935

-

0,49· 17,l!1

11, )() 99,25· 99,bl 0,2· 1,97 0,09 99,35 - 99,67 0,2-1,94

Opl. 0,54 - 19,79

26021

-309737323 Konkurs

-723709717 Konkurs 0,71- 26,76

-26856252377,45

-70098416888 Konkurs

0,13 98,87 - 99,42 0,2 - 2,03 0,11 99,17 . 99,57 0,2 - 1,98

0,00012

0,00001 -2600913735493,35

0,00001 -4183640987809,39 -112755524497 Konkurs

0,00001 -8030235882655,84 -216427730719 Konkurs

0,00001 -4777912031995,47 -128772119726 Konkurs

0,00008

0,00009

0,00012

-11495423405,95

50,00

50,00

50,00

50,00

50,00

50,00

50,00

50,00

50,00

zeichen

Kenn-

0,00018

135577,65

207250,14

21992 2039924,20

21471 2587200,88

20698 3584421,36

24523

24626

24863

25553 25829

0,43 -15,42

25829

4

0,09 99,35 - 99,67 0,2 -1,94

0,27 - 9,37

0,05 99,60 - 99,80 0,2 - 1,86

25553

25074

24813

24564

r(loo)

6

0,13 - 4,04

0,11 - 3,43

G(loo)

0,16 - 5,07

0,03 99,83 - 99,91 0,2 - 1,73

0,02 99,85 - 99,92 0,2- 1,71

s(loo)

0,03 99,78 - 99,89 0,2-1,76

24813

24564

p(lool

25074

8

10

15

Vk(loo)

#SW max nIl Werte nach 100 Jahren

30,0002 40,0002

28,0002 37,0002

30,0002 40,0002

44,0002 57,0002

45,0002 58,0002

47,0002 60,0002

-

-

-

-

$ aus der Differentialgleichung

p = 1{![$ - $] mit wobei neben $ auch der Parameter 1{! durch die Behörde festgesetzt wird. Gilt

$

< $ kann die

Unternehmung den Preis frei wählen, bis sie erneut die zulässige Rentabilität überschreitet und wieder einer Regelung des Preises unterliegt. Die Behörde verfügt also über zwei Größen, mit denen sie das Verhalten des Unternehmens beeinflussen kann: zum einen die obere Schranke für die Rentabilität $, zum anderen die Geschwindigkeit 1{!, mit der eine Preisänderung im Fall $

> $ vollzogen werden muss. Die beiden Steuergrößen 1{! und $ werden bei der folgenden

Analyse als Parameter und nicht als kontinuierlich veränderbare Größen verstanden. Als Beurteilungskriterium für die Vorteilhaftigkeit der Systementwicklung wird wie im vorherigen Modell der Barwert der Summe aus Konsumentenrente und Gewinn bezogen auf den betrachteten Planungszeitraum gewählt (vgl. die Seite 238). In Analogie zu den Berechnungen im Abschnitt 2.3 (Seite 184 ff.) wird auch bei den folgenden numerischen Rechnungen statt eines unendlichen Planungshorizontes ein Betrachtungszeitraum von t

E

[0, 100] zu Grunde

gelegt. Das zu betrachtende Wohlstandsmaß lautet damit in Analogie zu (3.10) W(lOQ)

=

1

100

0

e- rr [KR(t)

+ G(t)] dt,

(3.20)

wobei unterstellt wird, dass der Staat den gleichen Diskontsatz r wie das Unternehmen verwendet. Ergänzend wird Bezug zu alternativen Kriterien einer optimalen Regelung im Sinne des Kapitels II (Abschnitt 2.3) genommen. 3.3.2

Referenzwert ohne Regulierung

Wie bereits angekündigt worden ist, wird untersucht, ob die fallweise Preisregulierung einen Wohlstandsgewinn gegenüber der Situation ohne Regulierung ermöglicht. Dazu ist es in einem ersten Schritt notwendig, einen Referenzwert für den Wohlstand ohne Regulierung zu berechnen. Annahmegemäß befindet sich das Monopol zu Beginn in seinem langfristigen Gleichgewicht ohne Regulierung. Wie im Rahmen des Kapitels 1.2 (Seite 63 ff.) gezeigt worden ist, stellt dieser Punkt den Endpunkt der gewinnmaximierenden Trajektorie eines unregulierten Monopols dar, in dem das Unternehmen ohne Regulierung dauerhaft verbleibt. Die Spalte (a) der Tabelle III.5 auf der Seite 199 enthält für die Standardwerte der Parameter (Tabelle III.4, Seite 198) neben dem Gewinn des Unternehmens in diesem langfristigen Gleichgewicht, (;U = 1499,23, auch den gleichgewichtigen Preis

pU = 62,06,

von dem dann auf die zugehörige Konsumen-

251

3 Optimierung der Regulierung aus der Sicht der Behörde tenrente

iR" = [Y2 -

p"]2/[2YI]

= 719,65 geschlossen werden kann.78

Beachtet man, dass das Monopol ohne eine Veränderung der Rahmenbedingungen, also ohne eine Regulierung bei gewinnmaximierendem Verhalten in seinem langfristigen Gleichgewicht bleibt, so ist neben dem Gewinn G(t) auch die Konsumentenrente KR(t) konstant. Mit G(t)

G" und KR(t) = iR" resultiert

wo

=

[iR" + G"] [00 e-rldt

= -[iR" + G"{

-Ioor

r

1

-.

Für die unterstellten Standardwerte der Parameter erhält man somit W(1QO)

= -2218,88 e-100'r - 1 = 44078,58 = W"(1QO)

als Vergleichswert für die Analyse der Auswirkung der Regulierung. 3.3.3

WohlstandsefTekte bei fall weiser Preisregulierung mit Standardwerten f"tir die Re-

gulierungsparameter Die numerischen Ergebnisse, die für die Diskussion der Preisregulierung im Rahmen des Abschnitts 2.3 verwendet worden sind, beruhen auf Standardwerten für die Parameter, wie sie in der Tabelle lIlA zusammengefasst worden sind. Dabei wird im Hinblick die Regulierungsparameter ein Wert von

s = 0,20 für die zulässige Rentabilität und 1/1 = I für den Parameter

der Preisanpassung unterstellt. In einem ersten Schritt werden diese Parameterwerte beibehalten und darauf aufbauend der Wohlstandseffekt der Regulierung für diesen Standardlauf bei optimalem Verhalten des Unternehmens diskutiert. Im Anschluss werden im Abschnitt (d) die Werte für

s variiert und entsprechend die Werte für 1/1 in Abschnitt (e), um auf diese Weise Er-

kenntnisse darüber zu gewinnen, welche Parameterwerte eine möglichst günstige Entwicklung des Wohlstands in dem Sinne hervorrufen, dass der Wert des Integrals (3.20) maximal wird. Die Systementwicklung, die die Behörde nun mit Hilfe der Wohlstandsfunktion (3.20) beurteilt, ergibt sich aus der Lösung des Gewinnmaximierungsproblems des Monopols, das der fallweisen Preisregulierung mit jJ

= 1/I[s-s] für s ~ sunterliegt. Die gewinnmaximale Lösung

ist in analytischer beziehungsweise grafischer Form im Abschnitt 2.2 und numerisch im Teil 2.3 behandelt worden. Auf eine ausführliche Darstellung des Problems und der zugehörigen Optimumbedingungen wird an dieser Stelle verzichtet, da die benötigten Ergebnisse bekannt sind. Das System von Differentialgleichungen, aus dem sich die benötigten Werte G(t) und KR(t) 78

Die jeweiligen Größen sind mit genaueren Werten berechnet worden, die hier auf zwei NachkommastelIen gerundet angegeben werden.

Kapitel Iß Optimale Regulierung

252 für t E [0, 100] ergeben, lautet für alle t mit s

~

S

und für alle t mit s < S

Das Unternehmen befindet sich annahmegemäß bei Einführung der Regulierung im langfristigen unregulierten Gleichgewicht. Entsprechend sind die Startwerte für die Zustandsgrößen der Unternehmung, hier der Kapitalstock und der Preis, der Tabelle IIl.5 auf der Seite 199 (Spalte (a» zu entnehmen. Vk(O) = p(O)

vk =

22,9884

= ßU = 62,0619

Diese Werte entsprechen denjenigen der unregulierten Vergleichssituation und liefern somit für t

= 0 den gleichen Gewinn und die gleiche Konsumentenrente. Allerdings unterscheiden sich

die Werte der Zustandsvariablen für alle folgenden Zeitpunkte, da über die Differentialgleichung für den Preis und die Kozustandsgleichungen Veränderungen der Zustandsgrößen und damit von KR(t) und G(t) induziert werden. Wie die numerische Lösung des Problems im Abschnitt 2.3 zeigt, erweist es sich für die unterstellten Werte der Regulierungsparameter

s = 0,20

und 1/1 = 1 aus der Sicht einer gewinnmaximierenden Unternehmung als optimal, die Anfangswerte der adjungierten Variablen als

= 52,030552 1..2 (0) = 19,899995

AI (0)

zu wählen (vgl. hierzu die Tabelle Iß.7, Seite 212).

253

3 Optimierung der Regulierung aus der Sicht der Behörde

Die zugehörige Systementwicklung ist aus der Sicht der Unternehmung bereits ausführlich im Rahmen des Abschnitts 2.3 diskutiert worden. Der implizierte Wohlstand gemäß der Funktion (3.20) kann unter Verwendung des

e++-Programms berechnet werden, das bereits die nu-

merischen Werte im Abschnitt 2.3 geliefert hat. Zu diesem Zweck ist das Programm lediglich um eine zusätzliche Differentialgleichung erweitert worden, die die Änderung des kumulierten Wohlstands W (t) im jeweiligen Zeitpunkt angibt. Führt man die entsprechende Simulation für die unterstellten Standardwerte der Parameter

= 0,20 und 1jf = 1 durch, so ergibt sich W(lOO) = 47043,70 als kumulierter Wohlstand bei Regulierung gemäß (3.20) bezogen auf den Zeitraum t = [0, 100]. Ein Vergleich mit dem

S

Referenzwert W" (100) ohne Regulierung liefert W(lOO) > W"(lOO)

für

s=

0,20

und

1jf = 1.

Die Durchführung der fall weisen Regulierung führt gemessen am Barwert der kumulierten Summe aus Konsumentenrente und Gewinn zu einem Wohlstandsgewinn gegenüber dem entsprechenden Wert ohne Regulierung. Zur weiteren Analyse dieses Ergebnisses bietet es sich an. die Zeitpfade für den Gewinn und die Konsumentenrente heranzuziehen, die gemäß (3.20) beide mit dem gleichen Gewicht in die Zielfunktion der Behörde eingehen. Die oberen Teilgrafiken der Abbildung 11I.58 zeigen als durchgezogene Kurve die Entwicklung der Zeitwerte G(t) und KR(t) bei Regulierung und als gestrichelte Linie die konstanten Vergleichswerte des unregulierten Monopols G" beziehungsweise

iR".

Hinsichtlich einer allgemeinen Diskussion der Systementwicklung für diesen

Lauf ist auf die Seite 213 ff. zu verweisen. Als Zusammenfassung der dort dargelegten Ergebnisse ist hier zu betonen. dass der betrachtete Lauf das Resultat der Gewinnmaximierung des Unternehmens ist. wobei die optimalen Startwerte der adjungierten Variablen bis auf sechs NachkommastelIen exakt bestimmt worden sind. Der Pfad ist dadurch charakterisiert. dass der erste Systemwechsel nach mehr als 53 Jahren auftritt (vgl. die gepunktete Linie in den Grafiken für G(t) und KR(t» und das Unternehmen trotz der Regulierung den Gewinn relativ lange auf einem hohen Niveau halten kann. Man beachte ferner, dass der erste Systemwechsel um so später auftritt, je genauer die optimalen Startwerte der adjungierten Variablen bestimmt werden (Seite 219). Die Vorteilhaftigkeit des gewählten Pfades aus der Sicht der Unternehmung beruht insbesondere auf der Entwicklung in den ersten Dekaden. die auf Grund der vorgenommenen Diskontierung in der Ziel funktion - das Unternehmen maximiert den kumulierten diskontierten Gewinn - mit einem stärkeren Gewicht in die Zielfunktion eingehen. Ferner ist darauf zu

verweisen, dass ein Planungshorizont für eine Regulierung von 100 Jahren unrealistisch ist. Entsprechend wird den ersten Dekaden eine größere Bedeutung zugemessen und die folgende Entwicklung eher der Vollständigkeit halber in die Betrachtung eingeschlossen.

Kapitel m Optimale Regulierung

254 1600 rr---~-~---'--~----' 1400 - - - - - - - - ~ - - - G"- - - -

~ :~

1200 gl000 .~ 800

j

1200

c

600

ii 1000 ~ 800

" 0600 400 200 00

2000 1800

iR"

~ 400

20

200 00

100

30000r----r--~----~--_r--_.

~

20

80

100

25000 ...---r--~--r--~----,

j 20000

g 25000 .~ 20000

ii ~ IS000

o

tl 15000

~10000 .~'3 5000

ii

'310000 E ~ 5000 °0~--"2~0--~40~Ze-it-6~0'--'8~0~~I00

E

~

°0~-~2~0~-40*'Ze-it~60~-'8~0~~I00

50000r---~--~~::====~==~

"045000

B40000

:2 35000 °30000

~ 25000 l! 20000

:§ 15000 E10000

~ 5000

°0~--'2~0~~40~Ze-it~6~0~-'8~0~~I00

Abbildung rn.58: Wohlstandseffekte der Preisregulierung mit den Parametern i = 0,20 und t/f = I: Die beiden oberen Grafiken zeigen die Entwicklung des momentanen Gewinns G(t) und der momentanen Konsumentenrente KR(t); die unteren Grafiken veranschaulichen die Zeitpfade der kumulierten diskontierten Größen, also J~ e- rr G(r) dr, J~ e- rr KR(r) dr sowie W(t) = J~ e- rr [KR(r) + G(r)] dr.

Wie die linke obere Teilgrafik der Abbildung III.58 zeigt, liegt der momentane Gewinn G(t) im gesamten Zeitraum t E]O, 100] unterhalb des Wertes, den das unregulierte Unternehmen in seinem langfristigen Gleichgewicht realisiert. Das Monopol erleidet also durch die Regulierung einen Wohlstandsverlust. Wendet man sich der Nachfrageseite zu, so ergibt sich für den Zeitraum vor dem ersten Systemwechsel eine erhebliche Erhöhung der Konsumentenrente KR(t). Sie erreicht vor dem ersten Sprung mehr als die doppelte Höhe des Ausgangswertes

iR",

so dass eine wesentliche Wohlstandsverbesserung der Konsumenten zu verzeichnen ist.

In der Folgezeit sinkt die Konsumentenrente unter den Wert

iR" ohne Regulierung und nähert

sich langfristig sogar null, so dass auch die Konsumenten einen momentanen Wohlstandsverlust im Vergleich zur unregulierten Referenzsituation erleiden. Der sägezahnförmige Verlauf wird durch die gegenläufige Entwicklung des Preises hervorgerufen (vgl. die Abbildung 111.51, Seite 214). Dabei schnellt der Preis in den jeweiligen System wechseln auf ein höheres Niveau,

255

3 Optimierung der Regulierung aus der Sicht der Behörde

wird dann aber über die wieder einsetzende Regulierung erneut gesenkt. Diese Preisentwicklung spiegelt sich in den Phasen, in denen der Preis reduziert wird, in einem Anstieg der Konsumentenrente wider, wobei im Zeitpunkt des Systemwechsels jeweils ein erheblicher Abfall der Konsumentenrente zu beobachten ist. Die Entwicklungen der kumulierten diskontierten Werte f~ e- n G( 1') d1' und f~ e- rr KR( 1') d1' sind in den bei den folgenden Teilgrafiken der Abbildung rn.58 dargestellt. Durch die Diskontierung gehen die Werte nach dem ersten Systemwechsel bereits mit einer sehr geringen Gewichtung ein. Die sägezahnförmige Entwicklung schlägt sich nicht mehr sichtbar im Verlauf der kumulierten Größen nieder. Da allerdings die Zeitwerte des Gewinns G(t) und der Konsumentenrente KR(t) für alle t

E

[0, 100] positiv sind, weisen die Kurven für die kumulierten

Größen eine positive Steigung auf, die sich jedoch auf Grund der Reduktion der jeweiligen Zeitwerte und durch die Diskontierung im Zeitablauf verringert. Das kumulierte Wohlstandsmaß W(t)

= f~ e- rr [KR(1') + G(1')] dt der Regulierungsbehörde kennzeichnet entsprechend

eine positive, aber abnehmende Steigung. Dabei ist daran zu erinnern, dass die numerischen Ergebnisse für den kumulierten, diskontierten Wohlstand W' nach 100 Jahren gezeigt haben, dass W'(1QO) > W"(1QO) ist, so dass die Regulierung einen Nettowohlstandsgewinn verzeichnet. Obwohl also langfristig die Zeitwerte des Gewinns und der zugehörigen Konsumentenrente unterhalb der jeweiligen Werte ohne Regulierung liegen, bewirkt die Regulierung einen Wohlstandsgewinn gemessen am Barwert der kumulierten Summe aus beiden Größen bezogen auf den gesamten Planungszeitraum. Zumindest für die gewählten numerischen Spezifikationen kompensieren die kumulierten diskontierten Wohlstandsgewinne der Konsumenten in der Phase vor dem ersten Systemwechsel die späteren diskontierten kumulierten Wohlstandsverluste der Konsumenten und die diskontierten Gewinneinbußen der Unternehmen. Um die Wohlstandseffekte der Regulierung im Vergleich zur Referenzsituation besser analysieren zu können, ist es sinnvoll, statt der Größen G und KR sowie des aggregierten diskontierten Wohlstandsmaßes W, die Abweichungen der Zeitpfade von den jeweiligen Pfaden heranzuziehen, die sich ohne Regulierung im langfristigen Gleichgewicht einstellen. Zur Erleichterung der Schreibweise werden dabei die Definitionen b.G := G(t) -

G"

und

b.KR:= KR(t) _

iR"

verwendet. Wie bereits bei der Diskussion der beiden oberen Teilgrafiken der Abbildung rn.58 erläutert worden ist, bewirkt die Regulierung im gesamten Betrachtungszeitraum einen Verlust an Gewinn, da G(t)
W"(lOO) gilt. Hingegen liegt der erzielte Wert W(lOO) für den relativ hohen Wert s

= 0,7 unter dem Referenzwert.

Damit tritt bei

dieser Konstellation durch die Regulierung ein Wohlstandsverlust gegenüber dem langfristigen

261

3 Optimierung der Regulierung aus der Sicht der Behörde

Gleichgewicht ohne Regulierung auf. Der erzielte Zugewinn an Konsumentenrente reicht nicht aus, die Gewinneinbußen des Monopols zu decken, obwohl diese Verluste gegenüber den Ergebnissen bei alternativen Werten von

s noch relativ gering sind. Berechnet man die relativen

Abweichungen des kumulierten Gewinns und der kumulierten Konsumentenrente gegenüber dem jeweiligen Referenzwert ohne Regulierung, so ist festzustellen, dass eine relative Gewinneinbuße von 4% und ein relativer Zuwachs an Konsumentenrente von ca. 7% auftritt, was sich in einem Nettowohlstandsverlust von 0,7% niederschlägt.

s

Hinsichtlich der Änderung von W(IOQ) mit lässt sich festhalten, dass der kumulierte Wohl-

s von der Entwicklung der Konsumentenrente dominiert s. Ebenso resultieren die lokalen Maxima der kumulierten Konsumentenrente bezüglich s in einem lokalen Maximum von W(100) bei s = 0,01 beziehungsweise s = 0,05. Ein zusätzliches lokales Maximum tritt für s = 0,10 auf. Der höchste Zielfunktionswert W(1OQ) wird für s = 0,01 erzielt, also

stand W(1OQ) bei einer Variation von

wird. Wie Jo100 e-r< KR(r)dr steigt auch W(1OQ) bei einer Reduktion von

wiederum für einen extrem kleinen Parameterwert. Wie bei der Konsumentenrente ist anzumerken, dass die Niveaus des kumulierten Wohlstandes im Bereich der lokalen Maxima nahezu konstant sind, so dass nicht ausgeschlossen werden kann, dass die lokalen Maxima auf Rechenungenauigkeiten zurückzuführen sind. Eindeutig ist allerdings das Ergebnis, dass aus der Sicht der Behörde sehr kleine Werte von sgegenüber solchen Werten bevorzugt werden, die nur wenig unterhalb von s" liegen.

Das Resultat eines extrem kleinen optimalen Wertes

s ist insofern bemerkenswert, als der = s gilt. Be-

Preis bei dieser Wahl der Regulierungsparameter solange gesenkt wird, bis s

rücksichtigt man, dass seine Bruttorentabilität bezeichnet, die ausreichend groß sein muss, um neben den auftretenden Anpassungskosten für die Bruttoinvestitionen auch die Nutzungskosten für den Kapitalstock [r + 8]Qkvk zu decken, erstaunt es, dass der wohlstandsmaximierende Wert S so nahe bei null liegt. Aus diesem Grund liegt es nahe, die resultierenden Zeitpfade für die Rentabilität, den momentanen Gewinn und die momentane Konsumentenrente zu analysieren (Abbildung III.60). Daneben werden in der Abbildung III.61 die zugehörigen Abweichungen der Wohlstandsmaße gegenüber der Situation ohne Regulierung betrachtet. Wie den Zeitpfaden in der Abbildung III.60 zu entnehmen ist, sinkt der Gewinn für s

= 0,01

zunächst schneller als im Standardlauf. Außerdem treten die Systemwechsel, die jeweils in den Zeitpunkten stattfinden, in denen der Gewinn beziehungsweise die Rentabilität hochschnellt, verzögert auf. Hinsichtlich der Gewinnentwicklung fällt besonders auf, dass bei dem geringeren Wert

s im ersten Systemwechsel ein relativ hoher momentaner Verlust entsteht,

während der

Gewinn im Standardlauf zwar sinkt, aber positiv bleibt. Der hier zu beobachtende Verlust ist

s

darauf zurückzuführen, dass extrem klein ist, so dass der zulässige Bruttogewinn px- qa Va bei einem positiven Kapitalstock nicht ausreicht, die Kapitalkosten zu decken. Durch die simultane

262

Kapitel

m Optimale Regulierung

l~r---~--~--~----~--,

1400 1200

1000

:3800

' !i~

~400 200

o

·200 .400 0~----:;2'n0---.':40":ze-it-:60tn--oS'n 0 ----d,100

2,S

100

..----r--~--~--..----,

2

~ l,s ~

"

=

c::!

O.S

Abbildung III.60: Entwicklung des Gewinns, der Konsumentenrente und der Rentabilität für i = 0,01 im Vergleich zum Referenzlauf mit i = 0,20: Die Grafiken zeigen jeweils die Zeitpfade für den Parameterwert i = 0,01 als durchgezogene Kurve und die entsprechenden Pfade für den Standardlauf mit i = 0,20 als gestrichelte Kurve. Zur Orientierung ist ferner in der Grafik für den Gewinn eine horizontale gestrichelte Linie für den Nullgewinn eingezeichnet worden.

Reduktion des Kapitalstocks ist das Unternehmen in der Lage, in der Folgezeit hohe Verluste zu vermeiden und nähert sich wie im Standardlauf einer Situation mit Nullgewinn. Vergleicht man in der Abbildung III.60 den Zeitpfad der Konsumentenrente bei

s=

0,01

mit der Entwicklung im Standardlauf (Abbildung III.60, rechts oben), so zeigt sich, dass der neue Zeitpfad für

s = 0,01 fast immer oberhalb der Konsumentenrente im Standardlauf liegt,

wodurch auch die Vorteilhaftigkeit des hier diskutierten Pfades bedingt ist.

s = 0,01 bezies = 0,20 auf Grund der Regulierung im Vergleich zur Situation ohne Regulierung

Die Abbildung III.61 zeigt die Wohlstandseffekte, die sich in den Fällen hungsweise

auftreten. Im Einzelnen ist der Barwert der kumulierten Gewinneinbußen des Unternehmens J~ e- rT 6.G dr, der Barwert des Zuwachses an Konsumentenenrente J~ e- rT 6. KR dr und die

Abweichung des aggregierten Wohlstandsmaßes 6. W dargestellt. Wie in der vorhergehenden Grafik beziehen sich dabei die durchgezogenen Kurven auf den Fall gestrichelte Linie die Ergebnisse des Standardlaufs mit

s=

s = 0,01, währende die

0,20 veranschaulicht. Die Pfade

verdeutlichen, dass die kumulierten und diskontierten Gewinneinbußen

J; e-

rt

6.G dr im Be-

trachtungszeitraum auf Grund der implizierten schnelleren Preisreduktion größer als im Standardlauf sind. Hingegen ist der Barwert des Wohlstands gewinns aus der Sicht der Konsumen-

263

3 Optimierung der Regulierung aus der Sicht der Behörde

...2

-1000

~ ~-2000

,~.[i

" "-3000

t::0

1l

~-4000

E -5000 ..."'"

"

-6000 O~-~---tn--;J-;;;--':;''----I';'oo 80 20 40 Zeit 60

6000 =5000 = M·[i 4000

"" ]~3000

"B §'"

2000

/

/ /

/

-""=§ 1000 ~

0 -1000 0

20

40 Zeit 60

80

100

Abbildung III.61: Zeitpfade für den optimalen Parameterwert s = 0,01 im Vergleich zum Standardlauf mit s = 0,20: Die Grafiken zeigen für beide Parameterwerte die kumulierten Barwerte der Abweichungen der Wohlstandsmaße gegenüber der unregulierten Referenzsituation, also J~ e- n t.G dr, f~ e- rr t.KRdr sowie t. W. Die Zeitpfade für den wohlstandsmaximierenden Wert s = 0,01 werden dabei als durchgezogene Linie dargestellt, während sich die gestrichelten Zeitpfade auf die Pfade des Standardlaufs mit s = 0,20 beziehen. ten, f~ e- n tl. KR dr, im gesamten Betrachtungszeitraum für

s = 0,01 größer als im Standard-

lauf. Hinsichtlich der Vorteilhaftigkeit der Regulierung zeigt sich ebenfalls, dass der Barwert des aggregierten Wohlstandszuwachses gegenüber der Situation ohne Regulierung bei der Parameterwahl

s=

0,01 für alle Zeitpunkte t E [0, 100] größer als im Standardlauf ist. Dieses

Ergebnis ist insofern von Bedeutung, als der Planungshorizont von 100 Jahren unrealistisch ist. Da tl. Wallerdings im optimalen Lauf für alle Zeitpunkte größer als in allen alternativen Läufen und positiv ist, bleibt die Vorteilhaftigkeit der betrachteten Parameterkonstellation auch bei einem kürzeren Planungszeitraum erhalten.

3.3.5

Variation der Anpassungsgeschwindigkeit

In Analogie zur Vorgehensweise bei der Optimierung des Parameters S, der zum einen über die Differentialgleichung Bedingung s

~

zweite Parameter

p = 1fr[s -

s] das Ausmaß der Preissenkung, zum anderen über die

s den Gültigkeitsbereich der Differentialgleichung bestimmt,

wird nun der

1fr variiert, über den die Behörde die Geschwindigkeit steuern kann, mit dem

sich die Rentabilität dem Wert s annähert. Um die Effekte einer Änderung von 1fr analysieren zu

s

können, wird der Parameter konstant auf dem Standardwert

s = 0,20 gehalten. Die Ergebnisse

Kapitel m Optimale Regulierung

264 einer Variation von 1{!

'\'1 (0)

1/1 sind in der Tabelle m.9 zusammengefasst worden. '\'2(0)

folOO e-rTG(r)dr fd OO e-r< KR( r)dr

W(lOQ)dt Zeitpunkt des

I. Wechsels 1,0 52,030552 19,899995 1,4 54,007130 19,999999

26021,64

21022,06 47043,70

53,3965

24510,14

22882,73 47392,87

47,7211

1,5 54,468725 19,999992

24184,78

23445,60 47630,38

47,4210

1,6 54,919455 19,999993

23840,18

23820,48 47660,66

46,2364

1,7 55,359948 19,999995

23494,18

24069,80 47563,98

44,6322

1,8 55,790800 19,999999 1,9 56,212574 19,999993 2,0 56,625806 19,999999

23154,91

24240,53 47395,44

42,9135

22846,77

24363,70 47210,46

41,1357

22539,94

24443,01 46982,95

39,4642

Tabelle III.9: Variation der Anpassungsgeschwindigkeit 1{! bei konstantem Wert s = 0,20 Eine Veränderung des Parameters

1/1 erfordert zunächst wieder eine Bestimmung der gewinn-

maximierenden Startwerte der Kozustandsvariablen durch die Unternehmung. Die Werte Al (0) und A2 (0), die sich bei alternativen Werten für

1/1

(Spalte I. Tabelle III.9) aus der Sicht der

Unternehmung als optimal erweisen, werden in der zweiten beziehungsweise dritten Spalte der Tabelle III.9 angegeben. Die folgenden drei Spalten enthalten wiederum die kumulierten Barwerte des Gewinns und der Konsumentenrente sowie das aggregierte Wohlstandsmaß W(lOO) gemäß (3.20), Seite 250. Die letzte Spalte liefert den jeweiligen Zeitpunkt, in dem die Regulierung erstmalig wegen s
..(t)[x(t) - x'(t))

_00

für alle zulässigen Zeitpfade u folgt, falls die maximierte Harnilton-Funktion konkav in den Zuständen ist. l Somit gewährleistet (1.6), dass es keine Trajektorie gibt, die einen höheren I

Ein ausführlicher Beweis dieser Bedingung erfolgt in Feichtinger, Hartl (1986), Seite 43.

V Anhang

314

Wert der Zielfunktion bewirkt, da (1.6) J(u') ~ J(u) impliziert. Der Zeitpfad u', der neben (1.4) und (1.5) auch die Grenztransversalitätsbedingung (1.6) erfüllt, ruft damit die optimale Entwicklung des Systems hervor (vgl. Satz 1.1 und 1.2, Seite 314). Die Konkavität der maximierten Hamilton-Funktion kann zum Beispiel über die Konkavität der Hamilton-Funktion in den Zuständen und den Steuergrößen geprüft werden (Feichtinger, Hartl (1986), Seite 37). Ist die maximierte Hamilton-Funktion nicht konkav, so sind die Bedingungen 1.4 und 1.5 lediglich notwendig für eine optimale Systementwicklung. Sie liefern also lediglich Kandidaten für eine optimale Lösung. Ein Weg sicherzustellen, dass ein solcher Kandidat wirklich eine optimale Lösung ist, besteht darin zu zeigen, dass die als optimal bezeichnete Systementwicklung die einzige ist, die die notwendigen Bedingungen erfüllt (Feichtinger, Hartl (1986), Seite 34). Einen Überblick über alternative Grenztransversalitätsbedingungen, die zur Bestimmung der optimalen Lösung herangezogen werden, bieten Barro, Sala-i-Martin (1995), Seite 504. Ergänzend ist anzumerken, dass im Standardproblem der optimalen Kontrolle, das eine Diskontierung und eine maximierte Hamilton-Funktion aufweist, die konkav in den Zuständen ist, zumeist ein Sattelpunkt existiert. Nähert man sich diesem Punkt und verbleibt in ihm, so sind die genannten Bedingungen des Maximumprinzips einschließlich der Grenztransversalitätsbedingung erfüllt. Dieser Pfad stellt dann die optimale Lösung des Systems dar. Abschließend können die notwendigen Bedingungen für den Standardfall der optimalen Kontrolle bei unendlichem Zeithorizont wie folgt zusammengefasst werden: Satz 1.1 (Maximumprinzip für unendlichen Zeithorizont) Notv.'endig für die Optimalität

eines zulässigen Paares (x', u') ist die Existenz einer Konstanten Ao

~

0 und einer Kozu-

standsfunktion Ä(t), so dassfür kein t E [0, oo[ der Vektor (Ao, Ä(t) verschwindet, und dass mit Jf

= AoF(x, u) + ÄTf(x. u)

(1.7)

die Bedingung Jf (x', u·. AO, 1)

= max Je (x', u, AO, Ä) DEn

(1.8)

erfüllt ist und an jeder Stetigkeitsstelle von u' die Bedingung

i

= r1 _

gilt (Feichtinger; Hartl (1986), Seite 39).

aJf(x', u', Ao.1)

ax

(1.9)

315

I Mathematische Grundlagen

Satz 1.2 (Hinreichende Optimumbedingungen bei unendlichem Zeithorizont) Sei u' mit zugehöriger Zustandstrajektorie x· eine zulässige Lösung für das Problem der optimalen Kontrolle. Des Weiteren sollen Funktionen l.(t) E lRn existieren, so dass zusätzlich dingungen (1.8) und (1.9) mit der Hamilton-Funktion J{(x, u,l.) = F(x, u)

zu

den Be-

+ l.Tf(x, u) die

Grenztransversalitätsbedingung

lim e- rr (l.(t» T[X(t) - x· (t)] ~ 0

r->oo

(1.10)

für jede zulässige Trajektorie x(t) gilt. Dann ist u·(t) eine optimale Lösung des Problems, wenn

maxuell J{ (x, u, l.) für alle Paare (t, l.(t» konkav in x ist (Feichtinger, Hartl (1986), Seite 42). Zur weiteren Lösung des Systems können zunächst analytische Verfahren herangezogen werden. Da das entstehende Differentialgleichungssystem interdependent ist, ist diese Verfahrensweise zumeist sehr aufwendig. Alternativ hierzu können Phasendiagrarnme herangezogen werden, die einen Einblick in das dynamische Verhalten bieten. Für eine genauere Darstellung dieser Vorgehensweise ist auf die Seiten 292 ff. dieses Textes zu verweisen. Hinweise zur numerischen Ermittlung des optimalen Pfades finden sich auf den Seiten 319 ff. (b) Probleme mit endlichem Zeithorizont Im Rahmen dieser Arbeit werden Probleme mit unendlichem Zeithorizont behandelt. Der Vollständigkeit halber wird hier ein entsprechendes Optimierungsproblem für einen endlichen Planungszeitraum angeführt. Ein solches Optimumproblem besitzt die Form max u

l

T

0

e- rr F(x, u) dt+ e- rT S(x(T), T)

unter den Nebenbedingungen

(1.11)

x= fex, u), x(O)

= Xo,

U E Q.

Im Unterschied zu den zuvor betrachteten Optimierungsproblemen ist der Planungshorizont T fix vorgegeben. In der Zielfunktion taucht ferner der Term e- rT S(x(T), T) auf, der den diskontierten Restwert oder Schrottwert der Zustandsgröße x am Ende des Planungszeitraums angibt. Bezogen auf das ökonomische Beispiel, in dem der kumulierte Gewinn unter Berücksichtigung einer Bewegungsgleichung für den Kapitalstock maximiert wird, umfasst die Zielfunktion also zusätzlich zum Barwert des Gewinns auch den Barwert, der dem Kapitalstock am Ende des Planungszeitraums beigemessen wird. Gemäß Feichtinger, Hartl (1986), Seite 18, lautet die entsprechende Harnilton-Funktion J{(x, u, Ao,l.)

= AoF(x, u) + l.Tf(x, u).

V Anhang

316

Die notwendigen Bedingungen für eine optimale Lösung (x', u') umfassen die Maximierung dieser Funktion für alle Zeitpunkte

t E

[0,

Tl. also (1.8), die adjungierte Gleichung (1.9) und

die Transversalitätsbedingung >"(T)

= >"0 aS(x'(T), T) .

ax

Sofern die maximierte Hamilton-Funktion konkav ist, sind diese Bedingungen auch hinreichend für ein Maximum. Zur Abgrenzung von dem zuvor diskutierten Problem mit einem unendlichen Zeithorizont ist die Transversalitätsbedingung zu beachten, die den Wert der adjungierte Variablen im Zeitpunkt t angibt. Statt der Ungleichung (1.6) ist hier ein expliziter Endwert der Variablen zu erfüllen, der der Änderung des Schrottwertes bei einer marginalen Änderung der Zustandsgröße im Endzeitpunkt T entspricht.

1.3.2 Optimierung unter Nebenbedingungen in der Form von Ungleichungen Im Rahmen der Kontrolltheorie unterscheidet man zwei Arten von Nebenbedingungen. Zunächst gibt es die sogenannten reinen Nebenbedingungen der Zuslandsvariablen, die sich lediglich auf die Zustands variablen beziehen. Sie besitzen die Form g(x(t). t)

~

O.

Da die Optimierung dynamischer Systeme unter Berücksichtigung solcher Nebenbedingungen zu sehr komplexen Optimumbedingungen führt und in dieser Arbeit nicht benötigt wird, wird auf die Erläuterung des Maximumprinzips für diesen Fall verzichtet. Eine Diskussion dieser Probleme erfolgt zum Beispiel in Seierstad, Sydsreter (1987) auf den Seiten 313 ff. Neben reinen Nebenbedingungen können in Optimierungsproblemen sogenannte gemischte Nebenbedingungen vorliegen, die die Form

g(x(t), u(t), t)

~

0

(1.12)

besitzen. Während die reinen Nebenbedingungen nur von den Zustandsvariablen x(t) und der Zeit t abhängen, enthalten die gemischten Nebenbedingungen insbesondere die SteuervariabJen u(t). Sie sind als Bedingungen an die Steuervariablen u(t) für gegebene Werte der Zustands-

variablen x(t) und der Zeit t zu verstehen (Leonard, Long (1992), Seite 188). Im Folgenden wird das Lösungsverfahren für einen Optimierungsansatz mit gemischten Ne-

317

I Mathematische Grundlagen benbedingungen g(x, u)

= (gi (x, u), ... , gs(x, u» max u

T

vorgestellt, der die Form

[00 e-rr F(x, u) dt

Jo

unter den Nebenbedingungen

(1.13)

x= fex, u), x(O) = Xo,

g(x, u)

~

0,

u~O

besitzt (vgl. hierzu Seierstad, Syds::eter (1987), Seite 269 ff.). Das Optimierungsproblem ist ein Spezialfall des Standardansatzes (1.3), der auf der Seite 311 vorgestellt worden ist. So legen die Nichtnegativitätsbedingungen zusammen mit gemischten Nebenbedingungen den Raum Q der zulässigen Werte für die Steuervariablen u fest, Q(x)

= (ul g(x, u) ~ 0/\ U

~

O}.

Man beachte, dass der Bereich der zulässigen Steuergrößen im jeweiligen Zeitpunkt t vom aktuellen Wert der Zustandsvariablen abhängt. Die Vorgehensweise wird in Anlehnung an die statischen Optimierung unter Nebenbedingungen und am Standardproblem der optimalen Kontrolle erläutert. Die Lösung statischer Probleme unter Berücksichtigung von Nebenbedingungen erfolgt unter Verwendung der Lagrange-Funktion. In diese modifizierte Ziel funktion werden neben der ursprünglichen Zielfunktion

auch die Nebenbedingungen einbezogen. Liegen Nebenbedingungen in Ungleichungsform und Vorzeichenbedingungen für die Variablen vor, lässt sich das Optimum mit Hilfe der KuhnTucker-Bedingungen beschreiben. Die Lösung des hier betrachteten intertemporalen Optimierungsansatzes erfolgt in entsprechender Weise. Diese Analogie ist darin begründet, dass der dynamische Ansatz wie auch im Standardproblem der optimalen Kontrolle zunächst in eine Schar von statischen Optimierungsproblemen zerlegt wird. Daraus wird dann die Lösung des eigentlichen dynamischen Problems abgeleitet. Im ersten Schritt wird die Hamilton-Funktion J( (x,

u, 1, t)

= AoF(x, u) + lTf(x, u)

gebildet und für jeden Zeitpunkt t durch geeignete Wahl der Steuergrößen u'

E

Q(x) maxi-

miert. Zur Erleichterung der Schreibweise wird unterstellt, dass der Vektor (AO, 1) zu keinem Zeitpunkt t Null wird, so dass AO auf Eins normiert werden kann. Da der Bereich Q(x) Ungleichungen enthält, werden die optimalen Steuergröße u' mit Hilfe der Lagrange-Funktion und den zugehörigen Kuhn-Tucker-Bedingungen ermittelt. Die Lagrange-Funktion des hier

V Anhang

318 betrachteten Problems lautet: .c(x. u.l.. p.. t) wobei u

~

0 und p.

~

= Jl(x. u.l.. t) + p.Tg(X(t). U(t). t).

0 zu berücksichtigen ist und p. den Vektor der Lagrange-Multiplikatoren

bezeichnet. Die Optimierung erfolgt über die Auswertung der Kuhn-Tucker-Bedingungen: a.c < 0 aUj

=.

a.c ~ 0 - •

a~k

a.c -Uj=O. aUj a.c a~k=O. ~k

Uj ~O

ftlr ;= I ..... m.

~k ~O

ftlr k = I ..... s.

Die Auswertung der Kuhn-Tucker-Bedingungen liefert eine optimale Steuervariable u*. die ftlr alle Zeitpunkte t die Ungleichung Jl(x*(t). u*(t).l.(t), t)

~

max Jl(x*(t), u,l.(t), t)

uen(x)

gewährleistet. Um sicherzustellen, dass man die optimalen Werte der Kontrollvariablen u*(t) berechnen kann, muss das Problem wie bei einer statischen Optimierung bestimmmten Regularitätsbedingungen genügen. Die am häufigsten verwendete Bedingung ist die sogenannte Rangbedingung. Demnach muss der Rang der Matrix, die die partiellen Ableitungen der Beschränkungen nach den Kontrollvariablen enthält, mit der Zahl der bindenden Beschränkungen übereinstimmen. Die Rangbedingung impliziert, dass die Zahl bindender Beschränkungen nicht größer als die Zahl der Kontrollvariablen sein kann (Uonard, Long (1992), Seite 187 ff.). Neben der Maximierung der Hamilton-Funktion für alle Zeitpunkte t erfordert das Pontryaginsche Maximumprinzip die Gültigkeit der adjungierte Kozustandsgleichung, die die Änderung der Schattenpreise l. im Zeitablauf beschreibt (vgl. Satz 1.1). Überträgt man diese Bedingung auf das hier diskutierte Optimierungsproblem mit Nebenbedingungen, so lautet die entsprechende Kozustandsgleichung i(t)

= rl.(t) _

a.c(x*(t), u*(t),l.(t), ~(t), t)

ax

(Feichtinger, Hartl (1986), Seite 161). In diese Gleichung geht jetzt an Stelle der Ableitung der Hamilton-Funktion die Ableitung der Lagrange-Funktion nach der Zustandsvariablen

a.lO aJl(·) Tag(·) --=--+p. - -

ax

ax

ax

ein. In der adjungierten Gleichung (1.4), Seite 312, ist also zusätzlich zur Ableitung der Hamilton-Funktion der Term ~Tag(. )/ax zu berücksichtigen. Dieser Term stellt den mit dem Schattenpreis ~ bewerteten Effekt einer Änderung von x auf den zukünftigen Zustandsraum Q(x)

319

I Mathematische Grundlagen dar, der durch die Nebenbedingungen g(x, u)

~

0 beschrieben wird (Uonard, Long (1992),

Seite 192). Als weitere Optimumbedingung ist die Transversalitätsbedingung zu erfüllen, die mit deIjenigen des Standardproblems übereinstimmt (vgl. Feichtinger, Hart! (1986), Seite 163). Gemäß Uonard, Long (1992), Seite 213, sind die genannten Bedingungen auch hinreichend für die Optimalität eines Zeitpfades (x'(t), u'(t», wenn die Lagrange-Funktion konkav in (x, u) ist. Wenn die Lagrange-Funktion streng konkav ist, so ist die optimale Lösung eindeutig.

1.3.3 Numerische Lösung von Kontrollproblemen (a) Vorwärtslösung Aus dem Maximumprinzip für Probleme mit unendlichem Zeithorizont (Seite 310) folgen im Standardfall • Bedingungen für die optimalen Steuergrößen u' aus der Maximierung der HamiltonFunktion, • ein System von Differentialgleichungen, das zum einen die Bewegungsgleichungen

x=

f(x, u*) sowie die adjungierten Kozustandsgleichungen

i = rA-

aJe(x*, U*,A)

ax

enthält, wobei hier davon ausgegangen wird, dass Ao auf eins normiert werden kann, • die Anfangsbedingungen für die Zustandsvariablen x*(O)

= Xo,

• die Grenztransversalitätsbedingung limr-oo e- rt AT[X - x*] ~ O. Existiert ein Gleichgewicht und ist die Determinante der lacobi-Matrix des Systems negativ, so handelt es sich bei dem Gleichgewicht um einen Sattel punkt und der zugehörige SatteIpfad repräsentiert - zumindest im Standardfall - die optimale Lösung des Problems, die auch die Grenztransversalitätsbedingung erfüllt. In einem solchen Fall ist durch die Grenztransversalitätsbedingung eine Endbedingung für die Zustandsvariablen und die adjungierten Kozustandsvariablen gegeben, die im Folgenden als lim x*(t)

1-->00

=x

g

geschrieben wird. Wie auf den Seiten 298 ff. erläutert worden ist, unterscheiden sich die Lösungsmethoden für Differentialgleichungssysteme danach, ob es sich um ein Anfangswertproblem oder um ein

V Anhang

320

Randwertproblem handelt. Während bei einem reinen Anfangswertproblem nur Startwerte für die Variablen vorliegen, existieren bei einem Randwertproblem Bedingungen für die Systemvariablen in zwei Zeitpunkten. Betrachtet man vor diesem Hintergrund das dynamische Problem, das aus der Anwendung des Maximumprinzips im Standardfall der optimalen Kontrolle resultiert, ist zunächst festzuhalten, dass es sich um ein Randwertproblem handelt. So sind Bedingungen für den Zeitpunkt t

= 0 und für t

-+

00

gegeben. Allerdings wird ferner deutlich, dass das zu lösende Problem

durch zwei Besonderheiten gekennzeichnet ist. • Die Endbedingung liegt nicht für einen gegebenen Endzeitpunkt, sondern nur im Grenzübergang t -+

00

vor.

• Die Anfangsbedingung gibt nicht für alle Variablen Anfangswerte vor, sondern nur Bedingungen für einige Komponenten des Startvektors, nämlich für die Zustandsvariablen; die Startwerte für die adjungierten Kozustandsvariablen sind hingegen nicht gegeben. Die erste Anmerkung ist relativ unproblematisch. Zunächst ist anzumerken. dass sich die in der Literatur zu findenden Algorithmen zur Lösung von Randwertproblemen im Allgemeinen auf einen endlichen Zeithorizont beziehen. Allerdings erfolgt bereits in Collatz (1966) ein Hinweis auf dieses Problem. Als möglichen Lösungsweg für ein Randwertproblem mit unendlichem Zeithorizont schlägt Collatz (1966) vor. die Randbedingung für unendlichen Zeithorizont durch eine entsprechende Bedingung für einen endlichen Endzeitpunkt T zu ersetzen. Dann ist das Problem für eine Sequenz von Endzeitpunkten T zu lösen. Damit erhält man eine Folge von Lösungen für die Variablen in den jeweiligen Zeitpunkten. Sie können dann extrapoliert werden. so dass man auf den Wert der Variablen in den jeweiligen Zeitpunkten bei unendlichem Zeithorizont des Problems schließen kann. Ferner ist zu berücksichtigen, dass hier ein Pfad gesucht wird. der in einen Sattelpunkt führt. Wird ein solcher Sattelpunkt einmal erreicht, so verbleibt das System in diesem Punkt. Sofern das System aber bereits bei einem endlichen Zeithorizont in den Sattelpunkt gelangt, führt eine weitere Verlängerung des Zeithorizontes zu keinen Veränderungen des Pfades mehr. Schwierigkeiten birgt jedoch die zweite Besonderheit. So konzentriert sich die folgende Betrachtung auf das Problem, die fehlenden Werte des Startvektors für die adjungierten Variablen zu ermitteln, so dass sich das System für die gegebenen Anfangswerte der Zustandsvariablen gerade auf dem gesuchten Sattelpfad entwickelt. Zur Verdeutlichung wird das Phasendiagramm für ein Standardproblem der optimalen Kontrolle aufgegriffen, nämlich das Ramsey-Modell (Barro. Sala-i-Martin (1995), Seite 73). In diesem Fall ist ein System von zwei Differentialgleichungen zu lösen - eine für den Pro-KopfKapitalstock k und eine für den Konsum c -, wobei eine Anfangsbedingung für den Kapitalstock

321

1 Mathematische Grundlagen c(t)

c(k)

c& Co

c'o'

'-------'-_ _----'-_--'_ _ _ _ _-"'''-L_+

ko

k*

k go1d

k(t)

k*'

Abbildung V.ll: Phasendiagramm des Ramsey-Modells vorliegt und ein Sauelpunkt existiert, der die Grenztransversalitätsbedingung erfüllt. Die Struktur dieses Problems entspricht den Problemen, die sich im Standardfall der optimalen Kontrolle ergeben und insbesondere auch den Ansätzen, die in dieser Arbeit diskutiert werden. Der Ausgangspunkt ist der Kapitalstock ko. Die Endbedingung legt fest, dass der Sauelpunkt, hier der Schnittpunkt der beiden Isoklinen

c= 0 und k = 0, der Endpunkt ist, der bei einer op-

timalen Entwicklung erreicht werden soll. Eine Annäherung an diesen Punkt kann nur entlang des Sattelpfades erfolgen, der durch den Punkt (ko, co) führt. Allerdings kennt man lediglich den Anfangswert ko, nicht jedoch den zugehörigen Wert co. Wird ein anderer Wert für den anfanglichen Konsum gewählt, entfernt man sich immer weiter vom Sattelpfad und damit vom angestrebten Gleichgewicht. In der Grafik wird eine solche Entwicklung beispielhaft durch die Trajektorien ausgehend von den Punkten (c&, ko) beziehungsweise

(c~,

ko) dargestellt.

Betrachtet man ein solches Problem, erscheint die Situation zunächst als nicht schwierig. Die Idee der meisten Lösungsverfahren für Randwertprobleme ist die Rückführung des Randwertproblems auf eine Schar von Anfangswertproblemen, die durch die unterschiedlichen Iterationsmechanismen schließlich eine geeignete Approximation für den tatsächlichen Pfad erreichen sollen. Betrachtet man zum Beispiel ein einfaches Schießverfahren, so löst man eine Reihe von Anfangswertproblemen. Dabei wird jeweils der Startvektor in geeigneter Weise variiert, bis man schließlich den richtigen Startvektor gefunden hat, so dass die zugehörige Trajektorie in den Sauelpunkt mündet. Eine solche Verfahrensweise bezeichnet man als Vorwärtslösung, da man - ausgehend von einem teilweise bekannten Startwert - das System in Übereinstimmung mit der chronologischen Abfolge der Entwicklung löst. Die Algorithmen zur numerischen Lösung von Differentialgleichungen liefern letztlich aber alle nur Näherungen der Zeitentwicklung und im Allgemeinen nicht die exakten Zeitpfade.

V Anhang

322

stabiler Am

instabiler Ann L-______________________________-+ XI

Abbildung V.12: Lage des stabilen und des instabilen Anns im ursprünglichen Phasendiagramm Genau hier setzt die Kritik an der beschriebenen Verfahrensweise der Vorwärtslösung an. Die gesuchte Trajektorie ist ein Sattelpfad. Dieser Pfad wird als stabiler Ann bezeichnet, wobei stabil in dem Sinne verwendet wird, dass der Pfad - wie es auch die Abbildung Y.12 veranschaulicht - in das Gleichgewicht führt. Erreicht das System das Gleichgewicht, so verbleibt es in diesem Punkt. Der instabile Ann führt hingegen zu einer Divergenz vom Gleichgewicht. Auch wenn man in diesem Zusammenhang von einer stabilen Entwicklung entlang eines Satte1pfades spricht, ist der betrachtete Pfad, also der stabile Ann des Sattelpfades, eigentlich der Inbegriff einer Instabilität. So nähert man sich dem Gleichgewicht nur dann, wenn man exakt auf diesem Pfad bleibt. Die kleinste Abweichung führt dazu, dass man sich im Zeitablauf immer weiter von dem Pfad entfernt und hin zum instabilen Ann bewegt. Damit ist entsprechend auch eine immer größere Abweichung vom angestrebten Sattelpunkt verbunden. Berücksichtigt man, dass die Algorithmen Näherungsverfahren sind, so werden sie im Allgemeinen keine Entwicklung liefern, die ausgehend von einem Zeitpunkt tk einen Wert der Variablen für

tk+1

ennittelt, der exakt auf der gesuchten Trajektorie, sondern nur in der Nähe der

entsprechenden Trajektorie liegt. Selbst wenn unterstellt wird, dass man in der Tat den wahren optimalen Anfangswert berechnet hat, der dazu führt, dass das System auf dem Sattelpunktspfad startet, so ist durch die Näherung nicht gewährleistet, dass man auf dem Pfad bleibt. Folglich wird man vennutlich das Gleichgewicht nicht erreichen, sondern sich immer weiter von ihm entfernen. Entsprechend ist eine Vorwärtslösung durch numerische Näherungsverfahren nicht geeignet, einen Sattelpfad zu approximieren.

323

1 Mathematische Grundlagen (b) Rückwärtslösung

Im Folgenden wird ein Lösungsverfahren beschrieben, das die Lösung genau eines Anfangswertproblems statt einer Schar von Anfangswertproblemen in Verbindung mit einer langwierigen Iteration benötigt, um das ursprungliche Randwertproblem zu lösen. Gleichzeitig ist es durch eine relativ gute Konvergenz gegen die exakte Lösung des Problems gekennzeichnet. Bei diesem Verfahren handelt es sich um die sogenannte Rückwänsintegration. Die Darstellung basiert auf den Ausführungen von Brunner, Strulik (1998). Bei dem hier zu diskutierenden Verfahren nutzt man aus, dass ein Pfad gesucht wird, der in einen Sattelpunkt führt. Grundlegend sind zwei Aspekte, die im Folgenden erläutert werden. • Zwar ist die Anfangssituation nur unvollständig bekannt, da man nur über die Anfangswerte der Zustandsvariablen, nicht jedoch über die Startwerte der adjungierten Variablen verfügt. Durch die Grenztransversalitätsbedingung ist hier festgelegt, dass die optimale Entwicklung in einem Gleichgewicht oder genauer in einem Sattelpunkt endet. Die zugehörigen Endwerte der Variablen können entsprechend durch die Lösung eines simultanen Gleichungssystems ermittelt werden, das den Schnittpunkt der gleichgewichtigen Isoklinen beschreibt. Damit können die Werte aller Variablen, also auch der adjungierten Kozustände, im Endzeitpunkt berechnet werden. • Ein Sattelpunkt verfügt, wie bereits in der Abbildung Y.12 dargestellt worden ist, über zwei Arme: den stabilen Arm, der in den Sattelpunkt hineinführt, und den instabilen Arm, der zwar aus dem Sattelpunkt hinausführt, gegen den jedoch alle Trajektorien mit der Ausnahme des Sattelpfades konvergieren. Das Verfahren der Rückwärtsintegration transformiert das zu lösende Differentialgleichungssystem in ein neues System, das im Grunde die umgekehrte Situation betrachtet, sowohl in zeitlicher Hinsicht als auch in Bezug auf das Stabilitätsverhalten. Die Vorgehensweise lässt sich wie folgt skizzieren. • Die ursprunglichen Differentialgleichungen tauchen im transformierten System mit umgekehrtem Vorzeichen auf. So wird statt

x=

f(x, t)

nun das Differentialgleichungssystem

x= -f(x, t) betrachtet.

V Anhang

324

• Die Variable t wird durch eine transformierte Variable i ersetzt, da das System im Zeitablauf nun Iiickwärts durchschritten wird, also ausgehend vom eigentlichen Endzustand gelöst wird. • Die Lage der gleichgewichtigen Isoklinen im Phasendiagramm bleibt durch die Transformation des Systems unbeIiihrt. Entsprechend bleibt der alte Sanelpunkt als Gleichgewicht des Systems bestehen. • Die Richtungspfeile im Phasendiagramm drehen sich durch die Transformation um, da die Ableitung der Differentialgleichungen nach einer Variablen nun das umgekehrte Vorzeichen besitzen. Führt man diese Transformation des Systems durch, so erhält man statt der Abbildung V.12 das in der Abbildung V.13 dargestellte Phasendiagramm. instabiler Arm

stabiler Arm ~

____________________________

~XI

Abbildung V.13: Lage des stabilen und des instabilen Arms im Phasendiagramm des transformierten Systems

Auffallend ist, dass das System hinsichtlich der Lage der Trajektorien dem ursprünglichen System entspricht. Allerdings bewegt man sich auf diesen Trajektorien in der entgegengesetzten Richtung. Durch die Transformation ist der gesuchte Sattelpfad des Ausgangssystems, also der stabile Arm des ursprünglichen Systems, zum instabilen Arm geworden. Damit führt er - statt in das Gleichgewicht hinein - nun aus dem Gleichgewicht hinaus. Hingegen ist der Pfad, der urspIiinglich gleich dem instabilen Arm gewesen ist, nun der stabile Arm geworden. Da die Pfade in ihrer Lage nicht verändert worden sind, entsprechen die Koordinatenwerte des gesuchten Pfades, also die Tupel

(XI, X2),

die im Zeitablauf entlang des ursprünglich stabilen

Arms durchlaufen werden, nun exakt denjenigen des jetzt instabilen Arms. Bei Bewegungen auf diesem Arm werden sie allerdings in umgekehrter zeitlicher Reihenfolge durchlaufen.

2 Erläuterung der verwendeten Programme

325

Ferner gibt es noch einen weiteren wichtigen Unterschied zwischen den Phasendiagrammen. Befindet man sich im ursprünglichen System auch nur leicht neben dem gesuchten Pfad, so führt die Systemdynamik dazu. dass man sich immer weiter von diesem Pfad entfernL Nun befinden sich hingegen die Punkte. die in der Nähe des gesuchten Arms liegen. auf Trajektorien. die immer wieder zu diesem Arm zurückführen. Das bedeutet. dass kleinere Fehler durch Näherungslösungen bei der Ermittlung des gesuchten Pfades nicht vom gesuchten Pfad wegführen. sondern immer wieder gegen den gesuchten Pfad konvergieren. Als weiterer Vorteil ist zu betonen. dass die Ausgangssituation des transformierten Problems vollständig bekannt ist. Damit wird die Anwendung von Schießverfahren unnötig. und es ist nur ein einziges Anfangswertproblem für einen eindeutig bekannten Anfangspunkt zu lösen. Wie gerade erörtert worden ist. handelt es sich bei diesem Punkt um einen Sattelpunkt. Das impliziert. dass das System. wenn es sich exakt in diesem Punkt befindet. dort auch verbleiben wird. da die Änderungen aller Variablen sowohl im ursprünglichen als auch im variierten System gleich null sind. Um den gesuchten Pfad zu ermitteln. muss man also einen Startwert wählen, der geringfügig von dem Gleichgewichtwert abweicht. Ausgehend von einer solchen Startsituation. die in der unmittelbaren Umgebung des Gleichgewichtes, aber nicht auf dem stabilen Arm des transformierten Systems liegt. wird sich das System dann so entwickeln, dass man auf dem instabilen Arm des transformierten Systems landet. Zum Schluss verbleibt lediglich die Aufgabe, die Tupel der Variablen in umgekehrter zeitlicher Reihenfolge anzuordnen, um die Werte des Systems in der chronologischer Abfolge der eigentlichen Systementwicklung zu erhalten.

2 Erläuterung der verwendeten Programme 2.1

Konstruktion der Phasendiagramme für den Fall des unregulierten Monopols mit Hilfe von MATIlEMATICtr

Im Kapitel 1.2 ist das dynamische Verhalten des unregulierten Unternehmens mit Hilfe von Phasendiagrammen analysiert worden. Bis auf die Abbildung ill.4 sind die Grafiken in diesem Kapitel unter Verwendung von .MATHEMATICA", einer Software für mathematische Anwendungen, erstellt worden. Eine ausführliche Dokumentation zur Programmierung mit lWAmEMATICA" bietet Wolfram (1992). Im Folgenden wird als Beispiel das Programm vorgestellt, das zur Konstruktion der Isokline für)..1

= 0 in den Phasendiagrammen der Abbildungen III.l

und

ill.3 verwendet worden ist. Dabei sind die Zeilen dieses sogenannten Notebooks zum Zweck der Dokumentation durchnummeriert worden. Der Schrifttyp Courier hebt die Eingabe in MATIIE.\fATICA" hervor. Die übrigen Abbildungen können analog konstruiert werden.

V Anhang

326

In der ersten Zeile wird lediglich sichergestellt, dass die Variablen nicht mit numerischen Werten vorheriger Programmläufe belegt sind. In der zweiten Zeile wird ein Zusatzpaket geladen, das neben der Diracschen ,,Deltafunktion" insbesondere die Heaviside-Funktion oder auch den Einheitssprung für

x~O

sonst definiert (vgl. Heuser (1989), Seite 188 ff.). Diese Funktion wird in der Zeile 11 als Uni tStep aufgerufen. Die jeweiligen Kurvenverläufe werden für numerisch spezifizierte Parameterwerte berechnet. Dabei bezieht sich die Zeile 3 auf die Parameter der Faktorkosten. Die Parameter der Produktionsfunktion (Zeile 4) und der Nachfragefunktion (Zeile 5) sind entsprechend festgelegt. Diese Angaben stellen die Standardwerte dar, die auch im Rahmen der numerischen Lösung im Kapitel 2.3 verwendet werden. 1

Remova [ "Global' * "l

2

Naads["Calculus'DiracDelta'"l

3

qa = 10; qk = 100; r = 1/20; 6 = 1/10; 2': = 1/10;

4

e = 1; Cl = 1/2; K

5

)'1

6

ISOA1 [vk

7

bild1 = Plot [ISOAdvkl , {Vk- .001, 100} 1 ;

= 11/20;

= 1;)'2 = 100;

-

1 :=

qa K )'22 2 (r+c5) vk ((q.. le) Vk- K +)'levkK )2

8

ISOVk [vk_l := 2 6 2': qk vk ;

9

bild2 = Plot [Isov_k[Vkl , {Vk- .001, 100} 1

\0

va[t_l = (..:. ( )'2

qa

e vdtl

K

+n evk[t lK ))-2

11

Ib[t_l = A1}t l UnitStap[h[tll 2 cqk

12

AWP[ Ll :=NDSolva[

13 14

15 16 17

{ v k [t 1 == Ib [ tl - 6 Vk [ tl ' ,

Adtl == (r+c5) (Adtl +qk) vk[Ol == 10,

AdOl == j }, {Vk- All, {t, 0, 400}l;

Kq"va[tl Cl

vk[tl

,

- qk;

327

2 Erläuterung der verwendeten Programme Trajektorien =Tab1.[

18

{paramatricP1ot[ Bva1uate[ {Vk[t], Adt]} /. AWP[ j]],

19

20

{t, 0, 100},

21

P1otRaDIl.~

22

Disp1aYl'uDction~

23

Ticks

24

~

{O, 8S}, {-40, 300}, J:dentity,

l"a1s.] },

{j, 10, 80, 3}]; Show [{Trajektorien, bildl, bild2},

2S

26

Disp1aYl'uDction ~ $Disp1ayl'uDction]

In der Zeile 6 wird die Isokline für i I = 0 entsprechend der Gleichung (1.14) auf der Seite 70 definiert. Man beachte, dass

ISO.Al

eine Funktion des Kapitalstocks vk_ ist. Der anschließen-

de Plot-Befehl erstellt die zugehörige Grafik für den Wertebereich [0,001, 100]. Das Intervall darf den Punkt Vk

= 0 nicht enthalten, da die Isokline für i = 0 an dieser Stelle nicht definiert l

ist. Vollkommen analog lässt sich eine entsprechende Funktion Isovdvk_l in der Zeile 9 definieren. Diese Funktion beschreibt die Isokline für Vk Vk

= 0 als Funktion des Kapitalstocks

(vgl. die Gleichung (1.19) auf der Seite 73). Schließlich enthält bild2 die Grafik der

zugehörigen Kurve. Über die grafische Darstellung der Isoklinen hinaus kann MATIiDfATICA" dazu verwendet werden, die Systementwicklung ausgehend von gegebenen Anfangszuständen zu ermitteln. Um das Anfangswertproblem AW P in den Zeilen 12-17 zu lösen, werden zunächst die Funktionen für den optimalen Arbeitseinsatz

Va

[t_l (Zeile 10) und für die Bruttoinvestition

Ib

[t_l

(Zeile I I) entsprechend den Gleichungen (1.8) und (1.9) auf der Seite 66 benötigt. Beide Funktionen beziehen sich auf den Fall des unregulierten Monopols. Die Verwendung der UnitStep-Funktion ermöglicht nun eine Fallunterscheidung für die Bruttoinvestition, die

den Wert AI/(2cqk) annimmt, wenn AI

~

0 gilt, und die für AI < 0 gleich null ist.

Das Anfangswertproblem enthält die beiden Differentialgleichungen Vk(t) (Zeile 13) und

i l (t) (Zeile 14) entsprechend (1.5b) und (1.13). Die Startwerte für das Anfangswertproblem sind den Zeilen 15 und 16 zu entnehmen, wobei.Al [01 in der anschließenden Tabelle parametrisch variiert wird. Der Befehl NDSolve [ ... ] dient schließlich der numerischen Lösung des angegebenen Systems von Differentialgleichungen. Die Klarnmerpaare der Zeile 17 enthalten die Variablen, nach denen aufgelöst werden soll, sowie das relevante Zeitintervall [0, 400]. Da der Anfangswert für AI (0) noch nicht spezifiziert worden ist, kann die Lösung des Systems als eine Funktion von j aufgefasst werden, das heißt AW P [ j _1 . Die Trajektorien, die in den Zeilen 18-24 für das Zeitintervall t beziehen sich auf die Variablen AW P [ j

1 zu verwenden ist.

Vk(t)

E

[0, 100] berechnet werden,

und AI (t), wobei die Lösung des Anfangswertproblems

Gemäß der Zeile 24 variiert der Parameter j zwischen 10 und 80

V Anhang

328

bei einer Schrittweite von 3. Die zugehörige Grafik wird über ParametricPlot generiert, wobei der zu zeichnende Bereich (PlotRange) explizit festgelegt ist und auf eine Achseneinteilung (Ticks) verzichtet wird.

A.

o

Abbildung V.14: Darstellung der Trajektorien für den unregulierten Monopolfall Schließlich erhält man als Ergebnis das Phasendiagramm der Abbildung V.14, indem die berechneten Grafiken übereinandergelegt werden (Zeile 26). Der Schnittpunkt der beiden Isoklinen ist der Sattelpunkt, an den sich das Unternehmen bei optimalem Verhalten langfristig annähert. Der Sattelpfad selbst ist nicht ermittelt worden. Allerdings stellt man zwei unterschiedliche Entwicklungen für die Zeitpfade fest. So verlaufen die Zeitpfade, die durch einen relativ hohen Startwert für A. gekennzeichnet sind, oberhalb des Sattelpunktes. Hingegen führt ein niedriger Startwert für A. dazu, dass A. dauerhaft fällt.

2.2 Berechnung der langfristigen Gleichgewichte im unregulierten und im regulierten Monopolfall mit Hilfe von MA1HE.\L4.TICA· Langfristiges Gleichgewicht des unregulierten Monopols Die Berechnung der langfristigen Gleichgewichte für den unregulienen sowie den regulierten Monopolfall bilden den Ausgangspunkt für die numerische Lösung des Modells zur fallweisen Preisregulierung im Kapitel 2.3 (vgl. die Seite 197 ff.). Diese Gleichgewichte sind erneut unter Verwendung von MAmEMATICA'-Programmen ermittelt worden. Das Notebook lautet:

* "1

1

Remove [ "Global'

2

qa = 10; qk = 100; r = 1/20; 6 = 1/10; C = 1/10 ;

3

e = 1; CI = 1/2; K

4

)'1=1;)'2=100;

= 11/20;

329

2 Erläuterung der verwendeten Programme

6

g2

[ vk

-

2

1 ._

q.KY2 _ '-2 (r+6)vk(qa/e)vk-K+YlevkK)2 qk

sol = FindRoot[gl [xl == g2 [xl, {x, 30} 1 = x /. sol ; Print [' Vk = • , vkl ;

7 8

Vk

9

Die Zeilen 1-4 bedürfen keiner weiteren Erörterung. Unter Verwendung dieser Parameterwerte wird nun die Isokline für Vk

= 0 nach AI aufgelöst.

Das Ergebrus ist eine Funktion, die vom

Kapitalstock abhängt und in der Zeile 5 als gl [vk_l definiert wird. Die Funktion g2 [vk_l bezieht sich auf die Isokline >"1

= 0 und stimmt mit der Zeile 6 des vorangegangenen Notebooks

überein. Das langfristige Gleichgewicht ist durch den Schnittpunkt der beiden Isoklinen für ~I und Vk

= 0 determiniert.

=0

Um die zugehörigen Werte der Variablen zu ermitteln, ist somit zu-

nächst die Nullstelle der Funktion gl - g2 entsprechend der Zeile 7 zu ermitteln. Dabei wird die Nullstelle in der Nähe von x = 30 gesucht. Der in sol gespeicherte numerische Wert wird dann der Variablen

Vk

zugewiesen (Zeile 8) und mit dem folgenden Druckbefehl (Zei-

le 9) grafisch dargestellt. Ausgehend von diesem Wert für

Vk

lassen sich die Werte der übrigen

Variablen sukzessive berechnen. Die Ergebnisse für die hier unterstellten Standard werte der Parameter sind in der Tabelle 1II.5 auf der Seite 199 zusammengefasst worden. Langfristiges Gleichgewicht des regulierten Monopols Über einen ähnlichen Lösungsweg lassen sich die Werte der Variablen im Gleichgewicht für den regulierten Monopolfall berechnen, die ebenfalls in der Tabelle 1II.4 enthalten sind. Der zugehörige MAlliEJWATICA"-Programmcode lautet: Remove[ "Global' * 2

"l

q.=10; qk=100; r=1/20; 6=1/10; c=1/10;

3

e = 1;

4

1'1 = 1; 1'2 = 100;

a = 1/2;

K

= 11/20;

2/10; 1/1 = 1 , Al v k [vk_, p_, A1_, A2_l := 2 C qk - 6 vk ;

5 =

6

(5

7

p' [vk_, p_, A1_, A2_l := _1/1_ qk vk

8

A21/1 Al [vk_, p_, A1_, A2_1 := (r+ 6) (Al + qk) + - k2 qk V

9

qk vk _ P (Y2 - P) + qa 1'1

(Y11'2e-vkP ) 2)

(-pY2y~P+(1+2K)qa (Y~~-V~Kn 2~kqa (/~-V~Kr;

K

V Anhang

330

10

J...' [ k 2

V -, p-,

Al

-,

A2]:= r A2 + (1 _ A2 I/r ) (2 P - Y2 _ 2 qa (Y2 - p) ) qk vk Y1 (Y1 evkl=squer) SYSTEM=l; else SYSTEM=2; SYSTEMWECHSEL=FALSE ;

// starte im regulierten System // starte im unregulierten System

/***********************************************************************

* Systemwechsel vom unregulierten in das regulierte System **********************************************************************/

while( timeO < x_end // Startwerte abfragen if t>O i f (s>=squer) { // = System 1 if (SYSTEM==2) { SYSTEM=l; if (timeO>O) && (SYSTEMWECHSEL==TRUE)) ( STORE4PRINT2(timeO,Y20,s,G,p,Ib2,E,KR,va2) ; // Startwert fuer YlO [0] Y20 [0] ; // den Kapitalstock p; Y10[1] // den Preis Y20 [1] ; Y10[2] // lambda1 Y10[4] Y20 [2] ; // den kumulierten Gewinn Y20 [3] ; YlO [5] I/ den kumulierten Wohlstand SYSTEMWECHSEL=FALSE printf (" ########################## larobda1r=%Lf\n", HO [2] ) ; j***************************************************** **************

* Berechnung der uebrigen Startwerte im Systemwechsel ******************************************************************/

/. optimale Bruttoinvestition bei bindender Regulierung *1 if (YIO[2]O) && (SYSTEMWECHSEL==TRUE» ( STORE4PRINT1(timeO,Y10,s,G,Ibl,E,KR,val); // Startwert fuer Y20[OJ YlO [0]; /I den Kapitalstock Y20[lJ YlO [2J; /I lambdal Y20[2] YlO [4J; II den kumulierten Gewinn Y20[3J Y10 [5J; /I den kumulierten Wohlstand SYSTEMWECHSEL=FALSE 1* optimale Bruttoinvestition ohne bindende Regulierung *1 if (Y20[lJ