Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften: Konzept, Varianten und Anwendungsbeispiele [1. Aufl.] 978-3-658-21656-6;978-3-658-21657-3

Delphi-Verfahren ermöglichen die systematische Erfassung von Expert_innenurteilen. Sie haben sich vor allem dann bewährt

779 127 5MB

German Pages XVIII, 336 [345] Year 2019

Report DMCA / Copyright

DOWNLOAD FILE

Polecaj historie

Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften: Konzept, Varianten und Anwendungsbeispiele [1. Aufl.]
 978-3-658-21656-6;978-3-658-21657-3

Table of contents :
Front Matter ....Pages I-XVIII
Front Matter ....Pages 1-1
Die Delphi-Methode – eine Einführung (Kerstin Cuhls)....Pages 3-31
Das „klassische“ Delphi. Praktische Herausforderungen aus Sicht der Zukunftsforschung (Karlheinz Steinmüller)....Pages 33-54
Delphi-Verfahren in den Gesundheitswissenschaften – erkenntnistheoretische Potenziale und Herausforderungen (Saskia Jünger)....Pages 55-81
Das Gruppendelphi-Verfahren in den Sozial- und Gesundheitswissenschaften (Marlen Niederberger, Ortwin Renn)....Pages 83-100
Real-Time Delphi (Lars Gerhold)....Pages 101-123
Delphi-Märkte (Simon Kloker, Tim Straub, Tobias T. Kranz, Christof Weinhardt)....Pages 125-148
Front Matter ....Pages 147-147
Neue Qualifikationsanforderungen in der Gesundheitswirtschaft (Johannes Leinert, Alexander Rommel, Helmut Schröder)....Pages 151-185
Modifiziertes Delphi-Verfahren zur Ermittlung von Handlungsempfehlungen für die strukturelle Weiterentwicklung der Bewegungsförderung in Deutschland (Hannah Gohres, Petra Kolip)....Pages 187-210
Bewertung der gesundheitlichen Versorgungssituation älterer Menschen im Bundesland Bremen (Stefan Görres, Kathrin Seibert, Susanne Stiefler)....Pages 211-239
Eine Delphi-Befragung zu Strategien der Personalerhaltung und -gewinnung in der beruflichen Pflege: Fragestellung, Operationalisierung und Fragebogenentwicklung (Nora Lämmel, Jutta Mohr, Karin Reiber)....Pages 241-263
Abschätzung gesundheitsbezogener Maßnahmen mittels Gruppendelphi (Michael M. Zwick, Marco Sonnberger, Jürgen Deuschle, Regina Schröter)....Pages 265-285
Delphi-Studie zur Förderung von Sicherheits- und Gesundheitskompetenz bei der Arbeit (Clarissa Eickholt)....Pages 287-300
Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines systematischen Reviews (Marlen Niederberger, Ann-Kathrin Käfer, Laura König)....Pages 301-336

Citation preview

Marlen Niederberger Ortwin Renn Hrsg.

Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften Konzept, Varianten und Anwendungsbeispiele

Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften

Marlen Niederberger · Ortwin Renn (Hrsg.)

Delphi-Verfahren in den Sozial- und Gesundheits­ wissenschaften Konzept, Varianten und ­Anwendungsbeispiele

Hrsg. Marlen Niederberger Pädagogische Hochschule Schwäbisch Gmünd Schwäbisch Gmünd, Deutschland

Ortwin Renn Institute for Advanced Sustainability Studies e. V. Potsdam, Deutschland

ISBN 978-3-658-21656-6 ISBN 978-3-658-21657-3  (eBook) https://doi.org/10.1007/978-3-658-21657-3 Die Deutsche Nationalbibliothek verzeichnet diese Publikation in der Deutschen Nationalbibliografie; detaillierte bibliografische Daten sind im Internet über http://dnb.d-nb.de abrufbar. Springer VS © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Jede Verwertung, die nicht ausdrücklich vom Urheberrechtsgesetz zugelassen ist, bedarf der vorherigen Zustimmung des Verlags. Das gilt insbesondere für Vervielfältigungen, Bearbeitungen, Übersetzungen, Mikroverfilmungen und die Einspeicherung und Verarbeitung in elektronischen Systemen. Die Wiedergabe von allgemein beschreibenden Bezeichnungen, Marken, Unternehmensnamen etc. in diesem Werk bedeutet nicht, dass diese frei durch jedermann benutzt werden dürfen. Die Berechtigung zur Benutzung unterliegt, auch ohne gesonderten Hinweis hierzu, den Regeln des Markenrechts. Die Rechte des jeweiligen Zeicheninhabers sind zu beachten. Der Verlag, die Autoren und die Herausgeber gehen davon aus, dass die Angaben und Informationen in diesem Werk zum Zeitpunkt der Veröffentlichung vollständig und korrekt sind. Weder der Verlag, noch die Autoren oder die Herausgeber übernehmen, ausdrücklich oder implizit, Gewähr für den Inhalt des Werkes, etwaige Fehler oder Äußerungen. Der Verlag bleibt im Hinblick auf geografische Zuordnungen und Gebietsbezeichnungen in veröffentlichten Karten und Institutionsadressen neutral. Springer VS ist ein Imprint der eingetragenen Gesellschaft Springer Fachmedien Wiesbaden GmbH und ist ein Teil von Springer Nature Die Anschrift der Gesellschaft ist: Abraham-Lincoln-Str. 46, 65189 Wiesbaden, Germany

Vorwort

Delphi-Verfahren sind strukturierte Gruppenkommunikationsprozesse, in deren Verlauf komplexe Sachverhalte, über die unsicheres und unvollständiges Wissen existiert, durch Expert_innen in einem iterativen Prozess beurteilt werden. Das Besondere ist, dass bei jeder erneuten Befragung die aggregierten Gruppenantworten der vorherigen Befragung zurückgekoppelt werden und die Befragten auf dieser Basis ihre Urteile überdenken und gegebenenfalls revidieren können. Als charakteristische Merkmale gelten: 1) Anonymisierung der Antworten, 2) Iterative Befragung mit kontrolliertem Feedback und 3) Ermittlung aggregierter Gruppenantworten. Delphi-Verfahren haben sich in verschiedenen Disziplinen und Anwendungsfeldern international bewährt. Die ersten Delphi-Studien wurden im Bereich der Zukunftsforschung eingesetzt. Bis heute stellen sie ein wichtiges Instrument für die Analyse möglicher zukünftiger Zustände dar. Darüber hinaus werden Delphi-Verfahren zur Erfassung des aktuellen Wissensstandes, zur Auflösung bzw. Charakterisierung kontroverser Urteile, zur Identifikation und Formulierung von Standards bzw. Leitlinien, zur Entwicklung von Messinstrumenten, zur Identifikation von Indikatoren oder zur Formulierung von Handlungsempfehlungen bzw. prioritären Maßnahmen eingesetzt. In den Gesundheitswissenschaften haben sie sich vor allem zur Erfassung von Konsens bzw. Konsens über den Dissens unter Expert_innen etabliert. Durch die iterative Expert_innenbefragung kann Wissen zu einer offenen oder umstrittenen Fragestellung erfasst, kalibriert und auf mögliche Divergenzen hin charakterisiert werden. Darauf aufbauend können Konsensräume identifiziert und Dissensräume genauer und argumentativ abgesichert charakterisiert werden. Ziel ist es, die Evidenz für die durch Interventionen angestrebten Effekte zu erhöhen und damit die Chance zur Wirksamkeit zu verbessern.

V

VI

Vorwort

In den letzten Jahren haben sich zahlreiche Varianten von Delphi-Verfahren entwickelt. Vor allem durch neue technische Möglichkeiten im IT Bereich wurden innovative und weitreichende Veränderungen bei Delphi-Verfahren möglich. So werden mittlerweile Realtime-Delphis durchgeführt, bei denen die Expert_ innenurteile online und in Echtzeit zurückgekoppelt werden. In sogenannten Delphi-Märkten wird das Delphi-Verfahren mit Prognose- und Informationsmärkten sowie mit Erkenntnissen der big data Forschung zur Verbesserung der Vorhersagefähigkeit kombiniert. Andere Varianten betreffen die Zielstellung von Delphi-Verfahren. Beim Policy-Delphi geht es nicht um Konsens, sondern um die Erfassung des Dissenses, d. h. um die Breite der Urteile. Beim Argumentative-Delphi liegt der Fokus auf der argumentativen (qualitativen) Begründung der standardisierten Urteile durch die Expert_innen. Beim Gruppendelphi-Verfahren wird die Anonymität zugunsten eines persönlichen Austausches und der Erfassung inhaltlicher Begründungen für abweichende Urteile aufgegeben und die Expert_innen werden zu einem gemeinsamen Workshop eingeladen. Ein wissenschaftlicher und disziplinübergreifender Diskurs über Delphi-­ Verfahren, in dem die verschiedenen Varianten und möglichen Einsatzbereiche bzw. Besonderheiten in den Sozial- und Gesundheitswissenschaften vergleichend dargestellt und deren jeweilige Vor- und Nachteile diskutiert werden, fehlt bisher. Dieses Buch möchte einen Beitrag leisten, um diese Lücke zu schließen. Vorgestellt werden das Konzept, aktuelle Entwicklungen, innovative Verfahren, methodische Neuerungen und Anwendungsbeispiele von Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften. Damit ergeben sich zwei Forschungserträge: Einerseits erfolgt ein längst überfälliger Überblick über die Vielzahl an Varianten von Delphi-Verfahren und andererseits werden konkrete Anwendungsbeispiele mit einem Fokus auf methodischen Aspekten, wie der Fragebogengestaltung, der Expert_innenrekrutierung oder der Auswertung vorgestellt. Der Sammelband gliedert sich in zwei Hauptabschnitte: Im ersten Abschnitt werden das Konzept von Delphi-Verfahren und verschiedene Delphi-Varianten vorgestellt. 1. Kerstin Cuhls gibt einen Einblick in das Konzept, die unterschiedlichen Definitionen, Typen und Einsatzfelder. Sie zeigt die bei der Anwendung von Delphi-Verfahren besonders zu beachtenden Punkte auf. 2. Karlheinz Steinmüller formuliert praktische Hinweise zur Durchführung von Delphi-Verfahren und greift dabei auf jahrzehntelange Erfahrungen aus dem Bereich der Zukunftsforschung zurück. Er spannt den Bogen von der Fragebogenentwicklung bis zur Auswertung bzw. Interpretation der Daten.

Vorwort

VII

3. Saskia Jünger gibt einen Einblick in erkenntnistheoretische Potenziale und Herausforderungen. Dabei rezipiert sie vor allem wissenssoziologische Diskurse. Beispielhaft geht sie dabei auf das Feld der Palliativversorgung ein, um die Bedeutung von Delphi-Verfahren für die gesundheitswissenschaftliche Forschung darzulegen. 4. Marlen Niederberger und Ortwin Renn stellen das Konzept und das Vorgehen bei einem Gruppendelphi vor. Dies ist eine Variante, bei dem die Expert_innen zu einem gemeinsamen Workshop eingeladen werden und jeweils in Kleingruppen Bewertungen vornehmen, die dann im Plenum gemeinsam diskutiert werden. 5. Lars Gerhold beschreibt das Konzept des Realtime-Delphis, bei dem die Expert_innen online befragt und die Antworten in Echtzeit übermittelt werden. Dabei diskutiert er auch verschiedene Software-Programme. 6. Simon Kloker, Tim Straub, Tobias T. Kranz und Christof Weinhardt erläutern Delphi-Märkte, einen innovativen Ansatz zur Integration von Prognosemärkten und Delphi-Studien. Sie erläutern verschiedene Varianten der Integration und machen deutlich, wie durch die Kombination der zwei Methoden potenziell gegenseitige Schwächen ausgeglichen werden können. Im zweiten Abschnitt werden konkrete Delphi-Verfahren aus den Gesundheitswissenschaften präsentiert, diskutiert und reflektiert. Konkret werden Delphi-Verfahren aus dem Bereich Versorgung, Prävention, Palliativmedizin, Gesundheitsförderung, Pflege- und Zukunftsforschung vorgestellt. Die Verfahren verdeutlichen die vielfältigen Einsatzbereiche und Varianten von Delphi-­ Verfahren. Konkret werden folgende Anwendungsbeispiele illustriert: 1. Johannes Leinert, Alexander Rommel und Helmut Schröder stellen eine klassische Delphi-Studie zum Thema Qualifikationsanforderungen in der Gesundheitswirtschaft vor. Mit der Befragung von rund 1500 Expert_innen ist sie eine der größten Delphi-Studien, die in Deutschland je stattgefunden hat. In ihrem Artikel gehen die Autoren insbesondere auf die Zusammenstellung und Rekrutierung der Expert_innen ein. 2. Hannah Gohres und Petra Kolip präsentieren ein modifiziertes Delphi-­ Verfahren zur Ermittlung von konsentierten Handlungsempfehlungen für die strukturelle Weiterentwicklung der Bewegungsförderung in Deutschland. In diesem Beispiel wurden Elemente eines klassischen Delphi-Verfahrens mit denen eines Gruppendelphis verknüpft. Zudem wurden im Vorfeld Expert_ inneninterviews und Fokusgruppen durchgeführt.

VIII

Vorwort

3. Stefan Görres, Kathrin Seibert und Susanne Stiefler beschreiben ein Delphi-Verfahren zur Bewertung der gesundheitlichen Versorgungssituation älterer Menschen im Bundesland Bremen. Dieses Beispiel zeigt das Potenzial von Delphi-Verfahren zur Ideenaggregation und Strategieentwicklung. 4. Nora Lämmel, Jutta Mohr und Karin Reiber führten eine Delphi-Befragung zu Strategien der Personalerhaltung und -gewinnung in der beruflichen Pflege durch. In ihrem Beitrag gehen sie insbesondere auf die Fragestellung, Operationalisierung und Fragebogenentwicklung ein. 5. Michael M. Zwick, Marco Sonnberger, Jürgen Deuschle und Regina Schröter führten ein Gruppendelphi zur Abschätzung gesundheitsbezogener Maßnahmen im Bereich der Adipositasprävention durch. Dieses Beispiel verdeutlicht das Vorgehen und belebt das Anwendungspotenzial von Gruppendelphi-Verfahren bei besonders umstrittenen Themen. 6. Clarissa Eickholt präsentiert eine Delphi-Studie zur Förderung von Sicherheits- und Gesundheitskompetenz in kleinen und mittleren Unternehmen (KMU). Ziel der Delphi-Studie ist die Erfassung unterschiedlicher Expert_ innenurteile. Das Beispiel zeigt, wie in einem Delphi-Verfahren qualitative und quantitative Elemente kombiniert bzw. integriert werden können. 7. Marlen Niederberger, Ann-Kathrin Käfer und Laura König geben in ihrem Beitrag einen Überblick über die Delphi-Verfahren in der Gesundheitsförderung. Dazu präsentieren sie die Ergebnisse eines systematischen Reviews auf Basis von Publikationen in einschlägigen internationalen Fachzeitschriften. Ziel ist die Herausarbeitung der Forschungspraxis, insbesondere im Hinblick auf die Expert_innenauswahl, das Forschungsdesign und die Ergebnispräsentation. Mit dem Sammelband möchten wir einen Überblick über Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften geben und dem interessierten Leser und der interessierten Leserin anhand von konkreten Anwendungsbeispielen und Vorgehensweisen aufzeigen, welchen Beitrag Delphi-Verfahren zur Wissensgenerierung, Wissensaufbereitung und Handlungsorientierung leisten können. Wir danken allen Autor_innen für ihre spannenden und vielfältigen Beiträge. Wir hoffen mit diesem Buch einen wichtigen Impuls für die weitere wissenschaftstheoretische Diskussion, zur Verbreitung von Delphi-Verfahren und zur weiteren und reflexiven Verwendung vor allem in den Gesundheitswissenschaften zu setzen. Marlen Niederberger Ortwin Renn

Inhaltsverzeichnis

Teil I  Delphi-Verfahren: Konzepte und Varianten Die Delphi-Methode – eine Einführung . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 Kerstin Cuhls Das „klassische“ Delphi. Praktische Herausforderungen aus Sicht der Zukunftsforschung. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 Karlheinz Steinmüller Delphi-Verfahren in den Gesundheitswissenschaften – erkenntnistheoretische Potenziale und Herausforderungen. . . . . . . . . . . . 55 Saskia Jünger Das Gruppendelphi-Verfahren in den Sozial- und Gesundheitswissenschaften . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83 Marlen Niederberger und Ortwin Renn Real-Time Delphi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101 Lars Gerhold Delphi-Märkte. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 125 Simon Kloker, Tim Straub, Tobias T. Kranz und Christof Weinhardt Teil II  Anwendungsbeispiele für Delphi-Verfahren Neue Qualifikationsanforderungen in der Gesundheitswirtschaft. . . . . . . 151 Johannes Leinert, Alexander Rommel und Helmut Schröder

IX

X

Inhaltsverzeichnis

Modifiziertes Delphi-Verfahren zur Ermittlung von Handlungsempfehlungen für die strukturelle Weiterentwicklung der Bewegungsförderung in Deutschland. . . . . . . . . . . . . . . . . . . . . . . . . . . 187 Hannah Gohres und Petra Kolip Bewertung der gesundheitlichen Versorgungssituation älterer Menschen im Bundesland Bremen . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 211 Stefan Görres, Kathrin Seibert und Susanne Stiefler Eine Delphi-Befragung zu Strategien der Personalerhaltung und -gewinnung in der beruflichen Pflege: Fragestellung, Operationalisierung und Fragebogenentwicklung . . . . . . . . . . . . . . . . . . . 241 Nora Lämmel, Jutta Mohr und Karin Reiber Abschätzung gesundheitsbezogener Maßnahmen mittels Gruppendelphi. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265 Michael M. Zwick, Marco Sonnberger, Jürgen Deuschle und Regina Schröter Delphi-Studie zur Förderung von Sicherheits- und Gesundheitskompetenz bei der Arbeit . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287 Clarissa Eickholt Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines systematischen Reviews. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 301 Marlen Niederberger, Ann-Kathrin Käfer und Laura König

Herausgeber- und Autorenverzeichnis

Über die Herausgeber JProf. Dr. Marlen Niederberger ist Juniorprofessorin für Forschungsmethoden in der Ge-sundheitsförderung und Prävention an der Pädagogischen Hochschule Schwäbisch Gmünd. Ihre Expertise liegt in den Bereichen inter- und transdisziplinären Methoden, Partizipationsmethoden und Mixed-Methods Designs. Spezialisiert hat sie sich vor allem auf das Gruppendelphi-Verfahren, welches sie in verschiedenen Anwendungsfeldern einsetzt und beständig weiterentwickelt. Zudem verfügt sie über umfangreiche Kenntnisse im Bereich der Gesundheitsförderung und Prävention, mit einem Schwerpunkt auf der Verhältnisebene (v. a. kommunale Gesundheitsförderung) und dem Thema Migration, Integration und Flucht. Prof. Ortwin Renn ist Wissenschaftlicher Direktor am Institut für Transformative Nachhaltigkeitsforschung (Institute for Advanced Sustainability Studies, IASS) in Potsdam und Professor für Umwelt und Techniksoziologie an der Universität Stuttgart. Darüber hinaus leitet Renn gemeinsam mit Frau Dr. Marion Dreyer und Frau Agnes Lampke das Forschungsinstituts DIALOGIK, eine gemeinnützige GmbH zur Erforschung und Erprobung innovativer Kommunikations- und Partizipationsstrategien. Dazu kommen Honorar- und Ehrenprofessuren in Stavanger, Beijing und München. Seine Hauptforschungsfelder sind: Risikoanalyse (Governance, Wahrnehmung und Kommunikation), Theorie und Praxis der Bürgerbeteiligung bei öffentlichen Vorhaben, Transformationsforschung sowie sozialer und technischer Wandel in Richtung einer nachhaltigen Entwicklung.

XI

XII

Herausgeber- und Autorenverzeichnis

Autorenverzeichnis Dr. phil. Kerstin Cuhls ist seit 1992 am Fraunhofer-Institut für System- und Innovationsforschung (ISI) in Karlsruhe als wissenschaftliche Projektleiterin im Bereich Foresight tätig. Angefangen hat sie mit der Durchführung von Delphi-Studien für das BMBF im internationalen Vergleich. Von 2007 bis 2009 war Kerstin Cuhls Projektleiterin des BMBF-Foresight-Prozesses, Zyklus I, arbeitete an Folgeprojekten, u. a. auch am Zyklus II. In nationalen, regionalen und internationalen Studien für sehr unterschiedliche Auftraggeber baute sie ein umfangreiches Methodenrepertoire im Foresight auf. Von 2011 bis 2012 war Kerstin Cuhls Vertretungsprofessorin für Japanologie am Zentrum für Ostasienwissenschaften der Ruprecht-Karls-Universität Heidelberg. Sie hatte dort bis 2016 Lehraufträge sowie bis heute an der TU Berlin (Masterstudiengang Zukunftsforschung) und der Bundesakademie für Sicherheitspolitik. Sie war Mitglied mehrerer Foresight Advisory Boards, des European Forum for Forward-Looking Activities (EFFLA), der Highlevel Expert Group Research, Innovation and Science Policy Experts (RISE), und der der Expert_innengruppe Strategic Foresight. Jürgen Deuschle M.A., erlernte zunächst den Beruf des Funkelektronikers und arbeitete als Servicetechniker in der Musikbranche. An den Universitäten ­Stuttgart, Tübingen und Bern studierte er auf dem zweiten Bildungsweg die Fächer ­Soziologie und Geografie. An der Akademie für Technikfolgenabschätzung Baden-­ Württemberg und an der Universität Stuttgart lehrte und forschte er u. a. in Projekten zu den Themen Gerechtigkeit, Nachhaltigkeit, Bioenergie und Übergewicht. Seine Dissertation widmet sich den Fragen, warum Übergewicht ein Stigma ist, warum Menschen stigmatisieren und wie übergewichtige Kinder Stigmatisierung erleben und bewältigen. Neben seiner wissenschaftlichen Tätigkeit arbeitet Jürgen Deuschle als Fahrradkurier und Geschäftsführer von „Die Radler“ in Stuttgart. Clarissa Eickholt  studierte Diplom Pädagogik mit den Schwerpunkten Erwach­ senenbildung und Organisationswissenschaften an der Universität Köln. Nach dem Studium arbeitete sie als wissenschaftliche Mitarbeiterin und als Bereichsleitung für Lernen und Organisation bei der systemkonzept GmbH, seit 2010 ist sie Geschäftsführerin. Das Arbeitsfeld Sicherheit und Gesundheit bei der Arbeit bildet den Hintergrund ihrer Tätigkeit. Arbeits- und Forschungsschwerpunkte liegen im Transfer zwischen Wissenschaft und Praxis, im informellen Lernen bei der Arbeit und mediendidaktischen Anforderungen für kompetenzorientiertes Blended Learning. Seit 2014 ist sie im Vorstand des Fachverbandes Psychologie für Arbeitssicherheit und Gesundheit (PASIG) und leitet dort den Expert_innenkreis „Aus- und Weiterbildung“.

Herausgeber- und Autorenverzeichnis

XIII

Univ.-Prof. Dr. Lars Gerhold  leitet die Arbeitsgruppe Interdisziplinäre Sicherheitsforschung und das Forschungsforum Öffentliche Sicherheit an der Freien Universität Berlin. Nach dem Studium der Politikwissenschaften, Psychologie und Soziologie promovierte er in Psychologie zum Umgang mit Unsicherheit. Seine Forschungsschwerpunkte sind Sicherheitsforschung und Forschung zum Bevölkerungsschutz, Security Foresight, Gesellschaftlicher Wandel, Wahrnehmungs- und Handlungsforschung sowie Methoden der Zukunftsforschung. Er ist Mitglied des Board des Netzwerks Zukunftsforschung, Mitherausgeber der Zeitschrift für Zukunftsforschung sowie Mitherausgeber der „Standards und Gütekriterien der Zukunftsforschung“. Er lehrt u. a. zu Delphi-Methode im Masterstudiengang Zukunftsforschung an der Freien Universität Berlin. Prof. Dr. phil. habil. Stefan Görres  ist seit 1994 Professor an der Universität Bremen mit Schwerpunkten in Pflegewissenschaft und Gerontologie, Dekan des Fachbereichs 11, Human- und Gesundheitswissenschaften und Mitglied des Akademischen Senats, Mitglied des Direktoriums des Instituts für Public Health und Pflegeforschung (IPP). Zahlreiche Veröffentlichungen u. a. zu Themen wie Zukunft der Pflege, Professionalisierung von Pflegeberufen, Zukünftige Versorgungsstrukturen, Qualitätssicherung und Steuerungsmodellen in der Pflege. Mitherausgeber von wissenschaftlichen Buchreihen. Mitglied in zahlreichen wissenschaftlichen Fachgesellschaften und Jurys sowie in Wissenschaftlichen Beiräten bei Stiftungen und Unternehmen. Gutachten und Beratungen u. a. für Ministerien auf der Bundes- und Landesebene Hannah Gohres ist wissenschaftliche Mitarbeiterin und Promovendin in der Arbeitsgruppe Prävention und Gesundheitsförderung der Fakultät für Gesundheitswissenschaften an der Universität Bielefeld. Ihre Expertise liegt im Bereich der Bewegungsförderung, insbesondere im Kindesalter, sowie Mixed-­MethodsForschung und theoriegeleiteter Interventionsplanung. Dr. Dr. rer. medic Saskia Jünger ist Gesundheitswissenschaftlerin mit Spezialisierung in klinischer Psychologie. Nach ihrem Studium an der Universität Maastricht (NL) hat sie als Psychologin und wissenschaftliche Mitarbeiterin in der Psychosomatik, Palliativversorgung und Allgemeinmedizin gearbeitet. Sie hat verschiedene nationale und internationale Projekte im Bereich der Versorgungsforschung koordiniert; im Rahmen ihres PhD an der Lancaster University (UK) hat sie sich mit Konsensbildung und Wissensproduktion in der Palliativversorgung befasst. Ihr besonderes Interesse gilt der seelischen Gesundheit sowie einem wissenssoziologischen Blick auf Gesundheit und Krankheit. Seit Januar 2017 ist Saskia Jünger im Cologne Center for Ethics, Rights, Economics, and

XIV

Herausgeber- und Autorenverzeichnis

Social Sciences of Health an der Universität zu Köln verantwortlich für die Moderation des Forschungsschwerpunkts Gesundheitskompetenz in komplexen Umwelten. Ann-Kathrin Käfer ist wissenschaftliche Mitarbeiterin der Pädagogischen Hochschule Schwäbisch Gmünd. Sie beschäftigt sich mit dem Gruppendelphi-Verfahren zur Thematik der digitalen Bildung im Grundschulalter. Ihren Masterabschluss machte sie 2018 an der Pädagogischen Hochschule Schwäbisch Gmünd im Studiengang Gesundheitsförderung und Prävention. Simon Kloker  promoviert seit 2015 am Institut für Informationswirtschaft und Marketing (IISM) des Karlsruher Instituts für Technologie (KIT). Dort ist er für das FAZ.NET-Orakel, eine Prognosebörse in Kooperation mit der Frankfurter Allgemeine Zeitung, wissenschaftlich wie technisch verantwortlich. Seine konkreten Forschungsinteressen beziehen sich auf die Themen „Manipulation und Betrug auf Prognosebörsen“, „kognitiven Verzerrungen während der Abgabe von Erwartungen“ sowie der „Methodenintegration von Prognosebörsen und Delphi-Studien“. Laura König  studiert den Masterstudiengang Nachhaltige Dienstleistungs- und Ernährungswirtschaft an der Fachhochschule Münster. Im Rahmen ihrer wissenschaftlichen Hilfstätigkeit während des Bachelorstudiums der Gesundheitsförderung an der Pädagogischen Hochschule Schwäbisch Gmünd beschäftigte sie sich mit Delphi-Verfahren in der Gesundheitsförderung. Prof. Dr. Petra Kolip  ist Professorin für Prävention und Gesundheitsförderung an der Fakultät für Gesundheitswissenschaften der Universität Bielefeld. Ihre Expertise liegt u. a. in der Qualitätsentwicklung und Evaluation in Gesundheitsförderung und Prävention. Dr. Tobias T. Kranz  ist Alumnus des Instituts für Informationswirtschaft und Marketing (IISM) des Karlsruher Instituts für Technologie (KIT). Erstmals kam er 2007 mit Prognoseverfahren in Kontakt und verfasste seine Diplomarbeit über mobiles Anwenderverhalten auf Prognosemärkten. Er spezialisierte sich auf die Gestaltung elektronischer Marktplattformen mit Fokus auf Teilnehmerunterstützung und Vorhersagegüte. Dabei entwickelte er verschiedene Prognosemärkte, Delphi- und Planspielplattformen zur Vorhersage zukünftiger Ereignisse wie Wahlausgänge, Technologieakzeptanzen sowie konjunktureller, sicherheitspolitischer und sozio-ökologischer Zukunftsszenarien. Mit einer Arbeit über kontinuierliche Marktgestaltung wurde er 2015 am KIT promoviert. Seit 2016 ist er in leitender Position bei einem mittelständigen Finanzdienstleister tätig.

Herausgeber- und Autorenverzeichnis

XV

Nora Lämmel  M. A Politikwissenschaft, B. A. Sozialwissenschaft (HF), Germanistik (NF), ist Wissenschaftliche Mitarbeiterin in dem Forschungsverbund ZAFH care4care an der Fakultät Soziale Arbeit, Gesundheit und Pflege der Hochschule Esslingen. Neben den Projektschwerpunkten des ZAFH care4care „Fachkräftegewinnung, -entwicklung und -bindung in der Pflege“ ist ein weiterer thematischer Schwerpunkt ihrer bisherigen Arbeit die betriebliche Mitbestimmung, insbesondere in betrieblichen Veränderungsprozessen. Dr. Johannes Leinert ist Diplom-Volkswirt. Er studierte Volkswirtschaftslehre mit dem Schwerpunkt soziale Sicherungssysteme. Nach Abschluss seines Studiums arbeitete Herr Leinert als Referent und Projektleiter bei der Bertelsmann Stiftung, Abteilung Sozialpolitik. Daneben promovierte er an der TU Berlin zur Förderung freiwilliger Altersvorsorge. Anschließend war er als wissenschaftlicher Mitarbeiter bei der Gesundheitsberichterstattung des Bundes am Statistischen Bundesamt tätig und im Themenbereich „Gesundheitspolitik und Systemanalysen“ beim wissenschaftlichen Institut der AOK (WIdO) tätig. 2006 wechselte er zum infas-Institut. Dort arbeitet er im Themenschwerpunkt Gesundheitsforschung. Jutta Mohr  M. A. Pflegewissenschaft, B. Sc. Pflege, ist Wissenschaftliche Mitarbeiterin in dem Forschungsverbund ZAFH care4care an der Fakultät Soziale Arbeit, Gesundheit und Pflege der Hochschule Esslingen. Das Projekt beschäftigt sich mit der Thematik der Fachkräftegewinnung,- entwicklung und -bindung in der Pflege. Weitere Schwerpunkte ihrer Arbeit sind Ambient Assisted Living und onkologische Pflegeforschung. Prof. Dr. rer. soc. Karin Reiber  ist Professorin für Erziehungswissenschaft/ Didaktik mit dem Schwerpunkt Pflegepädagogik/-didaktik am Institut für Gesundheits- und Pflegewissenschaften der Hochschule Esslingen. An der Schnittstelle von Pflege- und Versorgungsforschung arbeitet sie u. a. mit Verbleibstudien/ Absolvent_innen-Befragungen, Expert_innen-Interviews und Delphi-Studien. Ihre thematischen Schwerpunkte sind die pflegeberufliche Aus-, Fort- und Weiterbildung sowie die Fachkräftegewinnung, -entwicklung und -bindung. Alexander Rommel M.A. Studium der Soziologie, Politischen ­ Wissenschaft und Philosophie an der Ruprecht Karls-Universität Heidelberg. Ab 1999 wissenschaftlicher Mitarbeiter und Projektleiter Wissenschaftliches Institut der Ärzte Deutschlands (WIAD) gem. e. V. in den Bereichen Gesundheitsberichterstattung, Surveyforschung und Versorgungsforschung. Seit 2012 wissenschaftlicher Mitarbeiter und Projektleiter am Robert Koch-Institut im Bereich

XVI

Herausgeber- und Autorenverzeichnis

Gesundheitsberichterstattung. Neben der Durchführung von Delphi-Erhebungen und Fokusgruppen liegt der Schwerpunkt auf der Analyse von Daten des Gesundheitsmonitorings am Robert Koch-Institut sowie von Sekundär- und Routinedaten. Forschung zur Epidemiologie von Erkrankungen und zur Inanspruchnahme von Gesundheitsleistungen. Dr. Helmut Schröder ist diplomierter Erziehungswissenschaftler und promovierter Soziologe. Zwischen 1982 und 1991 war er als Assistent an der Universität zu Köln beschäftigt, davon zwei Jahre am Seminar für allgemeine Heilpädagogik und Soziologie der Behinderten und mehr als sechs Jahre am Seminar für Sozialwissenschaften. Seit 1991 ist er bei infas tätig, seit 2003 als einer der beiden Bereichsleiter Sozialforschung. Herr Schröder arbeitet seit Mitte der achtziger Jahre auf dem Feld der Arbeitsmarkt-, Berufs- und Teilhabeforschung. Herr Schröder verfügt über langjährige Erfahrungen in der Leitung und Durchführung von komplexen Forschungsvorhaben. Dr. Regina Schröter  studierte Politikwissenschaften und Soziologie an der Universität Stuttgart und wurde dort 2018 promoviert im Themenbereich Bürgerbeteiligung. Aktuell arbeitet sie als Managerin für Projektkommunikation für Netze BW. Als zertifizierte Mediatorin moderiert sie darüber hinaus Bürgerbeteiligungsverfahren sowie Lehrveranstaltungen und Workshops. Regina Schröter veröffentlicht Publikationen zu unterschiedlichen Themen, aktuell zu Bürgerbeteiligung und Akzeptanz von Groß- und Infrastrukturprojekten. Kathrin Seibert M.Sc. Community & Family Health Nursing, Krankenschwester, wissenschaftliche Mitarbeiterin am Institut für Public Health und Pflegeforschung (IPP) der Universität Bremen, Abteilung 7 Pflegewissenschaftliche Versorgungsforschung, EBN-Trainerin. Projektmitarbeit in der ‚Untersuchung der gesundheitlichen Versorgungssituation älterer Menschen im Bundesland Bremen‘. Laufendes Promotionsvorhaben zur Versorgungsqualität von Pflegebedürftigen in der eigenen Häuslichkeit. Dr. Marco Sonnberger   studierte an den Universitäten Heidelberg und Stuttgart Soziologie und Politikwissenschaft. Er arbeitet am Zentrum für Interdisziplinäre Risiko- und Innovationsforschung (ZIRIUS) der Universität Stuttgart. Dort ist er Sprecher des Themenbereichs Nachhaltige Entwicklung und Transformation sowie Leiter der Nachwuchsgruppe DynaMo – Mobilitäts-Energie-Dynamiken in urbanen Räumen. Zu seinen Forschungsschwerpunkten zählen sozialwissenschaftliche Energie- und Mobilitätsforschung, nachhaltiger Konsum, Lebensstilforschung, Risikosoziologie, Umweltsoziologie sowie Technikfolgenabschätzung.

Herausgeber- und Autorenverzeichnis

XVII

Dr. Karlheinz Steinmüller  ist Wissenschaftlicher Direktor der Z_punkt GmbH The Foresight Company. Der Physiker und promovierte Philosoph arbeitet seit 25 Jahren in der Zukunftsforschung und beschäftigt sich mit Zukunftsstudien für namhafte Unternehmen und öffentlichen Auftraggeber. Schwerpunkte sind dabei sowohl zukünftige Technologien als auch gesellschaftliche Entwicklungen. Daneben hält er an der Freien Universität Berlin und an der European Business School Oestrich-Winkel Vorlesungen über Methoden der Zukunftsforschung. Er hat eine Reihe von Büchern über Zukunftsforschung, aber auch Science-Fiction veröffentlicht. Sein methodisches Interesse gilt insbesondere Disruptionen und Wild Cards. Susanne Stiefler M.A. Public Health/Pflegewissenschaft Schwerpunkt Präventionsforschung und Gesundheitsförderung, wissenschaftliche Mitarbeiterin am Institut für Public Health und Pflegeforschung (IPP) der Universität Bremen, Abteilung 7 Pflegewissenschaftliche Versorgungsforschung. Lehrtätigkeit in pflege- und gesundheitswissenschaftlichen Bachelor- und Masterstudiengängen. Mitarbeit u. a. in der Alterns-, Qualitäts- und Care-Mix Forschung (Heimeintritt vermeiden, EvaQS, StaVaCare-Pilot), als Projektkoordinatorin der ‚Untersuchung der gesundheitlichen Versorgungssituation älterer Menschen im Bundesland Bremen‘. Laufendes Promotionsvorhaben zu Prädiktoren für einen Heimeintritt bei bestehender Pflegebedürftigkeit und den Möglichkeiten diesem prädiktiv ­entgegenzuwirken. Dr. Tim Straub  ist wissenschaftlicher Mitarbeiter am FZI Forschungszentrum Informatik (FZI), wo er an diversen Projekten im Bereich der Digitalisierung arbeitet. Außerdem ist er Forschungsgruppenleiter der Forschungsgruppe „Digital Experience & Participation“ (DXP) der Gruppe „Information and Market Engineering“ (IM) am Institut für Informationswirtschaft und Marketing (IISM) des Karlsruher Instituts für Technologie (KIT). Durch seine Promotion am IISM zum Thema der „Anreizgestaltung für das Crowdsourcing“ kam er in Kontakt mit Partizipations- und Kollaborationsplattformen rund um das Thema der „Weisheit der Masse“. Hierbei entwickelte er auch elektronische Marktplattformen zur Verteilung und Aggregation knapper Ressourcen (Planspielplattform) ebenso wie verschiedene Prognosemärkte und Delphi-Plattformen. Prof. Dr. Christof Weinhardt ist Professor des Instituts für Informationswirtschaft und Marketing (IISM) des Karlsruher Instituts für Technologie (KIT). Er leitet die Gruppe „Information and Market Engineering“ (IM). Mit seinem akademischen Hintergrund in Wirtschaftsingenieurwesen, Volkswirtschaft und Wirtschaftsinformatik konzentriert sich seine Forschung auf interdisziplinäre Themen aus dem Bereich Market & Engineering und Plattformökonomie mit

XVIII

Herausgeber- und Autorenverzeichnis

Anwendungen in der IT-Industrie, der Energiewirtschaft sowie in Finanz- und Telkomärkten. In diesen Bereichen ist er Herausgeber und Gutachter für zahlreiche internationale Zeitschriften und Konferenzen, veröffentlichte mehr als 150 Artikel in renommierten Fachzeitschriften und Bücher und erhielt eine Reihe von Auszeichnungen für seine Forschung und Lehre. In der Enquete Kommission des Deutschen Bundestags „Internet und Digitale Gesellschaft“ war er für mehr 3 Jahre als Sachverständiger aktiv und forscht seitdem verstärkt auch in diesem Bereich (Online Partizipation). Dr. Michael M. Zwick  arbeitet als Technik- und Umweltsoziologe am Institut für Sozialwissenschaften der Universität Stuttgart. Zu seinen Arbeitsschwerpunkten zählen neben der Umwelt- und Risikoforschung die Wahrnehmung des technischen Wandels in der Öffentlichkeit sowie qualitative und quantitative Methoden der empirischen Sozialforschung.

Teil I Delphi-Verfahren: Konzepte und Varianten

Die Delphi-Methode – eine Einführung Kerstin Cuhls

Zusammenfassung

Die Delphi-Methode hat sich von einem „Klassiker“ zu unterschiedlichen Delphi-Methoden oder „Typen“ entwickelt, die sehr unterschiedliche Funktionen haben können und in verschiedenen Themenfeldern Einsatz finden. Dabei setzen sich mehr und mehr die online-Varianten durch. Beliebt sind auch Delphi-Methoden mit Instant-Feedback wie das Realtime Delphi. Diese Einführung erläutert die unterschiedlichen Definitionen, Typen und Einsatzfelder und zeigt die wichtigsten zu beachtenden Punkte bei der Anwendung eines der Delphi-Verfahren auf. Besonderes Augenmerk ist hier auf die Teilnehmenden und ihre unterschiedlichen Hintergründe und Expertisen sowie die Gestaltung des „Fragebogens“ zu legen. So sind typische Fragen eines Delphis die nach der Wichtigkeit oder dem Zeithorizont der Verwirklichung einer Zukunftsthese, z. B. einer Problemlösung im Gesundheitssystem, einer Technologie oder Bildungsmaßnahme. Die Delphi-Methode wird auch in Zukunft einen Platz im Methoden-Kanon der Zukunftsforschung sowie der allgemeinen empirischen Forschung unterschiedlicher Disziplinen (z. B. Betriebswirtschaftslehre) haben. Sie wird mehr und mehr in Gesamtprozesse integriert und als ein Baustein im Methoden-Mix, z. B. mit Szenarien gekoppelt, angesehen.

K. Cuhls (*)  Fraunhofer Institut für System- und Innovationsforschung, Karlsruhe, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_1

3

4

K. Cuhls

Schlüsselwörter

Delphi · Zukunftsforschung · Geschichte Delphi-Verfahren ·  Delphi-Varianten · Anwendungsbeispiele

Eine Einführung in die Delphi-Methode zu schreiben, ist im Jahr 2018 sehr ­vermessen, da es einerseits keine einheitliche Definition gibt und andererseits unterschiedliche Typen an Delphi-Methoden entwickelt wurden, die den Namen Delphi teilweise nur deshalb tragen, weil sie sich mit Zukunftsthemen befassen. Dies reicht für eine Definition nicht aus, wie unten diskutiert wird. Ein weiteres Definitionskriterium, das allen Delphi-Methoden gemein ist, beinhaltet das erneute Beurteilen eines Sachverhalts bzw. einer These unter Feedback. In den folgenden Abschnitten wird kurz die Geschichte der Delphi-Methode skizziert, um ein Grundverständnis herzustellen. Nach einer Bestandsaufnahme der Definitionen folgen Typen, Funktionen und Einsatzfelder sowie der grundlegende Fragebogenaufbau einer Delphi-Studie. Ein kurzer Ausblick rundet die Einführung ab.

1 Zur Geschichte der Delphi-Methode(n) Die Delphi-Methode wurde in den fünfziger Jahren im Rahmen des „Operations Research“ (Vorgänger der Systemforschung) von der RAND-Corporation in Santa Monica, Kalifornien, entwickelt. Der Name Delphi soll dabei auf den Altphilologen Kaplan zurückgehen, der beim Vorgehen an das griechische Orakel1 erinnert wurde. Die Ähnlichkeiten mit dem antiken Delphi sind dabei nicht zu übersehen: Auch das Orakel von Delphi hat nur handlungsbezogene, subjektive und Individuen-spezifische Ereignisse vorhergesagt. Diese wurden nicht eineindeutig, sondern in zweideutiger Form von der Pythia, dem Medium im Apollon, von sich gegeben und von den Priestern des Tempels in interpretierter, weiterhin aber zweideutiger Form weitergegeben (mündlich oder in Tafeln geritzt). Da die Weissagung vom Empfänger subjektiv eine weitere Interpretation erfährt, entwickelt sich eine Eigendynamik des Handelns, die zu einer subjektiv als solcher wahrgenommenen Verwirklichung führt, sobald sie ausgesprochen ist

1Zur

Geschichte des historischen Delphi siehe Maass (1993) oder Parke (1956), aber auch Andronicos (1983); zum Prinzip der sich selbst erfüllenden Prophezeiung heute siehe u. a. Weaver et al. (2015) oder Sternberg et al. (2011).

Die Delphi-Methode – eine Einführung

5

(self-fulfilling prophecy2). In einigen Fällen sind von den Orakelpriestern im Voraus Informationen eingeholt und in die Interpretation der Weissagung eingearbeitet worden, sodass es nicht mehr so schwer war, eine zutreffende Aussage zu machen (Grupp 1995, S. 26 ff.). Belege hierfür sind aufgefundene Schiefertafeln. Die ersten Delphi-Befragungen der Neuzeit fanden 1953 in mündlicher Form statt und widmeten sich militärischen Vorausschau-Themen, für die sie ursprünglich entwickelt worden waren3. In späterer Zeit hat sich die schriftliche Form der Umfrage durchgesetzt, da sie den einzelnen Teilnehmenden noch stärker erlaubt, die Meinung zu ändern (oder auch nicht), ohne das Gesicht zu verlieren oder Rechenschaft ablegen zu müssen. Erste Delphi-Befragungen per Computer wurden bereits früh getestet (ein erstes in Deutschland bereits vor 1979, Brockhoff 1979), aber erst in den letzten 10 Jahren haben sich onlineVarianten durchgesetzt. Eine Bestandsaufnahme zeigt, dass bereits im Jahr 2011 die Zitationsraten für Delphi-Artikel relativ hoch waren (Rowe und Wright 2011). Dies deutet auf eine große Verbreitung der Methode hin. Doch zunächst folgt die Frage, was unter der Delphi-Methode zu verstehen ist.

2 Definition der Delphi-Methode Das Delphi-Verfahren ist eine der subjektiv-intuitiven Methoden der Vorausschau. Die Methode basiert auf strukturierten Befragungen und nutzt die intuitiv vorlie­ genden Informationen der Befragten, die in der Regel „Expert_innen“ sind. Allerdings wird der Expert_innenbegriff häufig sehr breit gefasst (Cuhls 2000, 2009, 2012). Die Delphi-Methode liefert qualitative und quantitative Ergebnisse für die Vorausschau (Foresight) und hat neben explorativen und prognostischen auch normative Elemente. Da es nicht die eine Delphi-Methode gibt, sondern diverse Anwendungsvariationen, besteht eine Übereinstimmung vor allem darin, dass die „Delphi-Methode eine Expert_innenbefragung in zwei oder mehr Runden ist, bei der in der zweiten oder späteren Runden der Befragung die Ergebnisse der vor­ angegangenen Runde vorgestellt werden. Somit urteilen die Expert_innen ab

2Dieses

Phänomen findet sich auch bei den sehr einfachen Horoskopen (z. B. in Zeitschriften) wieder: Die Person, die an das Horoskop glaubt, verhält sich entsprechend und ermöglicht somit erst das Ereignis. Die andere Möglichkeit ist, dass das Horoskop so umfassend ­formuliert wird, dass subjektiv eines der individuellen Ereignisse in jedem Fall zutreffend ist. 3Helmer (1983), diverse Abschnitte. Die allerersten Delphi-Befragungen sollen allerdings bereits seit 1948 für Hunde- und Pferdewetten eingesetzt worden sein, Woudenberg (1991, S. 131–150) bzw. Pill (1971, S. 57–71).

6

K. Cuhls

der zweiten Befragungswelle jeweils unter dem Einfluss der Meinungen ihrer Fachkolleg_innen. Damit ist das Delphi-Verfahren „ein vergleichsweise stark strukturierter Gruppenkommunikationsprozess, in dessen Verlauf Sachverhalte, über die naturgemäß unsicheres und unvollständiges Wissen existiert, von Experten beurteilt werden“, so die frühe Arbeitsdefinition von Häder und Häder (1995, S. 12; Häder 2009, 2002, 2014). Viele nutzen eine pragmatische Charakteristik (siehe auch Niederberger und Renn 2018), die der „Standard-Delphi-Methode“ von Wechsler (1978, S. 23 f.) ähnelt: „Sie ist eine durch eine Monitorgruppe gesteuerte, mehrere Runden umfassende Befragung einer untereinander anonymen Gruppe von Experten, für deren subjektiv-intuitive Prognosen ein Konsens angestrebt wird. Nach jeder Befragungsrunde werden als Standard-Feedback ein aus Median und Interquartilbereich der Einzelprognosen gebildetes statistisches Gruppenurteil und, soweit schon möglich, die Argumente und Gegenargumente der extremen, d. h. außerhalb des Interquartilbereiches liegenden Einzelprognosen rückgekoppelt.“ Ob ein Konsens angestrebt oder nur identifiziert wird, ist in den jeweiligen Fällen unterschiedlich. Als charakteristisch wird daher spezifiziert: • Inhalte von Delphi-Studien sind stets Sachverhalte, über die unsicheres bzw. unvollständiges Wissen existiert. Andernfalls gäbe es effizientere Methoden zur Entscheidungsfindung (Häder und Häder 1995, S. 12). • Bei Delphi handelt es sich um Urteilsprozesse unter Unsicherheit. Die an Delphi-Studien beteiligten Personen geben also jeweils Einschätzungen ab (Landeta 2006). • Für die Teilnahme an Delphi-Studien werden Expert_innen benötigt, die aufgrund ihres Wissens und ihrer Erfahrungen in der Lage sind, kompetent zu urteilen (z. B. Seeger 1979; Cuhls 2000). • Besonders hervorzuheben sind die ablaufenden psychologischen Prozesse im Zusammenhang mit Kommunikation und weniger im Sinne mathematischer Modelle (Siehe hierzu insbesondere Pill 1971, S. 64; Dalkey 1968, 1969a, S. 541–551, 1969b; Dalkey et al. 1969; Dalkey und Helmer 1963; Dalkey 1967 oder Krüger 1975). • In Delphi-Studien wird versucht, die Effekte von sich selbst erfüllenden und sich selbst zerstörenden Prophezeiungen zu nutzen, jeweils im Sinne einer Beeinflussung oder „Schaffung“ einer bestimmten Zukunft (Cuhls 1998). Delphi-Befragungen werden seit den 1990er Jahren (eigentlich schon ab 1963, siehe Helmer 1966; Gordon und Helmer 1964, bzw. seit Start der japanischen Delphi-Studien um 1969, Kagaku Gijutsuchô Keikakukyoku 1971) teilweise als groß angelegte Befragungen durchgeführt, um die Weisheit der Masse bzw. der

Die Delphi-Methode – eine Einführung

7

großen Zahl („Wisdom of the Crowd“) zu nutzen (Surowiecki 2004). Allerdings ist umstritten, ob die Beobachtungen von Surowiecki allgemeingültig sind. Für Zukunftsthemen, die im „mainstream“ liegen und von vielen verstanden werden, finden sich jedoch mehr und mehr Belege, auch Tests in den japanischen Delphi-­ Studien deuten darauf hin (Kanama et al. 2008; NISTEP 2005; Kuwahara 2001). Eine einheitliche Begriffsdefinition gibt es bis heute nicht. Nach Dalkey und Helmer eignet sich das Verfahren „to obtain the most reliable consensus of opinion of a group of experts … by a series of intensive questionnaires interspersed with controlled feedback“ (1963, S. 458). Linstone und Turoff (1975, S. 3) charakterisieren ein Delphi „as a method for structuring a group communication process so that the process is effective in allowing a group of individuals, as a whole, to deal with a complex problem“. Zusammenfassend lässt sich daher sagen, Feedback und Anonymität (Ausnahme Gruppendelphi: siehe Niederberger und Renn 2018 bzw. Schulz und Renn 2009) sind wichtige Charakteristika der Delphi-Befragungen. Die Delphi-Technik als Foresight-Instrument scheint Anpassungsfähigkeit zu besitzen, denn immerhin hat sie die sich ändernden Herausforderungen der letzten 50 Jahre „überstanden“. Das Verfahren kann mit unterschiedlichem Verständnis von Foresight (Vorausschau) und Forecasting (im Sinne einer Prognostik) eingesetzt werden und wurde von den Nutzer_innen insbesondere für Fragestellungen zu Forschung, Technologie aber auch Organisation, Personal oder Bildung verwendet. Die Anwendungsfragestellungen diversifizieren jedoch mehr und mehr – und in der Praxis werden häufig auch Themenstellungen adressiert, für die es eigentlich keiner Delphi-Befragung bedarf. Es hört sich aber „schicker“ an. Häufig wird auch das Feedback „vergessen“. Dabei liegt der Vorteil der Delphi-Befragung darin, dass das Individuum durchaus eine konträr zu den anderen Teilnehmenden liegende Meinung ausdrücken kann – und dies mit unterschiedlichem Detaillierungsgrad. Da in der Entscheidungsfindung immer auch multiple Perspektiven gefragt sind (Linstone 1998 oder Linstone und Mitroff 1994), kann die Delphi-Methode auch in Fragestellungen mit langfristigem Zeithorizont eingesetzt werden. Wie in kontrollierten wissenschaftlichen Experimenten gezeigt wurde, sind die Einschätzungen aus Delphi-Studien nicht unbedingt „besser“ bzw. prognostisch genauer als diejenigen anderer konsensorientierter Verfahren (Dalkey 1969a, b oder Häder und Häder 1995, 2014). Es ist daher die kommunikative Kraft von Delphi-Ansätzen, die das Umschalten von einer Perspektive auf die andere ermöglicht. Die Anonymität der schriftlichen bzw. digitalen Befragung ist ein wichtiges psychologisches Moment (Bardecki 1984). In Expert_innenpanels und anderen Formen der Gruppenarbeit ist eines der grundlegenden Probleme, dass sich Meinungsführer_innen herausbilden. „Diesen Einfluß kann er ausüben, weil er den Beeinflußten irgendwie belohnen oder strafen kann, z. B. durch sein sozial-­

8

K. Cuhls

emotionales Verhalten (Freundlichkeit), seine gesellschaftliche Stellung oder sein Durchsetzungsvermögen. Er kann den Einfluß auch dann geltend machen, wenn der Beeinflußte ihn dazu berechtigt erachtet oder sich mit ihm identifiziert“ (Becker 1974, S. 14 f.). Die Anonymität des Delphi-Vorgehens verhindert die direkte Ausübung eines normativen Einflusses der Teilnehmenden untereinander und verlagert den Austausch in die Anonymität. Dies ist wichtig, denn es gibt in einer Gruppe fast immer Personen, die „sich nicht trauen“ zu widersprechen oder sich überhaupt zu Wort zu melden, insbesondere, wenn in der Gruppe mächtigere Personen oder hierarchisch höher Stehende dabei sind. Somit würde aber das Wissen der beeinflussten Personen4 nicht so starken Eingang in das Endergebnis finden wie das der Meinungsbildner (Becker 1974, S. 52). Die Antwortqualität (im Sinne einer Prognose) wird schlechter, wie in Experimenten nachgewiesen werden konnte.5 Bei Delphi-Befragungen wird deshalb wirklich eine Auswahl aller beteiligt, die als „Expert_innen“ oder Betroffene definiert werden können. Um eine hinreichende Fundierung zu erreichen, ist die schriftliche Form geeigneter, da in anonymisierter Form und ohne „Angesicht zu Angesicht“-Kontakte sowohl Meinungsänderungen, die zuzugeben sehr schwierig sind, als auch Bestehen auf der eigenen, eventuell konträr zu anderen stehenden Meinung, leichter fallen. Die gemeinsame Aktivität in Gruppen reicht daher nicht aus und wird von anonymen Verfahren unterstützt, „this further reducing the influence of certain psychological factors, such as specious persuasion, the unwillingness to abandon publicly expressed opinions, and the bandwagon effect of majority opinion“ (Helmer und Rescher 1959, S. 47). Es hängt also von der Person selbst ab, wie weit der Experte oder die Expertin in der Befragung in kognitiver Dissonanz (Festinger 1978; Bardecki 1984) zur Gruppenmeinung stehen will. Bei einigen Personen wird ein stärkerer Wunsch nach Assimilation als bei anderen bestehen. Die Zustimmung der eigenen zur Gruppenmeinung vermindert folglich das Gefühl der Dissonanz, die ansonsten ertragen werden muss. Aus diesem Grund spielt der Gruppendruck im Hinblick auf Konformität (Dalkey und Helmer 1963) und Konsensfindung eine entscheidende Rolle (Woudenberg 1991). Eine ebenso große Rolle spielt die Änderung des Wissens (Becker 1974, S. 54 f.). 4Dalkey

und Campbell haben nachgewiesen, dass ohne die Wahrung der Anonymität nach der Diskussion das Ergebnis nicht so genau ist wie der Meinungsdurchschnitt der Diskussionsbeteiligten vor der Diskussion, Dalkey (1968). 5Dalkey (1969, S. 23 ff.). Dieses Ergebnis wird allerdings von Sackman (1975) angezweifelt.

Die Delphi-Methode – eine Einführung

9

Auch wenn das Delphi-Verfahren ursprünglich in Experimenten für militärische Zwecke eingesetzt wurde, wird es mittlerweile vor allem als Prognoseund Zukunftsforschungsinstrument, in der Betriebswirtschaftslehre aber auch in spezifischen, z. B. wie in diesem Band in pflege- und gesundheitswissenschaftlichen Kontexten verwendet (Trevelyan und Robinson 2015). Nutzer_innen des Verfahrens mögen besonders die Datensätze „über die Zukunft“, die mit Delphi-Umfragen zusammengestellt und zur Diskussion freigegeben werden (häufiges Feedback zu BMFT 1993 und zu Cuhls et al. 1998). Allein schon das Aufschreiben von Zukunftsthemen in der Form von kurzen, prägnanten Thesen scheint einen immensen psychologischen Effekt zu haben, da er den Transfer von implizitem zu explizitem und damit „sichtbarem“, transferierbarem Wissen erzwingt. Trotzdem ist die Gefahr groß, dass Teilnehmende und Organisator_innen von Zukunftsstudien die Daten als „die Zukunft, die realisiert werden wird,“ betrachten – und nicht als Arbeitsmaterial auf dem Weg in eine Zukunftseinschätzung. Als die Medien in Deutschland die Delphi ‘98-Daten (siehe Cuhls et al. 1998) mangels anderer Informationen über „die Zukunft“ als einen Ausblick in das nächste Jahrhundert bzw. Jahrtausend beschrieben, machten sie häufig den Fehler, damit zu argumentieren, die Zukunft werde so, wie im Delphi ‘98 beschrieben, werden – ohne heutige oder zukünftige Entscheidungen, die auf diesem Wissen beruhen, zu berücksichtigen. Denn die heute gefällten Entscheidungen (auch unter einer anderen Informationslage) beeinflussen die Dinge, die auf uns zukommen. Delphi kann also nur potenzielle Antworten auf diejenigen Fragen liefern, die wir schon heute identifiziert haben. Andere Fragen oder Probleme müssen erst noch identifiziert werden – dies bedarf anderer Prozesse (häufig „Horizon Scanning“ genannt, siehe Cuhls et al. 2015). Daher kann man zusammenfassen, dass Delphi und andere Befragungen Werkzeuge sind, um die Meinungen und Einschätzungen einer gewissen (meistens großen) Anzahl an Menschen zu Zukunftsthemen zusammen zu bringen. Diese Art von Befragung ist besonders in Prozessen nützlich, in denen der Austausch von Meinungen und kommunikative Effekte wichtig sind, und die besonders ergebnisorientiert ablaufen. In Fällen, in denen Datensätze für Prioritätensetzungen benötigt werden, liefern Delphi-Studien die essenziellen „Basics“, also Daten, die auch für nachfolgende Roadmaps genutzt werden können (Cuhls 2017). Ganz allgemein kann ein Delphi-Prozess als ein Verfahren verstanden werden, bei dem in einem iterativen Vorgehen Expert_innenurteile zu einer bestimmten Fragestellung ermittelt werden, mit dem Ziel Konsens und/oder Dissens in den Urteilen zu erfassen und zu begründen.

10

K. Cuhls

3 Arten von Delphi-Befragungen Viele unterschiedliche Arten von Delphi-Befragungen sind inzwischen entstanden, und ihre Benennungen verwirren häufig. Als klassisches Delphi werden häufig die zwei- oder mehrrundigen Befragungen bezeichnet, die der oben genannten Grunddefinition folgen und ab der zweiten Runde Feedback geben sowie einen stark prognostischen Charakter haben (d. h. nach dem Realisierungszeitraum fragen). Daneben hat sich das Policy Delphi entwickelt, das ein klassisches zweirundiges Delphi-Verfahren ist, aber Policy-Themen beinhaltet oder lösungsorientierte Fragestellungen angeht (Turoff 1970; Linstone und Turoff 1975; Loe et al. 2016; aber auch Aichholzer 2002). Ziel ist hier, eine große Bandbreite an Meinungen zu einem bestimmten Thema einzuholen. Delphi wird hier als „a tool for the analysis of policy issues“ angesehen (Turoff 1970, S. 80). Neben dem Policy Delphi wurde das sogenannte Decision Delphi entwickelt, bei dem Expert_innen hinzugezogen werden, die entscheiden und auch umsetzen sollen (Keeney et al. 2011). Mini-Delphis sind Studien zu eingegrenzten Sektoren oder Fragestellungen, die nicht so umfangreich sind wie Überblicksstudien. Der Begriff ist jedoch nicht festgelegt. Häufig finden sich hier ähnliche Herangehensweisen wie im Policy-Delphi oder es werden problem- bzw. lösungsorientierte Thesen formuliert und eingeschätzt (siehe z. B. Cuhls et al. 1995). Neuere Entwicklungen sind sogenannte Realtime Delphi-Verfahren, die in „Echtzeit“ ablaufen, d. h. die Runden werden nicht mehr separiert, sondern die Antworten werden an die Expert_innen rückgekoppelt, sobald sie sich zum zweiten Mal auf der Internet-Plattform einloggen (Gordon und Pease 2006). Diese Delphi-Varianten bieten ein schnelles Feedback (beinahe in Echtzeit) und wurden besonders in den letzten Jahren den technischen Möglichkeiten entsprechend weiter entwickelt (für einen Überblick der Software siehe z. B. Aengenheyster et al. 2017). Die ersten Versuche zum Realtime Delphi waren vielversprechend (Friedewald et al. 2007; Zipfinger 2007), aber in der Praxis zeigt sich, dass die Teilnehmenden nicht häufiger als zwei oder drei Mal antworten. Der Grund dafür sind in der Regel zeitliche Restriktionen (wie Kommentare in Friedewald et al. 2007 annehmen lassen), sodass der Effekt, die Möglichkeit zu haben, so oft wie gewünscht zu antworten, die Meinung zu ändern und noch einmal über die Themen nachzudenken, in der praktischen Anwendung der Methode am Ende doch nicht so häufig genutzt wird. Realtime Delphi Prozesse benötigen, wenn sie online

Die Delphi-Methode – eine Einführung

11

durchgeführt werden, auch mehr Programmierungsaufwand, um das sofortige Feedback zu ermöglichen, was zwar heutzutage mit fertigen Tools nicht mehr kompliziert ist, aber aufwendige Pretests erfordert. Der Vorteil von online-gestützten Verfahren (teilweise mit fertigen Tools) und Realtime-Delphis im Besonderen ist, dass die Ergebnisse sofort berechnet werden und zu jeder Zeit des Prozesses verfügbar sind. Der Nachteil ist, dass die Sample-Kontrolle erschwert oder sogar unmöglich wird (Aengenheyster et al. 2017). Da einige Personen häufiger teilnehmen als andere haben sie theoretisch die Chance, die Ergebnisse stärker zu beeinflussen als die weniger aktiven Personen. Rein theoretisch könnten sie sogar extremen Einfluss nehmen, indem sie besonders stark abweichende Antworten geben und dadurch alle weiteren Teilnehmenden in die Irre führen. Dies ist allerdings nur eine theoretische Möglichkeit, in der Realität wurde ein solches Verhalten bisher nach dem Wissen der Autorin noch nicht beobachtet. Eine weitere Diskussion entspannt sich über der Frage, ob elektronische Delphi-Verfahren online oder offline durchgeführt werden sollten. Während die ersten Befragungen noch mit Stift und Papier durchgeführt wurden mit dem großen Nachteil, dass sie sehr Zeit- (für Postzustellung oder Faxlieferung) und Druckkosten-intensiv waren und dann weitere Zeit und weiteres Geld benötigten, um die Ergebnisse zu erfassen und auszuwerten, gab es schon frühe Versuche Computer-gestützter Delphi-Studien (in Deutschland Brockhoff 1979). Spätere elektronische Delphi-Methoden nutzten E-Mail oder Internet-Plattformen, um Fragebögen bereitzustellen, die wie Papier-Fragebögen aussahen und ggf. auch ausgedruckt werden konnten, um dann wieder auf dem klassischen Postweg zurückgeschickt zu werden. In einigen Ländern ist dies bis heute die effizienteste Weise, um ein ausreichend großes Rücklauf-Sample zu erhalten6: Konservative Personen oder Reisende ohne PC wurden so ebenfalls bedient. In anderen Ländern hat sich dagegen die Internet-Variante (online) schnell durchgesetzt, z. B. in Finnland (Hämäläinen 2003 oder Salo und Gustafsson 2004). Vorteile der elektronischen Fragebögen sind, dass sie zum Beispiel die ­Rückspiegelung der aggregierten Gruppenantworten in Echtzeit oder die Integration von Zufallsvariablen erlauben. Realtime Delphi Verfahren sowie die neuen Argumentative Delphis können nur online durchgeführt werden, da hier Instant-­ Feedback gegeben wird.

6Das

japanische nationale Delphi des NISTEP wurde z. B. erst in der 10. Ausgabe (publiziert 2015) online durchgeführt. 5 Jahre zuvor war noch der Papier-Fragebogen genutzt worden.

12

K. Cuhls

Argumentatives Delphi (Gheorghiu et al. 2014; Seker 2015): In dieser ­DelphiVariante steht die Lieferung von Argumenten für eine Einschätzung, z. B. des Realitätszeitraumes oder der Wichtigkeit des Themas, im Vordergrund der Befragung. Wenn zum Beispiel nach dem Zeitraum der Verwirklichung gefragt wird, gibt jeder Teilnehmende ein Argument oder mehrere als Begründung ab. Für Anschauungszwecke werden die ersten zwei Argumente vorgegeben. Die Teilnehmenden können sich nun für die vorgegebenen Argumente entscheiden (anticken) oder ein oder zwei neue Argumente nennen. Am Ende der Befragung entsteht so eine Kette von Für- und Wider-Argumenten und ein gutes Verständnis für die Einschätzung. Dies kann für andere Fragen wiederholt werden, z. B. die Wichtigkeit des Themas wie im EU Projekt BOHEMIA (Andreescu et al. 2017). Delphi Markets sind eine Zwischenform zwischen Delphi-Methode und Prediction Markets. Prediction Markets (ohne Autor 2017; Luckner et al. 2005; Berg et al. 2000) sind weder Delphi-Studien noch einfache Befragungen und trotzdem können sie inzwischen zum Kanon der Befragungen (mit „spielerischem Ansatz“) mit Feedback gerechnet werden. Prediction Markets „handeln“ mit Themen und nutzen dazu fiktives „Geld“, Aktien oder eine andere „Währung“ (Chips, Symbole). Sie sind ähnlich wie Realtime Delphi-Verfahren auf einer Plattform angelegt und die Teilnehmenden können so häufig sie möchten handeln. Nach einer bestimmten Zeit wird ein Prediction Market in der Regel beendet (Überblick über das Vorgehen bei Luckner et al. 2005; Spann und Skiera 2004; Berg et al. 2000). Eine andere Variation ist, Feedback mit Hilfe von spezieller Groupware in Workshop-Diskussionen zu nutzen (z. B. Hämäläinen 2003; Salo und Gustafsson 2004 oder Miles et al. 2004). In diesen Fällen werden Workshops mit Kreativitätsverfahren oder Diskussionen angeboten und wenn ausreichend Thesen oder Zukunftsthemen ausgearbeitet sind, werden sie anhand eines bestimmten Kriteriensatzes mithilfe der Groupware (d. h. Computer an jedem Platz im Raum) bewertet. Hämäläinen (2003) beschreibt auch ein Tool, das bis zur Entscheidungsfindung nutzbar ist. Es nutzt einerseits die Anonymität für die Einschätzungen über die Zukunft und erlaubt andererseits den Teilnehmenden, offen zu diskutieren und die Meinung in der Einschätzung der Kriterien zu ändern, ohne gleich das „Gesicht zu verlieren“ oder sich rechtfertigen zu müssen. Konsensbildung steht in diesen Workshops – genau wie in anderen Prozessen mit Delphi-Verfahren nicht im Vordergrund. Einschätzungen können so oft vorgenommen werden, wie die Teilnehmenden wünschen. Eine weitere, erwähnenswerte Alternative sind Gruppendelphis (für Details siehe Niederberger und Renn 2018; Schulz und Renn 2009; Webler et al. 1991). Sie bestehen aus kleinen, in der Regel exklusiv ausgewählten Gruppen von Teilnehmenden und nutzen intensive Diskussionen. Das Gruppendelphi wurde in

Die Delphi-Methode – eine Einführung

13

den 80er Jahren als Modifikation des klassischen Delphis entwickelt. Auch diese Delphi-Art entstand aus der Notwendigkeit, Begründungen für Einschätzungen erhalten zu wollen. Beim Gruppendelphi wird der Fragebogen für die erste Runde auf einem Workshop entwickelt, bereits vor dem Workshop verschickt oder gemeinsam auf dem Workshop ausgefüllt. Anonymität besteht bei diesen Diskussionen nicht mehr. Offene Diskussionen ersetzen die zweite bzw. weitere Runden. Dafür steht die Konsensfindung im Vordergrund. Die Vorteile dieser face-to-face Kommunikation nennen Webler et al. (1991, S. 258): sofortiges Feedback, die Begründungen für abweichende Sichtweisen geben Einblicke, welche Abweichungen vom Panel akzeptiert werden, und eine interne Überprüfung für die Konsistenz akzeptierter Meinungen. Das Verfahren wird heute vor allem dann eingesetzt, wenn ein direkter Austausch zwischen Expert_innen unterschiedlicher Disziplinen angemessen und notwendig erscheint. Wichtige Unterschiede existieren zwischen „einmaligen“ Befragungen (auch: Zukunftsbefragungen) sowie Delphi-Ansätzen (siehe Tab. 1).

4 Funktionen von Delphi-Studien Die Verbesserung der Vorhersagefähigkeit stand in den Anfängen der Delphi-Befragungen klar im Vordergrund. Mit der Nutzung von Delphi-Befragungen als Kommunikationstool und der Betrachtung der Einschätzung einer Realisierungszeit der Thesen als „Arbeitsmaterial“ statt als klassische Prognose hat sich dies jedoch geändert. Mehr und mehr stehen die Bewertungsfunktion entsprechend der gestellten Fragen im Fokus der Untersuchung. Allerdings werden in der aktuellen Diskussion Verfahren wie die „Delphi-Märkte“ erprobt, bei denen Prinzipien von Prognosemärkten (Prediction Markets) mit Delphi-Verfahren kombiniert werden. Die Hauptfunktion von Delphi-Studien ist weiterhin, den Blick auf die langfristigen Entwicklungen zu richten, um diese einzuschätzen, zu bewerten und damit den Umgang mit „Unsicherheit“ zu schulen sowie „Daten“ (keine Fakten!) über Zukünfte zu erhalten, die beim Umgang mit Entscheidungen hilfreich sind. Um dieses zu erreichen, werden quantitative und qualitative Elemente gemeinsam verwendet. Zunehmend werden sogar bewusst die qualitativen Elemente in den Vordergrund geschoben. Bei einem argumentativen Delphi werden beispielsweise inhaltliche Begründungen für die standardisierten quantitativen Urteile erfragt und auch beim Gruppendelphi oder Delphi-Verfahren, die in Workshops integriert sind (Delphi-in-Workshops), werden inhaltliche Begründungen mit quantitativen Abschätzungen kombiniert. Delphi-Befragungen werden manchmal als Baustein

Schriftlich und mündlich möglich Online oder offline möglich Keine Korrektur oder zweite Beurteilung Kein Feedback Erfragen von Annahmen, Meinungen, Einschätzungen Teilnehmer_innenanzahl sollte bei quantitativen Auswertungen statistisch relevant sein (Minimum 20), Ausnahmen bei qualitativen Befragungen

Schriftlich oder mündlich?

Online oder offline?

Runden?

Feedback?

Fragen

Anzahl der Teilnehmenden

Zukunftsbefragungen „einmal“

Nur online

Nur schriftlich online möglich

Realtime-Delphi

(aggregierte Antworten, anonymisiert)

Bei schriftlichen quantitativen Einschätzungen in der Befragungen sollte Teilnehmer_innenanzahl statistisch relevant sein (Minimum 20), bei Gruppen-Delphi auch kleiner als 20 möglich

(Fortsetzung)

Bei quantitativen Einschätzungen in der Befragungen sollte Teilnehmer_innenanzahl statistisch relevant sein (Minimum 20), bei Gruppen-Delphi auch kleiner als 20 möglich

Erfragen von Annahmen, Erfragen von Annahmen, Einschätzungen, Meinungen werden Einschätzungen, Meinungen, Korrekturmöglichkeit i. d. R. korrigiert

Feedback (aggregierte Antworten, anonymisiert)

Zwei oder mehr „Runden“: Kor- Keine „Runden“, aber Feedback rektur und weitere Beurteilung und mehrfache Aufforderung zum erneuten Bearbeiten Hauptbestandteil

Online oder offline möglich

Schriftlich fixiert

Delphi-Befragungen

Tab. 1   Unterschiede zwischen „einmaligen“ Zukunftsbefragungen, Realtime-Delphi und zweirundigen Delphi-Verfahren. (Eigene Darstellung, weiter entwickelt nach Cuhls 2012)

14 K. Cuhls

Delphi-Befragungen

Realtime-Delphi

Für wahrscheinliche, mögliche oder wünschbare Zukünfte einsetzbar

Alternativen können erfragt werden

Alternativen

Für wahrscheinliche, mögliche oder wünschbare Zukünfte einsetzbar, aber: Wahrscheinlichkeiten sind auch bei zwei oder mehr Runden schwer einschätzbar

(Fortsetzung)

Alternativen können erfragt und Alternativen können erfragt und in der zweiten Runde ebenfalls für die weitere Befragung aufgenommen werden bewertet werden

Für wahrscheinliche, mögliche oder wünschbare Zukünfte einsetzbar, aber: Wahrscheinlichkeiten sind auch bei zwei oder mehr Runden schwer einschätzbar

In der Regel anonymes Antwor- Anonymes Antworten, RückAnonyme und nicht-anonyme Antworten möglich, Auswertung ten, Ausnahme Gruppendelphi spielen der Ergebnisse aggregiert und anonymisiert in der Regel anonymisiert

Anonymität

Welche Zukünfte?

Repräsentative Befragung möglich, Festlegung, wofür das Sample repräsentativ sein soll

i. d. R. selektiv, nicht repräsenta- i. d. R. selektiv, nicht reprätiv, da niemand für die Zukunft sentativ, da niemand für die Zukunft „repräsentativ“ sein „repräsentativ“ sein kann kann

Breiter Expert_innenbegriff Breiter Expert_innenbegriff Expert_innen oder/und Nicht-Expert_innen, je nach Ziel („Personen, die sich hinsichtlich des Themas auskennen“) der Befragung

Zukunftsbefragungen „einmal“

Repräsentativität

Hintergrund und Expertise der Teilnehmenden

Tab. 1   (Fortsetzung)

Die Delphi-Methode – eine Einführung 15

Delphi-Befragungen

Realtime-Delphi

i. d. R. Fragen direkt, indirekt, offline, online Zusätzliche Qualitätsprüfung nur Zusätzliche Qualitätsprüfung über Interviews durch weitere Runden möglich

Fragen oder Thesen?

Qualitätsprüfung

i. d. R. Thesen/Statements und Fragen (Kriterien) zur Einschätzung

Explorative, offene Fragen möglich

Zusätzliche Einschätzungen und Korrekturen möglich, nicht jedoch integrierte Qualitätsprüfung

i. d. R. Thesen/Statements und Fragen (Kriterien) zur Einschätzung

Explorative offene Fragen (z. B. Explorative, offene Fragen möglich zur Ergänzung der Thesen) möglich

Kommentare werden gesammelt Kommentare können gesammelt Kommentare können und zurückgespielt werden gesammelt und zurückgespielt werden

Zukunftsbefragungen „einmal“

Offene Fragen

Kommentare

Tab. 1   (Fortsetzung)

16 K. Cuhls

Die Delphi-Methode – eine Einführung

17

in Workshops integriert, indem Themen diskutiert werden und zu einem konzeptionell passenden Zeitpunkt in einer Befragung online und instant bewertet werden. Diese können über eine Online-Plattform abgewickelt werden und bieten direktes Feedback, das dann entweder noch einmal (zweite Runde) bewertet wird oder direkt in die weitere Diskussion einfließt. Delphi-Prozesse werden immer häufiger mit anderen Forschungsmethoden kombiniert, da sie mit Thesen starten oder Inhalte zur Bewertung geben und diese in einem strukturierten Prozess zusammengestellt werden müssen. Dies geschieht entweder über systematische Suchen in der Literatur, der Nutzung von Standardklassifikationen, einem Horizon Scanning (Cuhls et al. 2015) oder anderen Methoden der Expert_innenbefragung wie Workshops oder Interviews. In früheren Delphi-Prozessen wurden die Thesen oft in einer „Vorrunde“ erfragt (also einer Extra-Befragung). Wenn die Delphi-Methode in Mixed-Methods Studien, innerhalb von Workshop-Diskussionen oder Fokusgruppen eingesetzt werden, rückt die eigentliche Delphi-Methode und mit ihren Ergebnissen in den Hintergrund und macht nur einen kleinen (aber häufig aufwendigen) Schritt innerhalb des Gesamtprozesses aus, bedeutet aber sehr wohl eine Methodenkombination. Eine der Funktionen von Delphi-Runden ist es, zu ermöglichen, einen „Konsens“ herzustellen. Da es in manchen Themengebieten jedoch so gut wie unmöglich ist, einen Konsens herzustellen (siehe z. B. Grupp 1995, Beispiele Energie und Biotechnologie), dienen heutige Delphi-Befragungen eher der Ermittlung, ob ein Konsens bereits besteht (also alle eine ähnliche Einschätzung vornehmen) oder ob das Thema sehr umstritten ist. Auch dies ist eine wichtige Information. Wenn ein Konsens keine Rolle spielt und es stärker um die Informationsgenerierung ohne den Effekt einer gegenseitigen Beeinflussung geht, ist es daher in vielen Fällen sinnvoll, keine Delphi-Umfrage zu machen, sondern gleich eine einfache (einrundige) Befragung anzulegen. Eine der Funktion von Delphi-Studien ist es auch, die Weisheit der Vielen (Surowiecki 2004) in einem strukturierten Prozess zusammenzuführen.

5 Einsatzbereiche Als Anwendungszwecke für Delphi-Studien werden folgende Punkte genannt: Delphi als • direktes Kommunikationsmittel, • Entscheidungsinstrument, • Problemlösungsinstrument,

18

K. Cuhls

• Prognoseinstrument, • Demokratisierungs- und Partizipationsinstrument, • Planungsinstrument in betrieblichen oder bürokratischen Zusammenhängen, • Bewertungs- und Urteilsinstrument. In den meisten Fällen stellen Delphi-Befragungen einfach nur Informationen über zukünftige Sachverhalte zur Diskussion und zur Bewertung, da über diese eine große Unsicherheit besteht, die reduziert werden soll. Da diese Sachverhalte bzw. Entwicklungen in sehr kurzer und möglichst unmissverständlicher Thesenform beurteilt werden sollen, ergeben sich Einschränkungen bezüglich der Methode. So ist zunächst zu beurteilen, ob überhaupt eine mehrfache Beurteilung notwendig ist oder eine einfache Befragung ausreicht (Cuhls 2012). Viele ­Delphi-Studien werden auch über mehrere Themengebiete hinweg durchgeführt, um einen Überblick über Zukunftsthemen zu generieren (z. B. Cuhls et al. 1998; Andreescu et al. 2017). Von den Themenfeldern her bieten sich Themen aus Forschung und Technologie an, da diese entsprechend ihrer Definition von Menschen gemacht werden und damit auch von Menschen einschätzbar sein dürften (immer unter Vorbehalt). Manchmal werden auch Bildungsthemen mit einer Delphi-Befragung angegangen (Kuwan et al. 1998; Prognos und Infratest Burke Sozialforschung 1998). Besonders viele Delphi-Studien wurden im Gesundheitsbereich durchgeführt, wie auch die Beiträge in diesem Buch zeigen. Von diesen sind einige technikzentriert, andere gehen von den Anforderungen im Gesundheitsbereich aus. Es gibt jedoch auch Studien im Bereich „Medical Education Research“ (Humphrey-Murto et al. 2017), d. h. einer Kombination mit Bildungsfragen. Häufig sind quer liegende Fragestellungen in den Themen von Delphi-Befragungen zu finden, ein Beispiel ist der Transfer von „private food marketing success factors to public food and health policy“ (Aschemann-Witzel et al. 2012). Weniger einfach ist es, gesellschaftliche Fragestellungen auf eine kurze These zu reduzieren. Hierfür bieten sich Szenarien oder andere, mit längeren Beschreibungen arbeitende Methoden an. Es ist auch möglich, bildliche Darstellungen in einer Delphi-Studie beurteilen zu lassen. Bilder werden ebenso wie Text sehr unterschiedlich interpretiert, können aber auch zu einer Einengung des Blickwinkels führen. Welche Bilder verwendet werden, muss daher gut bedacht sein – genauso wie die Frage der Engführung im Denken. Delphi-Studien werden nicht nur im akademischen Bereich genutzt, sondern finden sich vielfach in der angewandten Forschung, für Politik und Ministerien, Verbände und Unternehmen. Die Grenzen für Delphi-Studien liegen insbesondere bei den Ressourcen (Zeit, Geld, Kapazitäten), weniger bei den Themenfeldern.

Die Delphi-Methode – eine Einführung

19

Es ist jedoch zu beachten, dass sehr komplexe Themen sich für eine Befragung nicht eignen. Sie müssen in ihre Bestandteile (Thesen, sehr kurze Texte) zerlegt und damit fokussiert werden.

6 Fragebogengestaltung Die Fragebogengestaltung hat alle Möglichkeiten, die eine klassische sozialwis­ senschaftliche Befragung auch hat – nur muss sie auch wissenschaftlichen Stan­ dards entsprechen und es muss möglich sein, Feedback mitzuteilen und eine erneute Beurteilung zu ermöglichen (siehe Gerhold et al. 2015). Die meisten Fragebögen beinhalten einen Satz an Thesen, die es zu beurteilen gilt. Die einzelne These muss dabei kurz, prägnant und eineindeutig sein. Häufig werden Zeitraum der Realisierung in Fünfjahresschritten, die Wichtigkeit des Themas, die Genauigkeit der Einschätzung und die Expertise der Antwortenden abgefragt (seit Kagaku Gijutsuchô Keikakukyoku 1971). Einige Delphi-Studien fragen auch nach der Wahrscheinlichkeit des Eintreffens, der Wünschbarkeit (z. B. im Projekt FAZIT, Cuhls et al. 2007) sowie Hindernissen oder Problemen auf dem Weg der Realisierung (Cuhls et al. 1995). Offene Fragen oder Fragen nach Alternativthemen finden sich ebenfalls. Für die quantitativen Analysen werden wie bei anderen wissenschaftlichen Studien in der Regel Median, Mittel oder Modus berechnet (siehe Niederberger und Renn 2018, S. 11) und in der zweiten Runde an die Teilnehmenden zurückgespielt. Für die Feedbackrunde werden entweder Verteilungen dargestellt oder der Median (manchmal auch der Durchschnitt der Antworten) häufig in „Häuschen-Darstellung“ zurückgespielt. Hier liegt die Kunst darin, eine richtige, nicht irreführende Darstellungsweise zu wählen, die gleichzeitig gut verständlich ist. Die Beiträge in diesem Buch zeigen einige Beispiele.

7 Teilnehmende Auch wenn Delphi-Studien als Expert_innenbefragungen definiert sind, widmen sie sich in der Regel inter- und transdisziplinären Forschungsfragen: Die Einbeziehung von Expert_innen und Praxisakteur_innen in Forschungsprozessen spielt bei diesen Forschungsfragen eine wichtige Rolle. In Überblicksstudien werden sehr unterschiedliche Disziplinen angesprochen und das Wissen sehr unterschiedlicher Expertisen kombiniert. Deshalb relativiert sich hier der Expert_ innenbegriff sehr stark. Delphi-Verfahren können in diesem Zusammenhang zur

20

K. Cuhls

partizipativen Wissensproduktion, -integration oder zum Wissenstransfer eingesetzt werden. Die Zeit zwischen erster und zweiter Runde der Befragung wird gleichzeitig genutzt, um Zusatzinformationen über das Thema einzuholen (dies erledigt das Gehirn von selbst, es kombiniert neue Informationen mit bekannten Informationen – in diesem Fall die Informationen aus der Delphi-These7). In spezifischen Delphi-Anwendungen wie dem Gruppendelphi wird explizit ein Konsens gesucht und sei es nur der Konsens darüber, dass es keinen Kon­ sens gibt (Schulz und Renn 2009). Es gibt aber auch neuere Versuche mit ­Dissens-Delphi-Verfahren, die explizit herauszufinden versuchen, wo der Dissens liegt (Steinert 2009). Die wichtigste Gemeinsamkeit und Schwierigkeit aller Delphi-Verfahren ist jedoch, Personen für die Teilnahme an einer Befragung zu gewinnen. Bei einer Delphi-Befragung müssen die Teilnehmenden besonders motiviert werden, denn sie sollen mehrfach antworten. Dies wird zunehmend schwierig, da immer mehr Befragungen existieren und es für die Proband_innen schwer zu entscheiden ist, welche Teilnahme für sie persönlich wichtig und interessant sind. Der Begriff „Experte bzw. Expertin“ wird für Delphi-Studien sehr breit verwendet und bezieht inzwischen auch Personen mit sehr unterschiedlichen Hintergründen und aus unterschiedlichen Branchen ein, die sich jeweils mit dem Themenfeld auskennen sollen. In den meisten Umfragen bietet es sich daher an, eine Selbstbewertung zur Expertise hinsichtlich des ganzen Feldes oder des ein­ zelnen Themas vorzunehmen. Häufig wird der Grad der Expertise anhand einer Likert-Skala erfragt (von „Ich arbeite auf dem Gebiet…“ bis zu „keine Fach­ kenntnis“). Eine Fremdbewertung wäre noch besser, ist aber praktisch kaum leistbar. Mit der Zeit wurden die Foresight-Konzepte partizipativer und immer mehr unterschiedliche Personengruppen nehmen als „Expert_innen“ teil (Cuhls 2000). Die Frage lautet daher, wer ein „guter“ Experte bzw. „gute“ Expertin im Sinne guter Zukunftseinschätzungen sein kann, denn besonders gut informierte Personen sind manchmal in ihren Einschätzungen einseitig (Grupp 1995). So schätzten zum Beispiel die Expert_innen im Delphi '98 die Themen als „wichtiger“ ein, wenn sie auf dem Gebiet arbeiteten (Cuhls et al. 1998). Bei den Energie-Expert_innen konnten besondere Unterschiede zwischen den Befürworter_innen der Solarenergie und jenen der Nuklearenergie gefunden werden. Sie beurteilten jeweils die Themen aus dem Gebiet, auf dem sie arbeiteten, als wichtiger und auch zeitlich früher realisierbar (ebenda, auch Grupp 1995; Blind und Cuhls

7Zur

Funktion des Gehirns z. B. Burnett (2016).

Die Delphi-Methode – eine Einführung

21

2001; Blind et al. 2001). Hier scheint es vor allem um die Neigung zur Überschätzung (sogenannter „overestimation bias“) zu gehen. Wir haben vor langer Zeit einmal einen unfreiwilligen Test gemacht: In der zweiten Runde unserer Mini-Delphi-Studie wurden bei wenigen Thesen versehentlich falsche Daten als Feedback eingespielt. Die meisten Personen, die ihre Expertise als mittel bis hoch einschätzten, wunderten sich zwar und gaben in der Kommentarspalte dieser Verwunderung Ausdruck – änderten aber trotz­ dem häufig ihre Meinung Richtung Konsens oder blieben bei ihrer vorherigen Ansicht. Nur die Expert_innen, die ihre Fachkenntnis als „sehr hoch“ einschätz­ ten, schimpften, das könne nicht sein, und blieben bei ihrer Meinung (Cuhls et al. 1995). Professionell auf einem Gebiet arbeitende Personen können aber komplizierte Themen besser verstehen und beurteilen. In Fällen, in denen Personen mit „niedriger Expertise“ Themen beurteilen, die sie gut verstehen, können empirisch kaum Unterschiede in den Urteilen zu den „hochrangigen Fachexpert_innen“ festgestellt werden (Cuhls et al. 2002). Daher wird für Zukunftsbefragungen in der Regel dazu geraten, eine gemischte Zusammensetzung von Personen aus der Wirtschaft, Wissenschaft, dabei auch nicht-staatlichen Forschungseinrichtungen sowie anderen (Vereine, Banken, Journalisten, NGO’s etc.) einzubeziehen. In allen Untersuchungen muss die Teilnehmerzahl groß genug sein, um die entsprechenden Auswertungen vorzunehmen oder Schlüsse ziehen zu können. Für das Sample sollten weitere Kriterien aufgestellt werden wie die Alterszusammensetzung, Geschlecht die Branchen usw., um herauszufinden, ob Ältere anders antworten als Jüngere oder Branchenunterschiede in der Zukunftseinschätzung bestehen. Trotzdem wird bei einer Zukunftsbefragung das Sample nicht als „repräsentativ“ zu bezeichnen sein, wie z. B. in klassischen Meinungsumfragen, denn wer ist schon repräsentativ für die Zukunft? Oftmals sind in Befragungen (besonders zu Forschung und Technologie) Frauen unterrepräsentiert, mit dieser Frage muss umgegangen werden. Lobbyismus sollte vermieden bzw. eine Lösung gefunden werden, wie mit den Lobbyisten umzugehen ist, z. B. explizit die gleiche Anzahl von Personen unterschiedlicher Lobbygruppen einzubeziehen. Hier fällt allerdings die Identifikation schwer. In Foresight-Prozessen stützt man sich gerne auf Ko-Nomination (für Details siehe Nedeva et al. 1996). Allerdings haben diese den Nachteil, dass die Auswahl der Personen immer in den entsprechenden „Zirkeln“ verbleibt, also keine neuen Personen oder quer denkenden Ansätze einbezogen werden, was mehr und mehr kritisiert wird. Adressen zu identifizieren wird immer einfacher: Internet, Datenbanken, online Messekataloge, Mitgliederlisten usw. können inzwischen genutzt werden, ohne Datenschutzrichtlinien zu verletzen. Schwieriger wird es dann schon, die

22

K. Cuhls

eigene Datenbank so zu strukturieren, dass sie einerseits einfach zu handhaben ist, um den Versand, die Erfassung und das Speichern zu erleichtern, andererseits aber alle Sicherheitsanforderungen erfüllt. Diese müssen aber unbedingt eingehalten werden. Wie viele Personen involviert werden, hängt von der Anzahl der Themen, Thesen und Fragen genauso ab wie von der erwartbaren Antwortrate und anderen Faktoren. Wenn ein kleines Delphi in einem Raum mit Computer Groupware oder sogar Smartphones eingesetzt wird, kann das Sample relativ klein sein (Gruppengröße von zehn bis zwölf Personen). Wenn es aber um ein nationales Foresight-Programm geht, das spezifische Repräsentativität erfordert, sind mehr Personen gefragt und es wird in der Regel versucht, mehr als 100 Antworten pro These zu erhalten. Das bedeutet, es müssen pro Feld bis zu 500 Personen angefragt werden. Dies ist natürlich auch vom Land abhängig: in kleineren Ländern gibt es gar nicht so viele Expert_innen in dem Feld. In Deutschland Personen zu finden, die sich in detaillierten Fragen der Raumfahrt auskennen, hat uns beispielsweise schon früh vor große Herausforderungen gestellt (BMFT 1993). In einigen sehr langfristig angedachten Feldern gibt es auch in großen Ländern nur sehr wenige Personen, die sich mit den Themen beschäftigen. Dies festzustellen ist allein schon ein Ergebnis. Die Beispielthese „More than 20 % of the EU population has coupled sensors to their brains to enhance their sense spectrum (infrared, ultraviolet, vibration, magnetic fields etc.)“ (Mehr als 20 % der europäischen Bevölkerung hat Sensoren an ihr Hirn gekoppelt, um das Sinnesspektrum zu erweitern) können sicherlich nicht viele einschätzen. Bei der Frage „50 % of passenger transport is fully automated.“ (50 % des Passagiertransports ist komplett automatisiert)8 versteht der Normalbürger/die Normalbürgerin wenigstens die These und kann sie – vielleicht anders als der Experte/ die Expertin – einschätzen. Die allgemeine Öffentlichkeit einzubeziehen ist generell möglich, aber dann müssen die Fragen recht einfach zu verstehen sein. Nur dann ist der Normalbürger/die Normalbürgerin dem Experten/der Expertin gleichgestellt.

8Beispiele

aus dem Projekt BOHEMIA, siehe Andreescu et al. (2017).

Die Delphi-Methode – eine Einführung

23

8 Ausblick Die Methoden der Zukunftseinschätzung sind eindeutig nach ihrer Zielorientierung auszuwählen. In Zukunft werden sich die online durchgeführten Delphi-Befragungen endgültig durchsetzen. Für alle Arten der Befragungen wird es ganze Baukastensysteme geben, die auch die Thesengenerierung software-unterstützt ermöglicht. Weiterhin wird jedoch die Formulierung der Fragen essenziell für die Qualität des ganzen Verfahrens bleiben. Auch wenn es inzwischen Standard-Software für die Erstellung und Auswertung von Fragebögen gibt, steht und fällt das Ergebnis genauso wie die Teilnahmebereitschaft mit den Inhalten der Befragung. In allen Fällen muss die Delphi-Methode in einen größeren Foresight-/bzw. Zukunftsforschungs-Kontext eingebunden werden. Je nach Ziel und Teilschritt, den man mit der Befragung erreichen möchte, muss die Methodik angepasst werden. Daher sind moderne Delphi-Studien in der Regel multi-methodisch. Um einige Beispiele zu nennen: In den meisten Delphi-Befragungen wird nach dem Zeitraum der Realisierung in Fünfjahresschritten gefragt (alle japanischen Delphi-Studien des NISTEP, z. B. NISTEP 2005 oder 2015, Vorgänger: Kagaku Gijutsuchô Keikakukyoku 1971; in Deutschland z. B. BMFT 1993; Cuhls et al. 1995, 1998, 2002; Prognos et al. 1998; Andreescu et al. 2017 u. v. a.). Aus den entsprechenden Datensätzen können direkt einfache Roadmaps erstellt werden, indem die Daten zum Zeitpunkt der Realisierung geordnet und in eine Art Roadmap eingetragen werden (Cuhls et al. 1995; Cuhls und Möhrle 2008; Cuhls et al. 1998, 2017). Wenn die Kategorien und Statements zueinander passen, können sogar limitierte Szenarien ausgearbeitet werden (z. B. „targeted scenarios“ im Projekt BOHEMIA, siehe European Commission 2018). Derartige Analysen können helfen, Brüche in den Einschätzungen zu Befragungs-Statements zu visualisieren oder eine Strategie auszuarbeiten. Es kann überprüft werden, wie plausibel die Ergebnisse sind, z. B. wenn eine Entwicklung früher als eine andere eingeschätzt wird, kann es vorkommen, dass die dazu gehörende Technologie noch gar nicht entwickelt sein kann – aber die Expert_innen haben die Entwicklung trotzdem so früh eingeschätzt. Dies führt zur Frage der Plausibilität. Im deutschen Delphi '98 (Cuhls et al. 1998) fanden wir auf diese Weise einige Brüche im Sinne von Zeitsprüngen, insbesondere im Feld Management und Produktion. Zum Beispiel erwarteten die Expert_innen im Median, dass die Entgeltsysteme sich stark in Richtung Leistungsentlohnung bzw. Entlohnung in Unternehmensanteilen (aus damaliger Sicht sehr früh, schon 2004–2010) entwickeln würden. Das waren damals gewagte Behauptungen. Allerdings wurden keine Implausibilitäten aufgedeckt, es passte

24

K. Cuhls

zusammen, dass zuerst „für den Lohnanteil nicht mehr nur die Individualleistung ausschlaggebend war, sondern die Gruppenleistung bzw. das Betriebsergebnis“ (2002–2008 erwartet), dass es danach „objektivierte Bewertungsschlüssel…“ gibt und die „Mehrheit der Unternehmen entlohnt leistungsbezogen mit Unternehmens-Anteilsscheinen (Aktien)…“ (2003–2010). Auch wenn die Durchführbarkeit aller Befragungen online stark vereinfacht werden kann, sind nicht nur Design, Schnelligkeit und Handhabbarkeit (möglichst einfach für die Nutzenden und für die Auswertung) von Wichtigkeit, sondern die Inhalte und die Interpretierbarkeit der Ergebnisse dürfen nicht vergessen werden. Bei mehrdeutigen Thesen ist beispielsweise eine Interpretation schlicht unmöglich. Bei zu kleinen Samples und Antwortzahlen kann eine quantitative Analyse nicht durchgeführt werden oder zu einem sehr einseitigen Gesamtergebnis führen. Bei zu viel Statistik und zu vielen Tests bleibt häufig gar kein interpretierbares Ergebnis mehr übrig. Die Fragen der Sample-Auswahl und der Adressdatenbank bleiben online dieselben wie offline, auch wenn es einfacher ist, Adressen automatisiert zu erfassen. Datenschutzrichtlinien müssen unbedingt eingehalten werden. In Internet-Befragungen muss berücksichtigt werden, die Sample-Kontrolle zu behalten. Eine Erfahrung ist, dass die Antwortraten bei Internet-Befragungen relativ niedrig sind (besonders in Deutschland), teilweise unter zehn Prozent (z. B. Bioökonomierat 2015; El-Chichakli et al. 2016; Andreescu et al. 2017). Entsprechend müssen mehr Individuen angesprochen oder mehr Anreize gesetzt werden. Obwohl es für einfache und mehrrundige Befragungen aller Art in Zukunft immer mehr Baukastensysteme geben wird, muss sich jeder Forschende genau überlegen, in welchen Fällen welcher Ansatz genutzt wird. Inhalte müssen genau angepasst werden. In den letzten Jahren haben sich viele am Design „verkünstelt“, dabei aber häufig nicht darüber nachgedacht, dass die Inhalte weder verständlich noch auswertbar sind. Die Balance zwischen Design und Inhalt zu finden, ist die Kunst. Genauso verführen einige der Tools zu Statistikauswertungen, die niemand versteht, aber man hat eine Zahl. Auch dies ist nicht hilfreich. Die Formulierung von Statements ist bei einer Delphi-Befragung weiterhin die wichtigste und gleichzeitig aufwandträchtigste Aufgabe. Auch die Fragen bzw. Kriterien zu den Thesen müssen genau abgestimmt und getestet werden. Da Befragungen häufig unter Zeitdruck entstehen, fallen Pretests häufig weg. Das ist fatal, denn bei Tests bemerken die Organisator_innen des Prozesses meistens erst, dass die Thesen, die sie für verständlich gehalten haben, dieses gar nicht sind – oder schlimmer noch: zweideutig sind. Manchmal passen Kriterien und Thesen dann doch nicht zusammen oder sind einfach nicht einschätzbar. Manchmal stellt

Die Delphi-Methode – eine Einführung

25

auch die Handhabung der Befragung die Nutzer_innen vor unlösbare Probleme. An diesen Stellen darf daher nicht an der Zeit gespart werden. Für die Delphi-Methode sprechen bei allem Aufwand die Rückkopplung und das mindestens zweimalige Nachdenken über dasselbe Thema und entsprechend doppeltes Befragen. Bei einfachen Befragungen gibt es kein Korrektiv, d. h. die einmal gegebene Antwort zählt in der Auswertung. Entsprechend geben Befragungen mit Feedback die Möglichkeit, die Einschätzung zu revidieren. Das hat Vorteile bei Einschätzungen unter Unsicherheit. Die Beeinflussbarkeit der Systeme ist aber nicht zu unterschätzen (Rowe et al. 2005, S. 396; auch: unfreiwilliger Test in Cuhls et al. 1995), sodass selten deutlich wird, warum die Expert_innen ihre Meinung geändert haben und wovon sie sich haben beeinflussen lassen. Dies kann einerseits die vorgegebene Einschätzung anderer Expert_innen sein, andererseits aber auch ein externer Einfluss. Beispiel: im japanischen Delphi von 1997 wurden die Aussagen zum Aufbau eines „Kernbrennstoffkreislaufs“ stark von einem Unfall beeinflusst, der sich zwischen der ersten und der zweiten Runde der Befragung ereignete (NISTEP 1997; Cuhls 1998, 2003). Alle Fragen zu Sample-Auswahl, Generierung von Inhalten, Formulierung von Thesen und Kriterien, die für schriftliche und gedruckte Fragebögen in der Vergangenheit galten, haben online nichts von ihrer Brisanz verloren. Auch wenn uns informationstechnische Systeme neue Möglichkeiten suggerieren, geraten sie hier oft an ihre Grenzen oder begrenzen sogar die Möglichkeiten der Inhalte (Aengenheyster et al. 2017). In allen Delphi-Varianten und auch einfachen Befragungen gibt es noch sehr viele offene Fragen. Die Grenzen zwischen einem Delphi, Realtime Delphi und einer einrundigen Befragung verschwimmen mehr und mehr. Damit wird auch die Definition eines Delphi-Verfahren „fließend“. Der inflationäre Gebrauch des Begriffs „Delphi“ ist hier genauso wenig hilfreich. Immer häufiger werden einfache Befragungen ohne eine Verbindung zu Zukünften bereits „Delphi“ genannt – und ohne Feedbackschleife sind sie tatsächlich auch kein Delphi. Delphi-Befragungen können und sollten nicht in jedem Fall eingesetzt werden. Wenn die Themen sich nicht auf einfache Statements oder Fragen reduzieren lassen, sind in Vorausschau-Prozessen andere Methoden angesagt: Szenarien, Systems Dynamics, Diskurse, Zeitreisen, komplexere Kreativverfahren oder andere Workshop-basierte Ansätze könnten dann die bessere Wahl sein. Viele Befragungen werden durch die neuen technischen Möglichkeiten und Designs genauso wie aufgrund der vielen Themen, die den Expert_innen einfallen, „überladen“ und der „Fragebogen“ ist zu lang. Hier gilt weiterhin: Weniger ist oft mehr und wird besser von den Expert_innen beantwortet. Einfache Handhabbarkeit ist immer noch keine Selbstverständlichkeit.

26

K. Cuhls

Wenn das Ziel vor Augen deutlich ist, sollten sich die Organisator_innen einer Befragung zunächst überlegen, wie die Ergebnisse von einer Phase in die nächste gelangen können, wie sie dabei von der Form her aussehen sollten und ob deshalb die Methodenkombination mit einem Delphi-Verfahren angemessen oder überhaupt die richtige Wahl ist. Ohne sich dies zu verdeutlichen, kann die richtige Wahl auch nicht getroffen werden. Eine Delphi-Studie durchzuführen, nur weil man „auch mal ein Delphi machen möchte“, macht wenig Sinn. Daher sollte am Anfang gut überlegt werden, ob es tatsächlich ein so aufwendiger Ansatz sein soll, oder ob nicht auch eine „einfache“ Befragung genügt. Wenn nach „Fakten“ (im Sinne einer Erhebung) und nicht nach Annahmen gefragt wird, sind Delphi-Verfahren nicht nötig. Die Methodenauswahl ist deshalb nicht so einfach, da das Repertoire an Möglichkeiten sich immer mehr erweitert. Manchmal genügt es aber, sich wieder und wieder die eigenen Ziele und danach die Unterschiede der Methoden vor Augen zu halten, um die richtige Entscheidung zu treffen.

Literatur Aengenheyster, S., Cuhls, K., Gerhold, L., Heiskanen-Schüttler, M., Huck, J., & Muszynskae, M. (2017). Real-time Delphi in practice – A comparative analysis of existing software-based tools. Technological Forecasting and Social Change. https://doi. org/10.1016/j.techfore.2017.01.023. Aichholzer, G. (2002). Das ExpertInnen-Delphi: Methodische Grundlagen und Anwendungsfeld Technology Foresight. In A. Bogner, B. Littig, & W. Menz (Hrsg.), Das Experteninterview (S. 133–153). Wiesbaden: VS Verlag. https://doi.org/10.1007/978-3322-93270-9_6. Andreescu, L., et al., European Commission, & European Union. (2017). New horizons: Data from a Delphi survey in support of European Union future policies in research and innovation (Report KI-06-17-345-EN-N). https://doi.org/10.2777/654172 or https:// ec.europa.eu/research/foresight/index.cfm. Zugegriffen: 28. Apr. 2018. Andronicos, M. (1983). Delphi. Athen. Aschemann-Witzel, J., Perez-Cueto, F. J. A., Niedzwiedzka, B., Verbeke, W., & BechLarsen, T. (2012). Transferability of private food marketing success factors to public food and health policy: An expert Delphi survey. Food Policy, 37(2012), 650–660. Bardecki, M. J. (1984). Participant’s response to the Delphi method: An attitudinal perspective. Technological Forecasting and Social Change, 25, 281–292. Becker, D. (1974). Analyse der Delphi-Methode und Ansätze zu ihrer optimalen Gestaltung. Dissertation, Mannheim. Berg, J., Forsythe, E. R., Nelson, F., & Rietz, T. A. (2000). Results from a dozen years of election futures markets research. College of Business Administration, University of Iowa. http://www.biz.uiowa.edu/iem/archive/BFNR_2000.pdf. Zugegriffen: 6. Sept. 2011.

Die Delphi-Methode – eine Einführung

27

Bioökonomierat. (2015). Global visions for the bioeconomy – An international Delphi-study, durchgeführt von K. Cuhls, V. Kayser, & S. Grandt. Broschüre: Fraunhofer ISI. http://gbs2015.com/fileadmin/gbs2015/Downloads/GBS2015_02_Delphi-Study. pdf. Zugegriffen: 29. Sept. 2018. Blind, K., & Cuhls, K. (2001). Der Einfluss der Expertise auf das Antwortverhalten in Delphi-Studien: Ein Hypothesentest. ZUMA-Nachrichten, 49, 57–80. Blind, K., Cuhls, K., & Grupp, H. (2001). Personal attitudes in the assessment of the future of science and technology: A factor analysis approach. Technological Forecasting and Social Change, 68, 131–149. Brockhoff, K. (1979). Delphi-Prognosen im Computer-Dialog. Experimentelle Erprobung und Auswertung kurzfristiger Prognosen. Tübingen: Mohr. Bundesministerium für Forschung und Technologie (BMFT) (Hrsg.). (1993). Deutscher Delphi-Bericht zur Entwicklung von Wissenschaft und Technik. Bonn: BMFT. Burnett, D. (2016). Unser verrücktes Gehirn. München: C. Bertelsmann. Cuhls, K. (1998). Technikvorausschau in Japan. Ein Rückblick auf 30 Jahre Delphi-Expertenbefragungen. Heidelberg: Physica. Cuhls, K. (2000). Opening up foresight processes. Économies et Sociétés, Série Dynamique technologique et organisation, 5, 21–40. Cuhls, K. (2003). From Forecasting to Foresight processes – New participative Foresight Activities in Germany. Cuhls, K. & Salo, Ahti (Hrsg.), Journal of Forecasting, Wiley Interscience, Special Issue, 22, 93–111. Cuhls, K. (2009). Delphi-Befragungen in der Zukunftsforschung. In R. Popp & E. Schüll (Hrsg.), Zukunft und Forschung (Wissenschaftliche Schriftenreihe des Zentrums für Zukunftsstudien Salzburg): Bd.1. Zukunftsforschung und Zukunftsgestaltung. Beiträge aus Wissenschaft und Praxis. Berlin: Springer. Cuhls, K. (2012). Zu den Unterschieden zwischen Delphi-Befragungen und „einfachen“ Zukunftsbefragungen. In R. Popp (Hrsg.), Wissenschaftliche Schriftenreihe Zukunft und Forschung des Zentrums für Zukunftsstudien Salzburg: Bd. 2. Zukunft und Wissenschaft: Wege und Irrwege der Zukunftsforschung (S. 139–159). Berlin: Springer. Cuhls, K. (2017). Unternehmensstrategische Auswertung von Foresight-Ergebnissen. In M. Möhrle & R. Isenmann (Hrsg.), Technologie-Roadmapping, VDI-Buch (S. 47–62). Berlin: Springer Vieweg. https://doi.org/10.1007/978-3-662-52709-2_4. Cuhls, K., & Möhrle, M. G. (2008). Unternehmensstrategische Auswertung der DelphiBerichte. In M. G. Möhrle & R. Isenmann (Hrsg.), Technologie-Roadmapping, Zukunfts­strategien für Technologieunternehmen (3. überarbeitete und erweiterte Aufl., S. 107–135). Berlin: Springer. Cuhls, K., Breiner, S., & Grupp, H. (1995). Delphi-Bericht 1995 zur Entwicklung von Wissenschaft und Technik – Mini-Delphi. Karlsruhe (Druck als Broschüre des BMBF, Bonn 1996). Cuhls, K., Blind, K. & Grupp, H. (Hrsg.). (1998). Delphi '98 Umfrage. Zukunft nachgefragt. Studie zur globalen Entwicklung von Wissenschaft und Technik. Methoden- und Datenband, Karlsruhe. https://doi.org/10.13140/2.1.2412.8965. Cuhls, K., Blind, K., & Grupp, H. (2002). Innovations for our future. Delphi ‘98: New foresight on science and technology. Technology, innovation and policy (Series of the Fraunhofer Institute for Systems and Innovation Research ISI no. 13). Heidelberg: Physica.

28

K. Cuhls

Cuhls, K., von Oertzen, J., & Kimpeler, S. (2007). Zukünftige Informationstechnologie für den Gesundheitsbereich. Ergebnisse einer Delphi-Befragung, FAZIT-Schriftenreihe. Stuttgart. https://www.fazit-forschung.de. Cuhls, K., van der Giessen, A., & Toivanen, H. (2015). Models of horizon scanning. How to integrate horizon scanning into European research and innovation policies. Report to the European Commission, Brussels. Dalkey, N. C. (1967). Delphi. RAND Corporation, Santa Monica, Calif., https://www.rand. org/content/dam/rand/pubs/papers/2006/P3704.pdf. Zugegriffen: 7. Apr. 2019. Dalkey, N. C. (1968). Predicting the future. Santa Monica: Rand Corporation. Dalkey, N. C. (1969a). Analyses from a group opinion study. Futures, 2(12), 541–551. Dalkey, N. C. (1969b). The Delphi method: An experimental study of group opinion, prepared for United States Air Force Project Rand. Santa Monica: Rand Corporation. Dalkey, N. C., & Helmer, O. (1963). An experimental application of the Delphi-method to the use of experts. Management Science, 9, 458–467. Dalkey, N. C., Brown, B., & Cochran, S. (1969). The Delphi method, III: Use of self ratings to improve group estimates. Santa Monica: Rand Corporation. de Loe, R. C., Melnychuk, N., Murray, D., & Plummer, R. (2016). Advancing the state of policy Delphi practice: A systematic review evaluating methodological evolution, innovation, and opportunities. Technological Forecasting and Social Change, 104, 78–88. El-Chichakli, B., Braun, J., Barben, D., Lang, C., & Philip, J. (2016). Five cornerstones of a global bioeconomy. Nature, 535, 221–223. European Commission/European Union. (2018). Transitions at the horizon: Perspectives for the European Union’s future research- and innovation-related policies. https:// ec.europa.eu/info/research-and-innovation/strategy/support-policy-making/support-eu-research-and-innovation-policy-making/foresight/activities/current/bohemia_en. Festinger, L. (1978). Theorie der kognitiven Dissonanz. In M. Irle & V. Möntmann (Hrsg.), Bern: Verlag Hans Huber. Friedewald, M., von Oertzen, J., & Cuhls, K. (2007). European perspectives on the information society: Delphi report. EPIS Deliverable 2.3.1. Karlsruhe: Fraunhofer ISI, Brussels: European Techno-Economic Policy Support Network (ETEPS). http://epis.jrc.es/ documents/Deliverables/EPIS%202-3-1%20Delphi%20Report.pdf. Zugegriffen: 6. Sept. 2011. Gerhold, L., et al. (Hrsg.). (2015). Zukunft und Forschung: Bd. 4. Standards und Gütekriterien der Zukunftsforschung. Ein Handbuch der Wissenschaft und Praxis (S. 86–93). Wiesbaden: Springer. Gheorghiu, R., Andreescu, L., & Curaj, A. (2014). Dynamic argumentative Delphi: Lessons learned from two large-scale foresight exercises. In Contribution to the 5th International Conference on Future-Oriented Technology Analysis (FTA) – Engage today to shape tomorrow, Brüssel (S. 27–28). Gordon, T., & Pease, A. (2006). An efficient, RT Delphi: “round-less” almost real time Delphi method. Technological Forecasting and Social Change, 73, 321–333. Gordon, T. J., & Helmer, O. (1964). Report on a long-range forecasting study. Santa Monica: Rand Corporation. Grupp, H. (Hrsg.). (1995). Der Delphi-report (unter Mitarbeit von S. Breiner & K. Cuhls). Stuttgart: dva. Häder, M. (2002). Delphi-Befragungen – Ein Arbeitsbuch. Berlin: Springer.

Die Delphi-Methode – eine Einführung

29

Häder, M. (2009). Delphi-Befragungen – Ein Arbeitsbuch (Zweite Aufl.). Berlin: Springer. Häder, M. (2014). Delphi-Befragungen: Ein Arbeitsbuch (2. Aufl.). Wiesbaden: Springer Fachmedien. Häder, M., & Häder, S. (1995). Delphi und Kognitionspsychologie: Ein Zugang zur theoretischen Fundierung der Delphi-Methode. ZUMA-Nachrichten, 37. Hämäläinen, R. P. (2003). Decisionarium – Aiding decisions, negotiating and collecting. Journal of Multi-criteria Decision Analysis, 12, 101–110. https://doi.org/10.1002/ mcda.350 Helmer, O. (1966). Social technology. Los Angeles: Rand Corporation. Helmer, O. (1967). Analysis of the future: The Delphi method. Santa Monica: Rand Corporation. Helmer, O. (1983). Looking forward. A guide to futures research. Beverly Hills: Sage. Helmer, O. & Rescher, N. (1959). On The Epistemology of the Inexact Sciences, Management Science, 6, 47–52. Humphrey-Murto, S., Varpio, L., Wood, T. J., Gonsalves, C., Ufholz, L., Mascioli, K., Wang, C., & Foth, T. (2017). The use of the Delphi and other consensus group methods in medical education research: A review. Academic Medicine. https://doi.org/101097/ ACM.0000000000001812. Zugegriffen: 18. Jan. 2018. Kagaku Gijutsuchô Keikakukyoku (Hrsg.). (1971). Gijutsu Yosoku Hôkokusho (Bericht zur Technikvorausschau). Tôkyô. Kanama, D., Kondo, A., & Yokoo, Y. (2008). Development of technology foresight: Integration of technology roadmapping and the Delphi method. International Journal of Technology Intelligence and Planning, 4(2), 184–200. Keeney, S., Hasson, F., & McKenna, H. (2011). The Delphi technique in nursing and health research. New Delhi: Wiley-Blackwell. Krüger, U. M. (1975). Die Antizipation und Verbreitung von Innovationen. Entwicklung und Anwendung eines kommunikations-strategischen Konzeptes unter besonderer Berücksichtigung der Delphi-Technik. Dissertation, Köln. Kuwahara, T. (2001). Technology foresight in Japan: The potential and implications of DELPHI approach (NISTEP Research Material No. 77, S. 119–135). Kuwan, H, Ulrich, J. G., & Westkamp, H. (1998). Die Entwicklung des Berufsbildungssystems bis zum Jahr 2020: Ergebnisse des Bildungs-Delphi 1997/98. BWP, 6, 3–8. http://www.forschungsnetzwerk.at/downloadpub/kuwan1998_bwp_06_1998.pdf. Zugegriffen: 29. Sept. 2018. Landeta, J. (2006). Current validity of the Delphi method in social sciences. Technological Forecasting and Social Change, 73, 467–482. Linstone, H. A. (1998). Multiple perspectives revisited. In IAMOT Conference, Orlando. Linstone, H. A., & Mitroff, I. I. (1994). The challenge of the 21st century: Managing technology and ourselves in a shrinking world. Albany: State University of New York Press. Linstone, H. A., & Turoff, M. (Hrsg.). (1975). The Delphi method: Techniques and applications. Mass: Addison Wesley Pub Co. Advanced Book Program. Luckner, S., Kratzer, F., & Weinhardt, C. (2005). Stoccer – A forecasting market for the Fifa World Cup 2006. In Proceedings of the 4th Workshop on e-Business (WeB 2005). Maass, M. (1993). Das antike Delphi. Orakel, Schätze und Monumente. Darmstadt: Wissenschaftliche Buchgesellschaft.

30

K. Cuhls

Miles, I., Green, L., & Popper, R. (Hrsg.). (2004). WP 4 futures forum, D4.2 Scenario methodology for foresight in the European research area, Fistera – Thematic network on foresight on information society technologies in the European research area. Manchester. http://fistera.jrc.ec.europa.eu/pages/latest.htm. Zugegriffen: 3. Dez. 2010. National Institute of Science and Technology Policy (NISTEP) (Hrsg.). (1997). The sixth technology forecast survey – Future technology in Japan toward the year 2025 (NISTEP Report no. 52). Tokyo. National Institute of Science and Technology Policy (NISTEP) (Hrsg.). (2005). Comprehensive analysis of science and technology benchmarking and foresight (NISTEP Report No. 99). Tokyo. National Institute of Science and Technology Policy (NISTEP) (Hrsg.). (2015). The 10th science and technology foresight (Report no. 164). Tokyo. http://data.nistep.go.jp/ dspace/bitstream/11035/3079/2537/NISTEP-NR164-SummaryE.pdf. Nedeva, M., Georghiou, L., Loveridge, D., & Cameron, H. (1996). The use of co-nomination to identify expert participants for technology foresight. R&D Management, 26(2), 155–168. Niederberger, M., & Renn, O. (2018). Das Gruppendelphi-Verfahren. Vom Konzept bis zur Anwendung. Wiesbaden: Springer VS. ohne Autor. (2017). Delphi. Whitepaper Delphi markets. https://delphi.markets/whitepaper. pdf. Zugegriffen: 15. Febr. 2018. Parke, H. W. (1956). The Delphic oracle. Oxford: Blackwell. Pill, J. (1971). The Delphi method: Substance, context, a critique and an annotated bibliography. Socio-Economic Planning Science, 5, 57–71. Prognos, A. G., & Infratest Burke Sozialforschung. (1998). Delphi-Befragung 1996/1998 Potentiale und Dimensionen der Wissensgesellschaft – Auswirkungen auf Bildungsprozesse und Bildungsstrukturen. Integrierter Abschlussbericht. München: Selbstverlag. Rowe, G., & Wright, G. (2011). The Delphi technique: Past, present, and future prospects – Introduction to the special issue. Technological Forecasting and Social Change, 78, 1487–1490. Rowe, G., Wright, G., & McColl, A. (2005). Judgment change during Delphi-like procedures: The role of majority influence, expertise, and confidence. Technological Forecasting and Social Change, 72, 377–399. Sackman, H. (1975). Delphi critique. Expert opinion, forecasting, and group process. Toronto: Rand Corporation. Salo, A., & Gustafsson, T. (2004). Group support system for foresight processes. International Journal of Foresight and Innovation Policy, 1(3–4), 249–269. Schulz, M., & Renn, O. (Hrsg.). (2009). Das Gruppendelphi. Konzept und Fragebogenkonstruktion. Wiesbaden: VS Verlag. Seeger, T. (1979). Die Delphi-Methode: Expertenbefragung zwischen Prognose und Gruppenmeinungsbildungsprozessen. Freiburg: Hochschul. Seker, S. E. (2015). Computerized argument Delphi technique. IEEE Access. https://doi. org/10.1109/access.2015.2424703. Spann, M., & Skiera, B. (2004). Einsatzmöglichkeiten Virtueller Börsen in der Marktforschung. Zeitschrift für Betriebswirtschaft (ZfB), 74, 25–48. Steinert, M. (2009). A dissensus based online Delphi approach: An explorative research tool. Technological Forecasting and Social Change, 76, 291–300.

Die Delphi-Methode – eine Einführung

31

Sternberg, E., Critchley, S., Gallagher, S., & Raman, V. V. (2011). A self-fulfilling prophecy: Linking belief to behavior. Annals of the New York Academy of Sciences, 1234(1), 83–97. https://doi.org/10.1111/j.1749-6632.2011.06184.x. Surowiecki, J. (2004). The wisdom of crowds. Anchor: Doubleday. Trevelyan, E. G., & Robinson, N. (2015). Delphi methodology in health research: How to do it? European Journal of Integrative Medicine, 7, 423–428. Turoff, M. (1970). The design of a policy Delphi. Technological Forecasting and Social Change, 2(2), 149–171. Weaver, J., Filson Moses, J., & Snyder, M. (2015). Self-fulfilling prophecies in ability settings. The Journal of Social Psychology. https://doi.org/10.1080/00224545.2015.10767 61. Webler, T., Levine, D., Rakel, H., & Renn, O. (1991). The group Delphi: A novel attempt at reducing uncertainty. Technological Forecasting and Social Change, 39(3), 253–263. Wechsler, W. (1978). Delphi-Methode, Gestaltung und Potential für betriebliche Prognoseprozesse (Schriftenreihe Wirtschaftswissenschaftliche Forschung und Entwicklung). München: Florentz. Woudenberg, F. (1991). An evaluation of Delphi. Technological Forecasting and Social Change, 40(2), 131–150. Zipfinger, S. (2007). Computer-aided Delphi – An experimental study of comparing round-based with real-time implementation of the method. Linz: Trauner.

Das „klassische“ Delphi. Praktische Herausforderungen aus Sicht der Zukunftsforschung Karlheinz Steinmüller

Zusammenfassung

Nach wie vor wird die Delphi-Methode in ihrer ursprünglichen Verfahrensvariante häufig genutzt, um ungewisse Sachverhalte durch Expert_innen bewerten und einschätzen zu lassen. In diesem Beitrag wird untersucht, mit welchen praktischen Herausforderungen man bei der Durchführung d­ erartiger Studien konfrontiert wird und welche Lösungsansätze existieren: von der Identifikation und Rekrutierung der Expert_innen über die Entwicklung des Fragebogens bis hin zur Gestaltung der Befragungsrunden und ­schließlich zu Fallstricken bei Auswertung und Interpretation. Die Ergebnisse sind ­großenteils auch auf andere Varianten der Delphi-Methode übertragbar. Schlüsselwörter

Delphi-Methode · Panel-Rekrutierung · Item-Generierung Konvergenz von Bewertungen · Zukunftsbezug

1 Einführung Seit über einem halben Jahrhundert zählt die Delphi-Methode zu den bekanntesten und am häufigsten genutzten Werkzeugen im Methodenrepertoire von Foresight (Popper 2009). Sie hat dementsprechend zahlreiche Weiterentwicklungen vom Real-Time Delphi (Gordon 2009b) bis zum Gruppendelphi (Niederberger K. Steinmüller (*)  Z_punkt GmbH, Berlin, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_2

33

34

K. Steinmüller

und Renn 2018) erfahren. Mit einigem Recht kann man die Delphi-Methode als ein geradezu paradigmatisches Verfahren von Zukunftsforschung bezeichnen. An ihr manifestieren sich erkenntnistheoretische Probleme und praktische Herausforderungen jeglicher Vorausschau-Aktivitäten in exemplarischer Weise – bis hin zum Missbrauch der attraktiven Bezeichnung Delphi für Umfragen mit nur einer Befragungsrunde. Zugleich schwingt im Wort Delphi immer noch jene leichte Ironie mit, die die Erfinder der Methodik in den 1950er und frühen 1960er Jahren dazu veranlassten, das Verfahren nach dem antiken Orakel zu benennen: Wir wissen ja, dass Vorhersagen ein schwieriges Feld sind und allein die Götter die Zukunft aus direkter Anschauung kennen … Die Delphi-Methode dient dazu, bei Fragestellungen, über die nur unvollständiges Wissen, ungesicherte Hypothesen oder bloße Vermutungen existieren, einigermaßen verlässliche Aussagen zu erzeugen. Dies geschieht durch kollektive Intelligenz, die strukturierte Nutzung des Wissens einer Expert_innen-­ Community – unter Einbeziehung von tacit knowledge (stillschweigendem, noch nicht expliziertem Wissen) und zumindest ansatzweise durch den Austausch von Argumenten, im Idealfall in einem Raum herrschaftsfreier Kommunikation. Insofern ist die Delphi-Methode ein Mechanismus zur Erzeugung von dem, was Bertrand de Jouvenel (1967) Konjekturen nannte: begründete Spekulationen (Hypothesen) über die Zukunft. Angesichts ihres konjekturalen Ansatzes verwundert es nicht, dass Delphi-Studien von Anbeginn an Gegenstand empirischer Untersuchungen waren, in denen die Ergebnisqualität und Verfahrensvarianten analysiert wurden (Linestone und Turoff 1975; Rowe et al. 1991). Die Delphi-Methode verfügt über eine Reihe von Vorzügen: Sie gestattet die Abbildung von Gruppenmeinungen und kann daher als ein Verfahren zur Steuerung von Gruppenkommunikation betrachtet werden. Sie gewährleistet die Reputationsübertragung von den teilnehmenden Expert_innen auf die Studie bzw. ihre Ergebnisse. Vor allem aber gilt sie als ein Verfahren, mit dem Vorurteile und Befangenheiten eingedämmt werden können, indem die individuellen Voreingenommenheit der Expert_innen ausbalanciert werden. Angewandt auf Zukunftsthemen bewirkt die Delphi-Methode darüber hinaus bei den Beteiligten eine gewisse allgemeine Einstimmung auf antizipatives Denken, generell sensibilisiert sie für Unsicherheiten und Ungewissheit. Im Folgenden soll nach einer kurzen Annäherung an die Methode dargestellt werden, welche praktischen Herausforderungen beim Einsatz des klassischen Delphi-Verfahrens zu bewältigen sind. Der Fokus liegt hier auf Fallstricken bei der Anwendung der Methode, nicht auf einer detaillierten Darstellung der

Das „klassische“ Delphi. Praktische …

35

­ orgehensweise oder auf wissenschaftstheoretisch-methodologischen Analysen. V Erstere kann beispielsweise bei Häder (2009) nachgelesen werden, bei letzteren sei exemplarisch auf das thematische Sonderheft der Zeitschrift Technological Forecasting and Social Change, Nr. 78 von 2011, verwiesen (Rowe und Wright 2011). Als empirische Basis dienen hierbei jahrelange persönliche Erfahrungen im Bereich der Zukunftsforschung. Die hier gewonnenen Einsichten lassen sich m.E. großenteils auch auf andere Bereiche und andere Typen von Delphi-Studien übertragen.

2 Grundcharakteristika der Methode Ganz allgemein dient die Delphi-Methode dazu, „einen möglichst zuverlässigen Konsens innerhalb einer Expertengruppe […] durch eine Reihe von schriftlichen Befragungen und zwischengeschalteten kontrollierten Feedback der Meinungen zu erreichen“ (Helmer 1983, S. 135, Übersetzung des Autors). Das Verfahren soll zugleich kognitive Prozesse veranlassen und unterstützen und negative gruppendynamische Effekte, wie Meinungsdruck und Gruppendenken, Einfluss von sozialem Status bzw. Reputation, Profilierung durch Gegenpositionen, Wirkung von Rhetorik, … minimieren. Dies gewährleisten die drei zentralen Charakteristika der Methode1: 1. Anonymität: Die Teilnehmenden einer Delphi-Umfrage bleiben anonym. Sie erfahren nicht, welche Einschätzungen bzw. Bewertungen die anderen Teilnehmenden abgegeben haben. 2. Iteration: Es finden mehrere (meist zwei) Befragungsrunden statt, sodass die Teilnehmenden ihre Einschätzungen bzw. Bewertungen überdenken und anpassen können. 3. Kontrolliertes Feedback: Nach jeder Runde werden die Rückläufe qualitativ und/oder quantitativ (statistisch) ausgewertet und in aggregierter Form (Häufigkeitsverteilung, Mediane, Quantile, anonymisierte Kommentare …) an die Teilnehmenden zurückgespielt, sodass diese eine erweiterte Informationsbasis für eine erneute Reflexion erhalten.

1Zum

breiten Spektrum der Definitionen und Charakterisierungen der Delphi-Methode siehe Häder (2009, S. 19 ff.).

36

K. Steinmüller

Der klassischen Delphi-Methode liegt eine Reihe von Annahmen zugrunde, die als plausibel gelten, in der methodologischen Literatur zur Delphi-Methode (Woudenberg 1991) aber im Einzelfall durchaus hinterfragt werden: • Expertise: Es wird angenommen, dass Expert_innen in ihrem Fachgebiet, insbesondere wenn sie zu gemeinsamen Schlüssen kommen, wesentlich validere und besser begründete Aussagen treffen als weniger informierte Personen. • Weisheit der Vielen: Es wird angenommen, dass Vorhersagen oder andere Schätzungen, die eine Gruppe von Expert_innen abgibt, den Vorhersagen bzw. Schätzungen von individuelle Expert_innen hinsichtlich ihrer Korrektheit2 bzw. Wahrscheinlichkeit des Eintreffens überlegen sind (Hill 1982, S. 517), denn eine Gruppe verfügt über ein breiteres Spektrumpotenziell relevanter Informationen (Rowe et al. 1991, S. 235). Zudem können sich mögliche Voreingenommenheiten innerhalb der Gruppe ausgleichen. • Konvergenz: Es wird angenommen, dass sich die Bewertungen der beteiligten Expert_innen dank dem zwischengeschalteten Feedback von Runde zu Runde einander annähern. Diese Konvergenz drückt sich in einer Abnahme statistischer Streumaße (Varianz) oder vergleichbarer Parameter aus. Allerdings muss an dieser Stelle hervorgehoben werden, dass durchaus nicht alle Delphi-­ Studien auf Konsensbildung abzielen.

2.1 Breite Anwendungsmöglichkeiten Üblicherweise wird die Delphi-Methode dort angewandt, wo ein unsicherer Sachverhalt vorliegt, sich die Fragestellung einer empirischen Behandlung entzieht und auf Expert_innen mit ihrem Erfahrungshintergrund zurückgegriffen werden kann. Damit steht die Delphi-Methode in Konkurrenz zu Expert_ innen-Interviews, zu Befragungen mit nur einer Runde (Cuhls 2012) und Arbeitsgruppen-Treffen bzw. Workshops. Häufig dient das Delphi-Verfahren als eine „method of last resort“ (Linstone 1978, S. 275), die dann genutzt wird, wenn anderen Zugänge versagen. Sie ist jedoch keine „Allround-Methode“, sondern

2Die

Probleme beginnen allerdings schon bei dem, was als „valide“ oder „korrekt“ angesehen wird. Bei auf die Zukunft bezogenen Items (wie auch bei manch anderen) kann eine Übereinstimmung mit den Tatsachen, falls überhaupt, erst ex post festgestellt werden. Grunwald verweist darauf, dass „die Gleichsetzung von guten und zutreffenden Vorhersagen … sinnlos ist“ (Grunwald 2012, S. 172 f.).

Das „klassische“ Delphi. Praktische …

37

nur dann nutzbringend einzusetzen, wenn bestimmte Voraussetzungen bezüglich der Spezifik der Fragestellung und der Struktur der Expert_innen-Community vorliegen (Häder 2009, S. 23). Traditionelle Felder sind dabei insbesondere die technologische Früherkennung aber auch Fragen aus dem Bereich des Gesundheitswesens (Adler und Ziglio 1996; Thangaratinam und Redman 2005; Gordon 2009a, S. 3). Je nach Einsatzzweck kann man verschiedene Arten von Delphi-Studien unterscheiden. Häder (2009, S. 30 f.) führt insbesondere Delphi-Befragungen zur Ideenaggregation, zur Vorhersage von Sachverhalten, zur Ermittlung von Expert_ innen-Ansichten und zur Konsensfindung auf. Eine allgemeine, übergeordnete Typologie steht hier allerdings noch aus. Zu berücksichtigen ist, dass in einer Delphi-Studie wie allgemein bei Befragungen durchaus mehrere Typen von Items verwendet werden können. In Anlehnung an Gordon (2009a, S. 5) kann man bei Delphi-Studien zu technologischen Entwicklungen drei Fragetypen unterscheiden: • prädiktiver Typus – Vorhersagen zum Auftreten künftiger Entwicklungen: Wann wird ein bestimmtes Ereignis eintreten bzw. mit welcher Eintrittswahrscheinlichkeit ist in einem gegebenen Zeithorizont zu rechnen? Welchen Wert wird ein bestimmter Parameter (etwa Marktumfang) zu einem bestimmten künftigen Zeitpunkt annahmen? • normativer Typus – Items zur Wünschbarkeit von künftigen Entwicklungen: Ist es unter bestimmten Gesichtspunkten gesellschaftlich eher positiv oder eher negativ zu bewerten, dass ein bestimmtes Ereignis eintritt? Welche Argumente sprechen dafür oder dagegen? • instrumenteller Typus – Items mit Bezug zu Gestaltungsoptionen: Welche Maßnahmen, Strategien oder Instrumente können dazu dienen, dass ein bestimmter gewünschter künftiger Zustand erreicht oder ein unerwünschter vermieden wird? Was sind fördernde oder hemmende Einflüsse?

3 Vorbereitungsphase Der idealtypische Ablauf einer Delphi-Studie (Abb. 1) beginnt mit einer Vorbereitungsphase. In dieser werden die Ziele der Befragung festgelegt und die Vorgehensweise im Detail geplant. Die erste und oft unterschätzte Herausforderung besteht in der Konkretisierung der Fragestellung bzw. der Festlegung, welche Art von Informationen durch die Delphi-Studie erzeugt werden soll. Erfahrungsgemäß übersteigen die

38

K. Steinmüller

Idealtypischer Ablauf Klassische Delphi-Studien folgen in der Regel dem nachstehenden prinzipiellen Ablaufschema: 1. Vorbereitung und Planung der Studie 2. Identifikation und Rekrutierung der Expert_innen 3. Entwicklung des Fragebogens 4. Erste Befragungsrunde 5. Analyse der Rückläufe der ersten Runde und Formulierung von Feedback 6. Zweite Befragungsrunde 7. Analyse der Rückläufe der zweiten Runde 8. Gegebenenfalls weitere Befragungsrunden 9. Analyse des gesamten Befragungsverlaufs 10. Auswertung und Bericht Abb. 1   Idealtypischer Ablauf eines klassischen Delphi-Verfahrens. (Eigene Darstellung)

­ ünsche der Auftraggeber_innen hinsichtlich der Art und Vielfalt der InformatioW nen, hinsichtlich ihrer Granularität, dem Detaillierungsgrad etc. nicht selten das, was die Studie bzw. die potenziell beteiligten Expert_innen zu leisten vermögen. Es wäre – um ein fast triviales Beispiel zu nennen – sicherlich äußerst nützlich zu wissen, wann genau und wo die nächste Grippewelle einsetzt und wie virulent der Erreger sein wird; aber sobald diese Fragen zu spezifisch gestaltet werden (genauer Tag, Anzahl der Fälle auf Stadtbezirksniveau in den ersten 72 h), werden auch ausgewiesene Expert_innen zum bloßen Raten gezwungen – oder sie verweigern die Beantwortung „überzogener“ Fragen. Es kommt daher darauf an, sich nicht nur von den eigenen Informationswünschen leiten zu lassen, sondern realistische Erwartungen an das Wissen und die Auskunftsbereitschaft der Expert_innen zu entwickeln und die Items entsprechend zu formulieren. Wie bei anderen Studientypen wird häufig der zeitliche Aufwand unterschätzt. Das betrifft sowohl die Dauer der Umfragerunden (s. u.) als auch die der Auswertung. Ein gutes Projektmanagement plant mögliche Verzögerungen etwa bei der Rekrutierung von Expert_innen, beim Umgang mit Nachzügler_innen unter den Respondent_innen etc. ein und minimiert dadurch Reibungsverluste. Generell empfiehlt es sich vom Ende her zu denken und zu planen: Wie und durch wen sollen die Ergebnisse genutzt werden? In welcher Form sollen sie niedergelegt werden? Wann und wie sollen die Ergebnisse präsentiert und publiziert werden? Für größere Studien empfiehlt sich zudem die Einrichtung einer Gruppe, oft Steuerungskreis, Monitoring-Gruppe oder Steering Committee genannt, die das Projekt inhaltlich und methodisch begleitet. Ein derartiger Expert_innen-Kreis

Das „klassische“ Delphi. Praktische …

39

kann vielfältige Funktionen übernehmen. Er kann das Projektteam bei der Kommunikation und Abstimmung mit dem Auftraggeber_innen unterstützen, methodische Hinweise im Sinne einer begleitenden Evaluation geben, Vorschläge für zu rekrutierende Expert_innen unterbreiten oder in Pretests einbezogen werden. Selbstverständlich ist ein derartiger Expert_innen-Kreis mit zusätzlichem Aufwand, und seien es lediglich die Termine für Meetings, verbunden.

4 Identifikation und Rekrutierung der Expert_ innen Die Qualität einer Delphi-Studie steht und fällt mit den beteiligten Expert_innen. Sie zu identifizieren und für die Teilnahme zu gewinnen, ist eine oft schwierige und zeitaufwendige Aufgabe, zumal wenn die Organisatoren der Studie nicht selbst zur engeren Fachcommunity gehören, was bei den typischen zukunftsorientierten Studien eher die Regel als die Ausnahme ist.3 Für Häder und Häder (2000, S. 18 f.) wie für Gordon (2009a) besteht die zentrale Herausforderung bei Delphi-Studien darin, wie zu den vorgegebenen Fragen diejenigen Personen gefunden werden können, die sie aller Wahrscheinlichkeit nach am besten beantworten können.

4.1 Heterogenität der Panel Ideal wäre es, die Gesamtheit der Fachleute eines bestimmten Gebiets in die Studie einzubeziehen. Doch entstammen die Fragestellungen von Delphi-Studien nur im Ausnahmefall einem einzelnen Fachgebiet. In der Regel sind Delphi-Themen interdisziplinär oder transdisziplinär angelegt, sie fallen nicht in den Kompetenzbereich einer einzelnen Disziplin und oft genug stehen Fragen der Praxis, der Umsetzung von wissenschaftlichen Erkenntnissen oder von Innovationen in einem breiten gesellschaftlichen Kontext im Zentrum. Die Perspektive der praktischen Anwendung – im Bereich der Wirtschaft, der Politik, des Sozialwesens – erfordert es, dass neben Expert_innen aus dem akademischen Bereich auch gut informierte Spezialist_innen aus der Praxis ihre Einschätzungen beisteuern,

3Niederberger und Renn (2018, S. 8) verweisen darauf, dass sich das Delphi-Team schon bei der Ansprache der Expert_innen als kompetente Gesprächspartner („Quasi-Expert_ innen“) präsentieren muss, d. h. hinreichend mit der Thematik vertraut sein muss.

40

K. Steinmüller

Manager_innen, Politiker_innen, Vertreter_innen von gesellschaftlichen Organisationen – je nach Fragestellung auch betroffene Bürger _innen oder Patient_ innen. Ziel der Rekrutierung des Befragungspanels kann bei Zukunftsfragen nicht Repräsentativität (in irgendeinem soziodemografischen Sinne) sein, ausschlaggebend sind Fachkompetenz und Vielfalt der Perspektiven. Typischerweise sollten alle relevanten Anspruchsgruppen („Stakeholder“) einbezogen und auch Außenseiterpositionen berücksichtigt werden – was u. a. eine große Heterogenität des Panels hinsichtlich der fachlichen Hintergründe, der individuellen Erfahrungen etc. nach sich zieht. Bedenkt man, dass über die Komposition des Panels die Qualität der Ergebnisse gesteuert werden kann, liegt hier eine entscheidende Herausforderung von Delphi-Studien. Ausgewogenheit und Abbildung auch extremer Positionen zählt hier mehr als reine Quantität.

4.2 Panelgröße Der Umfang der Expert_innen-Gruppe, des Panels, richtet sich nach der Fragestellung. Bei sehr eng angelegten, disziplinären, monothematischen Studien kann bereits eine Größe von zehn bis zwanzig Rückläufen ausreichend sein; je nach Rücklaufquote kann die Anzahl der zur Teilnahme eingeladenen Personen das Mehrfache betragen. Bei den typischen transdisziplinären Fragestellungen allerdings ist jeweils eine hinreichende Anzahl von Vertreter_innen der Wissenschaft und der unterschiedlichen Praxisbereiche zu berücksichtigen, sodass dreißig bis fünfzig Rückläufe eine minimale Zielgröße ist. Bei umfänglicheren, multithematischen Delphi-Studien wie etwa bei Delphi-Studien zu mehreren Technologiefeldern werden mehrere, jeweils für ein Themenfeld zuständige Panels gebildet, womit die Gesamtanzahl der Expert_innen schnell in die Hunderte oder sogar Tausende gehen kann. Wichtig ist eine gute Balance: Bei einer zu geringen Anzahl von Expert_innen können extreme Einzelmeinungen ein zu großes Gewicht erhalten und statistische Auswertungsverfahren greifen dann auch nicht mehr. Mit der Anzahl der Expert_innen steigt naturgemäß aber der Aufwand – und oft genug auch der Zeitbedarf.

4.3 Identifikation und Rekrutierung Innerhalb einer wissenschaftlichen Disziplin lassen sich Expert_innen recht effizient anhand ihrer Publikationen oder akademischen Positionen auffinden. Für Praxisbereiche sieht es schwieriger aus. Einen guten Zugang bieten Konferenzen

Das „klassische“ Delphi. Praktische …

41

und Fachtagungen, auf denen Praktiker_innen auch dem Management oder von gesellschaftlichen Organisationen … zu Wort kommen, aber ebenso Branchenverbände, Interessengemeinschaften oder ähnliche Organisationen. Bisweilen fallen auch Expert_innen durch ihre mediale Präsenz auf. Derartige Meinungsführer werden erfahrungsgemäß häufiger als andere in Studien, Arbeitskreise etc. eingeladen, was sie als gut vernetzte Expert_innen interessant macht.4 In dem als Ko-Nomination bekannten Verfahren empfehlen Expert_innen, welche weiteren Expert_innen eingeladen werden könnten. Auswahl per Empfehlung kann allerdings auch dazu führen, dass nur Expert_innen ähnlicher Meinung (einer wissenschaftlichen Schule oder einer wirtschaftlichen oder gesellschaftlichen Interessengruppe) berücksichtigt werden, was selbstredend zu vermeiden ist. Zu beachten ist ferner, dass der formale (akademische) Status und die Reputation zwar ein guter Prädiktor für die Kompetenz von Expert_innen sind, oft die eigentlichen Fachleute aber quasi in der hierarchischen Struktur versteckt sind. Mitarbeiter_innen wissen häufig besser über ein sehr spezifisches Themenfeld Bescheid als ihre Vorgesetzten. Im Prinzip geht es bei der Panel-Rekrutierung darum, sich Expert_innen-­ Netzwerke systematisch zu erschließen. Telefonate oder individuelle Emails mögen zeitaufwendig sein, aber in der Regel führt kein Weg an ihnen vorbei.

4.4 Motivation zur Teilnahme Die umfänglichste Namensliste verfehlt ihren Zweck, wenn die Expert_innen nicht zur Teilnahme motiviert werden können. Welche Gegenleistung erhalten sie für den Zeitaufwand, den sie in das mehrfache Ausfüllen des Fragebogens investieren? Je nach Thematik der Studie und Stakeholder-Kategorie kommen durchaus unterschiedliche Motive ins Spiel (Aichholzer 2002, S. 13). Für die einen ist es relevant, dass sie über ihre Antworten einen Einfluss auf Entscheidungen ausüben können, andere fühlen sich den Initiatoren der Studie oder der beauftragenden Institution verpflichtet, für Dritte steht vielleicht die Möglichkeit im Vordergrund, selbst etwas Neues zu erfahren – und sei es, wie die ­Kolleg_ innen die Items bewerten. Wissenschaftler_innen und viele Praktiker_innen sind in der Regel an den Ergebnissen der Studie interessiert. Wird nur ein Auszug der

4Inhaltlich kann man von ihnen seltener neue Impulse erwarten. Gerade unter medial überpräsenten Expert_innen sind statistisch auffällig viele Personen mit festem, fast dogmatischem Meinungszuschnitt vertreten – „Igel“ nach der Typologie von Tetlock (2005).

42

K. Steinmüller

Ergebnisse öffentlich kommuniziert oder nur eine komprimierte Fassung, kann das Komplettpaket der Ergebnisse oder ein anderer bevorzugter Zugang zu den Resultaten als Incentive dienen. Im Einzelfall kann auch einmal mit Büchergutscheinen oder ähnlichen materiellen Anreizen gearbeitet werden. Wesentlich ist in jedem Fall aber ein wertschätzender Umgang mit den Expert_innen. Dies kann unter Umständen auch die Veröffentlichung ihrer Namen im Anhang der Studie einschließen.5 Von zentraler Bedeutung ist aber eine effiziente, sozusagen „nutzerfreundliche“ Gestaltung des Fragebogens: gute Verständlichkeit, Konkretheit und keine übermäßige Komplexität.

5 Entwicklung des Fragebogens Die Kunst, Fragebögen zu entwerfen, ist ein eigenes methodisches Kapitel der empirischen Sozialforschung. Unklare Formulierungen, fehlende Antwort-­ Optionen, Überladung mit Informationen, doppelte Verneinungen, zu voraussetzungsvolle oder hypothetische Items, Probleme bei Skalen sind nur einige der Fehler, die trotz entsprechender Lehrbücher immer wieder zu beobachten sind. Einen Überblick über wichtige Prinzipien der Fragebogengestaltung gibt Abb. 2. Oft wird heute einem ansprechenden visuellen Design mehr Aufmerksamkeit geschenkt als sauber formulierten Items. Auf diese allgemein bekannten Probleme soll hier jedoch nicht näher eingegangen werden, sondern auf solche Herausforderungen, die mit Delphi-Studien, vor allem zu Zukunftsfragen fast schon notwendigerweise verbunden sind.

5.1 Item-Generierung Dies beginnt bei der Generierung der Thesen für die Befragung. Selbst wenn sich deren generelle Zielrichtung aus einem übergelagerten Forschungsprojekt ergibt, ist es sinnvoll, einen spezifischen (Teil-)Prozess für die Sammlung, Filterung und Formulierung der Items aufzusetzen. Dabei ist zu klären, ob neben dem eigentlichen Projektteam auch (externe) Expert_innen, Vertreter_innen des Auftraggebers/der Auftraggeberin oder von Anspruchsgruppen (Verbänden oder anderen Organisationen) einbezogen werden sollen, ob neben allfälligen Recher-

5Wenn

die Teilnehmenden dem zustimmen. Die Anonymität der Bewertung der einzelnen Items wird dadurch nicht aufgehoben.

Das „klassische“ Delphi. Praktische …

43

Leitlinien für die Fragebogengestaltung 1. Expertise der Expert_innen: Frage nach dem, was die Expert_innen aus ihrer Erfahrung heraus abschätzen können, nicht nach dem, was man gern wissen würde. 2. Keep it simple: Überfordere die Expert_innen nicht durch zu viele Fragen und zu viele Antwort-Optionen, beschränke dich auf die wirklich notwendigen Items. 3. Klarheit und Konkretheit: Strukturiere den Fragebogen klar und übersichtlich und verwende eine präzise, eindeutige und einheitliche Terminologie; erläutere gegebenenfalls Begriffe und Konzepte in einer allgemeinverständlichen Form. 4. Keine Suggestivfragen und Unterstellungen: Vermeide Formulierungen, die bereits eine bestimmte Antwort nahelegen, verzichte auf implizite (oder explizite) Wertungen etwa durch eine emotional gefärbte Wortwahl. 5. Keine kombinierten oder bedingten Zukunftsaussagen: Vermeide doppelte Verneinungen. Vermeide es, mehrerer Aspekte oder Hypothesen miteinander zu verkoppeln, etwa in der Form von nachgeschobenen Begründungen, weshalb eine bestimmte Situation eintreten könnte. 6. Vollständige Antwort-Optionen: Achte darauf, alle logischen Antwortoptionen auch anzubieten, und zwinge die Teilnehmenden nicht, jede Frage, also auch solche, bei denen sie sich absolut nicht kompetent fühlen, zu beantworten. Ohne Optionen des Typs „keine Angabe“ ist ein Delphi-Fragebogen unvollständig. Abb. 2   Leitlinien für die Fragebogengestaltung. (Eigene Darstellung)

chen gegebenenfalls Brainstormings oder andere Workshopformate genutzt werden müssen. Üblicherweise geht daher der Formulierung der Thesen bzw. Items bereits ein Diskurs mit der Expert_innen-Community über die aufzunehmenden Themen und auszuklammernde Fragestellungen, über die adäquate Terminologie usw. voraus. Wie bei allen Befragungsmethoden sollte dem Wording der Items größte Aufmerksamkeit geschenkt werden. Es sollten Klarheit, Eindeutigkeit und maximale Verständlichkeit angestrebt werden. Die Delphi-Methode stößt hierbei auf die der Zukunftsforschung eigenen semantischen Schwierigkeiten (Steinmüller 1997, S. 77): Die zukünftige Gesellschaft, ihre Wirtschaft, Technik usw. sind ein unbekanntes – und unbenanntes! – Feld und dementsprechend fehlt oft eine einschlägige Terminologie für Themen, die sich gerade rapide entwickeln. Die Begrifflichkeiten sind im Fluss, Interessengruppen versuchen, über ihre Wortprägungen Einfluss zu gewinnen, und zudem speisen Trendforscher immer wieder wenig konsolidierte modische Schlagwörter in die Debatten. Bei sehr jungen Forschungsfeldern hat sich darüber hinaus noch nicht einmal ein einheitliches Fachvokabular herausgebildet, verschiedene Neologismen stehen in Konkurrenz und erleiden Bedeutungsverschiebungen. Umschreibungen und Erläuterungen lassen sich daher oft nicht vermeiden. Items knapp, präzise, ohne implizite Wertungen und zugleich aussagekräftig zu gestalten, setzt einige Erfahrung voraus.

44

K. Steinmüller

Wenig Sinn macht es dagegen, in Delphi-Studien nach Fakten zu fragen, die anderweitig ermittelt werden können. Dies führt erstens zu einer unnötigen Erweiterung des Fragebogens, zweitens würden sich Expert_innen auf dem Feld nicht ernst genommen fühlen und für Teilnehmende, die kein Expert_innen für die spezielle Fragestellung sind, wäre es ein reiner Wissenstest.

5.2 Herausforderung heterogene Panel Wie oben erwähnt, sind die Panels für Delphi-Studien meist sehr heterogen zusammengesetzt. Begriffe, die für Fach-Expert_innen trivial sind, können Praxisvertreter_innen neu oder völlig unbekannt sein – oder schlimmer noch, missverstanden werden. Und andersherum können Begriffe, die in einem Praxisbereich alltäglich sind und von allen verstanden werden, bei Wissenschaftler_innen Kopfschütteln hervorrufen. Die Erläuterung, die den/der einen Teilnehmenden ins Bild setzt, kann von einem anderen für banal gehalten werden und selbst die Form der Items – als These, als Frage … – findet unterschiedlich Anklang. Delphi-Fragebögen zu gestalten, kann somit auch bedeuten, Brücken zwischen verschiedenen Wissenskulturen zu bauen und den unterschiedlichen Hintergründen und Perspektiven der Befragten gerecht zu werden. Als Orientierung kann die Allgemeinverständlichkeit eines guten Sachbuchs gelten. Es versteht sich von selbst, dass ein umfangreicher Pretest des Fragebogens mit Repräsentant_innen der unterschiedlichen Anspruchsgruppen bzw. Wissenskulturen dringend angeraten ist. Allzu häufig hat sich im Projektteam eine bestimmte Lesart von Begriffen, Konzepten oder Formulierungen eingeschliffen, die von Dritten nicht immer nachvollzogen werden kann (Betriebsblindheit).

5.3 Ergänzung durch Kommentare Delphi-Studien können sowohl offene, als auch geschlossene Fragen umfassen. Offene Fragen sind dann angezeigt, wenn die Bandbreite möglicher Antworten nicht vorgegeben werden kann, die eigenen Worte der Befragten für die Untersuchung wichtig sind oder Wissenslücken aufgedeckt werden sollen. Geschlossene Fragen sind dann angebracht, wenn die Dimensionen der Antworten vereinheitlicht und vergleichbar gemacht werden sollen, wenn die Häufigkeiten und Zusammenhänge der Antworten ermittelt werden sollen und nur eine begrenzte Anzahl von Antwortoptionen (logisch) möglich ist. In der Regel operieren Delphi-Studien daher primär mit geschlossenen Fragen, denn diese gestatten

Das „klassische“ Delphi. Praktische …

45

es, dem Feedback nach den Runden eine statistische Analyse zugrunde zu legen. Aber selbst bei geschlossenen Fragen ist oft die Ergänzung durch offene Fragen angezeigt, insbesondere durch Kommentarfelder, in denen die Expert_innen die Gründe für ihre Bewertung anführen können. Die Sammlung von Argumenten – oft auch pro und kontra – ist für das Feedback zwischen den Runden hoch relevant, denn sie gestattet einen niedrigschwelligen Diskurs der Panel-­ Teilnehmenden untereinander. Zudem liefern Kommentare oft wertvolle Ideen, die ausgewertet und weiterverfolgt werden können.

5.4 Zukunftsbezogene Items Typischerweise werden in Delphi-Studien die Items als „Miniatur-Szenarien“ formuliert, etwa in der Art „Politiker verlieren bis zum Jahr 2025 deutlich an Vertrauen.“ Die Expert_innen sind dann aufgefordert, die Wahrscheinlichkeit des Eintretens gemäß einer vorgegebenen Skalierung zu bewerten. Alternativ wird oft nach dem Zeithorizont gefragt, bis wann ein derartiges Statement Realität werden könnte. Problematisch wird es, wenn separat Wahrscheinlichkeit und Zeitraum abgefragt werden, denn was kurzfristig unwahrscheinlich ist, könnte auf längere Sicht de facto zur Gewissheit werden. Eine kombinierte Abfrage – quasi als Matrix von Wahrscheinlichkeit und Zeitraum – dürfte allerdings auch die meisten Expert_innen überfordern und wird in Delphi-Studien meines Wissens nie genutzt. Selbstverständlich können die Items auch als Fragen („Welche Partei wird in den nächsten zehn Jahren richtungsbestimmend sein?“) formuliert werden, sich auf Schlagwörter beziehen („Beschreiben Sie bitte anhand der folgenden Adjektive, welche Charakteristika Arbeitsplätze haben werden: flexibel, multimedial …“) oder Rankings beinhalten („Sortieren Sie bitte die folgenden Argumente für den Einsatz autonomer Fahrzeuge nach ihrer gesellschaftlichen Relevanz: …“). Bisweilen werden die Expert_innen mit komplexen hypothetischen künftigen Situationen konfrontiert. Nicht jedem fällt es leicht, sich in ein „Was wäre wenn“-Szenario hineinzudenken, insbesondere wenn dies nicht den eigenen Zukunftserwartungen entspricht, und dann noch im Anschluss Fragen zu spezifischen Aspekten dieser Zukunft zu beantworten. Beispiel: „Stellen Sie sich eine Welt vor, in der jeder Mensch einen digitalen Gesundheitsberater – etwa in Gestalt einer Smartphone-App – hat und keinen Hausarzt mehr benötigt. Wie ­verändert sich unter dieser Voraussetzung das Verhältnis von Facharzt und Patient?“ Nicht alle Expert_innen sind bereit, sich auf derartige Hypothesen

46

K. Steinmüller

e­ inzulassen, und die Frage nach der Wahrscheinlichkeit der angenommenen künftigen Situation wird die anschließenden Einschätzungen beeinflussen. Dennoch können sich derartige Items als sinnvoll und ertragreich erweisen.

5.5 Selbsteinschätzung der Kompetenz Ein weiteres Spezifikum nicht nur von zukunftsbezogenen Delphi-Studien sind sog. subjektive Kompetenzfragen. Sie werden in der Regel aufgenommen, um die Aussagen von Expert_innen mit spezifischer Fachkenntnis mit höherem Gewicht in die Analyse einfließen zu lassen als die von Laien oder nur allgemein informierten Personen. In der subjektiven Kompetenzfrage wird eine Selbsteinschätzung der Teilnehmenden in Bezug auf ein Item oder eine Gruppe von Items gefordert, etwa ob man für die gegebene Fragestellung über spezifisches Fachwissen verfügt, grundsätzlich informiert ist oder kein tiefer gehendes Wissen hat. Bisweilen wird abgefragt, ob man sich seiner Bewertung „sehr sicher“, „einigermaßen sicher“, „etwas unsicher“ oder „sehr unsicher“ ist. Der Grundgedanke dabei ist, dass Expert_innen sich ihrer Urteile sehr sicher sein sollten, man bei der Auswertung also Meinungen von Personen, die sich als unsicher bezeichnen, ausklammern könnte. Diese Art der Filterung erscheint mir nicht gerechtfertigt. Gerade Expert_innen sind sich sehr oft bewusst, wie voraussetzungsreich ihre Antworten sind, während sich Laien in trügerischer Sicherheit wiegen können. Benutzt man die Abfrage jedoch nicht als Filter, dann erlaubt sie – zusätzlich zur Divergenz der Bewertungen – Rückschlüsse auf das kollektive Niveau der Ungewissheit.

6 Die Befragungsrunden 6.1 Erste Runde Nach Pretest und eventueller Überarbeitung können die Fragebögen an den Expert_innen-Kreis versandt werden. Früher geschah dies meist per Post oder per Fax, heute ist Email der Standard-Kommunikationskanal für klassische Delphi-Studien – bei Real-Time-Delphis eine Website. Der Begleitbrief bzw. ­ die begleitende E-Mail sollte die Teilnehmenden über den Hintergrund der Studie, Auftraggeber_innen und die geplante Verwertung der Ergebnisse aufklären. Ebenso wichtig sind Angaben zum Rücksendeschluss, zur Bearbeitungsdauer sowie die Zusicherung von Datenschutz und Anonymität.

Das „klassische“ Delphi. Praktische …

47

In der Ablaufplanung sollte genügend Zeit für die Runden vorgesehen werden, erfahrungsgemäß vier bis sechs Wochen, wobei Ferienzeiten berücksichtigt werden sollten. Selbst bei gutem Rücklauf empfiehlt sich eine Erinnerungs-E-Mail (Reminder) kurz vor Rücksendeschluss, allfällige Frist-Verlängerungen sind nichts Ungewöhnliches, und meist bezieht man auch Nachzügler_innen ein, deren Antworten erst eintreffen, wenn das Team schon mit der Auswertung befasst ist. Der Aufwand, der getrieben werden muss, um eine hinreichende Anzahl von Rückläufen zu erzeugen, wird oft unterschätzt. Nachfassaktionen, Emails oder Telefonate sind nichts Ungewöhnliches. Häufig müssen sogar zusätzliche Teilnehmende rekrutiert werden, sei es durch Empfehlungen aus dem Panel (Ko-Nominationen) oder weitere Recherchen. Gut strukturierte Teilnehmenden-Verwaltungssysteme, in denen jeder Kontakt vermerkt wird, sind hier sehr hilfreich, bei größeren Panels im Grunde unabdingbar. Sie müssen selbstverständlich den Datenschutzrichtlinien entsprechen. Problematisch ist eine nachträgliche Incentivierung, denn sie schafft Ungleichheit.

6.2 Analyse der Rückläufe der ersten Runde Entsprechend dem Projektziel werden die Rückläufe der ersten Runde ausgewertet, bei offenen Fragen zumeist nur qualitativ, bei geschlossenen Fragen quantitativ. Das Feedback, das an die Teilnehmenden zurückgespielt wird, ist gedacht, sie zur Überprüfung der eigenen Bewertungen zu veranlassen. Im Konkreten hängt die Wirkung des Feedbacks von der Art der gegebenen Informationen, deren Formulierung und auch vom Kontext (Begleitbrief …) ab. Eine grundlegende Herausforderung besteht hier darin, dass eine völlige Neutralität oder Objektivität der Rückinformation allenfalls in der Theorie möglich ist (Vorgrimler und ­Wübben 2003, S. 766). Die Organisatoren der Studie, das Forschungsteam sollte hier, wie schon bei der Formulierung des Fragebogens, größte Sorgfalt walten lassen. Selbst ein Pretest der Rückinformationen, eine Abstimmung mit dem Steuerungskreis kann hier sinnvoll sein – doch besteht auch dann die Gefahr, dass sich Interessenlagen im konkreten Wording a­ usdrücken. Bei den für Delphi-Studien zu Zukunftsthemen typischen Fragen zu Eintrittswahrscheinlichkeiten und Zeithorizonten werden in der Regel die Häufigkeitsverteilung und statistische Kenngrößen wie Median und/oder Mittelwert, oberes und unteres Quantil berechnet und für das Feedback an die Teilnehmenden in einer geeigneten grafischen Form dargestellt.

48

K. Steinmüller

Bisweilen lassen die Rückläufe aus der ersten Runde Defizite des Ansatzes erkennen, etwa wenn bestimmte Items eine hohe Verweigerungsrate haben oder wenn in Kommentaren auf Schwachstellen bei der Formulierung oder sogar fehlende Antwortoptionen hingewiesen wird, die beim Pretest übersehen wurden. Nachbesserungen vermindern zwar die Vergleichbarkeit der Resultate der Runden, aber das ist kaum ein Grund, auf sie zu verzichten. Mitunter sind Befragungen sogar darauf angelegt, in der ersten Runde zusätzliche Items zu generieren: Fragetyp „Welche Aspekte sind in dem Zusammenhang noch relevant?“ Die Aufnahme zusätzlicher Items entspricht zwar nicht der reinen Lehre der Delphi-Methode. Solange es sich aber nur um geringfügige Ergänzungen des Fragebogens handelt, ist nichts dagegen einzuwenden. Bei der Auswertung aber ist die unterschiedliche Genese der Items zu berücksichtigen. Aus den Erfahrungen mit der Methode hat sich ergeben, dass es nicht sehr sinnvoll ist, bei geschätzten Zeiten bis zum Eintritt künftiger Ereignisse (etwa bis zu technologischen Durchbrüchen) Mittelwerte zu bilden – extreme Bewertungen beeinflussen Mittelwerte zu stark. In der Regel wird heute eine Darstellung mit Median, unterem und oberem Quartil bei der zweiten Runde in die Expert_innenGruppe zurückgegeben. Und naheliegender Weise werden auch die Kommentare – zumindest in kondensierter Form – in das Panel zurückgespielt.

6.3 Zweite Runde Grundannahme der Delphi-Methode ist, dass die befragten Expert_innen in der zweiten Runde ausgehend von den Ergebnissen der ersten ihre Einschätzungen überprüfen und gegebenenfalls anpassen und sich so eine Art von Konsens herausbildet. Es wird angenommen, dass die Panelist_innen sich an den Bewertungen der anderen, speziell am Median orientieren und dass Expert_innen mit extremen Einschätzungen, die weit ab vom Median liegen, stärker geneigt sind, ihr Urteil zu revidieren als solche, die quasi mit dem Mainstream abgestimmt haben. Doch neben diesem Sog der Mehrheitsmeinung sind durchaus auch taktische Gegenpositionen vorstellbar: Man gibt eine noch extremere Bewertung ab, um Mittelwert bzw. Median in Richtung der eigenen Einschätzung zu verschieben. In der Praxis scheint dies allerdings nur in Ausnahmefällen v­ orzukommen. Fast immer liegt die Anzahl der Rückläufe in der zweiten Runde deutlich unter der der ersten. Diese sogenannte Panel-Mortalität kann unterschiedliche Gründe haben, wie etwa dass einzelne Expert_innen ihre Position verändert haben und nicht mehr erreichbar sind. Ein weiterer Grund kann darin vermutet werden, dass es manche Expert_innen als lästig empfinden, ein und denselben Fragebogen

Das „klassische“ Delphi. Praktische …

49

noch einmal auszufüllen. In einigen Studien zur Delphi-Methodik wird auch von einem „dogmatischen“ Verhalten einiger Expert_innen berichtet – diese sind nicht bereit, von ihrer einmal gefassten Meinung abzuweichen (Linstone 1978, S. 296 f.). Faktoren wie der Einfluss von Intuition, die Selbsteinschätzung von Expert_innen und die Größe der Panels und die Rolle von Dogmatismus waren von Beginn an auch Gegenstand von Sekundärstudien (Linestone und Turoff 1975; Rowe et al. 1991; Häder und Häder 2000). Ebenfalls wurde untersucht, inwiefern weitere – dritte und vierte – Runden zu einer Qualifizierung der Ergebnisse beitragen, insbesondere zu einer stärkeren Konvergenz der Bewertungen. Dies scheint nur in geringem Maße der Fall zu sein; die Expert_innen ändern ihre Meinungen nur noch minimal (Häder 2009, S. 120). Zudem steigt mit der Anzahl der Runden auch die Panel-Mortalität. Daher sind Delphi-Studien mit mehr als zwei Runden eine Seltenheit.

7 Analyse des gesamten Befragungsverlaufs Bei der abschließenden Analyse und Interpretation sind zahlreiche Umstände zu beachten. So kann sich durch eine höhere Fluktuation zwischen den Runden bzw. eine relevante Panelmortalität die gesamte Struktur des Panels – Zusammensetzung hinsichtlich der Anspruchsgruppen – verändern, was selbstverständlich bei der Auswertung zu berücksichtigen ist. In Einzelfällen, insbesondere bei Studien, die sich über einen längeren Zeitraum erstrecken, können aktuelle externe Ereignisse (Nachrichten mit Bezug zum Thema, neue wissenschaftliche Erkenntnisse) die Anpassung der Expert_innenurteile wesentlich stärker beeinflussen als das über die Studie vermittelte Feedback innerhalb der Expert_innen-Community.

7.1 Prinzip Zukunftsbild Insbesondere in der öffentlichen Wahrnehmung bieten Delphi-Studien oft Gegenstand für grundlegende Missverständnisse. Das häufigste besteht darin, dass die aus der Studie abgeleiteten Aussagen als Fakten, quasi als eine irgendwie objektiv existierende, reale Zukunft angesehen werden (Cuhls 2009, S. 214). Das Ergebnis jeglicher Zukunftsforschung ist aber stets ein Konstrukt, im besten Fall das einigermaßen schlüssige und mehr oder weniger konsensuelle Zukunftsbild einer bestimmten Expert_innen-Community, nicht mehr und nicht weniger (Neuhaus 2015). Bei der Befragung einer anderen Expert_innen-Gruppe hätte sich ein zumindest im Detail anderes Zukunftsbild ergeben. Insofern ist bei der

50

K. Steinmüller

Interpretation hervorzuheben, dass es sich um die Meinung eines bestimmten Panels handelt. Durch das Delphi-Verfahren wird diese Zukunftsbild konsolidiert, erreicht ein höheres Maß an Stabilität, aber es ist und bleibt ein Konstrukt, das auf eine bestimmte Weise erzeugt wurde. Hinzu kommt, dass dieses Zukunftsbild durchaus eine Einfärbung durch den jeweiligen Zeitgeist, eher optimistische oder pessimistische Grundstimmungen in der Expert_innen-Community erhalten kann – im Einzelfall können sogar Einflüsse der aktuellen Nachrichtenlage sichtbar werden, sodass eine Wiederholung der Studie mit denselben Expert_innen in einem gewissen zeitlichen Abstand etwas andere Ergebnisse erzeugen würde. Philosophisch kann man hier von der Immanenz der Gegenwart sprechen ­(Grunwald 2012, S. 183).

7.2 Pro-Domo-Bewertungen Auch die fachkundigsten Expert_innen liefern keine absolut objektiven Bewertungen; situative Aspekte und Voreingenommenheiten fließen unvermeidlich ein; sie werden durch die Aggregation der individuellen Bewertungen minimiert, aber nicht völlig beseitigt bzw. ausgeglichen. So liegt es beispielsweise häufig im Eigeninteresse von Forschenden, den Erfolg gerade laufender oder beabsichtigter eigener Forschungsanstrengungen nicht zu weit in die Zukunft zu projizieren (Pro-Domo-Effekt). In vielen Fällen würden potenzielle Sponsor_innen oder Vorgesetzte sehr zurückhaltend, wenn sie annehmen müssten, dass sich ein Durchbruch erst in Jahrzehnten einstellt. Andererseits können Fachleute bei einem zu nahen Zeithorizont in die Gefahr laufen, schon sehr bald nach ihren Ergebnissen gefragt zu werden.6 Daher scheinen bei Delphi-Studien nicht die unmittelbar mit einem Thema befassten Expert_innen, sondern die K ­ olleg_ innen aus dem Nachbarlabor oder einem benachbarten Themenfeld die realistischeren Bewertungen hinsichtlich der Zeiträume, die für eine technologischen Entwicklung oder einen Forschungsgegenstand notwendig sind, abzugeben (Cuhls et al. 1995, S. 13). Zudem kann sich auch bei Expert_innen Betriebsblindheit einstellen. Enge Spezialisierung verhindert oft die Sicht auf wichtige Rahmenumstände, sodass gerade hoch spezialisierte Fachleute oft systematische ­Fehlprognosen abgeben.

6Ein

Beispiel sind Angaben über die Frist bis zum Durchbruch bei kontrollierter Kernfusion: Dieser wird seit der ersten technologischen Delphi-Studie in den 1960er Jahren stets in etwa drei, vier Jahrzehnten angenommen.

Das „klassische“ Delphi. Praktische …

51

7.3 Konsens und Vorhersage Konsensuelle Vorhersagen waren bei der Etablierung der Methode der primäre Zweck und sind auch heute noch ein wichtiges Ziel von Delphi-Studien. Bei der Abschätzung von Zeiträumen bis zum Eintreffen bzw. Eintreten eines vorgegebenen Items (Miniatur-Szenarios) und bei der Bewertung der Wahrscheinlichkeit des Eintretens kann man von einer quasi prognostischen Verwendung der Delphi-Methode sprechen. Die Delphi-Prozedur ist zwar ein sehr effektives Verfahren bei der Erzeugung eines Konsenses, jedoch wirken hierbei ähnliche, wenn auch abgemilderte Gruppenzwänge wie bei anderen Verfahren, und Konsens ist nicht mit „Treffsicherheit“ ex post gleichzusetzen. Generell sind Genauigkeit oder „Treffsicherheit“ der Vorhersage nicht als das einzige oder eigentliche Ziel von Delphi-Studien anzusehen: Die Bewertungen der Items durch die Expert_ innen-Community sind dann als gut im Sinne von relevant und nützlich einzuschätzen, wenn sie neue Einsichten und brauchbares Orientierungswissen liefern, unabhängig davon, wie stark die Expert_innen-Urteile übereinstimmen und ob sie später einmal eintreffen (Grunwald 2012, S. 172 f.). So gesehen ist die Delphi-Methode weniger ein Verfahren zur Erzeugung von mehr oder weniger gesicherten Prognosen oder zur Herstellung eines stabilisierten Konsenses in der Expert_innen-Gruppe, sondern vielmehr ein spezifisches diskursives Verfahren, das das Nachdenken über mögliche Zukünfte, Leitbilder und Entwicklungswege anstößt und als Teil des gesellschaftlichen Diskurses Einfluss auf Entwicklungen ausübt. Im Einzelfall kann es daher für die Studie fruchtbarer sein, dass abweichende Meinungen begründet aufrecht erhalten werden. Der Kommunikationsprozess ist das Entscheidende, nicht die Tendenz zum Konsens. In der öffentlichen Wahrnehmung ist es allerdings – selbst bei absolut klarer und eindeutiger Kommunikation – fast unvermeidlich, dass die Ergebnisse einer Delphi-Studie als Prognosen missverstanden werden.

7.4 Chancen jenseits des Konsens Delphi-Umfragen erzeugen ein reichhaltiges Material, das oft bei der Auswertung nicht voll ausgeschöpft wird. Ein alleiniger Fokus auf Konsens bzw. Mittelwerte und Mediane verkennt die Potenziale, die gerade in Differenzen, in Dissens, in abweichenden Urteilen verborgen sind. Minderheitenvoten und Extrempositionen sind daher nicht als unschöne statistische „Ausreißer“ zu negieren, sondern zu

52

K. Steinmüller

analysieren und gegebenenfalls als wertvolle Hinweise auf andere Sichtweisen zu betrachten, insbesondere dann, wenn sie durch entsprechende Kommentare gestützt werden. Gewöhnlich werden die Antworten zu den einzelnen Items separat analysiert, was statistisch gesehen auf die Randverteilung hinausläuft. Allenfalls werden die Antworten wie bei repräsentativen Umfragen hinsichtlich der soziodemografischen Merkmale der Expert_innen, ihrer Zugehörigkeit zu Berufsgruppen, Positionen etc. statistisch ausgewertet, falls diese denn überhaupt erfragt werden. Das kann hoch relevante Informationen über differierende Einstellungen der erwähnten Gruppen zu bestimmten Problemkreisen liefern. Eine weitere Option einer statistischen Auswertung, die Analyse der Korrelationen zwischen den Items wird meines Wissens praktisch nie genutzt. Gerade sie könnte Informationen über versteckte Gruppierungen innerhalb des Panels – jenseits der oben erwähnten Merkmale – liefern, Gruppierungen, die sich durch bestimmte Grundeinstellungen, Weltbilder, Perspektiven etc. unterschieden.

7.5 Kombination mit der Szenariomethode Divergierende Expert_innen-Meinungen haben einen speziellen Wert: Sie deuten auf tatsächliche Unsicherheiten und Ungewissheiten bei einer Entwicklung hin. Hinter ihnen stehen möglicherweise ganz unterschiedliche Erwartungen und Perspektiven in Bezug auf ein Thema, etwa dass ein Experte/eine Expertin einen bestimmten Entwicklungstreiber als dominant einschätzt, ein anderer Experte/eine andere Expertin jedoch den gegenläufigen. Bei einer Nutzung der Delphi-Methode im Zusammenhang mit einer Szenariostudie (Armbruster et al. 2006) kann ein deutlicher und über die Runden stabiler Dissens bei einem Item daher einen relevanten Hinweis auf einen Schlüsselfaktor (einen wirkungsstarken, aber prognostisch ungewissen Faktor) geben. Die unterschiedlichen Erwartungen bzw. Bewertungen der Expert_innen können dann in divergierende Zukunftsprojektionen dieses Faktors übersetzt werden (v. d. Gracht 2008). In diesem Fall ist Dissens entschieden produktiver als Konsens.

8 Fazit Die klassische Delphi-Methode hat viele Vorzüge. Sie ist ein praktikabler und gut etablierter Weg zur Erhebung von Expert_innen-Meinungen und zu mehr oder weniger konsensuellen Zukunftsbildern. Sie fördert das Nachdenken über die

Das „klassische“ Delphi. Praktische …

53

Zukunft und gibt Expert_innen die Möglichkeit, das eigene Urteil zu überdenken. Die Rückläufe der Befragungsrunden können auf vielfältige Weise ausgewertet werden: hinsichtlich Konsens und Dissens, hinsichtlich impliziter und expliziter Zukunftsbilder usw. Nicht zuletzt sind Ergebnisse von Delphi-Studien, schon da sie auf dem Urteil vieler Expert_innen aufbauen, gut kommunizierbar. Als eine Technik, die zu großen Teilen auf Kommunikation beruht, kann das Ergebnis einer Delphi-Studie an vielerlei Stellen, etwa durch die Wahl der Expert_innen, die Formulierung der Statements, die Zusammenfassung der Ergebnisse einer Runde usw. beeinflusst werden. Methodenbewusstsein, ein Fingerspitzengefühl für Herausforderungen und Fallstricke sowie auch Diplomatie im Umgang mit den Expert_innen sind eine Voraussetzung für eine erfolgreiche Durchführung der Studie. Die Qualität einer Delphi-Studie steht und fällt mit klaren Forschungsfragen, einem kompetenten Panel, gutem Teilnehmendenmanagement und einem gut formulierten Fragebogen. Ihr Nutzen aber hängt von einer sinnvollen, differenzierten Interpretation der Ergebnisse und einer zielgruppenorientierte Aufbereitung, Präsentation und Dokumentation der Ergebnisse ab.

Literatur Adler, M., & Ziglio, E. (1996). The Delphi method and its applications to social policy and public health. London: Jessica Kingsley Publ. Aichholzer, G. (2002). Das ExpertInnen-Delphi: Methodische Grundlagen und Anwendungsfeld „Technology Foresight“. Wien: ITA – Institut für Technikfolgen-­Abschätzung der Österreichischen Akademie der Wissenschaften (ITA-Manuskript 01/2002). Armbruster, H., Kinkel, S., & Schirrmeister, E. (2006). Szenario-Delphi oder Delphi-Szenario? Erfahrungen aus zwei Vorausschaustudien mit der Kombination dieser Methoden. In J. Gausemeier (Hrsg.), Vorausschau und Technologieplanung (S. 109–137). Paderborn: Universität Paderborn Heinz Nixdorf Institut. Cuhls, K. (2009). Delphi-Befragungen in der Zukunftsforschung. In R. Popp & E. Schüll (Hrsg.), Zukunftsforschung und Zukunftsgestaltung. Beiträge aus Wissenschaft und Praxis (S. 207–221). Berlin: Springer. Cuhls, K. (2012). Zu den Unterschieden zwischen Delphi-Befragungen und „einfachen“ Zukunftsbefragungen. In R. Popp (Hrsg.), Zukunft und Wissenschaft. Wege und Irrwege der Zukunftsforschung (S. 139–157). Berlin: Springer. Cuhls, K., Breiner, S., & Grupp, H. (1995). Delphi-Bericht 1995 zur Entwicklung von Wissenschaft und Technik. Mini-Delphi. Karlsruhe: Fraunhofer-Institut für Systemtechnik und Innovationsforschung. de Jouvenel, B. (1967). Die Kunst der Vorausschau. Berlin: Luchterhand. Gordon, T. J. (2009a). The Delphi method. In J. C. Glenn & T. J. Gordon (Hrsg.), Futures research methodology version V 3.0. Washington: The Millennium Project.

54

K. Steinmüller

Gordon, T. J. (2009b). The real time Delphi method. In J. C. Glenn & T. J. Gordon (Hrsg.), Futures research methodology version V 3.0. Washington: The Millennium Project. Gracht, H. A. (2008). The future of logistics – Scenarios for 2025. Wiesbaden: Gabler. Grunwald, A. (2012). Ist Zukunft erforschbar? Zum Gegenstandsbereich der Zukunftsforschung. In W. J. Koschnick (Hrsg.), FOCUS-Jahrbuch 2012. Prognosen, Trend- und Zukunftsforschung (S. 171–195). München: FOCUS Magazin Verlag. Häder, M. (2009). Delphi-Befragungen. Ein Arbeitsbuch. Wiesbaden: VS Verlag. Häder, M., & Häder, S. (2000). Die Delphi-Methode als Gegenstand methodischer Forschungen. In M. Häder & S. Häder (Hrsg.), Die Delphi-Technik in den Sozialwissenschaften. Methodische Forschungen und innovative Anwendungen (S. 11–31). Wiesbaden: Westdeutscher Verlag. Helmer, O. (1983). Looking forward. A guide to futures research. Beverly Hills: Sage Publications. Hill, G. W. (1982). Group Versus Individual Performance: Are N + 1 Heads Better Than One? Psychological Bulletin, 91(3), 517–539. Linstone, H. A. (1978). The Delphi technique. In R. B. Fowles (Hrsg.), Handbook of futures research (S. 273–300). Westport: Greenwood Press. Linstone, H., & Turoff, M. (1975). The Delphi method: Techniques and applications. ­London: Addison-Wesley. Neuhaus, C. (2015). Prinzip Zukunftsbild. In L. Gerhold, D. Holtmannspötter, C. Neuhaus, E. Schüll, B. Schulz-Montag, K. Steinmüller, & Karlheinz (Hrsg.), Standards und Gütekriterien der Zukunftsforschung. Ein Handbuch für Wissenschaft und Praxis (S. 21–30). Wiesbaden: Springer VS. Niederberger, M., & Renn, O. (2018). Das Gruppendelphi-Verfahren. Vom Konzept bis zur Anwendung. Wiesbaden: Springer VS. Popper, R. (2009). Mapping foresight. Revealing how Europe and other world regions navigate into the future. Brussels: European Commission, Directorate-General for Research (EUR 24041 EN). Rowe, G., & Wright, G. (2011). The Delphi technique: Past, present, and future prospects – Introduction to the special issue. Technological Forecasting and Social Change, 78, 1487–1490. Rowe, G., Wright, G., & Bolger, F. (1991). Delphi: A reevaluation of research and theory. Technological Forecasting and Social Change, 39(3), 235–251. Steinmüller, K. (1997). Grundlagen und Methoden der Zukunftsforschung. Szenarien, Delphi, Technikvorausschau (SFZ-WerkstattBericht Nr. 21). Gelsenkirchen: Sekretariat für Zukunftsforschung. Tetlock, P. E. (2005). Expert political judgment. How good is it? How can we know? Princeton: Princeton University Press. Thangaratinam, S., & Redman, C. (2005). The Delphi technique. The Obstetrician & Gynaecologist, 7, 120–125. Vorgrimler, D., & Wübben, D. (2003). Die Delphi-Methode und ihre Eignung als Prognoseinstrument. Wirtschaft und Statistik, 8(2003), 763–774. Woudenberg, F. (1991). An evaluation of Delphi. Technological Forecasting and Social Change, 40(2), 131–150.

Delphi-Verfahren in den Gesundheitswissenschaften – erkenntnistheoretische Potenziale und Herausforderungen Saskia Jünger Zusammenfassung

Ziel dieses Kapitels ist es, die erkenntnistheoretischen Potenziale und Herausforderungen der Delphi-Methode in den Gesundheitswissenschaften aus wissenssoziologischer Perspektive zu betrachten. Hierbei wird insbesondere Bezug genommen auf die Schriften von Ludwik Fleck zur sozialen Konstruktion wissenschaftlicher Tatsachen, Berger und Luckmann zur sozialen Konstruktion der Wirklichkeit, sowie von Thomas Kuhn zur gemeinschaftlichen Herstellung einer ‚normalen Wissenschaft‘ im Sinne eines akzeptierten wissenschaftlichen Paradigmas. Vor diesem Hintergrund werden unterschiedliche Betrachtungsweisen der Delphi-Methode im Sinne der Herstellung von Erkenntnisgewinn in der Gesundheitsforschung beleuchtet. Daran anknüpfend sollen verschiedene Ansätze diskutiert werden, die in der Literatur als mögliche erkenntnis-theoretische und wissenschaftstheoretische/-philosophische Grundlagen der Delphi-Methode postuliert wurden – so wie deren Bedeutung für die methodologische Gestaltung und praktische Umsetzung von Delphi-Verfahren. Auf der Grundlage dieser theoretischen Vorüberlegungen werden erkenntnistheoretische Chancen und Potenziale, sowie auch Grenzen und Herausforderungen hinsichtlich der Verwendung von Delphi-Verfahren in den Gesundheitswissenschaften diskutiert.

S. Jünger (*)  Cologne Center for Ethics, Rights, Economics, and Social Sciences of Health (ceres), Köln, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_3

55

56

S. Jünger

Schlüsselwörter

Delphi-Verfahren · Gesundheitswissenschaften · Wissenssoziologie ·  Methodologie · Erkenntnistheorie

1 Einleitung – Die Kraft und Macht von DelphiVerfahren für das Wissen-Schaffen Die Beteiligung an verschiedenen nationalen und internationalen Delphi-Verfahren im Bereich der Palliativversorgung erlaubte mir vielfältige Einblicke in die Kraft und Wirksamkeit dieser Methode für die Wissensgenerierung sowie auch für berufspolitische Dynamiken in einer sich neu formierenden Fachdisziplin. Ich wurde Zeugin von Diskussionen in Forschungsteams, Debatten in Expert_innenpanels und Aushandlungsprozessen zwischen Forschungsteams und Expert_innenpanels. Im Zuge dessen war der Einfluss von Macht und Meinungsführung auf den Prozess der Wissensproduktion im Rahmen von Delphi-Verfahren gut zu beobachten – insbesondere die Transformation erster vorläufiger Ideen in einhellig akzeptierte konsensgestützte Aussagen und schließlich manifestes anerkanntes Fachwissen. Zugleich bekam ich ein Gefühl für die Herausforderungen und Limitationen des Verfahrens in dem Bestreben nach Homogenität und Konsens über professionelle, nationale und kulturelle Grenzen hinweg. Es stellte sich die Frage, wie man internationale Delphi-Verfahren in einer Weise gestalten kann, die der sprachlichen und kulturellen Vielfalt im Hinblick auf Gesundheitsfragen Respekt zollt – und die nicht nur den Sichtweisen im ‚Zentrum‘ des Diskurses Rechnung trägt, sondern auch abweichende Vorstellungen und Stimmen jenseits des Mainstreams der Wissensproduktion wertschätzt. Diese Spannung wurde zur Triebfeder, mich näher mit der Rolle von Delphi-Verfahren für die Wissensbildung in den Gesundheitswissenschaften auseinanderzusetzen und sie aus einer wissenssoziologischen Perspektive zu ­analysieren.

Delphi-Verfahren in den Gesundheitswissenschaften …

57

2 Die Rolle der Delphi-Methode in der Gesundheitsforschung am Beispiel der Palliativversorgung Der Schwerpunkt gegenwärtiger Delphi-Verfahren liegt in den Gesundheitswissenschaften vor allem auf der Zusammenführung von Expert_innen-­ Perspektiven zu komplexen Themenfeldern, innerhalb derer kein Einverständnis herrscht, sowie auf der Ermöglichung einer kollektiven Reflexion, um ein gemeinsames Verständnis zu fördern oder auch Divergenzen zwischen Expert_ innen-Meinungen zu identifizieren (Guzys et al. 2015). Mögliche Aufgaben und Zielsetzungen von Delphi-Verfahren sind beispielsweise das Ranking von Aspekten nach ihrer Wichtigkeit, die Definition einer Problemstellung oder eines Konzepts, die Bestimmung und Klassifikation von Eigenschaften oder die Identifikation von ‚best practice‘ im Hinblick auf eine Versorgungsfrage (Fletcher und Marchildon 2014). Typische Anwendungsfelder sind 1) die Entwicklung von Praxisleitlinien und professionellen Standards; 2) Kriterien und Kurrikulums-Inhalte für die Aus-, Fort- und Weiterbildung; 3) Entwicklung und Validierung von Assessment-Instrumenten; 4) Qualitätsindikatoren; 5) Kriterien im Bereich der Diagnose, Prognose und Klassifikation von Symptomen und Syndromen; 6) Statements für die Politik, Regelungen oder Verordnungen; 7) Identifikation und Festlegung von Forschungsprioritäten; 8) Identifikation von Barrieren und Versorgungslücken; sowie 9) Theoriebildung. Abb. 1 zeigt die Nutzung von Praxisleitlinien / professionelle Standards Aus-, Fort- und Weiterbildung Entwicklung / Validierung von Tools Qualitätsindikatoren Diagnose, Prognose, Klassifikation Politik / Regelungen / Verordnungen Forschungsprioritäten Barrieren in der Palliativversorgung Theoriebildung 0

10

20

30

40

50

Anzahl der Publikationen* * n = 93 Originalarbeiten, Stand März 2015; vgl. Jünger et al. 2017

Abb. 1   Delphi-Verfahren in der Palliativversorgung. (Eigene Darstellung)

58

S. Jünger

Delphi-Verfahren für die genannten Zielsetzungen exemplarisch für den Bereich der Palliativversorgung (Ergebnis einer systematischen Literatursuche in PubMed, EMBASE, CINAHL, Web of Science und Academic Search Complete, Stand März 2015; vgl. Jünger et al. 2017).

2.1 Rahmenbedingungen der Wissensgewinnung in der medizinischen Forschung Als vorherrschendes Paradigma der Wissensgenerierung in der medizinischen Forschung gilt seit den 1990er Jahren die evidenzbasierte Medizin (EBM). Sie wurde definiert als der gewissenhafte, ausdrückliche und vernünftige Gebrauch der gegenwärtig besten externen, wissenschaftlichen Evidenz für Entscheidungen in der medizinischen Versorgung der Patient_innen (EbM Netzwerk 2011; Kelly 2008). Die Praxis der EBM erfordert die Integration individueller klinischer Expertise sowie der besten verfügbaren klinischen Evidenz auf der Grundlage systematischer Forschung (Sackett 1997). Die randomisierte klinische Studie, oder besser noch, die systematische Übersicht mehrerer randomisiert kontrollierter Studien, wird als die hochrangigste Grundlage klinischer Praxis gesehen und wurde damit zum Goldstandard für die Bewertung medizinischer Interventionen (Cochrane 1972; Greenhalgh et al. 2014; Shah und Chung 2009; Sackett 1997). Expert_innen-Urteile, beispielsweise im Rahmen von Delphi-Verfahren, stellen gemäß EBM-Prinzipien hingegen das niedrigste Niveau der Erkenntnisgenerierung dar (Burns et al. 2011).

2.2 Kontext der Standardisierung Seit Mitte der 1990er Jahre wurden Standardisierung, Qualitätsmessung und Benchmarking in der Gesundheitsversorgung verstärkt zur Priorität (Donahue und van Ostenberg 2000; Heidemann 2000; van Niekerk et al. 2003; Segouin et al. 2005), einhergehend mit der Entwicklung von Standard Operating Procedures, Qualitätsindikatoren und Messinstrumenten, Audits und Zertifizierungssystemen (Donahue und van Ostenberg 2000; Heidemann 2000; Segouin et al. 2005). In zunehmendem Maße wurden einheitliche Strategien gefordert, um den Herausforderungen der Gesundheitsversorgung in einer globalisierten Welt begegnen zu können (WHO 2007). Vor diesem Hintergrund gewann das Delphi-Verfahren als Methode der Zusammenführung von Expert_inneneinschätzungen über geografische Grenzen hinweg eine besondere Bedeutung für die Etablierung von Standards sowie zur Erlangung von Homogenität und Vereinheitlichung.

Delphi-Verfahren in den Gesundheitswissenschaften …

59

2.3 Historischer und (gesundheits-)politischer Kontext – Professionalisierung und Differenzierung Für die Bedeutung von Delphi-Verfahren als Gruppenprozess spielt auch der historische und (gesundheits-)politische Kontext eine Rolle, wie hier am Beispiel der Palliativversorgung gezeigt wird. Ursprünglich aus der Hospizbewegung kommend, haben sich führende Pionier_innen in den letzten Jahrzehnten kontinuierlich um die Konstitution der Palliativmedizin als medizinische Fachdisziplin bemüht. Es taten sich Spannungsfelder und hegemoniale Aushandlungsprozesse zwischen dem gemeindenahen Bürgerschaftsengagement der Hospizbewegung und dem Wunsch nach Anerkennung in der medizinischen Fachwelt auf. Zudem bestand mit zunehmender Professionalisierung das Bestreben nach der Erhebung von Qualitätsstandards für die Versorgung sowie nach politischer Lobbyarbeit. Vor diesem Hintergrund entstanden verschiedene Instrumente des Benchmarkings und der Standardisierung sowie eine Reihe von Empfehlungsleitfäden (White Papers) der European Association for Palliative Care (EAPC), in deren Erstellung die Delphi-Methode von Anfang an eine tragende Rolle spielte (Tab. 1). Die White Papers wurden zu einem zentralen Instrument der Interessensvertretung in Bezug auf Finanzierung und Gesetzgebung sowie der Argumentation gegenüber der Politik. In dem ebenfalls auf einem Delphi-Verfahren basierenden White Paper for Global Palliative Care Advocacy (Centeno et al. 2018) verdichtet sich dieser Anspruch der globalen Reichweite strategischer Empfehlungen. Delphi-Verfahren wurden somit zu einem tragenden methodischen Wegbegleiter für diejenigen, die fachlich, wissenschaftlich und berufspolitisch an der Konstitution der Palliativversorgung als anerkannter medizinischer Fachdisziplin beteiligt sind.

2.4 Methodologische Rahmenbedingungen der Wissensgenerierung Am Beispiel der Palliativversorgung lässt sich ebenfalls aufzeigen, wie sich die Rahmenbedingungen der Wissensgenerierung auf die Wahl von Methoden und Forschungsdesigns auswirken. Vor dem Hintergrund des Anspruchs der Evidenzbasierung guter klinischer Praxis stellen sich der Forschung im Feld der Palliativversorgung verschiedene Herausforderungen. Bedingt durch deren spezifische Zielsetzung, nämlich die Erhaltung oder Verbesserung der Lebensqualität im Rahmen eines holistischen Versorgungsansatzes, bestehen Grenzen der Erlangung ‚hochrangiger‘ Evidenz im Sinne der EBM-Regeln (Aoun und Nekolaichuk 2014;

60

S. Jünger

Tab. 1   White Papers der European Association for Palliative Care (EAPC). (Eigene ­Darstellung) EAPC recommended framework for the use of sedation in palliative care (Cherny et al. 2009) EAPC White Paper on Standards and Norms for Hospice and Palliative Care in Europe (Radbruch et al. 2009, 2010)a EAPC White Paper on improving support for family carers in palliative care (Payne und EAPC 2010a, b)a Core competencies in palliative care: an EAPC White Paper on palliative care education (Gamondi et al. 2013a, b) White Paper on core competencies for education in paediatric palliative care (Downing et al. 2013) White paper defining optimal palliative care in older people with dementia (van der Steen et al. 2014)a Core competencies for palliative care social work in Europe: an EAPC White Paper (Hughes et al. 2014) EAPC White Paper on Outcome Measurement in Palliative Care (Bausewein et al. 2016) Defining volunteering in hospice and palliative care in Europe: an EAPC White Paper (Goossensen et al. 2016)a White paper on euthanasia and physician assisted suicide (Radbruch et al. 2016)a Defining consensus norms for palliative care of people with intellectual disabilities (Tuffrey-Wijne et al. 2016)a Definition and recommendations for advance care planning: an international consensus (Rietjens et al. 2017)a aDie

Empfehlungen in den gekennzeichneten White Papers basieren auf Delphi-Verfahren

Visser et al. 2015). Neben ethischen und methodischen Herausforderungen stellt sich die Frage nach einer sinnhaften Operationalisierung klinischer Ergebnisparameter (Addington-Hall 2007; Aoun und Nekolaichuk 2014; Visser et al. 2015). Traditionelle klinische Endpunkte wie Überlebensrate oder physische Indikatoren für den Rückgang einer Erkrankung sind per Definition auf den Bereich der Palliativversorgung kaum anwendbar. Es wurde daher in Zweifel gezogen, dass EBM der Komplexität einer schweren fortgeschrittenen Erkrankung hinreichend Rechnung trägt, insbesondere bei älteren Menschen mit multiplen chronischen Erkrankungen (Upshur 2005; Upshur und Tracy 2008; Bonisteel 2009). Delphi-Verfahren wurden somit zu einer bedeutsamen Alternative für die Etablierung anerkannten Fachwissens sowie zur Entwicklung von Leitlinien für die klinische Praxis, für Aus-, Fort- und Weiterbildung und für die Qualitätskontrolle.

Delphi-Verfahren in den Gesundheitswissenschaften …

61

3 Die Befragung und Auslegung des Orakels – Projektionsfläche für Forschungsfantasien? Die etymologische Quelle des Verfahrens – das delphische Orakel – dient als erkenntnistheoretische Metapher; die Bedeutung des Rituals zur Institutionalisierung von Wissen spielte sowohl im antiken Orakel als auch im modernen wissenschaftlichen Prozess eine tragende Rolle (Häder 2014). Der Vergleich birgt jedoch bei allem Charme auch seine Tücken, da gerade der mystische, nebulöse Charakter des delphischen Orakels sich mitunter dem Anspruch der Wissenschaftlichkeit moderner Delphi-Prozesse als abträglich erwies (Marchais-Roubelat und Roubelat 2011; Dayé 2018).

3.1 Epistemologische Grundlagen des Delphi-Verfahrens Die spezifische philosophische und erkenntnistheoretische Grundlage eines wissenschaftlichen Vorgehens hat Auswirkungen auf die methodologische Praxis und die Art der gewonnenen Erkenntnisse (Mitroff und Turoff 2002). In der Literatur finden sich unterschiedliche Überlegungen hinsichtlich möglicher epistemologischer Grundlagen der Delphi-Methode (Mitroff und Turoff 2002; Marchais-Roubelat und Roubelat 2011; Fletcher und Marchildon 2014; Guzys et al. 2015). Grundsätzlich kann die Delphi-Methode als heuristische Technik betrachtet werden, die sich der Meinung, der Erfahrungen, der Intuition und des impliziten Wissens der Expert_innen bedient (Guzys et al. 2015). Dayé (2018) zeichnet die historischen Entwicklungslinien von Delphi nach und beschreibt dessen epistemologische Evolution in den beiden ersten Dekaden seiner Entstehungsgeschichte (1948–1968). War Delphi ursprünglich als Technik zur Aggregation von Expert_inneneinschätzungen konzipiert, folgten später Bestrebungen, eine epistemologische Grundlage für die Nutzung von Expert_innen-Meinungen zu schaffen und Delphi damit als wissenschaftliche Methode zu etablieren. In den 1960er Jahren durchlief das Verfahren eine stärkere Standardisierung und Institutionalisierung, mit einer Betonung auf Konvergenz und einer ­ stärkeren Bedeutung numerischer Schätzwerte – auf Kosten der Flexibilität und der Offenheit, die noch für die ersten Studien charakteristisch waren. Delphi wurde gewissermaßen als Werkzeug rekonfiguriert, das ohne spezifisches wissenschaftliches Vorwissen angewandt werden konnte (Dayé 2018). Vor diesem Hintergrund erscheint es wenig verwunderlich, dass Delphi sich heute als Sammelbegriff für heterogene Ansätze erweist; die changierende Form der Methode kann verstanden

62

S. Jünger

werden als Folge ihrer vielschichtigen Nutzung, Adaptation und ‚Sozialisation‘ in unterschiedlichen Kontexten und Fachdisziplinen sowie für verschiedenartige Zielsetzungen (Dayé 2018). Mitroff und Turoff (2002) machen gewissermaßen aus der Not eine Tugend; sie argumentieren, dass es keine spezifische oder ‚beste‘ philosophische Grundlage für die Delphi-Methode gibt – dass der wissenschaftsphilosophische Standpunkt aber sehr wohl eine Rolle für die Gestaltung des Verfahrens sowie die Erwartung an dessen Ergebnisse spielt. Insofern sind eine bewusste Reflexion der eigenen Vorannahmen sowie die Darlegung eines gut begründbaren theoretischen Rahmens für die Wahl und Ausgestaltung des Delphi-Verfahrens von Bedeutung für die erkenntnistheoretische Konsistenz und Stringenz des Forschungsprozesses.

3.2 Dramaturgie von Delphi-Verfahren In der methodischen Gestaltung eines Delphi-Verfahrens setzt die Inszenierung des Expert_innen-Panels Zeichen im Hinblick auf die Selbstwahrnehmung der Teilnehmenden, deren Wahrnehmung der ihnen gestellten Aufgabe sowie deren Erwartung an die Gruppen- und Interaktionsdynamik (Scheele 2002). Der Monitoring-Gruppe kommt hier also eine bedeutsame Verantwortung zu, da die Selbstdefinition der Expert_innen als Teil eines Delphi-Panels die Art ihrer individuellen Beiträge sowie die Qualität der Interaktion beeinflussen wird, und damit auch die Eigenschaften der Ergebnisse. Dayé (2014) spricht hier von der epistemischen Rolle, die den Teilnehmenden im Rahmen der Studie zugeschrieben wird. Diese charakterisiert sich durch normative Erwartungen hinsichtlich ihres Wissens und ihrer Fähigkeiten (Wissensdimension), ihres Verhaltens und ihres Beitrags zum Erkenntnisprozess (Aufgabendimension) sowie ihrer Interaktion untereinander (Interaktionsdimension). Scheele (2002) hat eine Taxonomie unterschiedlicher Typen von Gruppenkonstellationen, entsprechender Interaktionsformen sowie deren Konsequenzen für die hervorgebrachten Formen der Realität aufgezeigt (S. 55). Hierbei macht es beispielsweise einen Unterschied, ob die Expert_innen sich als Teil einer wissenschaftlichen Gruppe begreifen, bei der es darum geht, möglichst neutrale, valide Ergebnisse zu produzieren – oder ob sie sich als auserwählte Vertreter_innen und Fürsprecher_innen einer Gemeinschaft sehen, die sich möglichst überzeugend einer gesellschaftlich und/oder politisch brisanten Fragestellung annehmen sollen. Im ersteren Fall wird der Austausch zwischen den Panel-Mitgliedern eher formell sein und der Fokus des individuellen Beitrags auf der Sorgfalt und Präzision der Antworten liegen; in letzterem

Delphi-Verfahren in den Gesundheitswissenschaften …

63

Fall hingegen kann die Interaktion eher durch Ideologie und Polemik geprägt sein und der individuelle Beitrag wird im Dienste eines spezifischen soziopolitischen Interesses stehen.

3.3 Wiedereröffnung des methodologischen Spektrums Delphi-Verfahren werden in den Gesundheitswissenschaften häufig zu den Konsensverfahren gezählt (Jones und Hunter 1995; Murphy et al. 1998). Allerdings basiert diese Zuordnung auf einem reduktionistischen Verständnis des Delphi-Verfahrens als Konsensprozess, während weitere zentrale Zielsetzungen wie die Ideengenerierung oder Zukunftsvorhersage außer Acht gelassen werden (Häder 2014; Scheele 2002; Mitroff und Turoff 2002). Diese Engführung auf Konsensbildung als Motivation für die Nutzung des Verfahrens im Gesundheitswesen hat einige Problematiken aufgeworfen, wie später näher ausgeführt werden soll. In den Gesundheitswissenschaften wird häufig eine Unterscheidung in quantitative und qualitative Forschungsmethoden vorgenommen, die jeweils in einem eher positivistischen bzw. konstruktivistischen Welt- und Wissenschaftsverständnis begründet sind. In den letzten Jahren sind zunehmend Mixed-Methods-Ansätze im Sinne der Kombination qualitativer und quantitativer Forschungsmethoden zur Beantwortung von Fragestellungen populär geworden und die Vorzüge einer Methodenpluralität zur Erkenntnisgenerierung rückten in den Fokus der Aufmerksamkeit (Kuckartz 2014; Burzan 2016; Zhang und Creswell 2013). Delphi-Verfahren lassen sich weder ausschließlich dem positivistischen Forschungsparadigma zuordnen, noch können sie rein zu den konstruktivistischen Ansätzen gezählt werden. Sie beinhalten sozialkonstruktivistische Elemente im Sinne der Aushandlung und Ko-Konstruktion einer geteilten Wirklichkeit innerhalb einer Gruppe von Menschen (Brady 2015; Guzys et al. 2015). Zugleich kennzeichnen sich Delphi-Verfahren durch Strategien der Standardisierung und Prozesskontrolle, welche typischerweise Charakteristika positivistischer Forschung sind, wie beispielsweise die Stringenz der Formalisierung und die Verankerung von Expert_innenurteilen in der bestmöglichen verfügbaren Evidenz (Akins et al. 2005; Birko et al. 2015; Holey et al. 2007). Prinzipiell können Delphi-Verfahren also Elemente unterschiedlicher methodologischer Ansätze der Datenerhebung und -auswertung in sich vereinen. Die Idee eines Spektrums bzw. einer Typologie wird der Frage nach dem epistemologischen Fundament sowie der methodologischen Ausgestaltung daher eher gerecht als eine ­dichotome

64

S. Jünger

Unterteilung in quantitative, positivistische sowie qualitative, konstruktivistische Ansätze (Hasson und Keeney 2011). In der Tat zeichnete sich die erste Delphi-Studie im Jahr 1951 durch eine Kombination quantitativer Befragung und qualitativer Interviews aus, in dem Bestreben, die den numerischen Schätzwerten zugrunde liegenden Überlegungen – und damit das implizite Wissen der Expert_innen – zu explizieren (Dayé 2018). Dayé spricht hier von einem ‚flexiblen Positivismus‘ im Sinne des Bestrebens, die kontrollierte Nutzung intuitiver Expertise als Quelle wissenschaftlicher Erkenntnis zu legitimieren (Dayé 2018). Mitroff und Turoff (2002) analysieren die Bedeutung verschiedener wissenschaftstheoretischer und -philosophischer Positionen für die Wahl des DelphiVerfahrens und die methodologischen Entscheidungen im Prozess. Empirisch verankerte Denkansätze mit stärkerer Gewichtung von Daten denn von Theorie sind nach Ansicht der Autoren besser für gut strukturierte Problemstellungen geeignet, für die bereits eine solide konsensfähige Grundlage existiert. Ist dies nicht der Fall, eignen sich eher Delphi-Verfahren mit Fokus auf die Hervorbringung von Alternativen statt auf das Erzielen von Konsens (Mitroff und Turoff 2002). Gerade sozialen oder gesundheitsbezogenen Fragestellungen wohnt inne, dass es nicht die eine Antwort oder den einen besten Lösungsansatz gibt; sie erfordern daher eine komplexere wissenschaftsphilosophische Annäherung. In Anbetracht des starken Fokus auf Konsensbildung ist jedoch in den Gesundheitswissenschaften gerade die Nutzung des Konflikts als methodologisches Element in Delphi-Verfahren auffallend unterrepräsentiert. Ein weiteres bisher kaum genutztes Potenzial liegt in der Integration partizipativer Ansätze in die Delphi-Forschung. Diese würden insofern neue Perspektiven für das Delphi-Verfahren eröffnen, da Expert_innen nicht allein als Teilnehmende, sondern als Teilhaber_innen am Design und der Umsetzung der Studie berücksichtigt würden. Somit könnte ein selbst-reflexives Element in Delphi-Studien aufgenommen werden, da diese nicht allein zur Wissensgenerierung im Hinblick auf den Gegenstand der Forschung als solchen beitragen würden, sondern gleichermaßen zur Gewinnung von Erkenntnissen im Hinblick auf die Teilnehmenden selbst sowie das Forschungsfeld als Ganzes (Mitroff und Turoff 2002). Ein wegweisendes Beispiel für die Möglichkeit, in einer Kombination von Delphi und partizipativer Aktionsforschung die Teilnehmenden bewusster in die Gestaltung des Verfahrens einzubeziehen, bietet die Studie von Fletcher und Marchildon (2014), die unter Abschn. 7.1.2 näher beschrieben wird. Anhand einer Literaturübersicht zu methodologischen Grundlagen von Delphi-Verfahren in der Gesundheitsforschung konnten Guzys et al. (2015) zeigen, dass nur eine Minderheit der identifizierten Publikationen Aufschluss über die methodologisch-theoretischen Vorannahmen gibt. Zugleich fand sich eine

Delphi-Verfahren in den Gesundheitswissenschaften …

65

Vielzahl an Ansätzen; als übergreifende Epistemologie wurde mehrheitlich auf qualitative Forschungsansätze und den Interpretivismus (als Gegenpol zum Positivmus) rekurriert; einzelne Studien verwiesen dabei insbesondere auf u. a. die Grounded Theory oder die Phänomenologie. Darüber hinaus wurde Delphi als Mixed-Methods-Ansatz oder pragmatischer Forschungsansatz beschrieben. Interessanterweise fanden sich in der Übersicht keine Veröffentlichungen, die spezifisch auf quantitative Perspektiven mit Fokus auf z. B. mathematisches Modellieren Bezug nahmen. Auf der Grundlage ihrer Ergebnisse diskutieren die Autor_innen den zyklischen Prozess der Hermeneutik als einen zielführenden methodologischen Rahmen für die Delphi-Forschung (Guzys et al. 2015). Der hermeneutische Zirkel vergegenwärtige den iterativen Prozess der Konzeptbildung zwischen Individuen und einem Kollektiv, der schließlich in einem geteilten Verständnis mündet, während divergierende Sichtweisen dennoch repräsentiert bleiben können.

3.4 Fazit Der Blick auf die gegenwärtige Nutzung der Delphi-Methode legt nahe, dass in den Gesundheitswissenschaften eine kreative Wiedereröffnung des erkenntnistheoretischen Diskurses stattgefunden hat, in dem Wissenschaftler_innen es wagen, die ursprüngliche Flexibilität der Methode neu zu entdecken und deren Umsetzung den Anforderungen eines komplexen Forschungsfelds anzupassen. Im Hinblick auf die epistemologischen Grundlagen zählt schließlich nicht allein die Frage, welche philosophischen Ansätze in Bezug auf das Delphi-Verfahren bereits diskutiert und genutzt wurden – sondern gerade auch, welche bislang weitgehend ausgeblendet wurden – denn hier liegen möglicherweise ungenutzte Potenziale im Sinne der Weiterentwicklung der Delphi-Methode (Mitroff und Turoff 2002). Dies verdient insbesondere Berücksichtigung vor dem Hintergrund, dass bislang in der Nutzung des Delphi-Verfahrens, sowie in der Forschung in den Gesundheitswissenschaften insgesamt, vor allem westliche Welt- und Wissenschaftsverständnisse vorherrschen. Außerdem gilt der Passung zwischen Fragestellung und Erkenntnisinteresse sowie Wahl und Gestaltung des Delphi-Verfahrens besonders sorgsame Reflexion; um es mit den Worten von Mitroff und Turoff (2002) zu sagen: But then, believing in conflict as we do, we might have a good debate on the matter. If one were to design a Delphi to investigate the matter, which Delphi inquirer design do you think we (you) ought to use? (Mitroff und Turoff 2002, S. 34).

66

S. Jünger

4 Exkurs in die Wissenssoziologie What realities have been or are being socially constructed – and what does this question mean for conducting Delphis? (Scheele 2002, S. 41).

Aus der Perspektive des sozialen Konstruktivismus und des symbolischen Interaktionismus kann Wissenschaft als interaktiver Aushandlungsprozess zwischen Individuen und innerhalb von Gruppen betrachtet werden (Fleck 2012; Bourdieu 1984; Keller 2011). Wissen wird demnach in einem Prozess diskursiver Ko-Konstruktion geschaffen (Keller 2011). Anders als im Positivismus oder kritischen Rationalismus werden wissenschaftliche Tatsachen nicht als losgelöstes, ahistorisches objektives Gut betrachtet. Wissenschaftliches Wissen wird verstanden als sozial, kulturell und historisch bedingt (Foucault 1976; Fleck 2012). Statt natürlicher Erscheinungen, die es nur mittels der angemessenen Methoden empirischer Forschung aufzudecken gilt, werden Fakten innerhalb bestimmter wissenschaftlicher Gruppierungen – so genannter ‚Denkkollektive‘ (Fleck 2012) konstruiert; deren ‚Denkstile‘ haben Einfluss auf die Generierung von Wissen. Dieser ‚habitus mentalis‘ (Scheele 2002) im Sinne der globalen Wirklichkeit einer Ära zeichnet sich durch eine geteilte Annahme darüber aus, was gültiges Wissen ist, wie dieses generiert bzw. entdeckt werden kann und wie sich dessen Akzeptanz oder Beweis konstituiert (Epistemologie), sowie durch die Grundlegeln, die seitens der Mitglieder einer Gemeinschaft erarbeitet und akzeptiert wurden (Brown 1995; Scheele 2002). Hier kann auch ein Bezug zu Kuhns Idee einer Normalwissenschaft hergestellt werden – die wissenschaftliche Gemeinschaft akzeptiert ein Paradigma, auf dessen Basis sie Forschung betreiben und sich der Erkundung neuer Fragestellungen widmen kann (Kuhn 1970). Das zentrale Interesse der Wissenssoziologie gilt der sozialen Produktion, Transformation und Zirkulation von Wissen (Keller 2011). Ein entscheidendes Kriterium zur Bewertung von Wissen ist dessen Passfähigkeit in einem Sinnkontext und nicht die abstrakte Beurteilung als ‚wahr‘ oder ‚falsch‘. Aus dieser Perspektive können Delphi-Verfahren als zielführende und effektive Methode für die Generierung von gemeinschaftlich ausgehandeltem kontextrelevantem Wissen betrachtet werden.

Delphi-Verfahren in den Gesundheitswissenschaften …

67

5 Erkenntnistheoretische Chancen und Potenziale Aus wissenssoziologischer Perspektive bieten Delphi-Verfahren in dreierlei Hinsicht Potenziale für die Wissensgenerierung in der Gesundheitsforschung: zur Schaffung eines gemeinsamen Fundaments, auf dem Wissenschaft betrieben werden kann; als Quelle der Identität und des Zusammenhalts; sowie zur Orientierung in einem komplexen professionellen Terrain.

5.1 Habitualisierung und Institutionalisierung – Schaffung eines wissenschaftlichen Fundaments Delphi-Verfahren können aus wissenschaftsphilosophischer Sicht als Ressource für die Festlegung grundlegender Elemente wissenschaftlicher Forschung und für die Wissensproduktion gesehen werden; „a type of foundational methodology upon which all other methodologies rest“ (Jorm 2015, S. 888). Erst der Konsens über Grundlagen, wie z. B. was als Wissen zählt oder was eine legitime Forschungsfrage ist, ermöglicht einen Zustand der „normalen Wissenschaft“ (Kuhn 1970). Die impliziten Denkstile, Grundannahmen, Metaphern und Argumentationsregeln lenken und legitimieren unser wissenschaftliches Denken und Handeln. Auf diesem Boden ist die weitere Differenzierung einer Disziplin möglich, wie die Untersuchung spezifischerer Fragen, die Gründung von Fachgesellschaften, die Herausgabe von Fachzeitschriften oder der Anspruch auf einen Stellenwert im Kurrikulum akademischer Ausbildung (Kuhn 1970). Aushandlungsprozesse im Rahmen von Delphi-Verfahren leisten somit einen Beitrag zur Entstehung und Fortführung eines Paradigmas, eines gemeinsamen Engagements und damit eines Fortschreitens der Wissensproduktion.

5.2 Kohäsion und Zusammenhalt Eine weitere Funktion von Delphi-Verfahren in der Gesundheitsforschung ist die Herstellung und Festigung des Zusammenhalts zwischen Mitgliedern der wissenschaftlichen Gemeinschaft. Durch die Teilhabe an einem gemeinschaftlichen Prozess des Erkenntnisgewinns kann die Identifikation mit einem Denkkollektiv und einem Denkstil (Fleck 2012) gefördert werden, ebenso wie mit den Ergebnissen eines Delphi-Verfahrens. Im Sinne der Normalwissenschaft (Kuhn 1970) ist die Wissensdynamik durch das Bestreben der Wissenschaftler_innen gekennzeichnet,

68

S. Jünger

einen kollektiven normativen Rahmen zu schaffen und gegen äußeren Druck zu verteidigen. Die Ko-Konstruktion einer gemeinsamen Wissensbasis und die Unterdrückung latenter Meinungsverschiedenheiten im Rahmen von Delphi-Verfahren erlauben es demnach, eine höhere gemeinsame einheitliche Idee zu vertreten.

5.3 Orientierung in einem komplexen und unsicheren professionellen Terrain In Anbetracht der oben genannten Herausforderungen und Einschränkungen hinsichtlich der Generierung wissenschaftlicher Evidenz durch RCTs oder Beobachtungsstudien für einige Felder und Fragestellungen der Gesundheitsversorgung stellen Delphi-Verfahren eine relevante Quelle der Evidenz dar und bilden die Grundlage für klinische Beratung, Versorgungsplanung und politische Entscheidungsfindung (Biondo et al. 2008; Jünger et al. 2017). Dies kann gerade bei existenziellen oder komplexen schwer lösbaren Fragestellungen von Bedeutung sein. Am Beispiel der historischen Entwicklung der Palliativmedizin als medizinische Fachdisziplin zeigt sich, wie Delphi-Verfahren eingesetzt wurden, um eine Einigung über Grundwerte, Definitionen, theoretische Konzepte und Standards für die klinische Praxis zu erzielen, ebenso wie Regeln für die wissenschaftliche Praxis. Führende Autoritäten im Gesundheitswesen berufen sich auf Empfehlungen, die auf den Ergebnissen von Delphi-Verfahren beruhen, beispielsweise Berufsverbände, wissenschaftliche Fachgesellschaften oder die Weltgesundheitsorganisation; sie werden zitiert und als Ressource für wissenschaftliche Argumentation und gesundheitspolitische Entscheidungen verwendet, was die zentrale Relevanz von Delphi-Verfahren zur Orientierung und Handlung in Gesundheitsfragen widerspiegelt.

6 Grenzen und Herausforderungen Grenzen und Herausforderungen im Hinblick auf den Einsatz von Delphi-­ Verfahren in der Gesundheitsforschung betreffen die Frage nach der Gegenstandsangemessenheit der Methode für bestimmte Fragestellungen im Gesundheitswesen, die Reproduktion von Macht und Hegemonie in und durch Delphi-Verfahren, sowie methodologische Herausforderungen.

Delphi-Verfahren in den Gesundheitswissenschaften …

69

6.1 Grenzbereiche der Gegenstandsangemessenheit von Delphi-Verfahren Zur Beantwortung von wertbehafteten, brisanten Fragestellungen der Gesundheitsforschung, beispielsweise im Hinblick auf Empfehlungen und Entscheidungen in der Pränataldiagnostik oder am Lebensende, kann der Einsatz von Delphi-Verfahren unangemessen sein – insbesondere mit Blick auf den in der Gesundheitsforschung prominenten Fokus auf das Ziel der Konsensbildung. Die Gefahr der Übereinstimmung ist, dass sie Konflikte und Debatten genau dort unterdrücken kann, wo sie am meisten benötigt würden. Gerade bei quantitativ orientierten Delphi-Studien mit dem Ziel der Konsensbildung ist zu beachten, dass die Expert_innenurteile, welche das Verfahren ‚überleben‘, nicht zwangsläufig die besten sind, sondern einen statistischen Kompromiss repräsentieren (Mitroff und Turoff 2002; Dayé 2018). In der Konsequenz können diese sich durchsetzenden Urteile die Bedeutsamkeit und Aussagekraft extremer oder konfliktierender Positionen fehlen lassen.

6.2 Macht und Hegemonie in und durch Delphi-Verfahren Welches Wissen letztendlich als Fachwissen anerkannt und institutionalisiert wird und weitere Verbreitung findet, ist abhängig von Machtverhältnissen sowie vom professionellen Habitus (Fleck 2012; Foucault 1976; Bourdieu 1984). Dieser Logik folgend implizieren hegemoniale Strukturen in der Wissenschaft eine Dominanz bestimmter Ideen sowie eine Unterrepräsentation anderer (Bourdieu 1984; Pellegrino 1992; Pastrana et al. 2010). Demnach kann davon ausgegangen werden, dass der habitus mentalis einer Epoche das Design sowie den Ausgang von Delphi-Verfahren beeinflusst – nicht nur im Sinne dessen, was als Wissen gesucht, akzeptiert und kommuniziert wird, sondern auch in der Art, wie Information kategorisiert und organisiert wird (Scheele 2002; Dayé 2018). Macht ist in Delphi-Prozessen auf unterschiedlichen Ebenen gegenwärtig. Dies betrifft die Zusammensetzung des Monitoring Teams und des Expert_ innen-Panels, die Nutzung von Sprache, die Gestaltung des Prozesses sowie auch die Grundhaltungen und Vorannahmen, welche ihrerseits die Definition der Fragestellung und die Interpretation der Ergebnisse beeinflussen. Forschung in der Medizin und in den Gesundheitswissenschaften ist tief in einem ‚Westlichen‘

70

S. Jünger

Denken verankert (Pellegrino 1992). Die akademische Wissenschaft zeichnet sich durch hoch spezialisierte Formen der Sprache und hierarchischer Machtstrukturen aus (Smith 2012). Die Aushandlungsprozesse der Wissensproduktion mittels Delphi-Verfahren finden in der Regel innerhalb dieses Rahmens statt; bezüglich der Ergebnisse besteht jedoch der Anspruch der Gültigkeit für eine weitaus breitere Gemeinschaft. Dies birgt die Gefahr einer Verzerrung zugunsten der dominanten Positionen der involvierten Expert_innen, insbesondere, wenn die Projektleitung bzw. das Monitoring Team einen hohen Status in der wissenschaftlichen Community genießen und die Ergebnisse damit weitreichende Anerkennung und Verbreitung finden.

6.3 Methodologische Herausforderungen Mit zunehmender Beliebtheit von Delphi-Verfahren in der Gesundheitsforschung hat sich auch eine gewisse Beliebigkeit hinsichtlich ihres Einsatzes eingestellt – sowohl was die Ziele und den Untersuchungsgegenstand angeht, als auch was die Methodik der Durchführung betrifft. „In their enthusiasm some analysts have urged Delphi for practically every use except cure of the common cold.“ (Linstone und Turoff 2002, S. 569). Die ursprünglichen Bestrebungen der Delphi-Methode wurden im Laufe ihres Sozialisationsprozesses gewissermaßen den Realitäten des epistemischen Marktes angepasst (Dayé 2018). Hinzu kommt die zuvor erwähnte Problematik, dass Delphi-Verfahren in der Gesundheitsforschung bisweilen als methodisches Feigenblatt für wissenschaftlichen Konsens genutzt werden: „…although the Delphi technique is widely regarded as a consensus development technique, our impression from reading Delphi publications was that achievement of consensus is often assumed to occur by virtue of performing a Delphi study.“ (Diamond et al. 2014, S. 402). Während die Flexibilität des Delphi-Verfahrens als methodologische Stärke gesehen werden kann, birgt sie zugleich das Risiko, dass die Methode wie ein unreflektiertes Label für eine Sammlung von Ansätzen mit stark divergierender methodischer Sorgfalt genutzt wird (Green et al. 1999; Humphrey-Murto et al. 2017). Eine weitere Herausforderung besteht in der oftmals mangelnden Transparenz hinsichtlich des Verfahrens einschließlich der methodischen Entscheidungen im Verlauf des Prozesses (Fletcher und Marchildon 2014). Dies betrifft beispielsweise die Aufbereitung von Zwischenergebnissen zur Gestaltung der nächsten Delphi-Runde (Jünger et al. 2017; Fletcher und Marchildon 2014). Insbesondere bei der Transformation der Daten aus einer offenen, qualitativen Delphi-Runde in geschlossene, quantitative Fragen besteht das Dilemma eines beträchtlichen

Delphi-Verfahren in den Gesundheitswissenschaften …

71

Informationsverlusts und einer unangemessenen Reduktion von Sinngehalten (Green et al. 1999).

7 Denkanstöße für eine kreative Vision von Delphi in den Gesundheitswissenschaften In Anbetracht der beschriebenen Potenziale und Herausforderungen beim Einsatz von Delphi-Verfahren in den Gesundheitswissenschaften können im Sinne der sorgsamen Nutzung der Methode einige Denkanstöße hilfreich sein. Diese betreffen die Begründung für die Wahl des Verfahrens, die Gestaltung des Prozesses, die Verarbeitung und Auswertung der Daten, die Interpretation der Ergebnisse und deren Übersetzung in eine wissenschaftliche Erkenntnis. Basierend auf Empfehlungen zur Durchführung und Veröffentlichung von Delphi-Verfahren (Jünger et al. 2017) können die im Folgenden beschriebenen Leitfragen diese Überlegungen unterstützen. Diese sind weniger als feste Regeln hinsichtlich der ‚korrekten‘ Durchführung gedacht, sondern eher als Fragen zur Reflexion im Sinne der eigenen Forschungshaltung sowie der Gegenstandsangemessenheit und der Transparenz im Rahmen der betreffenden Studie.

7.1 Reflexionen zur Forschungshaltung Die Literatur aus dem Bereich des ‚decolonising research methodologies‘ (Ermine et al. 2004; Smith 2012) bietet hilfreiche Argumente und Reflexionsansätze, die auf den Prinzipien der Partizipation, Konsultation und Einbeziehung unterschiedlicher Interessensgruppen beruhen. Voraussetzung hierfür ist es, sich als Forschende der historischen Dominanz und der hegemonialen Überlegenheit westlicher wissenschaftlicher Ansätze und Weltanschauungen bewusst zu sein. Um die Reproduktion paternalistischer Strukturen zu vermeiden, ist eine kontinuierliche kritische Selbstreflexion hinsichtlich der eigenen Ziele, Ambitionen und möglicher Interessenkonflikte angebracht. Delphi-Verfahren beinhalten bis zu einem gewissen Grad immer auch Aushandlungsprozesse im Hinblick auf Definitionsmacht und Deutungshoheit. Gerade für Forschende mit Renommee und Autorität in ihrer wissenschaftlichen Community ist es daher wichtig, sich die eigene Macht bei der Produktion, Verbreitung und Institutionalisierung von Gesundheits-Wissen zu vergegenwärtigen. Dies ist die Voraussetzung, um unterschiedlichen Kulturen, Traditionen und Perspektiven auf Gesundheit im Rahmen von Delphi-Verfahren gerecht zu werden.

72

S. Jünger

7.1.1 Diversität – Sprache, Kultur, theoretische Konzepte und Gesundheitspraxis Die Verwendung von Sprache und Definitionen verdient in Delphi-Verfahren besondere Beachtung, da diese eine Schlüsselrolle in der Institutionalisierung von Wissen spielen. Beispielsweise werden internationale Delphi-Verfahren in der Regel auf Englisch als der in der Wissenschaft dominierenden Sprache durchgeführt. Implizite, mit der Sprache eng verwobene Konzepte werden somit bei der Konsensbildung und Wissensproduktion übernommen. Wenn ein Delphi-Verfahren ein weites geografisches Gebiet mit vielen verschiedenen Kulturen, Traditionen und Sprachen umfasst, sollte daher die Übersetzung und interkulturelle Anpassung der Erhebungsinstrumente in Betracht gezogen werden. Die Auswahl von Expert_innen verdient ebenfalls große Aufmerksamkeit. Um eine kontextsensitive Wissensproduktion zu ermöglichen, sollten die Forschenden dafür Sorge tragen, dass auch andere als die vorherrschenden Weltanschauungen und Wissenssysteme vertreten sind. Bei Delphi-Verfahren im Gesundheitswesen empfiehlt es sich daher, nicht nur die Meinungsbildner_innen im Zentrum der Wissensproduktion einzubinden, sondern auch Repräsentant_innen der „Peripherie“. Forschende können sich hierzu beispielsweise folgende Fragen stellen: „Wird meine Forschungsfrage zu überraschenden Ergebnissen führen?“ „Wird mein Studiendesign – einschließlich der Zusammensetzung des Forschungsteams und der Auswahl des Expertengremiums – dem Umfang der Zusammenhänge gerecht, die ich mit den Ergebnissen dieses Delphi-Verfahrens abdecken möchte?“ „Entspricht das Spektrum der in der Studie behandelten Ideen und Konzepte der Realität der beteiligten Kontexte und Praktiken – oder schließt mein Design bestimmte Facetten der Realität unangemessen aus?“

7.1.2 Delphi und partizipative Forschungsansätze Erkenntnistheoretisch können partizipative Methoden – wie etwa die partizipative Aktionsforschung (PAR) – und Delphi-Verfahren als sich gegenseitig ergänzende Ansätze zur kollektiven Wissensproduktion sowie zur Information klinischer Praxis und gesundheitspolitischer Entscheidungsfindung betrachtet werden. In PAR sind die Teilnehmenden nicht allein in der Rolle der ‚Beforschten‘, sondern aktiv am Studiendesign, der Datenerhebung und der Interpretation der Ergebnisse beteiligt (Brazil 2012; von Unger 2012). Sie werden als Kooperationspartner_ innen gesehen, ausgestattet mit dem Wissen und der Handlungsmacht, zum Verständnis des Forschungsprozesses und zur Herstellung der Ergebnisse beizutragen. Umgekehrt wird den Teilnehmenden ermöglicht, die Forschungsergebnisse für ihre Ziele und Zwecke zu nutzen. Somit liegt der Fokus auf der Eröffnung eines Dialogs und der Generierung von Wissen durch Interaktion zwischen Forschenden

Delphi-Verfahren in den Gesundheitswissenschaften …

73

und Teilnehmenden. Die Kombination der Delphi-Methode mit PAR wurde bis dato kaum diskutiert. Fletcher und Marchildon (2014) beschreiben die Integration eines zweistufigen Delphi-Verfahrens in ein Forschungsprojekt mit PAR-Ansatz zur Rolle von Führungskräften im Gesundheitswesen. Die Autorinnen führen zentrale Argumente für die Wahl des DelphiVerfahrens im Rahmen dieses PAR-Projekts an. PAR stellt die Relevanzsetzungen und Lebenswelten von Teilnehmenden in den Mittelpunkt, verleiht erfahrungsbasiertem Wissen Autorität und eröffnet damit nicht-akademischen Personen und Gruppen den Raum, zur Wissensproduktion beizutragen. Die DelphiMethode definiert Akteur_innen und Interessensvertreter_innen eines Feldes als Expert_innen für den jeweiligen Forschungsgegenstand und erlaubt damit, auf der Grundlage der erfahrungsbasierten Einsichten der Teilnehmenden zu handlungsrelevanten Schlüssen in Bezug auf ungelöste Fragen des Gesundheitswesens zu gelangen. Zudem fördert die Delphi-Methode die Transparenz gegenüber den Teilnehmenden im Zuge der Aufbereitung, Analyse und Interpretation der (Zwischen-)Ergebnisse; dies kann als erweiterte Form der kommunikativen Validierung betrachtet werden. Darüber hinaus ist Delphi der PAR-Zielsetzung von Aktion und Veränderung zuträglich – die Methode kann Veränderungsprozesse in Echtzeit begleiten und damit die Funktion einer formativen Evaluation unter Beteiligung der involvierten Entscheidungsträger_innen erfüllen. Schließlich konnte die Studie von Fletcher und Marchildon (2014) zeigen, wie ein Delphi-Verfahren nicht einzig zur Erlangung von Konsens genutzt werden kann, sondern gerade auch zur offenen Reflexion der Ergebnisse. Teilnehmende erhalten damit die Möglichkeit, ihre eigenen Interpretationen geltend zu machen, statt allein die seitens der Forschenden ausgewählten und formulierten Items zu ranken oder zu raten. Hierdurch können Meinungsverschiedenheiten, Kontroverse und Konflikt offenbar werden.

7.2 Forschungspraxis und methodologische Stringenz Aufgrund seiner Vielschichtigkeit und Anpassungsfähigkeit erinnert die Delphi-Technik an ein methodologisches Chamäleon – das Verfahren kann je nach theoretischen Vorannahmen, Erkenntnisinteresse und Zielsetzung eines Projekts flexibel gestaltet und modifiziert werden. Zur Sicherung der methodischen Qualität sind Forschende zugleich gefordert, auf das Wissen und Handwerkszeug einer Bandbreite von Ansätzen und Methoden zurückgreifen zu können, z. B. Grundlagen der Statistik und Fragebogenkonstruktion, Auswertung qualitativer Daten sowie die Gestaltung von Gruppendynamik. Kriterien zur Bewertung der Q ­ ualität

74

S. Jünger

von Delphi-Verfahren sollten ebenfalls der möglichen methodischen Diversität Rechnung tragen – anstelle der klassischen Gütekriterien quantitativer Forschung (Objektivität, Validität und Reliabilität) wurden daher in Anlehnung an Lincoln und Guba (1985) folgende Kriterien der Vertrauenswürdigkeit von DelphiStudien vorgeschlagen: Überprüfbarkeit (confirmability), Glaubwürdigkeit (credibility), Zuverlässigkeit (dependability) und Übertragbarkeit (transferability) (Day und Bobeva 2005). Auf der Grundlage der Ergebnisse einer systematischen Literaturrecherche wurde ein Reporting-Standard für die Durchführung und Veröffentlichung von Delphi-Studien (Recommendations for Conducting and REporting DElphi Studies CREDES) entwickelt (Jünger et al. 2017). Dieser beinhaltet Leitfragen zur Reflexion hinsichtlich der methodischen Begründung für die Wahl des Delphi-Verfahrens, zur Planung und zum Studiendesign, zur Prozessqualität und Stringenz bei der Durchführung der Studie, sowie zur Transparenz und Qualität des Reporting.

7.2.1 Gegenstandsangemessenheit – Zielsetzung und Operationalisierung Zentral ist für die Wahl eines Forschungsdesigns oder einer Methode ist die Frage der Gegenstandsangemessenheit. Bei der Auswahl der Delphi-Technik zur Beantwortung einer bestimmten Forschungsfrage in der Gesundheitsforschung ist es wichtig, den konstruktivistischen Charakter der Methode zu berücksichtigen (Birko et al. 2015; Guzys et al. 2015; Mitroff und Turoff 2002; Scheele 2002). Der zuvor beschriebene Fokus auf konsensbildende Delphi-Verfahren in den Gesundheitswissenschaften kann einen augenscheinlichen gruppenübergreifenden Konsens erzwingen, während jedoch die einzelnen Expert_innen an ihren unterschiedlichen Positionen festhalten (Birko et al. 2015; Hasson und Keeney 2011). Scheele (2002) schlägt daher vor, bewusst und absichtsvoll Ambiguitäten oder gar Irritationen in Delphi-Studien einzubringen, um eine unerwünschte Konvergenz und Übereinstimmung zu vermeiden. Zudem ist bei der Interpretation der Ergebnisse die Bedeutung des (Nicht-)Konsenses zu reflektieren; gerade der Wert stabiler Meinungsverschiedenheiten ist nicht zu unterschätzen, da sie aufschlussreiche Erkenntnisse liefern und Unterschiede in den Perspektiven bezüglich komplexer Themen aufzeigen (Mitroff und Turoff 2002; Guzys et al. 2015).

7.2.2 Sicherstellung der Glaubwürdigkeit Es liegt in der Verantwortung des Monitoring Teams, den Expert_innen einen Raum zu eröffnen, innerhalb dessen sie zu validen und glaubwürdigen Urteilen gelangen können. Während das Monitoring Team den Prozess steuern und Entscheidungen auch in unklaren Situationen treffen muss, sollte darauf geachtet

Delphi-Verfahren in den Gesundheitswissenschaften …

75

werden, die Stimmen der unterschiedlichen Interessengruppen, die von den Ergebnissen des Prozesses betroffen sind, während aller Studienphasen einzubeziehen. Dazu gehören die Definition des übergeordneten Studienziels, die Operationalisierung der Forschungsfragen, die Generierung von Items, die Sprache und Formulierung von Aussagen und Definitionen, die Auswahl der Antwortmöglichkeiten, die Aufbereitung der Daten für die folgende Erhebungsrunde und die Interpretation der Ergebnisse. Forschungsprojekte werden zumeist aufgrund des Erkenntnisinteresses führender Wissenschaftler_innen in ihrem Feld initiiert, die in der Regel eine bestimmte Position zu einem bestimmten Thema vertreten. Das Monitoring Team kann hier gezielt Maßnahmen ergreifen, die sicherstellen, dass nicht direkt oder indirekt auf die Urteile der Expert_innen Einfluss genommen wird. An erster Stelle steht hierbei die Reflexion über eigene Interessen. Hilfreich sind außerdem eine ausgewogene Zusammensetzung des Monitoring Teams sowie die Gelegenheit des kritischen Austauschs innerhalb des Teams. Eine weitere Möglichkeit besteht z. B. darin, die methodische Koordination der Studie an eine unabhängige ‚neutrale‘ Person zu delegieren. Außerdem kann der Entwurf der Ergebnisse vor der Veröffentlichung einem externen Gremium oder Beirat zur kritischen Gegensicht vorgelegt werden.

7.2.3 Wissensproduktion durch Delphi-Verfahren – Darstellung, Veröffentlichung und Verbreitung Im Zuge der Wissensgenerierung durch Delphi-Verfahren ist es hilfreich, wenn Forschende sich die Bedeutung der Methode für die Verbreitung und Institutionalisierung von Gesundheits-Wissen vor Augen halten. Forschende können sich in diesem Kontext folgende Fragen stellen: „Sind die in der endgültigen Veröffentlichung verwendeten Begriffe stigmatisierend, zu präskriptiv oder zu ehrgeizig?“ „Schließen Definitionen Optionen und Wahlmöglichkeiten aus und schränken dadurch das Spektrum der „legitimen“ Ideen und Praktiken unangemessen ein?“ Auch hier können Ansätze, die auf Partizipation und öffentlicher Beratung beruhen, ein konstruktiver Weg sein, um ausgewogene Schlussfolgerungen zu gewährleisten. Bei der Veröffentlichung, Verbreitung und Umsetzung der Ergebnisse von Delphi-Verfahren dient es der Transparenz, die methodischen Entscheidungen während des Delphi-Prozesses zu explizieren, damit die Rezipient_innen die jeweiligen Schritte verstehen, die Entwicklung der Expert_innenurteile nachvollziehen und die erzielten Ergebnisse beurteilen können (Diamond et al. 2014; Hasson et al. 2000). Dies umfasst eine transparente Beschreibung des gesamten Verfahrens, einschließlich des Expert_innen-Panels sowie der Auswirkungen möglicher methodischer Limitationen auf die Interpretation der Ergebnisse und

76

S. Jünger

die ­daraus resultierenden Leitlinien oder Empfehlungen für die Gesundheitsversorgung. Hinsichtlich des Formats der Berichtslegung kann – ergänzend zu einem Qualitätsstandard oder Leitlinien für gute klinische Praxis – die Veröffentlichung einer zusätzlichen methodischen Publikation oder eines Studienprotokolls erwogen werden, um transparent über Einzelheiten des Studienprozesses zu informieren.

7.3 Ausblick Zusammenfassend lässt sich sagen, dass Delphi-Verfahren einen wertvollen Beitrag zur Produktion, Transformation, Zirkulation und Institutionalisierung von Gesundheitswissen darstellen. Dabei sind die Prämissen der Kontextsensitivität und der wissenschaftlichen Vernunft von höchster Relevanz: Gerade in internationalen Delphi-Verfahren verdienen unterschiedliche normative, ethische und rechtliche Rahmenbedingungen Berücksichtigung. Nur so können Forschende und gesundheitspolitische Entscheidungsträger_innen einem globalisierten Kontext der Gesundheitsversorgung gerecht werden. Dies erfordert eine sorgfältige Beachtung der Grenzen und potenziellen Risiken von (internationalen) Delphi-Verfahren, einschließlich der unverhältnismäßigen Dominanz bestimmter Standpunkte, welche im Prozess der Wissensproduktion gleichzeitig die Marginalität anderer Sichtweisen impliziert. Angesichts bestehender Kontroversen und anhaltender Meinungsverschiedenheiten zu einigen Kernfragen der Gesundheitsversorgung muss infrage gestellt werden, dass Konsens und Konvergenz um jeden Preis wünschenswert und angemessen sind – bergen sie doch die Gefahr, das Spektrum der erstrebenswerten und akzeptablen Entscheidungen, Einstellungen und Praktiken in der Gesundheitsversorgung unangemessen einzugrenzen, neue Tabus zu schaffen und den Boden für eine unerwünschte Bevormundung oder gar Kriminalisierung zu bereiten. Die ‚normale Wissenschaft‘ (Kuhn 1970) ermöglicht Habitualisierung und Festigung, ist zugleich aber gerade im Gesundheitswesen auch weiterhin von komplexen existenziellen Fragen und Ambivalenzen geprägt. Deshalb bleibt es wichtig, den Dialog lebendig zu erhalten. Letztlich wird ein gewissenhafter Einsatz von Delphi-Verfahren zu einer höheren Achtung und Anerkennung von Expert_innenurteilen in der wissenschaftlichen Wissensproduktion beitragen. Die Studie von Fletcher und Marchildon (2014) hat die Potenziale der Delphi-Methodologie im Rahmen eines qualitativen, partizipativen Forschungsprojekts gezeigt. Hier kann weitere Forschung ansetzen: Wie können Delphi-Verfahren in den Gesundheitswissenschaften zu einer wissenschaftlichen Mobilität zwischen ‚Zentrum‘ und ‚Peripherie‘ der Wissensproduktion beitragen?

Delphi-Verfahren in den Gesundheitswissenschaften …

77

Literatur Addington-Hall, J. M. (2007). Introduction. In J. M. Addington-Hall, E. Bruera, I. J. Higginson, & S. Payne (Hrsg.), Research methods in palliative care. Oxford: Oxford University Press. Akins, R. B., Tolson, H., & Cole, B. R. (2005). Stability of response characteristics of a Delphi panel: Application of bootstrap data expansion. BMC Medical Research Methodology, 5(37), 1–12. Aoun, S. M., & Nekolaichuk, C. (2014). Improving the evidence base in palliative care to inform practice and policy: Thinking outside the box. Journal of Pain and Symptom Management, 48(6), 1222–1235. Bausewein, C., Daveson, B. A., Currow, D. C., Downing, J., Deliens, L., Radbruch, L., Defilippi, K., Lopes Ferreira, P., Costantini, M., Harding, R., & Higginson, I. J. (2016). EAPC White Paper on outcome measurement in palliative care: Improving practice, attaining outcomes and delivering quality services – Recommendations from the European Association for Palliative Care (EAPC) Task Force on Outcome Measurement. Palliative Medicine, 30(1), 6–22. Brady, S. R. (2015). Utilizing and adapting the Delphi method for use in qualitative research. International Journal of Qualitative Methods, 14(5), 1–6. Brazil, K. (2012). Issues of diversity: Participatory action research with indigenous peoples. In J. Hockley, K. Froggatt, & K. Heimerl (Hrsg.), Participatory research in palliative care: Actions and reflections. Oxford: Oxford University Press. Berger, P. L., & Luckmann, T. (1966). The social construction of reality: A treatise in the sociology of knowledge. London: Penguin Books. Biondo, P. D., Nekolaichuk, C. L., Stiles, C., Fainsinger, R., & Hagen, N. A. (2008). Applying the Delphi process to palliative care tool development: Lessons learned. Supportive Care in Cancer, 16, 935–942. Birko, S., Dove, E. S., & Özdemir, V. (2015). Evaluation of nine consensus indices in Delphi foresight research and their dependency on Delphi survey characteristics: A simulation study and debate on Delphi design and interpretation. PLoS ONE, 10(8), e0135162. Bonisteel, P. (2009). The tyranny of evidence-based medicine. Canadian Family Physician, 55, 979. Bourdieu, P. (1984). Homo academicus. Standford: Standford University Press. Brown, H. R. (1995). Postmodern representation, postmodern affirmation. In H. R. Brown (Hrsg.), Postmodern representations. Truth, power, and mimesis in the human sciences and public culture (S. 1–19). Urbana: University of Illinois Press. Burns, P. B., Rohrich, R. J., & Chung, K. C. (2011). The levels of evidence and their role in evidence-based medicine. Plastic Reconstruction Surgery, 128(1), 305–310. Burzan, N. (2016). Methodenplurale forschung. Chancen und methoden von mixed methods. Weinheim: Beltz Juventa. Centeno, C., Sitte, T., de Lima, L., Alsirafy, S., Bruera, E., Callaway, M., Foley, K., Luyirika, E., Mosoiu, D., Pettus, K., Puchalski, C., Rajagopal, M. R., Yong, J., Garralda, E., Rhee, J. Y., & Comoretto, N. (2018). White Paper for global palliative care advocacy: Recommendations from a PAL-LIFE Expert Advisory Group of the Pontifical Academy for Life, Vatican City. Journal of Palliative Medicine (Epub ahead of print).

78

S. Jünger

Cherny, N. I., Radbruch, L., & The Board of the European Association for Palliative Care. (2009). European Association for Palliative Care (EAPC) recommended framework for the use of sedation in palliative care. Palliative Medicine, 23(7), 581–593. Cochrane, A. L. (1972). Effectiveness and efficiency. Random reflections on health services. The Nuffield Provincial Hospitals Trust. London: The Royal Society of Medicine Press Limited. Day, J., & Bobeva, M. (2005). A generic toolkit for the successful management of Delphi studies. Electronic Journal of Business Research Methods, 3(2), 103–116. Dayé, C. (2014). In fremden Territorien: Delphi, Political Gaming und die subkutane Bedeutung tribaler Wissenskulturen. Österreichische Zeitschrift für Geschichtswissenschaften, 25(3), 83–115. Dayé, C. (2018). How to train your oracle: The Delphi method and its turbulent youth in operations research and the policy sciences. Social Studies of Science, 48(6), 846–868. Deutsches Netzwerk Evidenzbasierte Medizin e. V. (2011). Definitionen. https://www. ebm-netzwerk.de/was-ist-ebm/grundbegriffe/definitionen/. Zugegriffen: 23. Sept. 2018. Diamond, I. R., Grant, R. C., Feldman, B. M., et al. (2014). Defining consensus: A systematic review recommends methodologic criteria for reporting of Delphi studies. Journal of Clinical Epidemiology, 67(4), 401–409. Donahue, K. T., & van Ostenberg, P. (2000). Joint Commission International accreditation: Relationship to four models of evaluation. International Journal for Quality in Health Care, 12(3), 243–246. Downing, J., Ling, J., Benini, F., Payne, S., & Papadatou, D. (2013). Core competencies for education in paediatric palliative care. Report of the EAPC Children’s Palliative Care Education Taskforce. Milan: European Association for Palliative Care. Ermine, W., Sinclair, R., & Jeffery, B. (2004). The ethics of research involving indigenous peoples. Report of the indigenous People’s Health Research Centre to the Interagency Advisory Panel on Research Ethics. Saskatoon: Indigenous People’s Health Research Centre. Fleck, L. (2012). Entstehung und Entwicklung einer wissenschaftlichen Tatsache (9. Aufl.). Frankfurt a. M.: Suhrkamp Taschenbuch Wissenschaft. Fletcher, A. J., & Marchildon, G. P. (2014). Using the Delphi method for qualitative, participatory action research in health leadership. International Journal of Qualitative Methods, 13, 1–18. Foucault, M. (1976). The birth of the clinic. An archaeology of medical perception. London: Tavistock. Gamondi, C., Larkin, P., & Payne, S. (2013a). Core competencies in palliative care: An EAPC White Paper on palliative care education – Part 1. European Journal of Palliative Care, 20(2), 86–91. Gamondi, C., Larkin, P., & Payne, S. (2013b). Core competencies in palliative care: An EAPC White Paper on palliative care education – Part 2. European Journal of Palliative Care, 20(3), 140–145. Goossensen, A., Somsen, J., Scott, R., & Pelttari, I. (2016). Defining volunteering in hospice and palliative care in Europe: An EAPC White Paper. European Journal of Palliative Care, 23(4), 184–191. Green, B., Jones, M., Hughes, D., & Williams, A. (1999). Applying the Delphi technique in a study of GPs’ information requirements. Health and Social Care in the Community, 7(3), 198–205.

Delphi-Verfahren in den Gesundheitswissenschaften …

79

Greenhalgh, T., Howick, J., Maskrey, N., & for the Evidence Based Medicine Renaissance Group. (2014). Evidence based medicine: A movement in crisis? British Medical Journal, 348(3725), 1–7. Guzys, D., Dickson-Swift, V., Kenny, A., & Threlkeld, G. (2015). Gadamerian philosophical hermeneutics as a useful framework for the Delphi technique. International Journal of Qualitative Studies on Health and Wellbeing, 10, 26291. Häder, M. (2014). Delphi-Befragungen: Ein Arbeitsbuch (3. Aufl.). Wiesbaden: Springer VS. Hasson, F., & Keeney, S. (2011). Enhancing rigour in the Delphi technique research. Technological Forecasting and Social Change, 78, 1695–1704. Hasson, F., Keeney, S., & McKenna, H. (2000). Research guidelines for the Delphi survey technique. Journal of Advanced Nursing, 32(4), 1008–1015. Heidemann, E. M. (2000). Moving to global standards for accreditation processes: The ExPeRT Project in a larger context. International Journal for Quality in Health Care, 12(3), 227–230. Holey, E. A., Feeley, J. L., Dixon, J., & Whittaker, V. J. (2007). An exploration of the use of simple statistics to measure consensus and stability in Delphi studies. BMC Medical Research Methodology, 7(52), 1–10. Hughes, S., Firth, P., & Oliviere, D. (2014). Core competencies for palliative care social work in Europe: An EAPC White Paper – Part 1. European Journal of Palliative Care, 21(6), 300–305. Humphrey-Murto, S., Varpio, L., Wood, T. J., Gonsalves, C., Ufholz, L.-A., Mascioli, K., Wang, C., & Foth, T. (2017). The use of the Delphi and other consensus group methods in medical education research: A review. Academic Medicine, 92, 1491–1498. Jones, J., & Hunter, D. (1995). Consensus methods for medical and health services research. British Medical Journal, 311, 376–380. Jorm, A. J. (2015). Using the Delphi expert consensus method in mental health research. Australian & New Zealand Journal of Psychiatry, 49(10), 887–897. Jünger, S., Payne, S. A., Brine, J., Radbruch, L., & Brearley, S. G. (2017). Guidance on Conducting and Reporting Delphi Studies (CREDES) in palliative care: Recommendations based on a methodological systematic review. Palliative Medicine, 31(8), 684–706. Keller, R. (2011). The Sociology of Knowledge Approach to Discourse (SKAD). Human Studies, 34, 43–65. Kelly, T. (2008). Evidence: Fundamental concepts and the phenomenal conception. Philosophy Compass, 3(5), 933–955. Kuckartz, U. (2014). Mixed methods. Methodologie, Forschungsdesigns und Analyseverfahren. Wiesbaden: Springer VS. Kuhn, T. S. (1970). The structure of scientific revolutions (2. Aufl.). London: The University of Chicago Press. Lincoln, Y. S., & Guba, E. G. (1985). Naturalistic inquiry. Newbury Park: Sage. Linstone, H. A., & Turoff, M. (Hrsg.). (2002). The Delphi method: techniques and applications. Boston, MA: Addison-Wesley. Marchais-Roubelat, A., & Roubelat, F. (2011). The Delphi method as a ritual: Inquiring the Delphic Oracle. Technological Forecasting and Social Change, 78, 1491–1499. Mitroff, I. I., & Turoff, M. (2002). Philosophical and methodological foundations of Delphi. In H. A. Linstone & M. Turoff (Hrsg.), The Delphi method: Techniques and applications (S. 17–34). Boston: Addison-Wesley.

80

S. Jünger

Murphy, M. K., Black, N. A., Lamping, D. L., et al. (1998). Consensus development methods, and their use in clinical guideline development. Health Technology Assessment, 2(3): i–iv, 1–88. Pastrana, T., Vallath, N., Mastrojohn, J., Namukwaya, E., Kumar, S., Radbruch, L., Clark, D. (2010). Disparities in the contribution of low and middle-income countries to palliative care research. Journal of Pain and Symptom Management, 39(1), 54–68. Payne, S., & the EAPC Task Force on Family Carers. (2010a). White Paper on improving support for family carers in palliative care: Part 1. European Journal of Palliative Care, 17(5), 238–245. Payne, S., & the EAPC Task Force on Family Carers. (2010b). White Paper on improving support for family carers in palliative care: Part 2. European Journal of Palliative Care, 17(6), 286–290. Pellegrino, E. D. (1992). Intersections of western biomedical ethics and world culture: Problematic and possibility. Cambridge Quarterly of Healthcare Ethics, 3, 191–196. Radbruch, L., Payne, S., & the Board of Directors of the European Association for Palliative Care (EAPC). (2009). White Paper on standards and norms for hospice and palliative care in Europe: Part 1. European Journal of Palliative Care, 16(6), 278–289. Radbruch, L., Payne, S., & the Board of Directors of the European Association for Palliative Care (EAPC). (2010). White Paper on standards and norms for hospice and palliative care in Europe: Part 2. European Journal of Palliative Care, 17(1), 22–33. Radbruch, L., Leget, C., Bahr, P., Müller-Busch, C., Ellershaw, J., de Conno, F., Vanden Berghe, P., & on behalf of the board members of the European Association for Palliative Care. (2016). Euthanasia and physician-assisted suicide: A white paper from the European Association for Palliative Care. Palliative Medicine, 30(2), 104–116. Rietjens, J. A. C., Sudore, R. L., Connolly, M., van Delden, J. J., Drickamer, M. A., Droger, M., van der Heide, A., Heyland, D. K., Houttekier, D., Janssen, D. J. A., Orsi, L., Payne, S., Seymour, J., Jox, R. J., Korfage, I. J., & on behalf of the European Association for Palliative Care. (2017). Definition and recommendations for advance care planning: An international consensus supported by the European Association for Palliative Care. Lancet Oncology, 18(9): e543–e551. Sackett, D. L. (1997). Evidence-based medicine. Seminars in Perinatology, 21(1), 3–5. Scheele, D. S. (2002). Reality construction as a product of Delphi interaction. In H. A. Linstone & M. Turoff (Hrsg.), The Delphi method: Techniques and applications (S. 35–67). Boston: Addison-Wesley. Segouin, C., Hodges, B., & Brechat, P. H. (2005). Globalization in health care: Is international standardization of quality a step toward outsourcing? International Journal for Quality in Health Care, 17(4), 277–279. Shah, H. M., & Chung, K. C. (2009). Archie Cochrane and his vision for evidence-based medicine. Plastic Reconstruction Surgery, 124(3), 982–988. Smith, L. T. (2012). Decolonizing methodologies: Research and indigenous peoples (2. Aufl.). London: Zed Books. Tuffrey-Wijne, I., McLaughlin, D., Curfs, L., Dusart, A., Hoenger, C., McEnhill, L., Read, S., Ryan, K., Satgé, D., Straßer, B., Westergård, B.-E., & Oliver, D. (2016). Defining consensus norms for palliative care of people with intellectual disabilities in Europe, using Delphi methods: A White Paper from the European Association of Palliative Care. Palliative Medicine, 30(5), 446–455.

Delphi-Verfahren in den Gesundheitswissenschaften …

81

Upshur, R. (2005). Looking for rules in a world of exceptions: Reflections on evidence-based practice. Perspectives in Biology and Medicine, 48(4), 477–489. Upshur, R. E. G., & Tracy, S. (2008). Chronicity and complexity. Is what’s good for the disease always good for the patients? Canadian Familiy Physician, 54, 1655–1658. van der Steen, J. T., Radbruch, L., Hertogh, C. M. P. M., de Boer, M., Hughes, J. C., Larkin, P., Francke, A. L., Jünger, S., Gove, D., Firth, P., Koopmans, R. T. C. M., Volicer, L., & on behalf of the European Association for Palliative Care (EAPC). (2014). White paper defining optimal palliative care in older people with dementia: A Delphi study and recommendations from the European Association for Palliative Care. Palliative Medicine, 28(3), 197–209. van Niekerk, J. P. de V., Christensen, L., Karle, H., Lindgren, S., & Nystrup, J. (2003). WFME Global Standards in Medical Education: Status and perspectives following the 2003 WFME World Conference. Medical Education, 37, 1050–1054. Visser, C., Hadley, G., & Wee, B. (2015). Reality of evidence-based practice in palliative care. Cancer Biology & Medicine, 12,193–200. von Unger, H. (2012). Partizipative Gesundheitsforschung: Wer partizipiert woran? Forum: Qualitative Sozialforschung, 13(1) (Artikel 7). World Health Organisation. (2007). Towards health-equitable globalisation: Rights, regulation and redistribution. Final report to the commission on social determinants of health. Ottawa: Institute of Population Health, Globalization and Health Equity. Zhang, W., & Creswell, J. (2013). The use of “mixing” procedure of mixed methods in health services research. Medical Care, 51(8), e51–e57.

Das Gruppendelphi-Verfahren in den Sozial- und Gesundheitswissenschaften Marlen Niederberger und Ortwin Renn

Zusammenfassung

Das Gruppendelphi-Verfahren ist eine Delphi-Variante, bei der die Anonymität der Expert_innen zugunsten eines offenen Austauschs aufgegeben wird. Die Expert_innen werden zu einem gemeinsamen Workshop eingeladen und bewerten in aufeinander folgenden Kleingruppen mit rotierender Zusammensetzung einen standardisierten Fragebogen. Durch den offenen Austausch werden Hintergründe für die Bewertungen offen gelegt und geprüft, ob divergierende Urteile argumentativ oder semantisch aufgelöst werden können oder ein Konsens über den Dissens vorliegt. Am Ende des Gruppendelphi-Workshops liegen in der Regel wesentliche eindeutigere Verteilungen der Urteile und inhaltliche Begründungen für abweichende Urteile vor. Das Gruppendelphi-Verfahren ermöglicht damit einen quantitativen und qualitativen Erkenntnisgewinn. Für die Gesundheitswissenschaften eignet sich das Verfahren vor allem zur inter- und transdisziplinären Konsensfindung, als Evaluationsinstrument und zur diskursiven Untersuchung gesellschaftlicher bzw. settingspezifischer Transformationsprozesse. Voraussetzung ist eine klar umrissene Forschungsfrage, deren Beantwortung eine gewisse Sachkenntnis benötigt. Allerdings wird es im Vergleich zu anderen Delphi-Varianten bisher eher selten eingesetzt.

M. Niederberger (*)  Pädagogische Hochschule Schwäbisch Gmünd, Schwäbisch Gmünd, Deutschland E-Mail: [email protected] O. Renn  Institute for Advanced Sustainability Studies e.V. (IASS), Potsdam, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_4

83

84

M. Niederberger und O. Renn

Schlüsselwörter

Gruppendelphi · Expert_innenbefragung · Expert_innenworkshop ·  Gesundheitswissenschaften · Public Health · Delphi-Verfahren

1 Einführung Beim Gruppendelphi-Verfahren werden Expert_innen zu einem gemeinsamen Workshop eingeladen. Dabei wird das Delphi-Prinzip der wiederholten Befragung mit einer Rückkopplung der statistischen Gruppenantworten so komprimiert, dass es an ein oder zwei Tagen durchführbar ist. Das Besondere dabei ist, dass durch den persönlichen Austausch inhaltliche Begründungen der Expert_innen erfasst und offengelegt werden können. Gleichzeitig wird damit die Anonymität der Expert_innen aufgegeben. Im Folgenden wird das Konzept und das Vorgehen des Gruppendelphi-Verfahrens vorgestellt. Anschließend werden die spezifischen Chancen und Herausforderungen für die Gesundheitswissenschaften diskutiert.

2 Das Gruppendelphi: Konzept und Definition Das Gruppendelphi wurde in den 80er Jahren als eine Variante des Delphi-Verfahrens entwickelt. Anliegen war es, die Charakteristika eines klassischen Delphis beizubehalten und gleichzeitig die negativen Seiten, vor allem das Fehlen inhaltlicher Begründungen, zu kompensieren (vgl. Hill und Fowles 1975; Renn und Kotte 1984; Renn et al. 1985; Webler et al. 1991; Schulz und Renn 2009; Niederberger und Renn 2018). Dabei wird davon ausgegangen, dass Aspekte wie disziplinspezifische Blickwinkel, lebensweltliche Erfahrungen oder auch semantische Formulierungen das Urteilsverhalten von Expert_innen beeinflussen. So ist beispielsweise die Unterscheidung, ob jemand weitere Forschung in einem bestimmten Themenfeld ablehnt, weil in diesem Bereich bereits genug geforscht wird, oder weil das Themenfeld und damit weitere Forschungen für unwichtig gehalten werden (vgl. Goodman 1987), eine zentrale Information für die Reichweite der Interpretation. Ziel des Gruppendelphis ist die Identifikation von Konsens bzw. Konsens über den Dissens unter Expert_innen. Konsens bzw. ein Konsens über den Dissens liegt bei einem Gruppendelphi dann vor, wenn durch weitere Diskussionen keine Änderung der Urteile mehr erfolgt. Je nachdem wie weit die Urteile ­auseinander

Das Gruppendelphi-Verfahren in den Sozial- …

85

gehen, kommt es zu einem Konsens oder einem Konsens über den Dissens. Eine mathematische Präzision der Formulierung „wie weit“ ist nicht vorgegeben, weil dies unter anderem von der Verwendung der Antwortformate bzw. Skalenbreiten in dem verwendeten Fragenbogen abhängt. Es geht also primär um die Ermittlung von stabilen Verteilungen der Schätzwerte. Grundprämisse ist, dass nicht alle Expert_innen die gleiche Meinung bzw. Beurteilung teilen, sondern dass es bei einer Befragung zu einer Streuung in den Antwortmöglichkeiten kommt (vgl. Williams und Webb 1994). Ziel des Gruppendelphis ist es herauszufinden, ob diese Streuung auf inhaltliche Unterschiede in den Einschätzungen, auf Wissensdefizite, auf Messfehler, auf unterschiedliche semantische Bedeutungsverständnisse. oder sonstige Artefakte der Erfassung von Schätzwerten (etwa Assoziationen mit bestimmten Zahlenwerten) beruht. Im Idealfall kann es zu einem Konsens kommen, wenn sich alle Differenzen als nicht inhaltlich begründet herausstellen und dadurch aufgelöst werden können. Häufig kommt es aber zu einem Konsens über den Dissens. Alle beteiligten Expert_innen sind sich im Endeffekt im Klaren darüber, warum Differenzen bestehen und warum diese zu dem Befragungszeitpunkt nicht aufgelöst werden können. Derartige Informationen können für Entscheidungsträger_innen beispielsweise zur Ableitung von weiteren Forschungsbedarf aber auch für Entscheidungen unter Unsicherheit genutzt werden. Es geht damit bei einem Gruppendelphi nicht ausschließlich um eine rein quantitative Einschätzung, sondern um die Integration qualitativer Daten. Diese werden zwar meist nicht im Sinne der theoretischen oder thematischen Kodierung systematisch ausgewertet, sie können aber semantische Unklarheiten offenlegen, Anhaltspunkte für die Interpretation und Reichweite der statistischen Befunde geben und zur kommunikativen Validierung der Befunde hinzugezogen werden. Damit zeigt das Gruppendelphi-Verfahren konzeptionell Parallelen zu einem Vertiefungsdesign, bei dem qualitative Daten im Nachgang zur Erläuterung bzw. Vertiefung quantitativer Befunde erhoben werden (Creswell 2008; Curry und Nunez-Smith 2015). Während das klassische Delphi-Verfahren vor allem Kontext- und Strukturfaktoren eines bestimmten Sachverhaltes erfassen kann, erlaubt das Gruppendelphi zusätzlich Interpretationen dieser Faktoren im Hinblick auf mögliche individuelle bzw. institutionelle Relevanzen, Hintergründe und Bedeutungen. Damit stellt das Gruppendelphi eine Art „Mixed-Methods-Instrument“ zur Integration qualitativer (Äußerungen der Expert_innen) und quantitativer Elemente (standardisierter Fragebogen) dar. Einerseits können statistische Abschätzungen die in vielen Delphi-Verfahren abgefragten Szenarien bzw. Projektionen nach dem Grad der Wahrscheinlichkeit ihrer Realisierungschance charakterisieren und

86

M. Niederberger und O. Renn

Streuungen zwischen den Antworten quantifizieren; andererseits können inhaltliche Aussagen dazu beitragen, die Varianz in den Antworten der Expert_innen zu verstehen und argumentativ zu erklären. Um aber im Rahmen eines Workshops den inhaltlichen Begründungen der Expert_innen auch zeitlich ausreichend Raum zu geben, wird die Anzahl der Expert_innen bei einem Gruppendelphi auf maximal 30 begrenzt (Niederberger und Renn 2018).

3 Die Spezifika von Gruppendelphi-Verfahren Der Hauptunterschied zwischen dem klassischen Delphi und dem Gruppendelphi besteht darin, dass es sich bei einem Gruppendelphi nicht um eine rein schriftliche Befragung der Expert_innen handelt, sondern um eine Face-to-Face-Situation. Ein Gruppendelphi zeichnet sich durch folgende Spezifika aus: 1. Keine Anonymität: Das Gruppendelphi-Verfahren stellt die einzige Modifikation von Delphi-Verfahren dar, bei der die Anonymität der Expert_innen zugunsten des persönlichen Austauschs nicht gewährleistet werden kann ­(Aengenheyster et  al. 2017). Allerdings kann die konkrete Teilnehmer_innenliste gegenüber der Öffentlichkeit anonymisiert werden. 2. Gemeinsame Beantwortung des Fragebogens: Anstatt einer individuellen Befragung beantworten die Expert_innen den Fragebogen gemeinsam während des Workshops. Sie werden dazu angehalten, Argumente und Sichtweisen auszutauschen und sich gemeinsam auf eine Antwort zu einigen. 3. Konsensziel: Gruppendelphi-Verfahren verfolgen das Ziel einen Konsens bzw. Konsens über den Dissens zu erhalten. Konsens wird statistisch und argumentativ hergestellt: a) Statistisch geht es um die Analyse von Mittelwerten und Streuungen. Bei einer zehnstufigen Skala werden üblicherweise Variationskoeffizienten1 unter 1 oder unter 0,5 als Konsens definiert (Niederberger und Renn 2018, S. 88). b) Argumentativ geht es darum, dass die Expert_innen während des Workshops selbst Konsens bzw. Konsens über den Dissens feststellen. 4. Gleichwertigkeit der Expert_innenurteile unabhängig von der Häufigkeit: Wenn kein Konsens zwischen den Expert_innen ermittelt werden kann, können Minderheitsvoten festgehalten werden. Sie fließen zusammen mit den

1Dieser setzt das arithmetische Mittel und die Streuung ins Verhältnis und erlaubt über alle Fragen/Items hinweg einen Vergleich der Streuung.

Das Gruppendelphi-Verfahren in den Sozial- …

87

inhaltlichen Begründungen gleichberechtigt in den Ergebnisbericht ein. In diesen Fällen wird Konsens über den Dissens festgehalten. Dabei ist die statistische Abweichung zwischen den Urteilen unerheblich. Das Festhalten von Minderheitsvoten ist vielmehr Ergebnis der Diskussion während des Workshops und des Festhaltens der Expert_innen an bestimmten Urteilen unabhängig von dem Gruppenurteil und den ausgetauschten Argumenten bzw. Informationen. 5. Ergebnisdarstellung in Echtzeit: Die statistischen Gruppenantworten werden den Expert_innen nicht wie im klassischen Delphi in schriftlicher Form zugänglich gemacht, sondern die Ergebnisse werden während des Workshops ausgewertet und den Expert_innen sofort zurückgekoppelt. Noch vor Ort haben die Expert_innen die Möglichkeit, ihre Urteile zu erläutern, ggfs. zu verteidigen, aber auch Fragen zur Auswertung zu stellen.

4 Ablauf eines Gruppendelphis Bei dem Gruppendelphi erfolgt die Befragung der Expert_innen im Rahmen eines ein- bis zweitägigen Workshops. Ein standardisierter Fragebogen wird in rotierenden Kleingruppen von Expert_innen beantwortet, und die Ergebnisse werden zwischen den Kleingruppendiskussionen im gesamten Plenum unter der Leitung eines Moderators/einer Moderatorin diskutiert. Bei einem Gruppendelphi beantworten die Expert_innen den Fragebogen nicht allein, sondern in mehreren aufeinander folgenden Kleingruppen mit rotierender Zusammensetzung und diskutieren die Antworten gemeinsam im Plenum. Es gibt also einen Wechsel zwischen der Arbeit in Kleingruppen und im Plenum. Die Expert_innen können ihre Urteile in beiden Diskussionsforen verteidigen, modifizieren, revidieren oder die Meinung der anderen anerkennen. Moderiert wird nur die Diskussion im Plenum, bei der Kleingruppenarbeit bleiben die Expert_ innen unter sich. Der Ablauf eines solchen Gruppen-Delphis ähnelt dem klassischen Verfahren und wird in Abb. 1 dargestellt. Die Anzahl der Delphi-Runden richtet sich nach den Urteilen der Expert_innen und nach der zur Verfügung stehenden Zeit. In der Regel werden, wie beim klassischen Delphi-Verfahren, zwei bis drei Delphi-Runden (Analogie zu Delphi-­ Wellen) durchgeführt, um relativ stabile statistische Befunde herzustellen bzw. zu ermitteln (vgl. Cuhls et al. 1998; Rowe und Wright 1999). Damit erweist sich eine Dauer von zwei Tagen als ideales Zeitfenster für die Durchführung eines Gruppendelphi-Workshops. Die Vorbereitung eines solchen Workshops kann allerdings

88

M. Niederberger und O. Renn

Abb. 1   Ablauf eines Gruppendelphis. (Eigene Darstellung, Niederberger und Renn 2018)

kann bis zu sechs Monate einnehmen, auch weil es wichtig ist, die designierten Expert_innen frühzeitig anzusprechen und den Termin bekannt zu geben. Möglich ist die Kombination des Gruppendelphi-Workshops mit einer schriftlichen Vorabbefragung der designierten Expert_innen oder sogar einer größeren Gruppe von Expert_innen. Bei dieser Befragung wird der standardisierte Fragebogen mit der Bitte einer individuellen Beantwortung der relevanten Items im Vorfeld des Workshops verschickt und anschließend ausgewertet. Die Antworten der Expert_innen werden anonym behandelt und im Hinblick auf Mittelwerte und Streuungen statistisch ausgewertet. Das Forscherteam erhält durch einen Vorabbefragung einen ersten Eindruck über die Urteile und Befindlichkeiten der Expert_innen und kann auf Basis der Ergebnisse den Workshop auf die besonders strittigen und kontroversen Aspekte fokussieren. In diesem Fall können Items, bei denen die Antworten kaum streuen, für den Workshop ausgeschlossen und Konsens angenommen werden. Auch die Expert_innen bekommen durch eine Vorabbefragung einen guten Einblick in die wichtigen Themenfelder des Gruppendelphis. Dadurch haben sie die Möglichkeit, sich erste Gedanken zu machen und ggfs. nach zu recherchieren. Bei dieser Vorabbefragung kann eine größere Anzahl an Expert_innen integriert werden, um die Reichweite der Erkenntnisse des Gruppendelphis zu erhöhen. Inwieweit diese Vorabbefragung sinnvoll oder notwendig erscheint, ist eine Abwägung von Ressourcen und vermutetem Erkenntnisgewinn. Auf der einen Seite bedeutet sie einen weiteren Ressourcenaufwand, aber auf der anderen Seite können sowohl das Forscher_innenteam als auch die Expert_innen diese Vorabbefragung zur

Das Gruppendelphi-Verfahren in den Sozial- …

89

Vorbereitung des Workshops nutzen. Als möglicher Nachteil kann es sich erweisen, dass Expert_innen durch die individuelle Vorbeantwortung der Fragen eine innere Festlegung vorgenommen haben, die sie daran hindert, im Verlauf der Gruppendiskussionen neue Aspekte aufzunehmen und ihre Positionen zu überdenken. Das Gruppendelphi lebt von gegenseitigen Lernprozessen und ist daher darauf angewiesen, dass die Teilnehmenden nicht bereits im Vorfeld inhaltlich festgelegt sind.

5 Expert_innenauswahl Wie auch bei anderen Delphi-Verfahren werden bei Gruppendelphi-Verfahren meist Expert_innen und Praxisakteur_innen unterschiedlicher Disziplinen und institutioneller Zugehörigkeit eingebunden. Die Expert_innen werden in der Regel durch eine bewusste Auswahl über ihren Beruf bzw. institutionelle Zugehörigkeit identifiziert und angesprochen. Durch die begrenzte Anzahl an Expert_innen für den Workshop ist die konkrete Auswahl der Expert_innen bei einem Gruppendelphi eine besondere Herausforderung. Bei der Identifikation der Expert_innen für ein Gruppendelphi müssen folgende Aspekte beachtet werden: • Frühzeitige Planung des Workshops: Bei einem Gruppendelphi besteht die Herausforderung, alle designierten Expert_innen zu einem gemeinsamen Workshoptermin zusammenzubringen. Doch gerade renommierte Expert_ innen sind oftmals über Monate hinweg ausgebucht. Die Einladung der Expert_innen erfolgt deshalb üblicherweise einige Monate vor dem Workshop (Niederberger und Renn 2018). • Inhaltliche Spannbreite: Die eingeladenen Expert_innen repräsentieren die gesamte Spannbreite an relevanten Meinungen und Institutionen. Bewusst werden dabei auch Expert_innen extremer, vermeintlich unbequemer Positionen eingeladen. Durch den offenen Austausch während des Workshops werden die inhaltlichen Hintergründe und Begründungen für diese abweichende Voten erfasst. Zudem sensibilisieren Expert_innen mit extremen Positionen die anderen Teilnehmenden oftmals für die Relevanz spezifischer Ziel- bzw. Betroffenengruppen und für mögliche Akzeptanz- bzw. Umsetzungsprobleme bei der Ableitung von Maßnahmen. • Gleichmäßige Verteilung der Expertise: In der Regel wird angestrebt, dass die designierten Expert_innen die relevanten Institutionen bzw. Meinungsbilder zu gleichen Teilen vertreten. Üblicherweise kommen die Expert_innen

90

M. Niederberger und O. Renn

zu etwa gleichen Teilen aus Wissenschaft, Politik und Wirtschaft und vertreten verschiedene Disziplinen (Niederberger und Renn 2018). Mit der Einbindung von Wissenschaft und Praxis wird der Anspruch verbunden, theoretische und lebensweltliche Expertise zu verbinden. Damit kann ein Gruppendelphi als eine formale Methode transdisziplinärer Forschung betrachtet werden (Bergmann et al. 2010; Pohl und Hirsch Hadorn 2008). • Status und Seniorität: Für die Konsensfindung und Güte der Ergebnisse ist es wichtig, dass sich alle Expert_innen gleichermaßen in die Diskussion einbringen und ihre Urteile äußern. Um apriori diese Chance zu erhöhen, werden mögliche Gruppeneffekte reflektiert und möglichst verhindert. Deshalb ist es wichtig, dass die Expert_innen über einen ähnlichen Status und Seniorität verfügen und so eine Kommunikation auf Augenhöhe erfolgen kann (Niederberger und Renn 2018). Deshalb werden im Bereich der Wissenschaft beispielsweise entweder Professor_innen eingebunden oder Post-docs bzw. Promovierende. • Expert_innen und Praxisakteur_innen als alleinige Zielgruppe: Im Unterschied zu anderen Delphi-Verfahren wird bei einem Gruppendelphi ein engeres Verständnis vom Expert_innenbegriff zugrunde gelegt. Zivilgesellschaftliche Akteur_innen, interessierte Bürger_innen oder Zielgruppen (z. B. Nutzer_ innen, Patient_innen) werden in der Regel nicht eingebunden, es sei denn sie besäßen eine spezifische Expertise, die andere nicht besitzen. Dadurch können mögliche Gruppeneffekte, die sich aufgrund des Workshopcharakters und der Diskussion mit Expert_innen ergeben, reduziert werden. Konzeptionell steht dahinter die analytische Trennung von Wissen und Interesse. Wer auf Basis des eigenen Interesses argumentiert, ist weniger bereit, aufgrund von wissensbezogenen Argumentationen lernbereit und adaptiv zu reagieren. Grundsätzlich besteht bei jedem Gruppendelphi-Workshop das Risiko, dass die Expert_innen Ergebnisse bewusst manipulieren, sich als Redensführer positionieren oder sich nicht ausreichend einbringen. Diese Risiken wird konzeptionell durch den Wechsel zwischen Kleingruppen- und Plenumsdiskussion, der Permutation der Expert_innen in den Kleingruppen und der neutralen Moderation im Plenum begegnet. Zudem dient der Fragebogen als Anker und Mahnmal, alle Punkte zu diskutieren und nicht abzuschweifen. Damit ist der Fokus der Diskussion in den Kleingruppen sowie im Plenum auf konkrete Sachverhalte gerichtet. Grundsatzdiskussionen bzw. „Fensterreden“ können weitgehend vermieden werden. Ein Ausschluss bewusster Manipulation durch Expert_innen ist aber nicht möglich.

Das Gruppendelphi-Verfahren in den Sozial- …

91

6 Moderation Die Aufgaben eines jeden Moderators bzw. jeder Moderatorin einer Gruppendiskussion sind die neutrale Steuerung, die Beteiligung aller Teilnehmenden am Diskussionsprozess und das Aufgreifen verschiedener Ideen bzw. Meinungen von Diskutant_innen (Hartmann et al. 2009). Ein Moderator/eine Moderatorin ist zum einen der „Souverän“ des gesamten Diskussionsprozesses, der inhaltlich verantwortlich an dem Thema arbeiten will und zum anderen die Person, die eine Gruppe bei der Erfüllung ihrer Aufgabe unterstützt (Hartmann et al. 2009). Der Verlauf der Diskussion und damit auch der Erfolg eines Gruppendelphis hängt entscheidenden von seinen/ihren Kompetenzen ab. Die Moderation eines Gruppendelphis ist im Vergleich zu anderen Diskussionsrunden unter folgenden Aspekten besonders anspruchsvoll: 1. Expert_innen sind eine anspruchsvolle Zielgruppe: Expert_innen reagieren mitunter ungehalten, wenn sie das Gefühl haben, ihre Zeit und Expertise würde nicht ausreichend berücksichtigt oder ihr Gegenüber ist nicht ausreichend vorbereitet. Notwendig ist deshalb ein gewisses Fingerspitzengefühl im Umgang mit unterschiedlichen Kommunikationsstilen von Expert_innen. Während einige Expert_innen ausführlich mit vielen technischen Details antworten, reagieren andere eher anekdotisch und beispielhaft. Wieder andere bleiben eher auf der abstrakten Ebene in ihren Ausführungen stecken (Martens und Brüggemann 2006). 2. Anspruchsvolle Themen: Die Themen bzw. Fragestellung eines Gruppendelphis erfordern ein Mindestmaß an Sachkenntnis. Zudem erscheint eine gewisse inter- und transdisziplinäre Kompetenz notwendig, weil die Themen häufig unterschiedliche Facetten und Expertisen berühren. 3. Unterschiedliche Denkkollektive: Die Expert_innen kommen aus verschiedenen Fachdisziplinen und vertreten unterschiedliche Denkkollektive, d. h. sie sind Träger_innen eines bestimmten Wissens- und Kulturstandes (Fleck 2011; Sabisch 2017). In den Gesundheitswissenschaften beispielsweise treffen verschiedene Disziplinen (z. B. Medizin, Psychologie, Soziologie und Ernährungswissenschaft) auf einander, die unterschiedlichen methodologischen Denkkollektiven verhaftet sind. Dies zu berücksichtigen und eine gemeinsame Sprache zu unterstützen, ist eine Herausforderung und erfordert vom Forscher- bzw. Moderationsteam eine Vertrautheit mit den Begrifflichkeiten und Sprachstilen der jeweils involvierten Extert_innen. 4. Politischer Gehalt von Wissen: Das zugeschriebene bzw. tatsächliche Wissen der Expert_innen ist Grundlage für deren Urteile. Dieses Wissen beruht nicht nur auf theoretischen und disziplinspezifischen Grundlagen, es beinhaltet auch

92

M. Niederberger und O. Renn

Funktions-, Betriebs- und Erfahrungswissen (Dreiack und Niederberger 2018; Meuser und Nagel 1997). Diese Wissensbestände können das Funktionieren von politischen Systemen und Organisationen bestimmen (Niederberger und Dreiack 2018; Molitor 2009). Auf der einen Seite können die Expert_innen dieses Wissen gezielt einsetzen, um Ergebnisse zu beeinflussen, zu manipulieren und Forschung zu instrumentalisieren. Andererseits kann die Thematisierung und Offenlegung entsprechende Hintergründe für abweichende Voten aufdecken und ggfs. zur Konsensfindung beitragen. 5. Risiko heftiger Kontroversen: Die Expert_innen eines Gruppendelphis vertreten bewusst unterschiedliche Meinungen, wodurch heftige Diskussionen auftreten können. Ein erfahrener Moderator/Moderatorin kann durch Strategien wie Versachlichung, Konfrontation oder Konkretisierung Konfliktsituationen abschwächen (Niederberger und Renn 2018). Der Moderator/Die Moderatorin eines Gruppendelphis braucht im Endeffekt Expertise im Hinblick auf die Gesprächsführung, Erfahrungen im Umgang mit Kontroversen und eine gewisse Sachkenntnis zum Thema. Dabei gibt es die Möglichkeit Co-Moderator_innen einzubinden. In diesem Fall kann eine Person die Aufgabe der Gesprächsführung übernehmen und die andere ist Spezialist für inhaltliche Aspekte. Auch eine simultane Protokollierung auf einem Flipchart oder mithilfe einer Präsentationssoftware hat sich in vielen Fällen bewährt.

7 Statistische Auswertung in Echtzeit Eine der größten Herausforderungen bei einem Gruppendelphi ist die statistische Auswertung der Fragebögen während des Workshops. Die Auswertungen sind Grundlage für die Plenumsdiskussionen und müssen deshalb unmittelbar nach den Kleingruppendiskussionen vorliegen. Dafür werden die Expert_innen in die Pause geschickt und das Forscher_innenteam wertet die Daten aus. Verschiedene Varianten sind hier möglich: Entweder geben die Kleingruppen ihre Antworten gleich in eine digitale Fragebogenversion ein und die Ergebnisse werden über ein Netzwerk zusammengespielt und ausgewertet oder die Expert_innen füllen den Fragebogen in Papierform aus, das Forscher_innenteam gibt die Antworten in das Computersystem ein und wertet sie mit einem Statistikprogramm (z. B. Excel, SPSS) aus. Wichtig ist dabei, dass diese Auswertung zügig erfolgen kann. Deshalb beruht ein Gruppendelphi-Fragebogen zumeist aus Ratingskalen (Niederberger und Renn 2018). Damit können Mittelwerte und Streuungsmaße zügig berechnet werden. Zudem können die Ergebnisse nach der Höhe der Streuung

Das Gruppendelphi-Verfahren in den Sozial- …

93

geordnet werden. Dadurch hat der Moderator/die Moderatorin die Möglichkeit, in der Plenumsdiskussion mit den strittigsten Punkten zu beginnen. Elaborierte statistische Berechnungen sind aufgrund des geringen Zeitfensters während des Workshops nicht möglich, in der Regel auch nicht notwendig.

8 Ergebnis eines Gruppendelphis Die Ergebnisse eines Gruppendelphis werden üblicherweise in Berichtsform aufgearbeitet. In diesem Bericht wird weniger der Diskussionsprozess festgehalten als vielmehr die Endergebnisse des Workshops. Dabei werden deskriptive Häufigkeitstabellen und statistische Maße angegeben. Bei Items mit einer starken Streuung, mit einem Minderheitsvotum oder bei Konsens über den Dissens werden zudem die inhaltlichen Begründungen der Expert_innen anonymisiert festgehalten. Der Bericht kann an die designierten Expert_innen vor Veröffentlichung bzw. Übergabe an den Auftraggebenden des Gruppendelphis mit der Bitte um eventuelle Korrekturen zugeschickt werden. Damit erhalten die Expert_innen ein letztes Mal die Möglichkeit zur Prüfung, ob ihre Meinung ausreichend in den Ergebnissen wiederzufinden ist. Allerdings bedeutet diese Rückspiegelung für die Expert_innen und das Forscher_innenteam einen erneuten Aufwand. Die Ergebnisse eines Gruppendelphis können beispielsweise zur Ableitung von Handlungsempfehlungen oder zur Weiterbearbeitung in einem Forschungsprozess genutzt werden.

9 Forschungs- und Anwendungsbereich von Gruppendelphi-Verfahren in den Gesundheitswissenschaften Das Gruppendelphi-Verfahren hat sich in verschiedenen Forschungs- und Anwendungsbereichen zur Entwicklung von Konsens bzw. Konsens über den Dissens bewährt.2 Grundsätzlich eignet es sich zur: • Wissensintegration: Dabei geht es um den Stand des Wissens über die Grenzen der eigenen Disziplin hinaus. Auslöser für Gruppendelphi-Verfahren

2Konkrete

Projektbeispiele finden sich in Niederberger und Renn (2018).

94

M. Niederberger und O. Renn

können politische Debatten, gesellschaftliche Transformationsprozesse oder disziplinspezifische Wissenslücken sein. So kann beispielsweise der aktuelle Wissensstand zur wissensbasierten Fundierung gesetzlicher Neuerungen ­aufbereitet werden. Dabei liegt der Fokus auf evidenzbasierten Erkenntnissen und auf der Einschätzung der Expert_innen über Machbarkeit, Akzeptanz und Durchsetzungschance möglicher Interventionen in Industrie und Gesellschaft. Konkrete Beispiele wären die Ampelkennzeichnung von Lebensmitteln, die Einführung der Abschreckungsbilder auf Zigarettenpackungen oder die Bewegungsförderung in Städten und Gemeinden. • Wissenstransfer: In diesem Bereich geht es primär darum, zusammen mit den entsprechenden Expert_innen aus der Praxis wissenschaftliche Forschungsergebnisse zu diskutieren, zu bewerten und zu priorisieren. Gemeinsam können Handlungsempfehlungen für Politik und Praxis abgeleitet werden. • Evaluation: Im Rahmen von Evaluationen geht es häufig darum, Expert_innen den Verlauf oder die Effekte von Projekten, Maßnahmen oder Interventionen bewerten zu lassen (Niederberger und Kuhn 2013). Bewährt hat sich das Gruppendelphi-Verfahren als prozessbegleitendes Evaluationsinstrument von Bildungsprogrammen (Niederberger und Kuhn 2013). Expert_innen sind in diesem Fall die eingebundenen pädagogischen Lehrkräfte bzw. das Fachpersonal. Ihre Befragung über ein Gruppendelphi erlaubt die frühzeitige Identifikation von möglichen Problemen und Schwierigkeiten und die partizipative Entwicklung von Lösungsstrategien. Zudem erhöht sich damit die Chance zur Akzeptanz und Umsetzungsbereitschaft der Ergebnisse. Grundsätzlich eignet sich ein Gruppendelphi zur Erfassung von Expert_innenurteilen, zur Ableitung von Handlungsempfehlungen, zur Auflösung von dissenten bzw. kontroversen Expert_innenurteilen und zur Identifikation und Bewertung von Interventionen bzw. Maßnahmen. Voraussetzungen für die Anwendung sind: • die trans- oder multidisziplinäre Fragestellung muss klar umrissen sein • die Beantwortung benötigt eine gewisse Sachkenntnis • die teilnehmenden Expert_innen decken die gesamte Spannbreite an Meinungen und Positionen ab und • sind bereit, sich einzubringen. Das Gruppendelphi-Verfahren findet vor allem in den Bereichen der Innovations-, Nachhaltigkeits- und Umweltforschung Anwendung (Niederberger und Renn 2018). In den Gesundheitswissenschaften werden Gruppendelphi-­Verfahren ­bisher selten eingesetzt, auch im Vergleich zu anderen Delphi-Varianten (­Jünger

Das Gruppendelphi-Verfahren in den Sozial- …

95

et al. 2017). Dennoch bestätigen erste Erfahrungen aus den Gesundheitswissenschaften das Potenzial und die Machbarkeit des Gruppendelphis. Gerade bei divergierenden Expert_innenurteilen und an der Schnittstelle zwischen Forschung, Praxis und Politik haben sie sich bewährt. Das Gruppendelphi erscheint relevant, wenn es unterschiedliche wissenschaftliche Erkenntnisse über die Wirkung von Interventionen gibt, verschiedene Disziplinen beteiligt sind und lebensweltliche wie theoretische Expertise gleichermaßen relevant sind. Konkrete Beispiele können sein (z. B. die Identifikation von Kompetenzprofilen von Gesundheitsmanager_innen oder die Identifikation von geeigneten Maßnahmen zur Feinstaubreduktion in Großstädten).

10 Chancen und Herausforderungen von Gruppendelphi-Verfahren in den Gesundheitswissenschaften Mit Gruppendelphi-Verfahren verknüpfen sich eine Reihe von Chancen aber auch Herausforderungen für die Gesundheitswissenschaften (Tab. 1). Die Belastbarkeit und Güte der Ergebnisse eines Gruppendelphi-Verfahrens hängen maßgeblich von der Auswahl und Teilnahmebereitschaft der designierten Expert_innen ab. Gelingt es, die gesamte Spannbreite an Meinungen abzubilden und eine Gesprächskultur auf Augenhöhe zu etablieren, können unterschiedliche Wissensstände und Urteile erfasst und diskutiert werden. Herausgearbeitet werden kann, ob ein echter Dissens vorliegt oder ggfs. divergierende Verständnisse über semantische Formulierungen bestehen oder Wissenslücken existieren. Bei dem Gruppendelphi-Workshop wird die Anonymität der Expert_innen zugunsten eines persönlichen Austauschs aufgegeben. Durch die Workshopsituation können die Expert_innen persönlich Argumente austauschen und Urteile begründen, bestätigen, modifizieren oder revidieren. Damit einher geht das Risiko von Gruppeneffekten. Redensführer_innen können die Diskussion dominieren und versuchen, die anderen mithilfe überzeugender Rhetorik zu beeinflussen. Dem steht aber entgegen, dass Minderheitsvoten ein besonderes Gewicht erhalten. Sie gehen nicht wie bei anderen Delphi-Verfahren im „statistischen Rauschen“ unter, sondern fließen gleichwertig in die Ergebnisse ein. Dieser Einfluss ist allerdings ambivalent: • Minderheitsvoten können eine Art „Frühwarnfunktion“ für Politik und Gesellschaft übernehmen. Denn mitunter können Minderheitsvoten in den Medien und in der Öffentlichkeit auf eine gewisse Resonanz stoßen. Beispiele sind

96

M. Niederberger und O. Renn

Tab. 1   Chancen und Herausforderungen von Gruppendelphi-Verfahren, eigene Darstellung Chancen

Herausforderungen

Erfassung von Mehrheits- und ­Minderheitsvoten

Abdeckung der gesamten Spannbreite an Meinungen durch die begrenzte Anzahl der Expert_innen

Identifikation von Konsens- bzw. ­Dissensräumen bei divergierenden Expert_ innenurteilen

Auswahl und Fokussierung auf wenige, zentrale Themen/Fragestellungen

Direkter Austausch zwischen Expert_innen Beteiligungsbereitschaft von relevanten unterschiedlicher Disziplinen und institutio- Expert_innen neller Zugehörigkeiten (inter- und transdisziplinär) Reduktion von Unsicherheit bei konkreten Forschungsfragen

Keine „Repräsentativität“ der Ergebnisse

Klärung der Gründe für Dissens (z. B. sach- Meinungsführer_innen und Fensterreden liche oder semantische Gründe) (Moderationsgeschick erforderlich) Relativ schnelles Verfahren (vor allem im Risiko der Instrumentalisierung des Vergleich zum klassischen Delphi-Verfahren) Verfahrens, vor allem bei politisch und gesellschaftlich sehr prekären Themen Hohe Anschlussfähigkeit im Forschungsprozess

Begrenzte Reichweite von Prognosen aufgrund unsicherer möglicher Zukünfte

Klimaskeptiker_innen oder Vertreter_innen der Holocaust-Lüge. Zudem können sich Minderheitsmeinungen im Laufe der Zeit zu Mehrheitsmeinungen entwickeln (Xie et al. 2011). Gleichzeitig ist es möglich, dass einzelne Expert_innen über neue oder bisher unbeachtete Informationen verfügen, die sich im Laufe der Zeit als besonders relevant herausstellen. • Minderheitsvoten beeinflussen die Gruppendiskussionsprozesse bei einem Workshop. Sozialpsychologische Forschungen zeigen, dass konsistent und beharrlich vertretene Minderheitsmeinungen auch eine Mehrheit verunsichern und latente Urteilsprozesse beeinflussen kann, die ggfs. zu echten Meinungsund Urteilsänderungen führen (Erb und Bohner 2010). Bei zu starker Rigidität kann eine Minderheitsmeinung aber auch abstoßend wirken (Nemeth et al. 1974). Erfahrungen zeigen, dass bei Gruppendelphis zwar gerade die Minderheitsvoten ausführlich diskutiert und reflektiert werden; liegt aber ein echter Dissens vor, wird dieser in der Regel selten im Rahmen eines zweitätigen Workshops aufgelöst, sondern als Konsens über den Dissens festgehalten.

Das Gruppendelphi-Verfahren in den Sozial- …

97

Ob es bei einem Gruppendelphi gelingt, tatsächlich die Minderheitsvoten zu erfassen, ist diskussionswürdig. Aus der Wirkungsforschung ist bekannt, dass sich Menschen oftmals der gegenwärtigen Mehrheitsmeinung anschließen (Schubert 2000). Als dominantes Motiv gilt die Isolationsangst, d. h. die Vertreter_innen befürchten in soziale Isolation zu geraten oder zweifeln ihre eigene Urteilsfähigkeit an. Möglicherweise halten bei einem Gruppendelphi-Workshop Expert_innen durch den offenen und direkten Austausch Minderheitsvoten aus diesem Grund eher zurück als Personen mit der vermeintlichen Mehrheitsmeinung. Aus den bisherigen Erfahrungen mit Gruppendelphis lässt sich dieses Verhaltens eines Konformitätsdrucks aber selten belegen. Grundsätzlich ist das Gruppendelphi-Verfahren für komplexe Forschungsprozesse anschlussfähig. Es kann zu Beginn zur Identifikation von Forschungslücken oder am Ende zur Plausibilisierung und Bewertung von Forschungsergebnissen eingesetzt werden. Als Verfahren ist es relativ schnell und preiswert durchführbar. Allerdings besteht wie bei anderen Verfahren der Expert_ inneneinbindung das Risiko der Instrumentalisierung und Manipulation von Ergebnissen (Dreiack und Niederberger 2018). Zudem sind die Ergebnisse eines Gruppendelphis Momentaufnahmen von oftmals komplexen und hochaktuellen Themen. Damit gehen ein gewisser Forschungsaufwand und die stete Produktion neuen Wissens einher. Die zeitliche Reichweite der Aussagen eines Gruppendelphis ist deshalb begrenzt und ist ggfs. regelmäßig zu prüfen. Allerdings eignet sich das Verfahren gut, in festgelegten Intervallen mit den gleichen oder mit anderen Expert_innen die Thematik regelmäßig neu abzuhandeln.

11 Fazit Das Gruppendelphi ist ein geeignetes Verfahren zur Einbindung von Expert_ innen in Forschungs- und Beurteilungsprozesse. Es eignet sich vor allem dann, wenn unterschiedliche Expert_innenurteile vorliegen, das Wissen unterschiedlicher Disziplinen (inter- und transdisziplinär) integriert werden soll und Projekte bzw. Interventionen identifiziert und bewertet werden sollen. Das Verfahren lässt sich mit einem überschaubaren Aufwand durchführen und verspricht vor allem eine bessere Kalibrierung von sachbezogenen Urteilen. Unterschiede in der Beurteilung von Sachverhalten oder in der Bewertung von Maßnahmen können aufgrund von divergierenden Wissensannahmen, unterschiedlichen Bewertungskriterien, Gewichtungsdifferenzen zwischen den Kriterien, Verständnisunsicherheiten oder unterschiedliche Relevanzzuschreibungen zurückzuführen sein. Gerade zur Identifikation von Dissens ist das Gruppendelphi gut geeignet. Es

98

M. Niederberger und O. Renn

hilft, Differenzen in der Beurteilung von Aussagen auf die „wahren“ Ursachen zurückzuführen. Nicht immer können diese Differenzen dann inhaltlich aufgelöst werden. Aber zumindest gibt es eine plausible Erklärung für diese Differenzen und eine von den jeweiligen Vertreter_innen vorgenommene Argumentationsbasis für die von ihnen vertretene Position. Dies ist für akademische Diskussionen ebenso wertvoll wie für politische Diskurse und kollektiv bindende Entscheidungen. Für die Gesundheitswissenschaften hat es vor allem Potenziale zur Konsensfindung, als Evaluationsinstrument und als Verfahren der transdisziplinären Forschung. Allerdings wird es im Vergleich zu anderen Delphi-Varianten bisher eher selten eingesetzt.

Literatur Aengenheyster, S., Cuhls, K., Gerhold, L., Heiskanen-Schüttler, M., Huck, J., & Muszynska, M. (2017). Real-Time Delphi in practice – A comparative analysis of existing soft-ware-based tools. Technological Forecasting and Social Change, 118, 15–27. Bergmann, M., Jahn, T., Knobloch, T., Krohn, W., Pohl, C., & Schramm, E. (2010). Methoden transdisziplinärer Forschung: Ein Überblick mit Anwendungsbeispielen. New York: Campus. Creswell, J. (2008). Research design: Qualitative, quantitative and mixed methods approaches. Thousand Oaks: Sage. Cuhls, K., Blind, K., & Grupp, H. (1998). Delphi ’98: Studie zur globalen Entwicklung von Wissenschaft und Technik. Karlsruhe: Fraunhofer-Institut für Systemtechnik und Innovationsforschung. Curry, L., & Nunez-Smith, M. (2015). Mixed methods in health sciences research: A practical primer. Los Angeles: Sage. Dreiack, S., & Niederberger, M. (2018). Qualitative Experteninterviews in internationalen Organisationen. Politische Vierteljahresschrift, 59(2), 293–318. Erb, H.-P., & Bohner, G. (2010). Consensus as a key: Towards parsimony in explaining minority and majority influence. In R. Martin & M. Hewstone (Hrsg.), Minority influence and innovation: Antecedents, processes and consequences (S. 79–103). Hove: Psychology Press. Fleck, L. (2011). Das Problem der wissenschaftlichen Beobachtung. In S. Werner & C. Zittel (Hrsg.), Denkstile und Tatsachen: Gesammelte Schriften und Zeugnisse (S. 534– 537). Frankfurt a. M.: Suhrkamp. (Erstveröffentlichung 1948). Goodman, C. (1987). The Delphi technique: A critique. Journal of Advanced Nursing, 12, 729–734. Hartmann, M., Besser, R., Maleh, C., Frank, H.-J., Rieger, M., & Funk, R. (2009). Ergebnisorientiert moderieren: Besprechungen, Versammlungen und Großgruppen. In I. Sachsenmeier (Hrsg.), Mit Kommunikation zum Erfolg Bd. 5. Weinheim: Beltz.

Das Gruppendelphi-Verfahren in den Sozial- …

99

Hill, K. Q., & Fowles, J. (1975). The methodological worth of the Delphi forecasting technique. Technological Forecasting and Social Change, 7, 179–192. Jünger, S., Payne, S. A., Brine, J., Radbruch, L., & Brearley, S. G. (2017). Guidance on conducting and reporting Delphi Studies (CREDES) in palliative care: Recommendations based on a methodological systematic review. Palliative Medicine, 31(8), 684–706. https://doi.org/10.1177/0269216317690685. Martens, K., & Brüggemann, M. (2006). Kein Experte ist wie der andere: Vom Umgang mit Missionaren und Geschichtenerzählern. TransState Working Papers, 39. Meuser, M., & Nagel, U. (1997). Das ExpertInneninterview – Wissenssoziologische Voraussetzungen und methodische Durchführung. In B. Friebertshäuser & A. Prengel (Hrsg.), Handbuch qualitative Forschungsmethoden in der Erziehungswissenschaft (S. 481–491). Weinheim: Juventa. Molitor, M. (2009). Bildungskompetenzen im Fokus des aktuellen ethischen Diskurses: Explorative Studien zu inhaltlichen Parametern verantwortlichen pädagogischen Handelns. München: Utz. Nemeth, C., Swedlung, M., & Kanki, B. (1974). Patterning of the minority’s responses and their influence on the majority. European Journal of Social Psychology, 4, 53–64. Niederberger, M., & Dreiack, S. (2018). Wissensarten und deren politischer Gehalt bei Expert_inneninterviews in internationalen Organisationen. Zeitschrift für Internationale Beziehungen, (25. Jg [2018/1], 189–198). https://doi.org/10.5771/0946-7165-2018-1-3. Niederberger, M., & Kuhn, R. (2013). Das Gruppendelphi als Evaluationsinstrument. Zeitschrift für Evaluation, 1, 53–77. Niederberger, M., & Renn, O. (2018). Das Gruppendelphi: Vom Konzept zur Anwendung. Wiesbaden: Springer VS. Pohl, C., & Hirsch Hadorn, G. (2008). Methodenentwicklung in der transdisziplinären Forschung. In M. Bergmann & E. Schramm (Hrsg.), Transdisziplinäre Forschung: Integrative Forschungsprozesse verstehen und bewerten (S. 69–92). New York: Campus. Renn, O., & Kotte, U. (1984). Umfassende Bewertung der vier Pfade der Enquete-Kommission auf der Basis eines Indikatorkatalogs. In G. Albrecht & H. U. Stegelmann (Hrsg.), Energie im Brennpunkt: Zwischenbilanz der Energiedebatte (S. 190–232). München: High Tech Verlag. Renn, O., Albrecht, R., Kotte, U., Peters, H. P., & Stegelmann, U. (1985). Sozialverträgliche Energiepolitik: Ein Gutachten für die Bundesregierung. München: High Tech Verlag. Rowe, G., & Wright, G. (1999). The Delphi technique as a forecasting tool: Issues and analysis. International Journal of Forecasting, 15, 353–375. Sabisch, K. (2017). Die Denkstilanalyse nach Ludwik Fleck als Methode der qualitativen Sozialforschung – Theorie und Anwendung [34 Absätze]. Forum Qualitative Sozialforschung/Forum: Qualitative Social Research, 18(2), Art. 5. http://nbn-resolving.de/ urn:nbn:de:0114-fqs170258. Schubert, B. (2000). Shell in der Krise: Zum Verhältnis von Journalismus und PR in Deutschland. Dargestellt am Beispiel der „Brent Spar“. Münster: LIT. Schulz, M., & Renn, O. (Hrsg.). (2009). Gruppen-Delphi: Konzept und Fragebogenkonstruktion. Wiesbaden: VS Verlag.

100

M. Niederberger und O. Renn

Webler, T., Levine, D., Rakel, H., & Renn, O. (1991). The group Delphi: A novel attempt at reducing uncertainty. Technological Forecasting and Social Change, 39, 253–263. Williams, P. L., & Webb, Ch. (1994). The Delphi technique: A methological discussion. Journal of Advanced Nursing, 19, 180–186. Xie, J., Sreenivasan, S., Korniss, G., Zhang, W., Lim, C., & Szymanski, B. K. (2011). Social consensus through the influence of committed minorities. Physical Review E, 84, 011130.

Real-Time Delphi Lars Gerhold

Zusammenfassung

Im klassischen Delphi werden erst nach Abschluss einer Runde alle Ergebnisse aufbereitet und sowohl numerische als auch qualitative Angaben an die Expert_innen zurückgemeldet. Dieser Beitrag beschreibt die darauf basierende Weiterentwicklung „Real-Time Delphi“, bei welchem die klassische „Rundenlogik“ aufgelöst wird, und die Rückmeldung der Zwischenergebnisse umgehend erfolgt. Im Beitrag wird dargestellt, welche Anforderungen mit dieser effizienzorientierten Ausrichtung des Delphiansatzes einhergehen und neben Spezifika im Vorgehen der Befragung werden auch Biases und Probleme diskutiert. Zudem werden Anbietende von Softwaretools vorgestellt und aktuelle Entwicklungen zu Real-Time Delphis benannt. Schlüsselwörter

Real-Time Delphi · Expert_innenbefragung · Fragebogenmethode · Real-Time Delphi Tools

L. Gerhold (*)  Institut für Informatik, Arbeitsgruppe Interdisziplinäre Sicherheitsforschung, Freie Universität Berlin, Berlin, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_5

101

102

L. Gerhold

1 Einleitung Real-Time Delphi1 ist eine methodische Erweiterung des klassischen Delphiansatzes (siehe Cuhls und Steinmüller in diesem Band), die zu einer weitaus höheren Dynamik in der Auseinandersetzung und Reflexion mit Expert_innenurteilen führt. Äquivalent zum klassischen Delphi handelt es sich beim RealTime Delphi um eine Expert_innenbefragung, die je nach Typ zur Aggregation von Ideen, zur Bestimmung eines zukünftigen Sachverhaltes, zur Ermittlung von Expert_innenmeinungen zu zukünftigen Entwicklungen oder zur Konsensfindung dienen kann (Häder 2009, S. 30 ff.). Der zentrale Unterschied zwischen Real-Time und klassischem Delphi liegt in der unmittelbaren Rückmeldung von Zwischenergebnissen. Im klassischen Delphi werden erst nach Abschluss einer Runde alle Ergebnisse aufbereitet und sowohl numerische als auch qualitative Angaben an die Expert_innen zurückgemeldet. Die Teilnehmenden können dadurch einen umfassenden Überblick über die gesamten Ergebnisse der ersten Befragungsrunde erhalten, bevor sie ihre Angaben prüfen und möglicherweise revidieren. Im Real-Time Delphi hingegen wird diese klassische „Rundenlogik“ aufgelöst, indem die Teilnehmenden nach der Beantwortung sofort Zugriff auf die Zwischenergebnisse erhalten, was eine umgehende Neubewertung eigener Urteile ermöglicht. So wird der sequenzielle Erhebungs- und Rückmeldeprozess des klassischen Delphis durch einen kontinuierlichen Prozess im Real-Time Delphi ersetzt. Initialzündung für die Etablierung der Methode im akademischen Kontext war der Aufsatz „RT Delphi: An efficient, „round-less“ almost real time Delphi method“ von Gordon und Pease (2006). Gordon und Pease stellen hierin die Real-Time Delphi Methode als Ergebnis einer Auftragsarbeit für die Defense Advanced Research Projects Agency (DARPA) vor (Gordon und Pease 2006). Die wesentlichen Anforderungen der DARPA bestanden vor allem in der Erhöhung der Geschwindigkeit von Entscheider basierten Abstimmungsprozessen mit Expert_innenurteilen, um „rapid decisions in tactical situations“ zu ermöglichen (Gordon und Pease 2006, S. 322). Die technische Lösung von Gordon und Pease sah vor, dass mehrere Expert_innen gleichzeitig synchron oder auch asynchron ihre Urteile über die Wertigkeit alternativer Lösungsmöglichkeiten bzw.

1In

der Literatur sind verschiedene Schreibweisen gängig: RT Delphi (Gordon und Pease 2006), Real-Time/Real-time/real-time Delphi (u. a. Geist 2010, Gnatzy et al. 2011, Gordon 2009).

Real-Time Delphi

103

statistische Schätzungen zu zukünftigen Entwicklungen abgeben. Ursprünglich von der DARPA für eine kleine Anzahl von Expert_innen (10–15) angefordert, konnte die technische Lösung auch eine höhere Anzahl an Teilnehmenden ermöglichen. Zu Beginn der Entwicklung der Methode für die DARPA war die zentrale Funktion des Real-Time Delphis die effiziente und schnelle Konsens- und Entscheidungsfindung zwischen mehreren Expert_innen bezüglich verschiedener Handlungsoptionen. Der Fokus lag damit auf der Verbesserung der Gruppenkommunikation und der Erfassung von Gruppenmeinungen. Neben diesen auf Gruppenkommunikation zielenden Ansatz benennt Häder (2009, S. 19) als zweite wesentliche Form von Delphistudien die Bearbeitung spezieller inhaltlicher Fragestellungen im Sinne einer Erarbeitung von Problemlösungen. Die Problemlösung zielt dabei auf die Beurteilung zukünftiger Sachverhalte durch Expert_innen ab, deren Gegenstand naturgemäß unsicher bzw. kontingent ist (Neuhaus und Steinmüller 2015). Auf Basis bereits durchgeführter Delphistudien entwickelte Häder (2009) die bereits benannten Delphi-Typen (Typ1: Ideenaggregation, Typ 2: Bestimmung eines zukünftigen Sachverhaltes, Typ 3: Ermittlung von Expert_innenmeinungen, Typ 4: Konsensfindung), welche ebenso als Rahmen für die Durchführung von Real-Time Delphis genutzt werden können2.

2 Funktionsweise Real-Time Delphi Ausgehend von der vorangegangenen Darstellung der Entstehung des Real-Time Delphi Ansatzes, werden in diesem Abschnitt die Funktionsweisen und Grundlagen der Fragebogenmethode offengelegt. Dies ist zum einen relevant für das grundlegende Verständnis der Methode, zum anderen zeigen die Ausführungen, dass der Mehrwert der methodischen Innovationen des Real-Time Ansatzes nicht für Nutzende auf der Hand liegen. Dies gilt gleichermaßen für diejenigen, die eine Real-Time Delphistudie planen und durchführen als auch für die Teilnehmenden einer solchen Befragung.

2Die Typisierung unterstützt die Delphientwickler_innen dabei, sich über die Zielsetzung im Klaren zu werden, erlaubt eine methodische Rahmung (z. B. Gestaltung der Fragen in Abhängigkeit der Zielsetzung) und zeigt die Möglichkeiten auf, die Delphi-Befragungen bieten (Häder 2009, S. 31).

104

L. Gerhold

Die grundlegende Funktionsweise eines Real-Time Delphis beschreiben Gordon und Pease wie folgt: Ausgehend von einer vorliegenden, elektronisch verfügbaren und auf numerischen Angaben basierenden Befragung, werden für alle Teilnehmenden an der laufenden Studie folgende Informationen angezeigt (in Anlehnung an Gordon und Pease 2006, S. 323): 1. Das arithmetische Mittel oder der Median als Durchschnittswerte aller bisherigen Antworten zu einer Frage 2. Die Anzahl der bisherigen Antworten 3. Die qualitativen Begründungen, die bisher zu den numerischen Angaben angeführt wurden 4. Ein Button für die eigene numerische Beantwortung der jeweiligen Frage 5. Ein Button für qualitative Begründungen in Ergänzung zur numerischen Einschätzung Die Beantwortung einzelner Fragen oder auch der gesamten Befragung kann in einem Real-Time Delphi durch die Teilnehmenden mehrfach wiederholt werden. D. h. das eigene Urteil kann durch die Befragungsteilnehmenden mehrfach verändert werden. Daraus ergibt sich unter Umständen eine Veränderung des Durchschnittswertes der Gruppenantwort zu einer Frage. Die präsentierten Zwischenergebnisse können sich damit laufend ändern, je nachdem, wann und wie häufig eine Person an einer laufenden Real-Time Delphistudie teilnimmt. Zugleich kann sich das Verhältnis (d. h. der Unterschied) zwischen der eigenen Antwort und der Gruppenantwort verändern. Verringern sich die Wertunterschiede zwischen einzelnen Antworten der Expert_innen, verringert sich auch die Streuung der Werte um den Mittelwert. Eine geringe Streuung deutet auf einen hohen Konsens zwischen den Angaben der Befragten hin. In der technisch unterstützten Umsetzung bedeutet dies, dass das Layout eines Real-Time Delphis umfassender als in klassischen Befragungen ist. Abb. 1 zeigt das Layout eines frühen Delphis (Gordon 2007): Hier muss der Eintrittszeitpunkt für verschiedene Events (1.01 bis 1.04) im Hinblick auf zukünftige Entwicklungen im Bereich Energieversorgung (z. B. „business as usual“, „environmental backlash“) geschätzt werden. Es werden zudem Durchschnittswerte und Anzahl bisheriger Antworten angegeben. Über den „Comments“-Button öffnet sich ein Zusatzfenster, in welchem alle bisherigen Kommentare angezeigt werden. Im Vergleich dazu zeigt Abb. 2 ein moderneres Layout, basierend auf der von Wes Boyer für das Millenium Project programmierten Real-Time Software, welche in das Global Futures Information System GFIS eingebettet ist. Auf der

Abb. 1   Layout eines frühen online Real-Time Delphifragebogens. (Gordon 2007)

Kommentarfelder

Pull down Menüs

Anzahl der bisherigen Antworten

Durchschniswerte

Real-Time Delphi 105

Abb. 2   Layout eines Real-Time Delphi des Millenium Project/GFIS. (Der Screenshot wurde zur Verfügung gestellt von den Autoren Glenn und Florescu 2015)

106 L. Gerhold

Real-Time Delphi

107

linken Seite wird eine Frage bezüglich eines unsicheren zukünftigen Zustand, hier „weltweite Arbeitslosigkeit“, formuliert. Die Befragten haben im mittleren Bereich die Möglichkeit, numerische Angaben zur zukünftigen Entwicklung in verschiedenen Zeiträumen zu machen. Die „Diskussion“ darunter zeigt qualitative Begründungen zu den numerischen Angaben, die zudem eine Gruppeninteraktion ermöglicht, wie auch das Kommentarfeld auf der rechten Seite. Die Nutzung verschiedener Frage- bzw. Itemformate unterscheidet sich nicht zwischen klassischem und Real-Time Delphi. Es können jeweils offene wie geschlossene Items genutzt werden, die als Fragen, Aussagen oder Miniszenarien dargeboten werden. Hinsichtlich der Itemskalierung sind Zeitintervalle bzw. erwartete Eintrittszeiträume ebenso denkbar wie die Abfrage von Erwünschtheit, der Wahrscheinlichkeit und der erwarteten Auswirkungen. Hier sei auf die entsprechende Fachliteratur verwiesen, in welcher auch die Konstruktion von Items behandelt wird (Linstone und Turoff 1975, 2011; Häder 2009; Häder und Häder 2000; Cuhls 2009, 2012). Beispiel: Item und Fragen (Aguirre-Bastos et al. 2009): Item: Climate change causes extreme environmental conditions in some EU countries (incl. storms, floods, draughts). Fragen: In your opinion, how probable is it that this change will unfold until 2025?

In your opinion, how important will this change be for European security by then?

– Not probable – Rather probable – Very probable – Almost sure

– Not important at all – Rather important – Very important – Crucial

Beispiel: Item und Skalen (Wagner et al. 2016, S. 437 f.): Item: Because of an increase in social interconnection due to social media, citizens of all socioeconomic categories receive additional qualification to become involved in participation processes Skalen: probability of occurrence 0-100%

the potential impact on politicians 5-point Likert-type scale

desirability of occurrence 5-point Likert-type scale

108

L. Gerhold

Beispiel: Szenario und Skalen (Sonk n. V.) Der Traum vieler Arbeitnehmer hat sich im Jahr 2050 erfüllt: Statt 40 Stunden wird in Deutschland nur noch 20 Stunden pro Woche gearbeitet. Die Erklärung hierfür ist simpel: Diverse Innovationen in der Produktion von Gütern und Dienstleistungen haben dafür gesorgt, dass menschliche Arbeitskraft einfach nicht mehr in demselben Maße benötigt wird, wie noch zu Anfang der 2000er-Jahre. Die Bevölkerung nutzt die hinzugewonnene Freizeit allerdings nicht nur zum eigenen Wohl sondern vielmehr, um ehrenamtlich das Stadtbild zu verschönern und Tätigkeiten auszuführen, die der Allgemeinheit und der Stadt zu Gute kommen. Skalen: Bitte bewerten Sie die Wahrscheinlichkeit des Auftretens des Szenarios (in %; bzw. keine Angabe). 0 bis 100%

Bitte bewerten Sie die Erwünschtheit des Auftretens des Szenarios. 5-stufige Ratingskala von „sehr erwünscht“ bis überhaupt nicht erwünscht“

Mit steigender Komplexität des Items bzw. bei Verwendung von Szenarien oder Zukunftsbildern ergeben sich zudem folgende Herausforderungen: • Es ist uneindeutig, wie Befragte die einzelnen Bestandteile des Items bewerten, bzw. ob einzelne Elemente überbewertet werden. • Wenn sich einzelne Bestandteile des Miniszenarios widersprechen, ist keine eindeutige Antwort möglich. Dies ist durch entsprechende Homogenitätsprüfungen (z. B. durch Konsistenzanalysen) und Pre-Tests zu vermeiden. • Einzelne Bestandteile des Szenarios sind so extrem formuliert, dass Befragte zwar den größten Teil eines Szenarios bewerten können, der extreme Aspekt diese Bewertung jedoch zu sehr überlagert. Da es keine Idealbeschreibung eines Items geben kann, wird auf die Empfehlungen von Rowe und Wright (1999) verwiesen: • Items sollen sinnvoll formuliert sein, was bedeutet, dass sie […] „relate to the domain of knowledge of the specific panelist“ (Rowe und Wright 1999, S. 368). • Eine zu starke Vereinfachung kann dazu führen, dass die Fragen oder die Ergebnisse, die sie hervorbringen, unklar in ihrer Bedeutung sind (Rowe und Wright 1999). Darüber hinaus gilt auch im Real-Time Delphi, dass eine subjektive Kompetenzschätzung bezüglich des erfragten Themenfeldes dienlich ist, um die Daten im Nachgang anhand dieser filtern zu können. Hierbei haben Forschende zu entscheiden, ob diese einmalig zu Beginn oder im Verlauf des Fragebogens immer wieder beantwortet werden muss.

Real-Time Delphi

109

Beispiele für Fragen nach der subjektiven Kompetenz sind: • • • •

Wie kompetent fühlen Sie sich gegenüber dem Forschungsgegenstand? Wie sicher sind Sie sich in Ihrem Urteil? Wie vertraut sind Sie mit dem Themenfeld? Seit wann sind Sie in Ihrem Berufsfeld tätig?

3 Real-Time Delphi und klassisches Delphi: Gemeinsamkeiten und Unterschiede Real-Time Delphis basieren in ihrem Grundkonzept auf der Delphi Methode, wie auch vorangegangen an den Hinweisen zur Formulierung von Fragebogenitems deutlich wurde. Im Folgenden werden daher Gemeinsamkeiten und Unterschiede beider Ansätze in der Gegenüberstellung verdeutlicht. Das dem Real-Time Delphi zugrunde liegende methodische Verständnis ist wie auch beim klassischen Delphi das einer Befragung. Beide haben zudem die Verwendung eines (Online-) Fragebogens, die Gewährleistung der Anonymität der Teilnehmenden sowie die Ermittlung und Rückmeldung von Gruppenantworten gemeinsam (Häder 2009). Zudem variiert sowohl bei Delphis wie auch bei RealTime Delphis die Einschätzung darüber, ob diese einer qualitativen oder einer quantitativen Forschungslogik zugeordnet werden können, über verschiedene Autor_innen hinweg. Während beispielsweise Steinmüller (1997) sowie Glenn und Gordon (2009) Delphis im Grundsatz einen qualitativen und explorativen Charakter zuschreiben, da sie Meinungen zu Fragen generieren, zu denen keine „harten“ Daten vorliegen, beschreibt Popper (2009) den methodischen Ansatz als semi-quantitativ, da „mathematical principles to quantify subjectivity, rational judgements and viewpoints of experts and commentators“ angewendet werden. Schüll (2009) wiederum löst die Positionierung im qualitativ-quantitativen Paradigma auf, indem er darlegt, dass sowohl qualitative wie auch quantitative Elemente enthalten sein können. Diese Einschätzung bedarf jedoch einer Spezifizierung, wie sie Gerhold an anderer Stelle vorgenommen hat: Es bedarf der Unterscheidung der drei Diskursebenen Forschungskonzeption, Datenerhebung und Datenanalyse (Gerhold 2012): Forschungskonzeptionell bedarf es einer Verortung jeder Delphistudie innerhalb eines theoretischen Rahmens, um das Verständnis des Forschungsgegenstandes und der damit einhergehenden umfassenden Gegenstandsbildung

110

L. Gerhold

gerecht zu werden. Auf Ebene der Datenerhebung ist zu reflektieren, dass eine auf die numerische Schätzung von Eintrittswahrscheinlichkeiten ausgerichtete ­Delphistudie zu anderen Aussagen über die Zukunft führt als eine diskursive und damit qualitative Aushandlung von zukünftigen Entwicklungen (siehe hierzu z. B. Niederberger und Renn in diesem Band). Nicht zuletzt bedarf es auch einer dezidierten Bestimmung der Relation gewonnener quantitativer und qualitativer Daten in Delphistudien. Es muss beispielsweise bestimmt werden, ob offene Kommentare als komplementäre Informationen zu den numerischen Durchschnittswerten verstanden werden, oder ob ihnen gar eine validierende Funktion (Divergenz bzw. Konvergenz als Ergebnis) zugeschrieben wird. Dies ist für weitere Bearbeitung der Daten ausschlaggebend. Aus der weiter oben beschriebenen Logik des methodischen Vorgehens eines Real-Time Delphis erwachsen zudem offenkundige Unterschiede zur klassischen Delphimethode: Die klassische „Rundenlogik“ wird aufgelöst und es müssen nicht erst alle Urteile von Expert_innen vorliegen, bevor Zwischenergebnisse z. B. in Form von Mittelwerten zurückgemeldet werden können (siehe Abb. 3). Hieraus ergibt sich ein deutlicher Anstieg an Effizienz und Zeitgewinn, welcher für Entscheidende wertvoll sein kann. Außerdem liegt ein bedeutender Unterschied darin, dass Expert_innen immer wieder zur Befragung zurückkehren können, um ihre bisherigen Urteile zu verändern. In der Regel wird ihnen bei der wiederholten Befragung sowohl ihr ursprüngliches Urteil als auch die Relation ihres Urteils zu dem der anderen Teilnehmenden dargestellt. Dies erfolgt anhand der Darstellung der Abweichung der eigenen numerischen Angabe zur Gruppenantwort, die ggf. auch farblich unterlegt sind (vgl. Abb. 4). Damit wird die Funktionsweise der in klassischen Delphistudien unterstellten Lerneffekte in ein etwas anderes Setting überführt. Lern- und Reflexionsprozesse müssen umgehender einsetzen. Bisher ist man davon ausgegangen, dass erste Urteile in Expert_innenstudien zunächst auf Basis von Fachwissen, naheliegenden Quellen, Intentionen zur Beantwortung und damit mentalen Modellen erfolgen. Im Delphi Ansatz würde das bedeuten, dass Expert_innen die ihnen gestellten Fragen zuerst auf Basis des ihnen explizit zur Verfügung stehenden Fachwissens, welches ggf. mit bestehenden mehr oder weniger wissenschaftlichen Quellen belegt werden kann, bewerten. Mit dieser Bewertung geht intentionales Handeln einher; die Expert_innen folgen bei der Beantwortung ihrem Impuls, welcher sich kohärent zu ihrer persönlich-fachlichen Einschätzung (dem mentalen Modell) über die Problemstellung verhält. Diese Modelle – und damit die aus ihnen abgeleiteten ersten Urteile werden in einem zweiten Schritt einer Überprüfung aufgrund externer Anker (d. h. das nun verfügbare Urteil der

Delphi Moderator_in

Entscheidung über Beenden der Befragungsrunden

Erste Einschätzungsrunde Feedback

Neubewertung

Expert_in n

Expert_in 3

Expert_in 2

Expert_in 1

Abschluss der Delphi Studie

Expert_in 1

Offizieller Start der Delphi Studie

Ein kleiner Kreis an ausgewählten Expert_innen schätzt mögliche Prognosen ein, die als Ausgangswerte für die Real-Time Delphi Studie dienen

Expert_in 2

Expert_in 3

(1) Bewertung (2) Echtzeit Feedback (3) Möglichkeit der Neubewertung

Möglichkeit, Umfrage neu zu bewerten

Ablauf einer Real-Time Delphi Studie

Abb. 3   Ablauf eines klassischen und eines Real-Time Delphis. (Gnatzy et al. 2011, S. 1686, Übersetzung des Autors)

Expert_in n

Expert_in 3

Expert_in 2

Expert_in 1

Ablauf einer klassischen Delphi Studie

t

Beenden der der Delphi Studie

Expert_in n

Real-Time Delphi 111

112

L. Gerhold

Abb. 4   Rückmeldebildschirm einer Real-Time Delphistudie. (Gnatzy et al. 2011, S. 1684)3

anderen Teilnehmenden) und einer möglicherweise folgenden Neujustierung aufgrund eines Lernprozesses unterzogen (Häder 2009, S. 40 f.). Diese Logik ist hier nicht ohne Einschränkung anwendbar. Der zuvor erwähnte Lernprozess basiert auf der Annahme, dass das erste eigene Urteil unabhängig von der Gruppenmeinung erfolgt und erst im weiteren Verlauf durch die Angaben der anderen Teilnehmenden zur Disposition gestellt wird. In einem Real-Time Delphi wird hingegen in der Regel das Gruppenurteil direkt nach Abgabe der eigenen Einschätzung angezeigt (vgl. Abb. 3). D. h. bereits die Übermittlung des Gruppenurteils zur ersten Frage, kann sich auf die Antworten zu weiteren Fragen auswirken (siehe Abschn. 4 „Spezifische Herausforderungen von Real-Time Delphistudien“). Tab. 1 fasst die dargestellten Gemeinsamkeiten und Unterschiede von klassischen und Real-Time Delphis zusammen:

3Die

hier abgebildete Software ist nicht öffentlich verfügbar. Als Farbschema wurde genutzt (Gnatzy et al. 2011, S. 1685): Green Yellow Orange Red

Within group opinion Moderate divergence from group opinion Significant divergence from group opinion Strong divergence from group opinion

± ± ± ±

divergence of max. 10 % of IQR from median divergence of max. 20 % of IQR from median divergence of max. 40 % of IQR from median divergence of more than 60 % of IQR from median

Real-Time Delphi

113

Tab. 1   Charakteristika von klassischem und Real-Time Delphi. (Eigene Darstellung auf Basis von Linstone und Turoff 2002; Häder 2009; Gordon und Pease 2006) Charakteristikum

Klassisches Delphi Gemeinsamkeiten

Real-Time Delphi

Erhebungsinstrument

Fragebogen

Fragebogen

Stichprobe

Expert_innenpanel

Expert_innenpanel

Anonymität der Antworten

Gegeben Unterschiede

Gegeben

Anzahl der Runden

Zwei oder mehr

Keine Runden, sondern sofortige Rückmeldung

Basis der Rückmeldung über Urteile anderer Teilnehmenden

Rückmeldung des arithmetischen Mittels oder des Medians aller Expert_inneneinschätzungen

Rückmeldung des arithmetischen Mittels oder des Medians aller bisherigen Expert_inneneinschätzungen

Umfang der qualitativen Rückmeldungen

Zusammenfassung oder gesamte Darstellung aller Begründungen die die teilnehmenden Expert_innen für Ihre numerischen Einschätzungen abgegeben haben

Gesamte Darstellung aller bisherigen Begründungen die die teilnehmenden Expert_innen für Ihre numerischen Einschätzungen abgegeben haben

Revision des Urteils von Teilnehmenden

Keine weiteren Änderungen Änderungen nach nach Beendigung des Frage- Beendigung des Fragebogens möglich, bis die bogens möglich gesamte Erhebungsphase durch eine(n) Moderator(in) beendet wurde

4 Spezifische Herausforderungen von Real-Time Delphistudien Wie eingangs bereits beschrieben, ist ein wesentliches Merkmal von Real-Time Delphistudien, dass die aus klassischen Delphis bekannte Rundenlogik aufgelöst wird. Hieraus ergeben sich zwei wesentliche Fragen methodischer Art: Zunächst ist zu klären, wie mit der initialen Kondition (siehe Abschn. 4.1) umzugehen ist: Welche Informationen werden den ersten Teilnehmenden einer Studie preisgegeben? Darüber hinaus ist es von Relevanz, wie mit bestimmten Fehlerarten (siehe Abschn. 4.2) umgegangen werden kann.

114

L. Gerhold

4.1 Initiale Kondition Im Real-Time Delphi werden die Teilnehmenden mit den Durchschnittswerten und qualitativen Antworten bisheriger Befragungsteilnehmenden konfrontiert. Haben zum Beispiel vor der eigenen Teilnahme bereits 20 Expert_innen eine Frage beantwortet, so werden für jede Frage die Durchschnittswerte der Antworten von diesen 20 Personen zurückgemeldet. Da insbesondere das arithmetische Mittel anfällig gegenüber statistischen Extremwerten und Ausreißern ist, kann dies bei kleinen Fallzahlen problematisch sein, da ein verzerrtes Bild bezüglich der Gruppenmeinung an Ausfüllende des Fragebogens vermittelt wird. Je höher die Fallzahl (n) der Befragungsteilnehmenden, desto geringer wirkt sich dieses Problem aus4. Die mögliche Verzerrung durch die initiale Kondition zeigt sich dementsprechend vor allem zu Beginn von Real-Time Delphistudien, da es immer Expert_innen geben muss, die als erste den Fragebogen ausfüllen. Ihr Urteil könnte also besonderen Einfluss auf die Antworten nachfolgender Teilnehmenden haben. Dies ist sowohl auf die numerischen Werte als auch auf die qualitativen Angaben zu beziehen, da insbesondere aus letzteren ein Framing-Effekt (siehe Abschn. 4.2) für die weitere Befragung erwachsen könnte. Um der Herausforderung der initialen Kondition zu begegnen, sind mehrere Möglichkeiten denkbar: • Die Rückmeldefunktion von Gruppenantworten und qualitativen Angaben wird im Real-Time Delphi erst freigeschaltet, wenn eine kritische Masse an Angaben erzielt wurde. Gordon (2009, S. 8) schlägt mit Verweis auf finnische Studien 5 bis 10 „key experts“ vor, deren Urteil als Ausgangspunkt genommen werden sollte. Allerdings ist auch diese Zahl mehr oder weniger willkürlich angesetzt und sollte stattdessen in Abhängigkeit des Themenfeldes höher angesetzt werden. Gnatzy et al. (2011) haben anhand einer Beispielstudie im Themenfeld Energie untersucht, inwieweit diese Variante im Verhältnis zum klassischen Delphi zu einer signifikanten Änderung führen würde und konnten keine signifikanten Unterschiede feststellen. Allerdings ist auch hier eine deutliche Limitierung der Aussagekraft aufgrund des methodischen Ansatzes sowie der thematischen Ausrichtung zu bedenken.

4Es

sei jedoch darauf hingewiesen, dass eine große Fallzahl nicht unbedingt die Zielsetzung sein muss: „In a statistically based study, such as a public opinion poll, participants are assumed to be representative of a larger population; in Delphi, non-representative, knowledgeable persons are needed.“ (Gordon 2009, S. 5).

Real-Time Delphi

115

• Es werden bereits Durchschnittswerte in die Studie eingespielt, bevor diese für alle Expert_innen freigeschaltet wird. Hierbei kann auf Betatests oder andere möglichst plausible Datengrundlagen, z. B. Daten die in anderen wissenschaftlichen Studien zu einer vergleichbaren Fragestellung ermittelt wurden, zurückgegriffen werden (Gordon und Pease 2006, S. 326). Sinnvoll ist insbesondere bei sehr unsicheren und/oder komplexen Forschungsfragen die Durchführung einer „0-ten Runde“. Hierbei werden möglichst heterogen ausgewählte Expert_innen eingeladen, z. B. im Rahmen eines Workshops die Fragen bzw. Aussagen des Delphis zu bewerten und ggf. zu überarbeiten oder neue zu entwickeln. Darauf aufbauend können diese Expert_innen gemeinsam oder unabhängig voneinander Ausgangswerte verhandeln.

4.2 Biases in Delphistudien Während bislang kaum empirische Studien zur Wirkung der initialen Kondition vorliegen, weisen Winkler und Moser (2016) auf eine ganze Reihe methodischer Herausforderungen hin, die sich aus Framing-, Anker- und Mitläufereffekten ergeben. Diese Biases gelten grundsätzlich auch für Delphistudien, ihre Prüfung im Kontext von Real-Time Delphistudien steht jedoch bislang aus. Aus der Darstellung von Winkler und Moser sind u. a. der bereits benannte Framing‐Effekt sowie Anker- und Mitläufereffekt als prominente Biases für Real-Time Delphi relevant: • Framing Effekte treten insbesondere bei homogenen Gruppen sowie besonders extremen Formulierungen auf. Je nachdem, wie ein Sachverhalt im Szenario/ in der Fragestellung dargestellt wird, kann er die Bewertung (z. B. in Form von Wahrscheinlichkeit, Erwünschtheit) von Empfänger_innen beeinflussen. Im Real-Time Delphi ist dies nicht nur auf die Formulierung der Frage, sondern auch auf die qualitativen Begründungen der Teilnehmenden zu beziehen. Framing verhindert dabei u. U. rationale Bewertungen und damit die mögliche Variabilität von Antworten. • Ankereffekte beziehen sich auf die Abhängigkeit des eigenen Urteils bzw. der eigenen Schätzung von bereits vorliegenden Ankerwerten (z. B. Erfahrungswerte, Urteile anderer). Das Problem hierbei liegt in der möglichen Übergewichtung des Ankerwertes. Ist dieser extrem, weil beispielsweise das arithmetische Mittel bei geringer Fallzahl genutzt wird, verstärkt sich der Effekt. Ankereffekte sind in Real-Time Delphis dahin gehend relevant, als dass nicht wie im klassischen Delphi zunächst alle Fragen unabhängig von der Kenntnis der Durchschnittswerte der anderen Befragungsteilnehmenden

116

L. Gerhold

beantwortet werden, sondern in der Regel, die eigene Antwort umgehend in Relation zur Gruppenantwort dargestellt wird. • Da sich Delphis in der Regel mit Fragen befassen, die mit einem hohen Maß an Unsicherheit einhergehen, ist der Mitläufereffekt ebenso relevant. Hier wird das Antwortverhalten dem der Gruppe angepasst, weil Konformitätsdruck herrscht, eine kontroverse Diskussion vermieden oder schwache Argumente nicht infrage gestellt werden sollen. Die eigene Unsicherheit bei der Beantwortung der Frage wird zugunsten einer Gruppenantwort reduziert. Diese kann wiederum durch erste einsehbare extreme Argumente in den qualitativen Begründungen anderer Expert_innen beeinflusst werden. Im Umgang mit diesen Biases sind folgende grundlegende Regeln hinsichtlich der Erstellung des Fragebogens, der Auswahl der Expert_innen und zur Gestaltung der Rückmeldungen zu beachten (siehe hierzu Winkler und Moser 2016, eigene Ergänzungen des Autors): Erstellen des Fragebogens • Durchführung eines Pretests, um zu überprüfen, ob die Items bzw. Fragen für die Expert_innen verständlich formuliert sind. • Randomisierung der Fragen, um zu vermeiden, dass Antworten durch bestimmte vorhergehende Fragen beeinflusst werden (Reihenfolgeeffekte). Auswahl der Expert_innen • Vermeiden von Schneeballverfahren (z. B. Expert_innen empfehlen weitere Expert_innen), da dies die Heterogenität der Stichprobenzusammensetzung beeinträchtigen kann. • Teilnehmende sollten eine möglichst hohe Expertise aufweisen, um Ankereffekte möglichst gering zu halten. • Möglichst heterogene Gruppenzusammensetzung, da mehrere „konkurrierende“ Ankerwerte existieren können. Gestaltung der Rückmeldungen • Qualitativ hochwertige, argumentative Rückmeldungen statt nur statistischer Durchschnittswerte. So kann die Breite der Perspektiven auf ein Item/ein Szenario dargelegt werden.

Real-Time Delphi

117

• Moderation der Feedbacks, z. B. durch Löschen doppelter oder besonders extremer Argumente. • Unterschiedliche Argumente, insbesondere Gegenargumente sollten in der Darstellung der Zwischenergebnisse oben stehen, um auch diejenigen Teilnehmenden herauszufordern, die in die Begründungen anderer nur „reinlesen“.

5 Technische Innovationen und Real-Time Delphi Tools Der Markt im Bereich Real-Time Delphi wächst stetig, mit qualitativ sehr unterschiedlichem Erfolg und Ausmaß. Einige Produzierende betten die Real-Time Software in eine Methoden- oder Zukunftsforschungsplattform ein, um ein breiteres Methodenportfolio anbieten zu können (Global Futures Intelligence System GFIS, Foresight Cockpit, RAHS bzw. FACT). Andere konzentrieren sich ausschließlich oder zumindest vorrangig darauf, eine explizite Real-Time Delphi Software anzubieten (z. B. eDelphi, Surveylet). Im Hinblick auf die in der Einleitung umrissene Entstehung der Methode entwickelten Gordon und Pease die ersten technischen Gehversuche eines RealTime Delphis unter dem Codenamen „Delphi Blue“. Dieser Code wurde von Gordon adaptiert und unter dem Namen Real-Time Delphi im gemeinsam mit Glenn geführten Millenium Project genutzt. Mittlerweile wurde im Rahmen des Millenium Project eine neue Software entwickelt, welche im bis heute verfügbaren Global Futures Intelligence System (GFIS, www.themp.org) mündete. Das im Rahmen des GFIS verfügbare Real-Time Delphi Tool ist für alle, je nach zugehöriger Organisation zu unterschiedlichen Konditionen (von individuellen Jahreslizenzen für 99 US$ bis hin zu Firmenjahreslizenzen für 2100 US$), buchbar. Diese Lizenzen umfassen nicht nur die Nutzung des Real-Time Delphi-Tools, sondern erlauben auch Zugriff auf zahlreiche Methodenbeschreibungen (z. B. Cross-Impact Analyse, Text Mining, Environmental Scanning) und zudem verschiedene Reports und Informationen zu zukünftigen globalen Herausforderungen. Das derzeit (Stand März 2018) in der Beschaffung befindliche System „Future Analysis Cooperation Tool“ (FACT) der Bundeswehr basiert auf dem aktuell noch genutzten und etablierten Prototypen Risk Assessment and Horizon Scanning (RAHS). RAHS ist eine internetgestützte Plattform für Methoden und Inhalte der sicherheitspolitischen Zukunftsanalyse. Mithilfe von 43 Methoden können Analyst_innen Forschungsprojekte unter Einbeziehung von Expert_innen kollaborativ und computerunterstützt durchführen. Dabei gehört die Real-Time

118

L. Gerhold

Delphi Befragung zu den am meist genutzten Methoden. Die Nutzung ist für Personen außerhalb der Bundeswehr nur auf Anfrage möglich. Zu den etablierten reinen Real-Time Delphi Tools gehören eDelphi und Surveylet. Das finnische eDelphi (ehemals eDelfoi) bietet eine kostenlose Grundversion an, in welcher allerdings keine Daten exportiert werden können. Zusätzlich können verschiedene Services und Optionen bis 1100 € gebucht werden. Das Tool umfasst dabei alle gängigen und hier beschriebenen Fragetypen sowie einen umfassenden Managementbereich zur Organisation der Erhebung und des Panels. Surveylet ist eine ebenso professionell entwickelte Software, die verschiedene Varianten von Delphis (neben Real-Time auch klassisches Delphi sowie „RTD-2“, was die mehrfache Wiederholung von Real-Time Delphis umfasst) anbietet. Die Kosten richten sich hier im Wesentlichen nach der Nutzungsintensität, d. h. je mehr Antworten generiert werden, desto höher sind die Kosten für die Nutzung der Software. Neben diesen bereits in mehreren wissenschaftlichen Studien genutzten Softwarelösungen wurden und werden aktuell weitere Angebote entwickelt. Expertsight adressiert den Unternehmenskontext und muss direkt kontaktiert werden, um eine Studie zu entwickeln. Real Delphi ist ein Start-up Unternehmen, welches ein neues RTD Tool entwickelt und bereits erste Studien durchführt. Das Unternehmen 4strat hat eine Toolbox („Foresight Cockpit“) entwickelt, zu welcher auch eine Real-Time Delphi Softwarelösung gehört, die sich derzeit (Stand März 2018) in der Finalisierung befindet. Die hier dargestellten Softwarelösungen unterliegen in der Regel einem wirtschaftlichem und nur bedingt einem akademischen Interesse. Damit gehen verschiedene Fragen und Herausforderungen einher, die vor der Nutzung eines Tools reflektiert werden sollten. Eine systematische Betrachtung verschiedener Tools liegt bislang nur für die ersten vier in Tab. 2 genannten Anbietende vor. Aengenheyster et al. (2017) haben diese Tools anhand von 20 Kategorien hinsichtlich ihrer Features (z. B. Layout des Erhebungsinstrumentes, Fragetypen, Pretestfunktionen etc.), Datenoutput (z. B. welche Art von Daten werden generiert, wie kompatibel sind diese zu anderen Programmen, welchen visuellen Output gibt es und welche Optionen zur qualitativen Analyse bestehen?), Benutzer_innenfreundlichkeit (z. B. Wie gut ist die Software handhabbar, welche Hilfefunktionen gibt es, wie stabil läuft die Software) und Administration (Wie gut ist das Teilnehmendenmanagement, wie intuitiv lässt sich eine Software nutzen) analysiert. Die Autor_innen kommen zu dem Schluss, dass alle untersuchten Tools vergleichbar in ihrer grundsätzlichen Ausrichtung auf die Real-Time Delphi Methode sind, jeweils unterschiedliche Vorzüge und Nachteile haben und allesamt Raum für Weiterentwicklungen bieten. Zudem weisen die Autor_innen

Real-Time Delphi

119

Tab. 2   Delphitools und Anbietende in der Übersicht (eigene Darstellung). In einigen Fällen wird die Software als Bestandteil größerer Methodenplattformen angeboten, was entsprechend gekennzeichnet ist. (Die Schreibweisen von „Real-Time Delphi“ wurden jeweils der Schreibweise der Anbietenden übernommen.) Plattform/Software

Anbieter/Website

Global Futures Intelligence System (GFIS) (Plattform); Realtime Delphi (Software)

www.themp.org

eDelphi (Software)

www.edelphi.org

Risk Assessment and Horizon Scanning (RAHS)/Future Analysis Cooperation Tool (FACT) (Plattform), Real-Time Delphi (Software)

www.rahs-bundeswehr.de

Surveylet (Software)

www.calibrum.com

Expertsight (Unternehmen/Software)

www.expertsight.com

Real Delphi (Unternehmen/Software)

www.realdelphi.com

Foresight Cockpit (Plattform/Software)

www.foresight-cockpit.de

auf ein grundlegenderes Problem hin, welches im Rahmen von durchzuführenden Real-Time Delphistudien unbedingt Beachtung finden sollte: In den bislang dokumentierten Real-Time Delphistudien findet kaum eine substanzielle Reflexion der genutzten Umfragetools statt, obwohl mit jedem Tool automatisch Limitierungen einhergehen. So bieten die Tools ggf. nicht jede im ursprünglichen Forschungsdesign vorgesehene Frageoption oder Antwortskalierung als Option an. Ggf. ist die Moderation der offenen Antworten nicht in dem Maße möglich, wie es im Hinblick auf zu erwartende Biases notwendig wäre. Die Zielsetzung der Tools ist es, Nutzenden eine möglichst einfache Durchführung von Real-Time Delphis zu bieten. Dies wird besonders an den angebotenen automatisierten Ergebnisdarstellungen deutlich. Hierbei können Nutzende in der Regel einen automatischen Ergebnisreport abrufen, welcher in anschaulichem Layout die Ergebnisse darstellt. Dabei werden jedoch bisweilen Grundregeln der empirischen Arbeit missachtet, etwa, wenn bei sehr kleiner Fallzahl (n) arithmetische Mittelwerte dargestellt werden oder Gruppenunterschiede anhand von Mittelwerten abgebildet werden, ohne auf die Limitierungen bei der Interpretation einzugehen. Zudem erfolgt vor der automatisierten Auswertung keine Datenbereinigung, welche jedoch in jedem Datensatz unerlässlich ist. Es ist daher anzuraten, die erhobenen Daten zu exportieren, die Datensätze zu bereinigen und dann einer Weiterverarbeitung mit entsprechenden Tools wie SPSS, R oder Stata bzw. für die qualitative Analyse MAXQDA, Atlas.ti oder anderen zuzuführen. Entscheidend für die Durchführung einer Real-Time Delphistudie ist dabei nicht, dass alle Tools mit

120

L. Gerhold

Limitierungen einhergehen, sondern vielmehr, dass diese im Forschungsprozess offengelegt und durch die Forschenden im Hinblick auf die daraus resultierenden Folgen reflektiert werden, um keinem systemimmanenten Fehler zu unterliegen.

6 Diskussion & Ausblick Die bisherigen Ausführungen haben das Potenzial der Real-Time Delphi Methode offengelegt und zugleich Grenzen und Herausforderungen in der Anwendung beschrieben. „The greatest weakness of RT Delphi is that only a proof of concept prototype exists. More development is required to place into full scale operation, particularly the asynchronous application“ (Gordon und Pease 2006, S. 332). Diese Einschätzung ist heutzutage sicher in dieser Form nicht mehr zutreffend, denn Weiterentwicklungen des Real-Time Delphi existieren wie beschrieben in vielfacher Form. Hierbei drehen sich Innovationen insbesondere um die einzelnen technischen Komponenten wie Frageformate, Darstellung von Ergebnissen, Panelmanagement, Layout und Anpassung an neue technische Standards z. B. die Optimierung der Anzeige für mobile Endgeräte wie Smartphones oder Tablets (responsives design). Auch der Real-Time Gedanke selbst wird weitergedacht, in dem er z. B. mit der Erfassung von Raum kombiniert wird: Di Zio et al. (2017) haben als neue Methode das Real-Time Spatial Delphi entworfen, in welchem unter Hinzunahme von Geoinformationssystemen raumbasierte Entscheidungen in Expert_innengruppen getroffen werden können. Ein weiterer konzeptioneller Vorschlag besteht in der Weiterentwicklung des Real-Time Delphi Ansatzes zu einem „social Real-Time Delphi (sRTD)“ (Kloker et al. 2018). Die Autor_innen zielen dabei auf eine Verbesserung der Gruppeninteraktion innerhalb der qualitativen Angaben ab. Durch die Vergabe von zufälligen und anonymen Usernamen soll die Diskussion zu je einer einzelnen Frage/einem einzelnen Item ertragreicher werden, da sich die Diskutierenden nun konkret aufeinander beziehen können. Darüber hinaus schlagen sie vor, qualitative Aussagen mit Tags wie „hilfreich“ oder „gefällt mir“ versehen (und damit bewerten) zu können. Zweifelsohne stellt das Real-Time Delphi heute eine ausgesprochen zeiteffiziente Lösung im Umgang mit zukunftsbezogenen Fragestellungen dar. Die verfügbaren Tools sind einfach zugänglich und in der Regel intuitiv nutzbar. Gleichwohl muss konstatiert werden, dass die technischen Möglichkeiten von Real-Time Delphi Tools im Vergleich zu Anbietenden klassischer, nicht auf Wiederholungen angelegter Befragungen wie beispielsweise unipark, Surveymonkey, Limesurvey etc. noch nicht denselben Standard haben. Dies gilt z. B. hinsichtlich der Möglichkeiten der Nutzenden, das Fragenbogenlayout anzupassen

Real-Time Delphi

121

oder die Variabilität im Umgang mit den erhobenen Daten, etwa die Möglichkeiten automatisiert Codebücher zu erstellen und Datensätze in verschiedenen Formaten zu exportieren. Dass diese Möglichkeiten in Real-Time Delphis noch begrenzter sind, ist u. a. auf den eingeschränkten Nutzendenkreis und damit ein deutlich kleineres Marktsegment von Delphisoftware zurückzuführen. Gleichwohl ist auch hierin nicht die eigentliche Herausforderung in der Durchführung von Real-Time Delphistudien zu sehen. Diese liegt vielmehr in der kritischen methodischen Reflexion der Durchführung. Die insgesamt eher überschaubare Literatur, die sich mit methodischen Fragstellungen der Durchführung von Delphistudien beschäftigt, drückt sich auch in den heute verfügbare RealTime Delphistudien, wie sie auch in diesem Beitrag benannt worden, aus. Oftmals wird auf eine umfassende Darstellung des methodischen Vorgehens und der Methodenzielsetzung verzichtet. Diese sollte jedoch mindestens umfassen: • Typisierung der Real-Time Delphistudie anhand der Klassifikation von Häder (2009, S. 36) • Darlegung der Item- und Skalenentwicklung (theoretische Grundlage, Vorgehen, Pretest) • Technische Limitierungen bei der Programmierung des Erhebungsinstrumentes sowie Probleme in der Erhebungsphase • Expert_innenverständnis und Auswahlbegründung der Expert_innen • Darlegung des Prozesses der Datenbereinigung und -aufbereitung (qualitativer wie quantitativer Daten) • Einhaltung der Standards zur Ergebnispräsentation (Skalierungen, Prozentdarstellungen etc., vgl. Döring und Bortz 2016)5

Literatur Aengenheyster, S., Cuhls, K., Gerhold, L., & Muszynska, M. (2017). Real-time Delphi in practice – A comparative analysis of excisting software-based tools. Technological Forecasting and Social Change, 118, 15–27. https://doi.org/10.1016/j. techfore.2017.01.023. Aguirre-Bastos, C., Giesecke, S., Wasserbacher, D., & Weber, M. (2009). FORESEC Deliverable D 4.3 1st Delphi Report 30 April 2009. Nicht mehr online verfügbar.

5Eine

Orientierung zu den Anforderungen guter Zukunftsforschung gibt das Handbuch zu Standards und Gütekriterien der Zukunftsforschung (Gerhold et al. 2015).

122

L. Gerhold

Cuhls, K. (2009). Delphi-Befragungen in der Zukunftsforschung. In R. Popp & E. Schüll (Hrsg.), Zukunftsforschung und Zukunftsgestaltung: Beiträge aus Wissenschaft und Praxis (S. 207–221). Berlin: Springer. Cuhls, K. (2012). Zu den Unterschieden zwischen Delphi-Befragungen und „einfachen“ Zukunftsbefragungen. In R. Popp & E. Schüll. (Hrsg.), Zukunft und Wissenschaft. Wege und Irrwege der Zukunftsforschung. S. 139–158. Berlin, Heidelberg: Springer (Zukunft und Forschung, 2). Di Zio, S., Rosas, J. D. C., & Lamelza, L. (2017). Real time spatial Delphi: Fast convergence of experts’ opinions on the territory. Technological Forecasting and Social Change, 115, 143–154. Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissenschaften. Berlin: Springer. Geist, M. (2010). Using the Delphi method to engage stakeholders: A comparison of two studies. Evaluation and Program Planning, 33(2), 147–154. https://doi.org/10.1016/j. evalprogplan.2009.06.006. Gerhold, L. (2012). Methodenkombination in der sozialwissenschaftlichen Zukunftsforschung. In R. Popp (Hrsg.), Zukunft und Wissenschaft (S. 159–183). Berlin: Springer VS. https://doi.org/10.1007/978-3-642-28954-5_8. Gerhold, L., Holtmannspötter, D., Neumann, C., Schüll, E., Schulz-Montag, B., Steinmüller, K., & Zweck, A. (2015). Standards und Gütekriterien der Zukunftsforschung. Ein Handbuch für Wissenschaft und Praxis. Wiesbaden: Springer. Glenn, J. C., & Gordon, T. J. (2009). Integration, comparisons, and frontiers of futures research methods. In J. C. Glenn & T. J. Gordon (Hrsg.), Futures research methodology Version 3.0, the millennium project (S. 1–34). Washington DC: American Council for the United Nations University. Glenn, J. C., & Florescu, E. (2015). State of the Future. The Millennium Project. Verfügbar unter http://www.millennium-project.org/publications-2-3/#sof2015-16. Gnatzy, T., Warth, J., von der Gracht, H., & Darkow, I.-L. (2011). Validating an innovative real-time Delphi approach – A methodological comparison between real-time and conventional Delphi studies. Technological Forecasting and Social Change, 78(9), 1681– 1694. https://doi.org/10.1016/j.techfore.2011.04.006. Gordon, T., & Pease, A. (2006). RT Delphi: An efficient, „round-less“ almost real time Delphi method. Technological Forecasting and Social Change, 73(4), 321–333. https://doi. org/10.1016/j.techfore.2005.09.005. Gordon, T. J. (2007). Energy forecasts using a “Roundless” approach to running a Delphi study. Foresight 9(2), 27–35. https://doi.org/10.1108/14636680710737731. Gordon, T. J. (2009). The Real-Time Delphi Method. In J. C. Glenn & T. J. Gordon (Hrsg.), Futures research methodology version 3.0, the millennium project. Washington DC: American Council for the United Nations University. Häder, M. (2009). Delphi Befragungen. Ein Arbeitsbuch (2. Aufl.). Wiesbaden: Springer VS. https://doi.org/10.1007/978-3-658-01928-0. Häder, M., & Häder, S. (Hrsg.). (2000). Die Delphi-Technik in den Sozialwissenschaften. Methodische Forschungen und innovative Anwendungen. Wiesbaden: Springer VS. Kloker, S., Straub, T., Morana, S. & Weinhardt, C. (2018). The Effect of Social Reputation on Retention: Designing a Social Real-Time Delphi Platform. Research Papers. 46. https://aisel.aisnet.org/ecis2018_rp/46.

Real-Time Delphi

123

Linstone, H. A., & Turoff, M. (1975). Introdcution. In H. A. Linestone & M. Turoff. (Hrsg.), The Delphi Method. Techniques and Applications. Reading: Addison-Wesley Educational Publishers Inc. Linstone, H. A., & Turoff, M. (2002). Introdcution. In H. A. Linestone & M. Turoff. (Hrsg.), The Delphi Method. Techniques and Applications. Digitale Version. Verfügbar unter https://web.njit.edu/~turoff/pubs/delphibook/index.html. Linstone, H. A., & Turoff, M. (2011). Delphi: A brief look backward and forward. Technological Forecasting and Social Change on ScienceDirect Technological Forecasting and Social Change, 78(9), 1712–1719. https://www.sciencedirect.com/science/journal/00401625. https://www.sciencedirect.com/science/journal/00401625/78/9. Neuhaus, C., & Steinmüller, K. (2015). Grundlagen der Standards Gruppe 1. In L. Gerhold, D. Holtmannspötter, C. Neuhaus, E. Schüll, B. Schulz-Montag, K. Steinmüller, & A. Zweck (Hrsg.), Standards und Gütekriterien der Zukunftsforschung (S. 17–20). Wiesbaden: Springer VS. https://doi.org/10.1007/978-3-658-07363-3_2. Popper, R. (2009). Mapping Foresight. Revealing how Europe and other world regions navigate into the future. Luxemburg: European Foresight Monitoring Network. https:// doi.org/10.2777/47203. Rowe, G., & Wright, G. (1999). The Delphi technique as a forecasting tool: Issues and analysis. International Journal of Forecasting, 15, 353–375. Schüll, E. (2009). Zur Forschungslogik explorativer und normativer Zukunftsforschung. In R. Popp & E. Schüll (Hrsg.), Zukunftsforschung und Zukunftsgestaltung. Beiträge aus Wissenschaft und Praxis (S. 223–234). Berlin: Springer VS. https://doi. org/10.1007/978-3-540-78564-4. Sonk, M. (nicht veröffentlicht). Neue Formen der Arbeit als Transformationsfaktor. Studentenprojekt der FU Berlin. Steinmüller, K. (1997). Grundlagen und Methoden der Zukunftsforschung. Szenarien. ­Delphi. Technikvorausschau. Werkstattbericht 21. Gelsenkirchen. Wagner, S., Vogt, S., & Kabst, R. (2016). How IT and social change facilitates public participation: A stakeholder-oriented approach. Government Information Quarterly, 33, 435–443. Winkler, J., & Moser, R. (2016). Biases in future-oriented Delphi studies: A cognitive perspective. Technological Forecasting and Social Change, 105(2016), 63–76. https://doi. org/10.1016/j.techfore.2016.01.021.

Delphi-Märkte Simon Kloker, Tim Straub, Tobias T. Kranz und Christof ­Weinhardt

Zusammenfassung

Delphi-Märkte bezeichnen Ansätze und Implementierungen der Integration von Prognosemärkten und Delphi-Studien (Real-Time Delphi). Durch die Kombination der zwei Methoden zur Erstellung von Prognosen können potenziell gegenseitige Schwächen ausgeglichen werden. So können Prognosemärkte zum Beispiel für die Auswahl von Teilnehmenden mit Expertise herangezogen werden und motivieren durch ihren spielerischen Ansatz und Anreizmechanismen auch zur langfristigen Teilnahme. In diesem Beitrag werden zwei Potenziale für Prognosemärkte und vier Potenziale für Delphi-­Studien, welche sich durch die Integration ermöglichen, theoretisch hergeleitet. Anschließend werden drei verschiedene Integrationsansätze vorgestellt, anhand derer die Integration auf User-, Markt- und Delphi-Fragen Ebene exemplarisch verdeutlicht wird und wobei gezeigt wird, dass je nach

S. Kloker (*) · T. T. Kranz · C. Weinhardt  Institut für Informationswirtschaft und Marketing, Karlsruher Institut für Technologie, Karlsruhe, Deutschland E-Mail: [email protected] T. T. Kranz E-Mail: [email protected] C. Weinhardt E-Mail: [email protected] T. Straub  FZI Forschungszentrum Informatik, Karlsruhe, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_6

125

126

S. Kloker et al.

Ansatz nicht alle Potenziale erreicht werden können. Am Ende werden Empfehlungen für den Einsatz von Delphi-Märkten abgeleitet, bestehende Limitationen für Delphi-Märkte sowie zukünftige Entwicklungen aufgezeigt. Schlüsselwörter

Prognosemärkte · Identifikation von Teilnehmenden mit Expertise ·  Langfristige Motivation · Anreize · Real-Time Delphi · Methodenintegration

1 Prognosen mittels Märkten In these democratic days, any investigation into the trustworthiness and peculiarities of popular judgments is of interest. The material about to be discussed refers to a small matter, but is much to the point1 (Galton 1907).

Lange bevor Surowiecki mit seinem bekannten Buch „The wisdom of crowds“ (Die Weisheit der Massen) im Jahr 2005 ein ganzes Forschungsgebiet über die Aggregation und Nutzung von verteilten Informationen und Kompetenzen offiziell einläutete, war bereits die Relevanz der Frage nach der Verlässlichkeit von Entscheidungen durch eine große Anzahl an Menschen unbestritten aktuell. Galton (1907) beschäftigte sich mit dieser Frage und führte eine der heute berühmtesten Parabeln für die Weisheit der Massen ins Rennen. Bei einer Ausstellung für Mastvieh und Geflügel 1906 in Plymouth, England, wurde ein Wettbewerb um einen Ochsen ausgerufen. Für einen vernachlässigbaren Betrag konnten Lose erworben, welche dazu berechtigten eine Einschätzung über das Gewicht des Ochsen abzugeben. Der Gewinn für die beste Schätzung sollte der Ochsen selbst sein. Während viele einzelne Schätzungen das Ziel mehr oder weniger weit verfehlten, war Galton insbesondere durch das Ergebnis des Mittelwerts verblüfft: Ein Fehler von nur 0,08 % (Shrier et al. 2016). Galton schien der Vergleich passend, dass die durchschnittlichen Teilnehmenden an seinem Wettbewerb in etwa ähnlich wenig über Ochsen wussten, wie durchschnittliche Wahlberechtigte über Politik. Die Parabel ist nur eine von seither vielen Beweisen, dass Prognosen durch eine Gruppe oder Menge an Schätzern häufig sogar bes-

1Deutsch:

„In diesen demokratischen Tagen ist jede Untersuchung der Vertrauenswürdigkeit und der Besonderheiten von Volksurteilen von Interesse. Das Material, über das diskutiert werden soll, bezieht sich auf eine kleine Sache, ist aber sehr treffend.“

Delphi-Märkte

127

ser sind als die Meinung einzelner Fachkundigen (Shrier et al. 2016; Green et al. 2007). In den 1950ern wurde die Delphi-Methode als anonymes, rundenbasiertes Feedbackverfahren von der militärisch finanzierten RAND Corporation eingeführt, um insbesondere Expertise unabhängig von Hierarchie, Status oder Reputation zu aggregieren (Linstone und Turoff 2002). Dieses wurde kontinuierlich weiterentwickelt in vielen Anwendungskontexten erfolgreich eingesetzt (Linstone und Turoff 2002). Aber auch andere Ideen zur Aggregation von vielen Einzelmeinungen machten davor und seither Schule. Bereits seit Mitte des 19. Jahrhunderts wurden Prognosemärkte zur Vorhersage von politischen Ereignissen verwendet (Rhode und Strumpf 2004). Die theoretische Grundlage wurde 1945 von Hayek mit seiner Betrachtung des Marktpreises als (gewichteter) Informationsträger aller öffentlichen, als auch privaten Informationen, und später durch Fama (1970) nachgeliefert: die Informationseffizienz von Märkten.

1.1 Informationseffizienz 1984 untersuchten Ökonomen den Zusammenhang zwischen Futures auf den Orangenpreis (Wetten auf den Orangenpreis) in den USA und den Fehlern der Wettervorhersage in den entsprechenden Anbaugebieten (Shrier et al. 2016). Dabei fanden sie heraus, dass der Tagesschlusspreis der Futures (gegen 14:45 Uhr) den Fehler bezüglich der Minimaltemperatur des Wetterberichts am selben Abend vorhersagen konnte. Die Ökonomen erklärten sich dies dadurch, dass der Marktpreis alle öffentlich verfügbaren Informationen (bspw. Wetterbericht), aber zusätzlich auch noch alle privaten Informationen, widerspiegelt. Das sind all diese, die nur Marktteilnehmende vor Ort haben, die die Gegend kennen, den Himmel beobachten können und wissen, dass die frischen Orangen bei geringen Temperaturen nicht überleben. Sehen die lokalen Marktteilnehmenden also eine aufkommende Kaltwetterfront werden diese den Marktpreis durch Käufe nach oben korrigieren, da sie von einem sinkenden Angebot und steigenden Preisen ausgehen und damit voraussichtlich Gewinn realisieren. Die Tatsache, dass durch die Bildung des Marktpreises über diesen Mechanismus alle verfügbaren Informationen eingepreist sind, wird als „Markteffizienzhypothese“ bezeichnet (Fama 1970)2. Auch unsere heutigen Aktienbörsen basieren

2Die Markteffizienzhypothese wird anhand Annahmen über die im Preis enthaltenen Informationen nochmals in „starke“, „mittel-starke“ und „schwache“ Markteffizienz unterschieden.

128

S. Kloker et al.

auf diesem Prinzip. Daher werden auch Aktienkurse oder Aktienindizes wie der DAX-30 als Indikatoren des Wirtschafts- oder Unternehmenswachstum, also als Projektion der Zukunft, interpretiert. Auch die Prognosemärkte basieren auf dem Prinzip der Markteffizienz. Voraussetzung dafür ist allerdings, dass sich das Handeln für die einzelnen Teilnehmenden lohnt, wie das zum Beispiel auf einer Aktienbörse, bzw. Aktienmärkten gegeben ist.

1.2 Prognosemärkte Man kann sich Prognosemärkte als eine Art Spiel-Aktienmärkte vorstellen. Auf so einem Markt kann man Kontrakte (Aktien) definieren, die abhängig von der Realisierung eines definierten Ereignisses ausgezahlt werden. Prognosemärkte sind also Märkte, auf denen Kontrakte gehandelt werden, die auf Basis zukünftiger Ereignisse ausgezahlt werden (Graefe et al. 2010). Die Preise auf solchen Märkten können sowohl als aktuell wahrscheinlichster Wert oder direkt als Wahrscheinlichkeit für den Eintritt des zukünftigen Ereignisses interpretiert werden (Wolfers und Zitzewitz 2006). Ein einfaches Beispiel: Wir nehmen eine Aktie an, die wie folgt definiert ist: „Wenn A die nächste Bürgermeisterwahl gewinnt, zahlt jeder Anteil dieser Aktie 100 Geldeinheiten (GE) aus, sonst 0 GE.“ Hat nun eine Person zum aktuellen Zeitpunkt die Einschätzung, dass A eine 20 prozentige Gewinn-Wahrscheinlichkeit hat, so ist jeder Anteil dieser Aktie für ihn 20 GE wert, da er mit 20 % 100 GE auszahlt und mit 80 % 0 GE (0,2 × 100 GE + 0,8 × 0 GE = 20 GE). Liegt der aktuelle Marktpreis bei 10 GE, lohnt es sich für diese Person Aktien zu kaufen, da einen Gewinn von 10 GE für jeden erworbenen Anteil erwartet werden kann (sie bezahlt 10 GE für einen Anteil, der für sie 20 GE wert ist). Die Einschätzung dieser Person kann sich allerdings durch den Erhalt neuer Information jederzeit ändern. Erhält diese Person beispielsweise die Information, dass noch vor der Wahl die Verwicklung von A in einen Korruptionsskandal ans Licht kommen wird, kann dies ihre Einschätzung sofort auf eine 0 prozentige Gewinnwahrscheinlichkeit ändern. Die Person ist nun der Meinung, dass diese Nachricht die Chancen von Politiker A auf einen Wahlsieg zunichtemachen. Entsprechend dieser neuen Einschätzung lohnt es sich also für die Person alle ihre Anteile dieser Aktie zu jedem angebotenen Marktpreis zu verkaufen, um dann am Ende nicht leer auszugehen, wenn ihrer Annahme gemäß diese zu 0 GE ausgezahlt wird. Gehen alle Teilnehmenden nach diesem Prinzip vor, auf Basis ihrer Erwartungen und Informationen ihren erwarteten Gewinn zu maximieren, pendelt sich ein Marktpreis ein, der eben alle diese Erwartungen und Informationen

Delphi-Märkte

129

widerspiegelt – und somit jedem auch zurück spiegelt, was die Anderen denken. In der Theorie kann eine Kennzahl (der Marktpreis), die alle verfügbaren Informationen und Erwartungen zu einem Zeitpunkt widerspiegelt (Fama 1970), als die zu diesem Zeitpunkt beste Prognose auf das Ereignis interpretiert werden (Marktvorhersage). Prognosemärkte werden in den verschiedensten Bereichen eingesetzt, wie beispielsweise in Politik, Sport, Entertainment, wirtschaftliche Entwicklung (inkl. Konjunktur), Projektmanagement, Ideenmanagement und Risikoabschätzung (Luckner et al. 2005; Graefe 2017; Teschner et al. 2011; Bothos et al. 2009; Cowgill et al. 2009; Prokesch et al. 2015; Cipriano und Gruca 2014). Dem liegen auch die vielen Vorteile von Prognosemärkten zugrunde, wie eine schnelle Reaktionszeit auf neue Informationen (Graefe et al. 2010), eine kontinuierliche Prognose (Graefe et al. 2010), eine einfache Schaffung von Anreizen und gute Umsetzbarkeit von Anreizkompatibilität3 (Luckner und Weinhardt 2007), Motivation durch Gamification (Buckley und Doyle 2017), eine implizite langfristige Gewichtung von guten und schlechten Vorhersagern (Arrow et al. 2008) und die (zumindest theoretische) Robustheit gegen nicht ausgeglichene Stichproben (Kranz et al. 2014a). Diverse Nachteile von Prognosemärkten, sind, wie auch die Vorteile, nochmals in Tab. 1 genannt und werden direkt im Anschluss im Abschn. 2.1 genauer erläutert. Die Gestaltung eines Prognosemarktes ist dabei relativ offen. Der Marktmechanismus kann von einer kontinuierlichen Doppelauktion (ähnlich echter Börsen) bis hin zu Hidden Markets (Teschner und Weinhardt 2012) variieren, denen eine Market Scoring Rule4 zugrunde liegen kann und die praktisch nicht mehr von einfachen Umfragen zu unterscheiden sind (Laskey et al. 2015). Zumindest im Hintergrund wird dabei aber immer die Aggregation der einzelnen Einschätzungen über einen Markt, also Kontrakte, Geldbestände und Depots, aggregiert.

3Anreizkompatibilität

ist gegeben, wenn jeder einzelne Teilnehmende den für sich erwarteten Nutzen genau dann maximiert, wenn er seiner wahren Einschätzung oder Einstellung gemäß agiert, also gemäß seiner wahren Erwartung handelt oder diese angibt. 4Eine (Market) Scoring Rule definiert ein Regelwerk, in dem alle abgegebenen Einschätzungen abhängig von der Realisierung des zugrunde liegenden Ereignisses einem Nutzen zugeordnet werden, sodass man sich gemäß seiner/ihrer Einschätzung einen erwarteten Nutzen berechnen kann/könnte. Eine „ordnungsgemäße Scoring Rule“ erfüllt verschiedene Kriterien, unter anderem Anreizkompatibilität.

130

S. Kloker et al.

2 Gemeinsamkeiten und Potenziale für eine Integration Sowohl Delphi-Studien5 als auch Prognosemärkte verfolgen in mancherlei Hinsicht ähnliche Ziele. Beide Verfahren aggregieren viele Einzelmeinungen (Green et al. 2007) und lassen sich als Feedbackverfahren bezeichnen (Sprenger et al. 2007). Dies bedeutet, dass beide Verfahren die (aggregierte) Meinung der Gruppe an alle Teilnehmende zurück spiegeln, um diesen die Möglichkeit zur Korrektur der eigenen Einschätzung zu geben. Zudem arbeiten beide Verfahren anonym (oder quasi-anonym, Kochtanek und Hein 1999), sodass eine Identifizierung der anderen Teilnehmenden nicht oder nur erschwert möglich ist. Prognosemärkte sind in der Regel als Online-Plattformen konzipiert, was die Integration mit dem Real-Time Delphi-Verfahren als Adaption der Delphi Methode besonders interessant macht. Das Real-Time Delphi Konzept6, initial vorgestellt von Gordon und Pease im Jahr 2006, ist eine Online-Adaption der klassischen Delphi-Methode, um die Dauer von Umfragen zu verringern. Sie zeichnet sich insbesondere durch einen asynchronen Feedback-Zyklus aus (Kloker et al. 2016). Das Konzept von Real-Time Delphi, dass den starren Runden-basierten Charakter der Delphi-Methode hin zu einem asynchronen individualisierten Prozess adaptiert, lässt sich gut mit der Teilhabe an Märkten vergleichen und verbinden. Ein Vergleich „über Kreuz“ der Felder in Tab. 1 zeigt schnell und deutlich auf, dass sich die beiden Verfahren in vielerlei Hinsicht potenziell ergänzen könnten und sich einige Vorteile, bzw. der Ausgleich von diversen Schwächen herleiten ließen.

2.1 Potenziale für Prognosemärkte In Prognosemärkten werden alle Informationen über Preis-/Mengen-Bündel ausgetauscht. Daher lassen Prognosemärkte keine qualitativ differenzierten Aussagen einzelner Meinungen zu, z. B. auf Basis welcher Information und vor welchen Hintergründen die Teilnehmenden am Markt handeln und die Marktvorhersage verändern.

5Wenn

im Folgenden von Delphi-Studien bzw. -Umfragen gesprochen wird, ist implizit immer die Umsetzung als Real-Time Delphi gemeint. In allen anderen Fällen wird explizit darauf hingewiesen. 6Für detaillierte Informationen, wird auf ein anderes Kapitel in diesem Sammelband verwiesen, das sich explizit mit der Real-Time Delphi-Methode beschäftigt.

Delphi-Märkte

131

Tab. 1   Ausgewählte Stärken und Schwächen von Prognosemärkten und Delphi-Studien gegenüber gestellt. (Eigene Darstellung) Stärken

Prognosemärkte

Delphi-Studien/Real-Time Delphi

• Spielerischer Charakter (Buckley und Doyle 2017) • Implizite langfristige Gewichtung der einzelnen Teilnehmer und ­Teilnehmerinnen (Arrow et al. 2008) • Schnelle Reaktionszeit auf neue Informationen (Graefe et al. 2010) • Tendenz aktuelle Prognose immer neu anzufechten (Green et al. 2007) • Sehr hohe Teilnehmerzahl möglich (Green et al. 2007) • Kontinuierliche Vorhersage (Graefe et al. 2010) • Direktes Feedback auf eigene ­Einschätzung (Kranz et al. 2014b) • Robustheit gegen nicht ausgeglichene Stichproben (Kranz et al. 2014a)

• Erfassung quantitativer ­Informationen, Hintergründe und Zusammenhänge • Hypothetische Fragen und Fragen mit langem Zeithorizont möglich (Linstone und Turoff 2002) • Es kann mehr als eine Frage gestellt werden • Die Fragen können neuen ­Erkenntnissen angepasst werden

Schwächen • Keine qualitativen Informationen • Keine Hintergrundinformationen (Zusammenhänge) • Nicht jede Frage/jeder ­Sachverhalt lässt sich als Aktie definieren (Kausalitäten, hypothetische ­Fragestellungen) (Wolfers und Zitzewitz 2006) • Beobachtbare Ereignisse sind Voraussetzung (Slamka et al. 2012) • Geringe Sichtbarkeit alternativer Standpunkte • Komplexität (Green et al. 2007)

• Gestaltung der Anreize, wenig Anreizkompatibilität (Green et al. 2007) • Langfristige Motivation zur ­Teilnahme ist schwierig zu erhalten (Mullen 2003) • Tendenz zur Konformität (Woudenberg 1991) • (Nur) mittlere bis hohe ­Teilnehmendenzahl möglich (Vernon 2009; Linstone und Turoff 2002)

Durch die Integration von Prognosemarkt und Delphi-Studie kann Teilnehmenden die Möglichkeit gegeben werden, ihre Einschätzung auch qualitativ zu untermauern oder Informationen zu teilen. Grundsätzlich besteht in Prognosemärkten kein Anreiz neue Informationen zu teilen, da aus diesen Profit realisiert werden kann. Dieses Potenzial ist aber in der Regel für einen einzelnen Teilnehmenden schnell ausgeschöpft, sodass Teilnehmende bereit sind, diese im Tausch mit anderen Informationen preiszugeben (Kloker et al. 2017). In v­ ielen

132

S. Kloker et al.

Real-Time Delphi-Anwendungen können Teilnehmende erst Argumente einsehen, wenn sie selbst an der Umfrage teilnehmen. Im Sinne der Reziprozität, aber auch aufgrund von Selbstdarstellung und Prestige (Reputation), wird damit der Informationsaustausch angereizt (Kloker et al. 2016). Während in klassischen Prognosemärkten alle Teilnehmenden unabhängig voneinander Informationen akquirieren müssen, lernen Teilnehmende in Delphi-Studien direkt von den anderen Teilnehmenden. Auch neue Ideen oder Szenarien lassen sich so besser kommunizieren als über Marktpreise. Nach Green et al. (2007) führt dieser Informationsaustausch zu einer höheren Effizienz bei der Informationssuche und auch zu weniger Informationskaskaden. Letzteres insbesondere deshalb, da Teilnehmende die Hintergründe einer Preisbewegung kennen und diese nicht ohne Hintergrund bewerten müssen und auf eine wichtige, ihnen nicht bekannte, Information schließen. Ein erstes Potenzial ist also der verbesserte qualitative Informationsfluss und -austausch. Durch die eindimensionale Abbildung als Aktie steigt bei komplexen Vorhersagen die Abstraktionsbelastung der Teilnehmenden. Bereits einfache Märkte sind für viele Teilnehmende eine Hürde, die wenig Hintergrundwissen über Aktienhandel besitzen, da ihnen die notwendigen Kenntnisse fehlen, wie Erwartungen in Marktpreise übersetzt werden (Green et al. 2007). Dies kann sowohl zum Absprung von Teilnehmenden (mit allen daraus resultierenden Problemen wie verzerrten Stichproben) als auch zu Handel führen, der aber eigentlich nicht der Einschätzung entspricht. Der Hidden-Market Ansatz (Teschner und Weinhardt 2012) löst dieses Problem zumindest bedingt. Außerdem lassen sich Zusammenhänge und Kausalitäten nur schwer in Kontrakten abbilden, allerdings gut in Delphi-Studien abfragen. Ein zweites Potenzial der Integration mit Delphi-Studien ist daher die flexiblere Gestaltbarkeit des Prognosegegenstands. Weitere nachgelagerte Potenziale sind je nach Umsetzung eine geringere notwendige Anzahl an Teilnehmenden (Abramowicz 2004), eine höhere Resistenz gegenüber Manipulation (Green et al. 2007), eine bessere Sichtbarkeit alternativer Standpunkte und eine höhere Akzeptanz der Ergebnisse durch die einzelnen Teilnehmenden (Graefe und Armstrong 2011).

2.2 Potenziale für Real-Time Delphi In Delphi-Studien ist die Auswahl der Teilnehmenden (mit Expertise) der kritische Faktor für die Qualität der Ergebnisse und daher nach wie vor ein potenzieller Schwachpunkt (Gordon 2007; Welty 1972; Ammon 2009). Bei Teilnehmenden ohne (genug) Hintergrundwissen oder wenn alle Teilnehmenden aus

Delphi-Märkte

133

dem g­ leichen Pool an Informationen schöpfen, ist die Anwendung der Delphi-­ Methode nicht ratsam bzw. zielführend (Green et al. 2007; Sniezek 1990). Bei vielen Delphi-Studien wurden die Teilnehmenden aufgrund ihrer Reputation ausgewählt, welche aber nicht zwangsläufig deren individuelle Prognosegüte widerspiegelt (Hill und Fowles 1975), und das bei oft relativ hohen Kosten (Akquise, Lohn/Entschädigung) für Teilnehmende mit hoher Reputation (Welty 1972). Als drittes Potenzial können also in integrierten Ansätzen die Märkte zur Auswahl von Teilnehmenden mit Expertise und potenzieller Information und sehr hoher Prognosegenauigkeit herangezogen werden. Verfahren dazu sind in Kloker et al. (2017) und Absatz 3.1 beschrieben. Ein weiteres Problem von Delphi-Studien ist die sinkende Motivation der Teilnehmenden im Verlauf der Durchführung (Cuhls 2003; Kloker et al. 2018c), da sich der traditionelle Delphi-Prozess für die Teilnehmenden häufig als sehr starr und langwierig darstellt. Es ergibt sich das Problem von hohen Abbruchquoten, denen in traditionellen Delphi-Studien nur bedingt begegnet werden kann (Okoli und Pawlowski 2004; Reid 1988). Prognosemärkte bieten die Möglichkeit intrinsische sowie extrinsische Anreize zu setzen und motivieren die Teilnehmenden zu einer langfristigen Teilnahme, da sich so die größten Gewinne erzielen lassen (Green et al. 2007). Von einer Integration dieser Methoden kann also die dauerhafte und aktive Teilnahme an der Delphi-Studie profitieren (viertes Potenzial). Winkler und Moser (2016) beschäftigen sich mit kognitiven Heuristiken, die zu systematischen Fehlern in Vorhersagen, auch in Delphi-Studien, führen. Die Persistenz von solchen Fehlern, wie zum Beispiel der Anker-Heuristik, wird auch von de Wilde et al. (2018) aufgezeigt. Winkler und Moser (2016) und de Wilde et al. (2018) empfehlen das gezielte Schaffen richtiger Anreize als Gegenmaßnahme. Diese können finanzieller Natur sein, in Form von Reputation gegeben werden (Winkler und Moser 2016) oder aber auch als Rechenschaftspflicht der Vorhersager gestaltet werden, sodass diese die Konsequenzen also tragen müssen (de Wilde et al. 2018). Ganz nach dem wörtlichen Sinn des englischen Sprichworts „Put your money where your mouth is“, müssen die Teilnehmenden in Prognosemärkten die Glaubwürdigkeit ihres Argumentes also auch mit einer „Investition“ oder „Wette“ beweisen, was durchaus zum erneuten Nachdenken anregen kann (Levin et al. 1988). Abhängig vom unterliegenden Marktmechanismus lässt sich dadurch ein Performanz-kompatibles oder sogar ein anreizkompatibles Umfeld schaffen (Chen und Pennock 2010; Luckner und Weinhardt 2007; Jurca und Faltings 2008). Neben der Tatsache, dass die Einschätzung durch den Handel abgegeben werden muss, kann dies, sofern dies mit der Abgabe

134

S. Kloker et al.

eines Argumentes gekoppelt wird7, den Teilnehmenden weitere Information bezüglich der Glaubwürdigkeit und Konfidenz hinter einem einzelnen Argument bereitstellen. Als fünftes Potenzial profitieren Delphi-Studien von einem Prognosemarkt durch bessere Schaffung von Anreizen, Verringerung kognitiver Verzerrungen und ggf. Informations-Anreicherung von Argumenten. Eine letzte, abhängig vom jeweiligen Kontext problematische, Eigenschaft von Delphi-Studien ist, dass diese prinzipiell darauf angelegt sind einen Konsens zu finden und damit implizit Uneinigkeit unterdrücken (Green et al. 2007). Dies führt dazu, dass nur Meinungen hinterfragt werden, die außerhalb des aktuell bestehenden Konsenses liegen, während eine Meinung im Konsens einfach hingenommen wird. In Prognosemärkten können nur dann Gewinne aus einer guten Prognose realisiert werden, wenn die eigene Meinung von der der „Masse“, also dem aktuellen Marktpreis, abweicht (Green et al. 2007)8. Dadurch muss jede Meinung hinterfragt und herausgefordert werden. Dennoch kann es in Delphi-Studien zur Bildung von zwei oder mehreren Meinungsclustern kommen (Gnatzy et al. 2011). Als sechstes Potenzial bieten Prognosemärkte den Vorteil, dass auch für Fragestellungen bei denen verschiedene Weltbilder und Wertvorstellungen aufeinander treffen und/oder es zu Meinungsclustern kommt, dennoch ein Konsens, der Preis, gefunden wird (werden muss). Ein weiteres nachgelagertes Potenzial ist, je nach Umsetzung und Marktmechanismus, die bestehende Anreizkompatibilität9 (Chen und Pennock 2010).

3 Integrationsansätze Der Begriff Delphi-Märkte, als Bezeichnung für Ansätze zur Integration der Delphi-Methode mit Prognosemärkten, trifft allerdings noch keine konkrete Aussage über die vielseitig mögliche Art der Ausgestaltung dieser Integration. Dabei lassen sich nicht alle im Abschn. 2 angesprochenen Potenziale in jedem Ansatz zur Integration realisieren. Im Folgenden werden drei Ansätze zur Integration vorgestellt, um einen Eindruck der Breite und möglichen Einsatz-Szenarien zu vermitteln. Dabei wird zwischen der Integration auf User-, Markt- und Fragen-Ebene unterschieden.

7Siehe

dazu später den Integrationsansatz in Abschn. 3.2. Manipulation und uninformierten Handelsstrategien abgesehen. 9Zumindest der Prognose. Gilt nicht für die Abgabe von wahrheitsgemäßen Argumenten. 8Von

Delphi-Märkte

135

3.1 Integration auf User-Ebene Bei der Integration auf User-Ebene wird ein Prognosemarkt und eine RealTime Delphi-Plattform parallel betrieben. Die beiden Plattformen sind über eine gemeinsame Userbasis verbunden. Dieser Möglichkeit liegt auch der Arbeit von Kloker et al. (2017) und dem Prognosemarkt „FAZ.NET-Orakel“10 zugrunde und ist in Abb. 1 konzeptuell dargestellt. Im Zentrum steht dabei ein Panel aus Prognosemarkt-Teilnehmenden. Dieses Panel hat verschiedene Eigenschaften: 1) Es beinhaltet sowohl informierte, als auch uninformierte Marktteilnehmende (Gruca und Berg 2007). 2) Alle Marktteilnehmende bringen ein gewisses Interesse an dem Thema mit (Servan-­Schreiber et al. 2004). 3) Teilnehmende des Panels besitzen sowohl öffentliche, als auch private Informationen (Gruca und Berg 2007). Die Teilnehmenden handeln entsprechend ihrer Erwartung auf dem Prognosemarkt und sehen sich dabei auch mit den Erwartungen der anderen Teilnehmenden konfrontiert. Bei einer Integration auf User-Ebene, kann sich nun eine Real-Time Delphi-Umfrage an den Teilnehmenden dieses Panels bedienen. Neben der Option, alle Teilnehmenden von thematisch verbundenen Märkten zu der Delphi-Umfrage einzuladen, was das in Abschn. 2.2 angeführte Problem der Selektion von Teilnehmenden mit Expertise für die Delphi-Runde nur bedingt lösen würde, ergeben sich insbesondere drei interessante Alternativen für die Selektion von Teilnehmenden (Kloker et al. 2017): • „The Topscorer“: In Prognosemärkten werden Teilnehmende üblicherweise auf Basis ihres Handelserfolgs gelistet, der nach Hayek (1945) langfristig nur von Teilnehmenden mit wahren (und privaten) Informationen erzielt werden kann. Teilnehmende, die in der Rangliste weiter oben stehen besitzen mit höherer Wahrscheinlichkeit wichtige und richtige Informationen und qualifizieren sich somit für die Delphi-Studie als Teilnehmende mit Expertise. • „The Potential“: Eine Problematik des „The Topcscorer“-Verfahrens ist, dass eine wirklich aussagekräftige Rangliste für einen Markt erst nach dessen Auszahlung erstellt werden kann. Für Delphi-Umfragen, für die bisher

10http://orakel.faz.net.

Das FAZ.NET-Orakel ist eine Kooperation der Frankfurter Allgemeine Zeitung mit dem Institut für Informationswirtschaft und Marketing (IISM) am Karlsruher Institut für Technologie (KIT) und für die Leserschaft der FAZ.NET zugänglich. Das FAZ.NET-Orakel wird vorwiegend für die Prognose von Wahlereignissen und ökonomischen Indikatoren herangezogen, sowie Einzelfragen zu aktuellen Themen.

136

S. Kloker et al.

REAL-TIME DELPHI

PROGNOSE MARKT

Abb. 1   Integration auf der User-Ebene. Prognosemarkt und Real-Time Delphi laufen parallel. Nutzer können auf beiden Plattformen aktiv werden und gegebenenfalls Informationen von einer zur anderen Plattform transferieren. (Eigene Darstellung)

kein themenverwandter Markt besteht, können Teilnehmende mit Expertise nicht basierend auf ihrem bisherigen Handelserfolg ausgewählt werden. Das Selektionsverfahren „The Potential“ wählt daher Teilnehmende basierend auf ihrem Handelsverhalten aus. Es lässt sich zeigen, dass bestimmtes Verhalten in Prognosemärkten mit einer höheren Erfolgswahrscheinlichkeit korreliert ist (Kloker et al. 2018a). Attribute solchen Verhaltens lassen sich auf historischen Daten lernen und können dann zur Auswahl von Teilnehmenden mit Expertise genutzt werden. • „The Bohemian“: Dieses Selektionsverfahren wählt die Teilnehmenden für die Delphi-Umfrage ebenfalls auf Basis des aktuellen Handelsverhaltens aus. Zentraler Unterschied zum Selektionsverfahren „The Potential“ ist, dass nicht nur Teilnehmende mit hoher Erfolgswahrscheinlichkeit, sondern mit maximal voneinander abweichendem Handelsverhalten ausgewählt werden. Teilnehmende, die eher Aktien kaufen, haben unter Umständen andere Informationen oder Standpunkte als Teilnehmende, die eher Aktien verkaufen. Vor diesem Hintergrund scheint es sinnvoll, beide Meinungen in der Delphi-Umfrage zu berücksichtigen und als Teilnehmende einzuladen. Insbesondere diese Teilnehmenden, die mit ihrem Handelsverhalten offensichtlich andere Meinungen als der „Mainstream“ der anderen Marktteilnehmenden vertreten, haben potenziell neue, interessante, oder zumindest bisher unbeachtete Informationen und Standpunkte, die für die Delphi-Umfrage von Interesse sein können. Dieses Selektionsverfahren führt somit zu hoher Heterogenität.

Delphi-Märkte

137

Neben den oben genannten Selektionsverfahren wäre auch noch eine Zufalls-Auswahl möglich, da durch die Teilnahme am Markt bereits von einem generellen Wissensstand zu dem Thema auszugehen ist. Ebenfalls vorstellbar wäre eine Selbstselektions-Strategie, nach der die Teilnehmenden selbst entscheiden, ob Sie an der Delphi-Umfrage teilnehmen wollen. Nach Green et al. (2007) nehmen ohnehin nur diese Teilnehmenden am Markt teil, die denken, dass ihre privaten Informationen noch nicht in der bisherigen Prognose berücksichtigt sind. Aktionen im Delphi-Markt haben also keinen direkten (regelbasierten) Einfluss auf den Prognosemarkt, bzw. die Marktvorhersage. Dennoch können Informationen über die Teilnehmenden zwischen den Methoden ausgetauscht werden. In Märkten realisieren Marktteilnehmende in der Regel sehr schnell Gewinne aus verfügbaren Informationen, weshalb diese für den einzelnen Marktteilnehmenden innerhalb kurzer Zeit ihren Wert verlieren (vgl. Fama 1970, Markteffizienz). Um weitere Gewinne aus der zukünftigen Kursentwicklung erzielen zu können, sind Marktteilnehmende ständig darauf angewiesen neue Informationen zu finden. Dies kann unter anderem im Austausch mit anderen Teilnehmenden in der Delphi-Umfrage geschehen, was die Teilnehmenden anreizt aktiv und langfristig an der Delphi-Umfrage teilzunehmen. Ein Vorteil dieses Integrationsansatzes ist ferner, dass das Design von Markt und Real-Time Delphi völlig unabhängig voneinander auf die spezifischen Anforderungen des jeweiligen Kontextes angepasst werden können. Dies gilt auch für die Art, mittels der die Teilnehmenden vom Markt auf die Real-Time Delphi-Plattform eingeladen werden. Kranz et al. (2014b) empfiehlt hier eine stärker integrierte Lösung, die direkt das Beantworten von einzelnen Fragen aus der Delphi-Studie heraus erlaubt. Die Integration auf User-Ebene hebt also das erste und das dritte Potenzial und sollte dann eingesetzt werden, wenn keine technische Integration gewollt oder möglich ist, wenn die Durchführung der Delphi-Umfrage entkoppelt von gewinnsuchenden Anreizen und Handelsstrategien sein soll, oder wenn Teilnehmende aus mehreren Pools an Personen rekrutiert werden, von denen manche aber kein Verständnis von Märkten haben. Insbesondere profitieren Delphi-­Studien auch dann von diesem Integrationsansatz, wenn die objektive Auswahl von Teilnehmenden für das Ergebnis von großer Bedeutung oder nicht möglich ist (beispielsweise aufgrund fehlender historischer Daten über potenzielle ­Teilnehmende).

138

S. Kloker et al.

3.2 Integration auf Marktebene Bei der Integration auf Marktebene wird im Grunde genommen ein Real-Time Delphi innerhalb des Kontextes eines Prognosemarktes betrieben. Diesem Ansatz liegt auch die Plattform „Delphi Markets“11 zugrunde und ist in Abb. 2 konzeptuell dargestellt. Im Zentrum steht hier der Markt mit der Marktfrage (Prognoseziel des Marktes). Hierin liegt auch die erste Einschränkung dieses Ansatzes. Da ein Markt jeweils nur eine Frage beantworten kann, besteht die Delphi-Umfrage ebenfalls nur aus einer einzelnen Frage. Der Markt fungiert direkt als Aggregationsmechanismus für die Einzelmeinungen aller Teilnehmenden. Teilnehmende auf dem Prognosemarkt haben bei jeder Abgabe eines Handelsauftrags die Option die zugrunde liegenden Informationen und Hintergründe anzugeben. Daher ist jeder Kommentar auch einem preiserhöhenden oder -senkenden Effekt zuzuordnen und damit, in der Theorie, einem positiven oder negativen Effekt auf die vorherzusagende Variable oder Wahrscheinlichkeit. Die „Optionalität“ dieser Argumentabgabe zu gewährleisten ist von zentraler Bedeutung, da sonst viele, den Markt beruhigende und Liquidität bereitstellende, Handelsstrategien, die auf kleine Gewinne aus sind, unterbunden werden würden. Diese Argumente können dann optisch, zum Beispiel wie in „Delphi Markets“, an den Seiten des Marktes nach pro und kontra sortiert werden. Sind Teilnehmende mit einem Argument nicht einverstanden und möchten ein Gegenargument dazu verfassen, muss dies automatisch auch mit der Abgabe eines Handelsauftrags einhergehen. Die Vorteile dieses Ansatzes sind im fünften Potenzial erläutert. Dieser Ansatz bringt einige Vor- und Nachteile mit sich, die je nach Anwendungsfall abgewogen werden müssen. Die Integration auf Marktebene erzeugt, abhängig vom Marktmechanismus, ein Performanz- und/oder anreizkompatibles Umfeld für die Prognose der Marktfrage, weshalb davon auszugehen ist, dass Teilnehmende wahrheitsgemäß und mit weniger kognitiven Heuristiken prognostizieren. Zudem erlaubt dieser Ansatz es, die Teilnehmenden sowohl intrinsisch, über die Möglichkeit ihr Wissen zu teilen (einen Beitrag zu leisten), oder extrinsisch, mittels einer Rangliste, über Preise, oder sogar über das Handeln mit Echtgeld, langfristig zu motivieren. Dies fördert die aktive und langfristige Teilhabe am Markt und an der Delphi-Umfrage als auch das kontinuierliche

11https://delphimarkets.net.

Delphimarkets.net ist eine privat betriebene Seite, die in mit offenen und geschlossenen Delphi-Märkten Fragestellungen aus den verschiedenen Themenbereichen prognostiziert (u. a. Risikomanagement).

Delphi-Märkte Abb. 2   Integration auf der Marktebene. Real-Time Delphi wird im Kontext des Prognosemarktes durchgeführt. Eine Teilnahme am Real-Time Delphi ist ohne Teilnahme am Prognosemarkt nicht möglich. (Eigene Darstellung)

139

REAL-TIME DELPHI

PROGNOSE MARKT

Recherchieren von Informationen (Gangur 2016). Die Frage nach Spiel- oder Echtgeld ist dabei für die Prognosegüte nachrangig (Servan-Schreiber 2017)12. Ein weiterer Vorteil ist die nutzerfreundliche Gestaltung der Interaktion. Die Integration auf Marktebene erlaubt es theoretisch alle relevanten Elemente auf einer Ansicht darzustellen, sodass kein Wechsel zwischen verschiedenen Plattformen oder Ansichten notwendig ist. Der letzte Vorteil dieses Ansatzes ist, wie bereits in Abschn. 2.2 erwähnt, dass ein Markt immer einen Preis findet, auch wenn verschiedene Wertvorstellungen und Meinungen sich gegenüberstehen. Nach Linstone und Turoff (2002) wird insbesondere auch für solche Fragestellungen, in denen Werte und Ziele im Konflikt stehen, die Delphi-Methode genutzt. Ein Markt zur Findung eines Konsens-Preises und eine Argumentation im Stil der Delphi-Methode zum Austausch der Standpunkte können sich hier sehr gut ergänzen. Ein Nachteil dieses Ansatzes ist, dass Anreizkompatibilität zwar für die Prognose erreichbar ist, dies aber nicht zwangsläufig auch für Argumente gilt. Unter Umständen ist sogar ein gegenteiliger Effekt zu erwarten. Teilnehmende könnten die Argumente nutzen, um andere Teilnehmende auf eine falsche Fährte zu locken und aus den resultierenden Handelsaufträgen auf dem Markt Gewinn zu schöpfen. Manipulation ist in Prognosemärkten ein relevanter Aspekt bei Entscheidungen bezüglich Mechanismus und Design (Kloker und Kranz 2017; Kloker et al. 2018b). Ein weiterer Nachteil ergibt sich aus dem Umstand, dass

12Einfluss

hat die Wahl zwischen Spiel- und Echtgeld nach Servan-Schreiber (2017) vor allem auf die Selbstselektion der Teilnehmenden und damit nur indirekt auf die Prognose(-güte), wobei Prognosemärkte per se robust gegen unausgeglichene Stichproben sind.

140

S. Kloker et al.

Prognosemärkte eigentlich nur für Fragestellungen genutzt werden können, für die auch eine Realisierung in absehbarer Zukunft zu verzeichnen sind (Green et al. 2007). Da im anderen Fall die Anreize für wahrheitsgemäße Einschätzungen nicht mehr gewährleistet wären, könnte der Marktpreis unter Umständen zum Spielball reiner Spekulations- und Signalling13-Strategien werden14. Unabhängig vom Zeithorizont kann es aber auch andere Schwierigkeiten geben (Komplexität oder Zusammenhänge zwischen Ereignissen), die die Formulierung einer Fragestellung in einen handelbaren Kontrakt als Marktfrage sehr schwierig oder unmöglich machen (Green et al. 2007; Wolfers und Zitzewitz 2006). In diesem Zusammenhang bieten „Kombinatorische Prognosemärkte“ (Laskey et al. 2015) eine interessante Option. Sie erlauben die Modellierung von Abhängigkeiten zwischen einzelnen Märkten und würden somit das Problem der Formulierung von komplexen Fragestellungen als Kontrakte, wie auch, dass bisher nur eine Marktfrage möglich ist, adressieren. Bisher ist aber keine Implementierung oder Diskussion einer Integration eines kombinatorischen Marktes mit der Delphi-Methode bekannt. Zuletzt stellt auch die erhöhte Komplexität eines Marktes ein Hindernis für Teilnehmende dar, die den Markt nicht vollständig verstehen oder sich nicht damit auseinandersetzen wollen, aber dennoch an der Delphi-Studie teilnehmen würden. Die Integration auf Marktebene hebt also das erste, das vierte, das fünfte und das sechste Potenzial und sollte dann eingesetzt werden, wenn die Fragestellung relativ einfach in einem Markt dargestellt werden kann. Der Markt wird dabei von den Argumenten profitieren, während die Real-Time Delphi-Studie durch den Markt motiviert wird. Allerdings werden sich viele Delphi-Studien nicht auf eine Marktfrage herunterbrechen lassen, weshalb die Vorteile für den Prognosemarkt bei diesem Ansatz klar überwiegen. An dieser Stelle stellt sich berechtigterweise die Frage, inwiefern sich dieser Ansatz von einem einfachen (oder kombinatorischen) Prognosemarkt mit einem „Forum“ oder einer „Kommentarbox“ für jede Marktfrage unterscheidet. Dies sind vor allem zwei Punkte: 1) Jeder Kommentar (bzw. jedes Argument) ist

13Signalling

bezeichnet eine empfängerbezogene Preisgabe von Informationen. Insider neue Informationen handeln, bewegt sich der Preis. Diese kleine Preisbewegung kann von anderen Teilnehmenden als Signal für neue Information(en), die in eine bestimmte Richtung wirken, interpretiert und ggf. als glaubwürdig eingeschätzt werden. Dies führt dann oft zu weiteren Preisbewegungen in dieselbe Richtung. Dieser Effekt kann aber auch dazu genutzt werden um Insider-Information nur vorzutäuschen und anschließend Gewinne aus den resultierenden Preisbewegungen zu ziehen.

14Wenn

Delphi-Märkte

141

einer Preisbewegung zugeordnet, also kann nicht einfach kommentiert werden, ohne gleichzeitig am Handel teilzunehmen. Zudem werden sich Argumente in einem Delphi-Markt vermehrt auf eine konkrete Information beziehen, als dass sie sich lediglich generell zur Frage äußern oder nebensächliche Diskussionen geführt werden (bspw. Spaß-Kommentare, Flaming, etc.). 2) Wie in vielen Implementierungen des Real-Time Delphi üblich, sind die Kommentare anderer Teilnehmenden nicht sichtbar, bis eine eigene Einschätzung abgegeben wurde. Dies wäre prinzipiell (in Abhängigkeit vom zugrunde liegenden Marktmechanismus) auch mit dem Handelspreis möglich.

3.3 Integration auf Delphi-Fragen-Ebene Bei der Integration auf Delphi-Fragen-Ebene wird im Grunde genommen ein klassisches Real-Time Delphi genutzt. Lediglich die Aggregation der einzelnen Antworten zu jeder Frage findet auf Basis von Märkten statt. Die Integration ist schematisch in Abb. 3 dargestellt. Im Zentrum steht hier die Real-Time Delphi-Umfrage als solche und folgt auch deren Prozess. Für jede Einzelfrage wird ein Prognosemarkt genutzt, auf dem die Teilnehmenden die Erwartungen bezüglich dieser Frage handeln können. Dieser Ansatz birgt jedoch zwei Probleme: 1) Die Integration auf Delphi-Fragen-Ebene kann für die Teilnehmenden aufgrund der vielen Märkte sehr schnell komplex und zeitintensiv werden. 2) Zudem hängen die Fragen in Delphi-Umfragen üblicherweise thematisch zusammen und bedingen sich. Dies führt auch dazu, dass die Märkte sich bedingen und dies wiederum Arbitrage-Möglichkeiten15 und Signalling-Strategien mit den potenziell negativen Konsequenzen fördert (wahrheitsgemäßes Antworten ist nicht mehr die dominante Strategie). Hidden Markets mit Scoring Rules und kombinatorische Märkte können diese zwei Probleme adressieren, allerdings nur unter Inkaufnahme von Kompromissen. Der Einsatz von Hidden Marktes kann der Komplexität und Zeitintensität Abhilfe schaffen. Je nach verwendetem Marktmechanismus ist die Delphi-Umfrage mit integriertem Markt nicht von anderen Delphi-Umfragen zu unterscheiden (Teschner und Weinhardt 2012; Laskey et al. 2015). Kommen ordnungsgemäße Scoring Rules zum Einsatz (und wird dies den Teilnehmenden auch

15Mit Arbitrage

wird die Realisierung eines risikolosen Gewinns bezeichnet.

142 Abb. 3   Integration auf der Marktebene. Real-Time Delphi wird im Kontext des Prognosemarktes durchgeführt. Eine Teilnahme am Real-Time Delphi ist ohne Teilnahme am Prognosemarkt nicht möglich. (Eigene Darstellung)

S. Kloker et al.

REAL-TIME DELPHI

PROGNOSE MARKT

entsprechend kommuniziert), kann dabei auch die Anreizkompatibilität erhalten werden. Verschiedene ordnungsgemäße Scoring Rules sind bekannt, die vermutlich meist implementierte ist die Logarithmic Market Scoring Rule (­Hanson 2002). Scoring Rules haben zudem den Vorteil, dass keine Anforderungen an die Liquidität gestellt werden und viele informationsarme Handelsstrategien nicht angewandt werden können. Allerdings verliert die Umfrage zum Teil ihren spielerischen Charakter, der die langfristige Motivation fördert, und auch die Geld-Metapher, die tiefere Überlegungen induzieren könnte (Levin et al. 1988). Andere Vorteile bleiben aber erhalten. Dies ist insbesondere die langfristige implizite Gewichtung der Teilnehmenden abhängig von ihren vergangenen Prognosegüten. Teilnehmende mit guten Prognosen erhöhen ihren Depotwert und damit auch ihren Markteinfluss. Teilnehmende mit langfristig schlechten Prognosen hingegen senken ihren Depotwert und verlieren somit ihren Einfluss auf die Prognose. Kombinatorische Märkte können Arbitrage- und Signalling-Strategien unterbinden, da sie die Bedingungen zwischen den einzelnen Märkten abbilden können. Dies setzt der Gestaltbarkeit der einzelnen Märkte aber wiederum verschiedene Grenzen16 und schränkt somit die Art der Fragen ein. Zudem sind kombinatorische Märkte bisher nur auf Basis von Market Scoring Rules und keinen anderen Marktmechanismen bekannt. Eine offene Frage, die je nach Einzelfall bewertet werden muss, ist, ob und wie die einzelnen Märkte (für die einzelnen Fragen) fair zu einem Gesamt-­Ranking zusammengefasst werden können, ohne wiederum Arbitrage-Möglichkeiten und

16Kombinatorische Märkte sind nur zwischen Marktfragen möglich, deren summierten Wahrscheinlichkeiten über alle Optionen sich auf 100 % addieren. Index- oder Spread-Kontrakte sind nicht möglich.

Delphi-Märkte

143

Signalling-Strategien zu fördern. Auch eine Auswahl der Teilnehmenden mit Expertise durch den Markt ist nicht mehr gegeben. Die Integration auf Delphi-Fragen-Ebene hebt also das erste und das zweite Potenzial, sofern man die Anwendung aus Sicht der Prognosemärkte sieht. In diesem Fall aber wichtiger, birgt der Ansatz für Delphi-Studien das vierte, das fünfte und das sechste Potenzial. Delphi-Studien profitieren durch die langfristige Motivation der Teilnehmenden, die zusätzlichen Informationen, die die einzelnen Argumente untermauern, die potenzielle Anreizkompatibilität, die langfristige stärkere Gewichtung der besseren Teilnehmenden, und dass ein Konsens gefunden werden muss. Dieser Ansatz empfiehlt sich daher für sehr komplexe Fragestellungen, bei denen zudem davon ausgegangen werden kann, dass die Teilnehmenden auch über Handelserfahrung verfügen. Die Variante mit Hidden Markets empfiehlt sich dann, wenn nur das Erstere, aber nicht das Letztere zutrifft, womit man allerdings die langfristige Motivation teilweise etwas schwächt. Prokesch et al. hat 2015 einen Ansatz zur Integration von Delphi-Studien mit Prognosemärkten vorgestellt, der im Grunde genommen als Integration auf Delphi-Fragen-Ebene mit Hidden Markets betrachtet werden kann. Als Marktmechanismus wurde allerdings eine Scoring Rule verwendet, die zu keinem Handel mehr führt, wodurch der Begriff „Delphi-Markt“ nicht mehr ganz passend ist und der Vorteil von klassischen Märkten der impliziten langfristigen Gewichtung und der Geld-Metapher nicht mehr gegeben ist. Wie in einer klassischen Delphi-Studie hat Prokesch et al. (2015) die Teilnehmenden zuvor explizit ausgewählt. Dennoch, auch dieser Ansatz konnte die relevanten Benchmarks schlagen (Prokesch et al. 2015) und zeigt, dass Delphi-Märkte, korrekt und an richtiger Stelle angewendet, die gegenseitigen Schwächen der einzelnen Ansätze kompensieren können.

4 Fazit und zukünftige Entwicklungen Die vorangegangenen Abschnitte haben drei verschiedene Ansätze aufgezeigt, um einen Eindruck möglicher Implementierungen zu vermitteln. Die Integration auf User-Ebene hat insbesondere die Potenziale bezüglich der Selektion von Teilnehmenden mit Expertise für die Delphi-Studie durch den Markt hervorgehoben. Die Integration auf Markt-Ebene zeigt auf, wie ein Prognosemarkt durch die Vorteile von Delphi-Studien profitieren kann (qualitative Informationen). Die Integration auf Delphi-Fragen-Ebene hat die Potenziale für Delphi-Studien aufgegriffen, die sich durch den Markt ergeben.

144

S. Kloker et al.

Eine Integration der Methoden kann allerdings auch andere Gestaltungsformen annehmen. Generell ist eine Kombination in den allermeisten Fällen nur dann zielführend, wenn die Realisierung des prognostizierten Ereignisses auch in „absehbarer“ Zeit beobachtbar ist, da sonst der Prognosemarkt nicht ausgezahlt werden kann und somit nicht anreizkompatibel ist. Es existieren zwar einzelne Ansätze zur Anwendung von Prognosemärkten für die Prognose von Ereignissen, die unter Umständen nicht beobachtet werden können, oder für die kein allgemein akzeptierter objektiver Auszahlungswert festgelegt werden kann (Slamka et al. 2012), diese bringen aber immer Einbußen bezüglich Genauigkeit und Anfälligkeit für Manipulation mit sich (Kloker und Kranz 2017). Delphi-Märkte sind aktuell noch relativ wenig eingesetzt und erforscht (Prokesch et al. 2015). Einzelne bekannte Studien berichten allerdings von ermutigenden Ergebnissen. Ein maßgebliches Hindernis und bleibende Limitationen für den Einsatz von Delphi-Märkten sind sicher die erhöhte Komplexität und der ebenfalls größere Implementierungsaufwand, die nicht jedem Anwendungsfeld und -fall gerecht werden. Auch eine noch ausstehende Formalisierung und Validierung der Delphi-Märkte als eigene Forschungsmethode hindert die Anwendung in der Wissenschaft – sofern diese bei der Breite der Gestaltungsmöglichkeiten überhaupt möglich ist. Dennoch empfiehlt sich ein hier ein stärkerer Forschungsfokus. Insbesondere die Integration auf User-Ebene erlaubt die Einbindung der „Crowd“ in den Vorhersageprozess und kann somit auch als partizipativer Ansatz verstanden werden (Niemeyer et al. 2016). Auch im Themenbereich „Gesundheit“ können daher Delphi-Märkte sowohl die Ergebnisse von öffentlichen Diskussionen unterstützen, als auch deren Akzeptanz erhöhen. Während ein Panel aus Fachpersonen über die zukünftige Ausgestaltung der Krankenkassenbeiträge diskutiert, kann ein auf User-Ebene integrierter Markt dazu dienen relevante Kennzahlen zu prognostizieren (z. B. Entwicklung der Beiträge und Beitragszahlenden, Entwicklung der Kosten, …). Der Markt kann dann auch, wie oben beschrieben, genutzt werden um einzelne hervorstechende Teilnehmende in der Diskussion zu Wort kommen zu lassen. Zukünftige Forschung wird sich insbesondere darauf konzentrieren müssen, die theoretisch hergeleiteten Potenziale, wie zum Beispiel die objektive Auswahl der Teilnehmenden mit Expertise (drittes Potenzial), oder die positiven Effekte der Marktstruktur auf die Aggregation der Erwartungen für jede einzelne Frage, sowie die erhöhte (langfristige) Motivation in Delphi-Studien zu quantifizieren. Die Potenziale sind groß, die Möglichkeiten umso größer. Delphi-Märkte werden mit großer Sicherheit immer wieder Einsatz finden und – sofern die Ergebnisse weiterhin ermutigend bleiben – sich auch öfter für den Einsatz empfehlen.

Delphi-Märkte

145

Literatur Abramowicz, M. (2004). Information markets, administrative Decisionmaking, and predictive cost-benefit analysis. The University of Chicago Law Review, 71(3), 933–1020. http://www.jstor.org/stable/1600601. Ammon, U. (2009). Delphi-Befragung. In S. Kühl, P. Strodtholz, & A. Taffertshofer (Hrsg.), Handbuch Methoden der Organisationsforschung: Quantitative und Qualitative Methoden (S. 458–476). Wiesbaden: VS Verlag. http://doi.org/10.1007/978-3-53191570-8_22. Arrow, K. J., Forsythe, R., Gorham, M., Hahn, R., Hanson, R., Ledyard, J. O., et al. (2008). The promise of prediction markets. Science, 320(5878), 877–878. https://doi. org/10.1126/science.1157679. Bothos, E., Apostolou, D., & Mentzas, G. (2009). IDEM: A prediction market for idea management. In C. Weinhardt, S. Luckner, & J. Stößer (Hrsg.), WEB2008: Designing E-Business systems markets services and networks (S. 1–13). Berlin: Springer Berlin Heidelberg. Buckley, P., & Doyle, E. (2017). Individualising gamification: An investigation of the impact of learning styles and personality traits on the efficacy of gamification using a prediction market. Computers & Education, 106, 43–55. https://doi.org/10.1016/j.compedu.2016.11.009. Chen, Y., & Pennock, D. M. (2010). Designing markets for prediction. AI Magazine, 31(4), 42–52. Cipriano, M. C., & Gruca, T. S. (2014). The power of priors: How confirmation bias impacts market prices. Journal of Prediction Markets, 8(3), 34–56. Cowgill, B., Wolfers, J., & Zitzewitz, E. (2009). Using prediction markets to track information flows: Evidence from Google. In S. Das, M. Ostrovsky, D. Pennock, & B. Szymanksi (Hrsg.), 1st International conference on auctions, market mechanisms and their applications 2009 (S. 3). Berlin: Springer Berlin Heidelberg. http://doi. org/10.1007/978-3-642-03821-1\_2. Cuhls, K. (2003). From forecasting to foresight processes—New participative foresight activities in Germany. Journal of Forecasting, 22(2–3), 93–111. https://doi.org/10.1002/ for.848. de Wilde, T. R. W., Ten Velden, F. S., & De Dreu, C. K. W. (2018). The anchoring-bias in groups. Journal of Experimental Social Psychology, 76, 116–126. https://doi. org/10.1016/j.jesp.2018.02.001. Fama, E. F. (1970). Efficient capital markets: A review of theory and empirical work. The Journal of Finance, 25(2), 383–417. https://doi.org/10.2307/2325486. Galton, F. (1907). Vox populi (The wisdom of crowds). Nature, 75(7), 450–451. Gangur, M. (2016). Motivation system on prediction market. In N. T. Nguyen, L. Iliadis, Y. Manolopoulos, & B. Trawiński (Hrsg.), Proceedings of the 8th International Conference on Computational Collective Intelligence, ICCCI 2016, Halkidiki, Greece, September 28–30, 2016, Part II (S. 354–363). Cham: Springer International Publishing. http://doi. org/10.1007/978-3-319-45246-3_34.

146

S. Kloker et al.

Gnatzy, T., Warth, J., von der Gracht, H. A., & Darkow, I.-L. (2011). Validating an innovative real-time Delphi approach – A methodological comparison between real-time and conventional Delphi studies. Technological Forecasting and Social Change, 78(9), 1681–1694. https://doi.org/10.1016/j.techfore.2011.04.006. Gordon, T. J. (2007). Energy forecasts using a „Roundless“ approach to running a Delphi study. Foresight, 9(2), 27–35. https://doi.org/10.1108/14636680710737731. Gordon, T. J., & Pease, A. (2006). RT Delphi: An efficient, „round-less“ almost real time Delphi method. Technological Forecasting and Social Change, 73(4), 321–333. https:// doi.org/10.1016/j.techfore.2005.09.005. Graefe, A. (2017). Prediction market performance in the 2016 U.S. presidential election. Foresight: The International Journal of Applied Forecasting, 1(45), 38–42. http://econpapers.repec.org/RePEc:for:ijafaa:y:2017:i:45:p:38-42. Graefe, A., & Armstrong, J. S. (2011). Comparing face-to-face meetings, nominal groups, Delphi and prediction markets on an estimation task. International Journal of Forecasting, 27(1), 183–195. https://doi.org/10.1016/j.ijforecast.2010.05.004. Graefe, A., Luckner, S., & Weinhardt, C. (2010). Prediction markets for foresight. Futures, 42(4), 394–404. https://doi.org/10.1016/j.futures.2009.11.024. Green, K. C., Armstrong, J. S., & Graefe, A. (2007). Methods to elicit forecasts from groups: Delphi and prediction markets compared. The International Journal of Applied Forecasting, 8, 17–20. Gruca, T. S., & Berg, J. E. (2007). Public information bias and prediction market accuracy. The Journal of Prediction Markets, 1(3), 219–231. https://doi.org/10.5750/jpm. v1i3.430. Hanson, R. (2002). Logarithmic market scoring rules for modular combinatorial information aggregation. Journal of Prediction Markets, 1(1), 3–15. http://www.ubplj.org/ index.php/jpm/article/view/417. Hayek, F. A. (1945). The use of knowledge in society. American Economic Review, 35(4), 519–530. Hill, K. Q., & Fowles, J. (1975). The methodological worth of the Delphi forecasting technique. Technological Forecasting and Social Change, 7(2), 179–192. https://doi. org/10.1016/0040-1625(75)90057-8. Jurca, R., & Faltings, B. (2008). Incentives for expressing opinions in online polls. In Proceedings of the 9th ACM conference on electronic commerce (S. 119–128). New York: ACM. http://doi.org/10.1145/1386790.1386812. Kloker, S., & Kranz, T. T. (2017). Manipulation in prediction markets – Chasing the fraudsters. In Proceedings of the 25th European conference of information systems, June 5th–10th 2017, Guimarães, Portugal. Kloker, S., Kranz, T. T., Straub, T., & Weinhardt, C. (2016). Shouldn’t collaboration be social? – Proposal of a social real-time Delphi. In Proceedings of the second Karlsruhe service summit research workshop. http://service-summit.ksri.kit.edu/downloads/ Session_3B2_KSS_2016_paper_19.pdf. Kloker, S., Straub, T., & Weinhardt, C. (2017). Designing a crowd forecasting tool to combine prediction markets and real-time Delphi. In A. Maedche, J. vom Brocke, & A. Hevner (Hrsg.), Designing the digital transformation. DESRIST 2017. Lecture notes in computer science (10243rd Hrsg., S. 468–473). Cham: Springer. http://doi. org/10.1007/978-3-319-59144-5_33.

Delphi-Märkte

147

Kloker, S., Klatt, F., Hoeffer, J., & Weinhardt, C. (2018a). Analyzing prediction market trading behavior to select Delphi-Experts. Foresight. http://doi.org/10.1108/FS-01-20180009. Kloker, S., Straub, T., Morana, S., & Weinhardt, C. (2018b). Fraud and manipulation prevention in prediction markets. In Proceedings of the 13th international conference, DESRIST 2018, Chennai, India, June 3–6, 2018 (S. 1–6). Kloker, S., Straub, T., Morana, S., & Weinhardt, C. (2018c). The effect of social reputation on retention: Designing a social real-time Delphi platform. In Proceedings of the 26th European conference on information systems (ECIS2018), Portsmouth, UK, 2018. Kochtanek, T. R., & Hein, K. K. (1999). Delphi study of digital libraries. Information Processing and Management, 35(3), 245–254. https://doi.org/10.1016/S03064573(98)00060-0. Kranz, T. T., Teschner, F., Roüast, P., & Weinhardt, C. (2014a). Identifying individual party preferences in political stock markets. In Proceedings of the IADIS international conference on E-Society. (Madrid, Spain) (S. 162–169). Kranz, T. T., Teschner, F., & Weinhardt, C. (2014b). Combining prediction markets and surveys: An experimental study. In Proceedings of the European conference on information systems (ECIS) 2014, Tel Aviv, Israel, June 9–11, 2014. Laskey, K. B., Hanson, R., & Twardy, C. (2015). Combinatorial prediction markets for fusing information from distributed experts and models. In Proceedings of the 18th international conference on information fusion (Fusion) (S. 1892–1898). Levin, I. P., Chapman, D. P., & Johnson, R. D. (1988). Confidence in judgments based on incomplete information: An investigation using both hypothetical and real gambles. Journal of Behavioral Decision Making, 1(1), 29–41. https://doi.org/10.1002/ bdm.3960010105. Linstone, H. A., & Turoff, M. (2002). The Delphi method: Techniques and applications. Reading: Addison-Wesley. Luckner, S., & Weinhardt, C. (2007). How to pay traders in information markets: Results from a field experiment. Journal of Prediction Markets, 1(2), 147–156. http://econpapers.repec.org/RePEc:buc:jpredm:v:1:y:2007:i:2:p:147-156. Luckner, S., Kratzer, F., & Weinhardt, C. (2005). STOCCER-A forecasting market for the FIFA World Cup 2006. In 4th Workshop on e-Business (WeB 2005), Las Vegas, USA. Mullen, P. M. (2003). Delphi: Myths and reality. Journal of Health Organization and Management, 17(1), 37–52. https://doi.org/10.1108/14777260310469319. Niemeyer, C., Wagenknecht, T., Teubner, T., & Weinhardt, C. (2016). Participatory crowdfunding: An approach towards engaging employees and citizens in institutional budgeting decisions. In Proceedings of the annual Hawaii international conference on system sciences (S. 2800–2808). http://doi.org/10.1109/HICSS.2016.351. Okoli, C., & Pawlowski, S. D. (2004). The Delphi method as a research tool: An example, design considerations and applications. Information & Management, 42(1), 15–29. https://doi.org/10.1016/j.im.2003.11.002. Prokesch, T., von der Gracht, H. A., & Wohlenberg, H. (2015). Integrating prediction market and Delphi methodology into a foresight support system — Insights from an online game. Technological Forecasting and Social Change, 97, 47–64. https://doi. org/10.1016/j.techfore.2014.02.021.

148

S. Kloker et al.

Reid, N. (1988). The Delphi technique: Its contribution to the evaluation of professional practice. In R. Ellis (Hrsg.), Professional competence and quality assurance in the caring professions (S. 230–254). London: Chapman & Hall. http://doi. org/10.1016/0020-7489(90)90106-S. Rhode, P. W., & Strumpf, K. S. (2004). Historical presidential betting markets. Journal of Economic Perspectives, 18(2), 127–141. http://www.aeaweb.org/articles ?id=10.1257/0895330041371277. Servan-Schreiber, E. (2017). Debunking three myths about crowd – Based forecasting. In Collective intelligence conference, Brooklyn, New York, USA. Servan-Schreiber, E., Wolfers, J., Pennock, D. M., & Galebach, B. (2004). Prediction markets: Does money matter? Electronic Markets, 14(3), 243–251. https://doi.org/10.1080/ 1019678042000245254. Shrier, D., Adjodah, D., Wu, W., & Pentland, A. (2016). Prediction markets. http://cdn. resources.getsmarter.ac/wp-content/uploads/2016/08/mit_prediction_markets_report. pdf. Slamka, C., Jank, W., & Skiera, B. (2012). Second-Generation prediction markets for information aggregation: A comparison of payoff mechanisms. Journal of Forecasting, 31, 469–489. https://doi.org/10.1002/for.1225. Sniezek, J. A. (1990). A comparison of techniques for judgmental forecasting by groups with common information. Group & Organization Studies, 15(1), 5–19. https://doi. org/10.1177/105960119001500102. Sprenger, T., Bolster, P., & Venkateswaran, A. (2007). Conditional prediction markets as corporate decision support systems – An experimental comparison with group deliberation. Journal of Prediction Markets, 1(3), 189–208. https://doi.org/10.5750/jpm. v1i3.428. Surowiecki, J. (2005). The wisdom of crowds. New York: Anchor. Teschner, F., & Weinhardt, C. (2012). Evaluating hidden market design. In P. Coles, S. Das, S. Lahaie, & B. Szymanski (Hrsg.), Auctions, market mechanisms, and their applications (Bd. 80, S. 5–17). Berlin: Springer. http://doi.org/10.1007/978-3-642-30913-7_3. Teschner, F., Stathel, S., & Weinhardt, C. (2011). A prediction market for macro-economic variables. In Proceedings of the Annual Hawaii international conference on system sciences (S. 1–9). http://doi.org/10.1109/HICSS.2011.23. Vernon, W. (2009). The Delphi technique: A review. International Journal of Therapy and Rehabilitation, 16(2), 69–76. http://doi.org/10.12968/ijtr.2009.16.2.38892. Welty, G. (1972). Problems of selecting experts for Delphi exercises. Academy of Management Journal, 15(1), 121–124. Woudenberg, F. (1991). An evaluation of Delphi. Technological Forecasting and Social Change, 40(2), 131–150. Winkler, J., & Moser, R. (2016). Biases in future-oriented Delphi studies: A cognitive perspective. Technological Forecasting and Social Change, 105, 63–76. https://doi. org/10.1016/j.techfore.2016.01.021. Wolfers, J., & Zitzewitz, E. (2006). Interpreting prediction market prices as probabilities (Working Paper Series). http://www.nber.org/papers/w12200.

Teil II Anwendungsbeispiele für Delphi-Verfahren

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft Methodik und Ergebniszusammenfassung einer Delphi-Erhebung im Bereich Public Private Health Johannes Leinert, Alexander Rommel und Helmut Schröder Zusammenfassung

Mit der Studie „Public Private Health“ sollte die Frage beantwortet werden, welche Folgen demografischer, sozialer, technischer und ökonomischer Wandel aus Expert_innensicht für künftige Qualifikationsanforderungen der Beschäftigten in Ausbildungsberufen im Gesundheitswesen und den angrenzenden Bereichen haben. Dieser Fragestellung wurde im Rahmen der Studie mit einem Methodenmix aus qualitativen und quantitativen Ansätzen nachgegangen. Das Kernelement der Studie bildete eine mehrstufige Delphi-Befragung, in der rund 1500 Expert_innen um ihre Einschätzungen gebeten wurden. Dazu wurde ein differenzierter Stichprobenplan entwickelt, auf dessen Basis eine geschichtete Stichprobe aus 19 Haupt- und 75 Unterschichten gezogen wurde. In der qualitativ ausgerichteten ersten Delphi-Runde wurden Expert_innenmeinungen über qualifikationsrelevante Entwicklungen im deutschen Gesundheitssystem gesammelt, die in der quantifizierenden

J. Leinert (*) · H. Schröder  infas Institut für angewandte Sozialwissenschaft GmbH, Bonn, Deutschland E-Mail: [email protected] H. Schröder E-Mail: [email protected] A. Rommel  Robert Koch-Institut; ehem. Wissenschaftliches Institut der Ärzte Deutschlands (WIAD) gem. e. V., Berlin, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_7

151

152

J. Leinert et al.

zweiten Delphi-Runde hinsichtlich ihrer Eintrittswahrscheinlichkeiten und Auswirkungen auf Qualifikationsbedarfe bewertet wurden. Die in Delphi-Verfahren übliche dritte Befragungsrunde wurde durch drei Expert_innenworkshops ersetzt. In diesem Beitrag wird primär die methodische Vorgehensweise der Studie beschrieben. Der Schwerpunkt liegt auf der Erläuterung des Studiendesigns, der Expert_innenauswahl und der Operationalisierung der Fragestellung. Darüber hinaus werden die wichtigsten Studienergebnisse zusammengefasst. Schlüsselwörter

Delphi-Verfahren · Methode · Stichprobe · Operationalisierung ·  Gesundheitswesen · Qualifikation · Szenario-Technik

1 Einleitung In diesem Beitrag wird die methodische Vorgehensweise der Studie „Public Private Health“ (PPH) beschrieben, die vom infas Institut für angewandte Sozialwissenschaft (infas) und dem Wissenschaftlichen Institut der Ärzte Deutschlands (WIAD) im Jahr 2011 im Auftrag des Bundesministeriums für Bildung und Forschung (BMBF) erstellt wurde. Im Mittelpunkt der Studie stand die Frage, welche Folgen demografischer, sozialer, technischer und ökonomischer Wandel für die Tätigkeitsfelder, Aufgabenzuschnitte und Qualifikationsanforderungen der Beschäftigten im Gesundheitswesen und den angrenzenden Bereichen (z. B. Pflege, Altenhilfe, Wellness) haben. Im Fokus standen dabei Beschäftigte der „mittleren“ Ebene (Ausbildungsberufe), also beispielsweise medizinische Fachangestellte, Pflegefachkräfte, Sozialarbeiter_innen, Ernährungsberater_innen und nicht ärztliche bzw. nicht akademische Therapeut_innen. Dieser Forschungsfrage wurde im Rahmen der PPH-Studie mit einem Methodenmix aus qualitativen und quantitativen Ansätzen nachgegangen. Das Kernelement der Studie bildete eine mehrstufige Delphi-Befragung, mit der Expert_inneneinschätzungen über qualifikationsrelevante Entwicklungen und künftige Qualifikationsbedarfe gewonnen werden sollten. In den folgenden Ausführungen wird näher beschrieben, wie dabei vorgegangen wurde. Ausgehend von der Fragestellung wird das Studiendesign begründet und dargestellt, wie mit den besonderen Anforderungen umgegangen wurde, die sich in der PPH-Studie insbesondere für die Stichprobengenerierung und die Operationalisierung der Forschungsfrage ergaben.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

153

In Kap. 2 werden zunächst die Fragestellung und Zielsetzung der Studie beschrieben, bevor der Forschungsgegenstand abgegrenzt wird. In Kap. 3 werden Studiendesign und Methode vorgestellt, in Kap. 4 wird die Auswahl der Expert_ innen beschrieben. In Kap. 5 wird die Operationalisierung der Forschungsfragestellung erläutert. In Kap. 6 wird der Feldverlauf der Delphi-Runden zusammengefasst. In Kap. 7 werden einige zentrale Ergebnisse der PPH-Studie vorgestellt. Die folgenden Ausführungen müssen sich auf eine zusammenfassende Darstellung beschränken. Für eine ausführliche Studienbeschreibung sei auf den umfangreichen Abschlussbericht der PPH-Studie von Klaes et al. (2011) verwiesen, der in weiten Teilen die Grundlage für die vorliegenden Erläuterungen darstellt. Dort findet sich auch eine ausführliche Darstellung der inhaltlichen Studienergebnisse und eine Dokumentation der Erhebungsmaterialien. Die Studie und ihre Ergebnisse werden auch in Klaes et al. (2013) beschrieben; eine speziell auf den Pflegebereich fokussierte Zusammenfassung findet sich in Schüler et al. (2013).

2 Hintergrund 2.1 Fragestellung und Zielsetzung der Studie Die PPH-Studie wurde im Rahmen der BMBF-Initiative „Früherkennung von Qualifikationserfordernissen im Netz (FreQueNz)“ gefördert. Diese Initiative sollte gewissermaßen als „Frühwarnsystem“ beizeiten erkennen, wenn sich Anforderungen an die beruflichen Qualifikationen der mittleren Qualifikationsebene verändern. Mit der PPH-Studie sollten dabei unter anderem Expert_inneneinschätzungen zu der Frage eingeholt werden, „wie sich markante technologische, organisatorische und gesellschaftliche Veränderungen auf Tätigkeiten und Qualifikationsanforderungen der Beschäftigten im Gesundheitssystem auswirken werden.“ (Klaes et al. 2011, S. 26). Im Fokus standen dabei Beschäftigte der „mittleren“ Qualifikationsebene (Ausbildungsberufe).1 Vor diesem Hintergrund wurde mit der PPH-Studie zusammenfassend folgende Fragestellung untersucht:

1Damit

gemeint waren „Fachkräfte mit Abschlüssen in einem anerkannten Ausbildungsberuf (nach BBiG/HwO), in einem der bundeseinheitlich geregelten nicht ärztlichen Heilberufe (nach § 74 Abs. 1 Nr. 19 GG) oder in einem der länderrechtlich geregelten schulischen Ausbildungsgänge sowie Absolventen mit Fortbildungsabschlüssen.“ (Klaes et al. 2011, S. 3).

154

J. Leinert et al.

Welche Qualifikationsanforderungen ergeben sich auf mittlere Sicht (5–10 Jahre) für die mittlere Ebene (Ausbildungsberufe) im Gesundheitswesen und den angrenzenden Bereichen?

Ziel der Studie war die Bereitstellung einer empirisch fundierten Informationsbasis über sich abzeichnende Veränderungen der Arbeitswelt und Bedarfe zur Anpassung von Qualifikationen, auf deren Grundlage das BMBF sowohl weitere Forschungsbedarfe definieren als auch prüfen konnte, ob Berufsordnungen angepasst oder neue Berufsbilder entwickelt werden sollten. Um dieser Anforderung gerecht zu werden, war für die Einholung von Expert_innenmeinungen ein Studiendesign zu entwickeln, dass geeignet war, mit künftigen Entwicklungen Sachverhalte zu erheben, die sich naturgemäß der Beobachtung entziehen. Auch sollte die Erhebung offen sein für die gesamte Bandbreite möglicher und vermutlich dissonanter Einschätzungen; gerade bei einer Befragung von Akteur_innen im stark hierarchisch organisierten Gesundheitswesen war also darauf zu achten, dass nicht die Einschätzungen und Positionen bestimmter Berufsgruppen das Ergebnis der Erhebung insgesamt dominieren. Zudem sollten innovative Entwicklungen auch dann aufgespürt werden, wenn diese bislang noch weitgehend unbekannt waren und erst einer kleinen Anzahl von Expert_innen erwähnenswert schienen. Daher war es wichtig, im Sinne eines Screening-Ansatzes möglichst alle vorhandenen Positionen einzubeziehen.

2.2 Abgrenzung des Forschungsgegenstandes Ausgangspunkt für die im Folgenden skizzierte Abgrenzung des Forschungsgegenstandes (Klaes et al. 2011, S. 29–30) war die Annahme, dass ein komplexes Gefüge aus demografischem, soziostrukturellem, technischem und ökonomischem Wandel als Treiber für Veränderungen im Gesundheitswesen und seinen angrenzenden Bereichen wirkt. Daraus ergeben sich veränderte Anforderungen an die Ausübung ganz konkreter Tätigkeiten, die in einem oder mehreren Leistungsbereichen (z. B. Pflege) in einer oder mehreren Institutionen (z. B. Altenheime) durch eine oder mehrere Berufsgruppen (z. B. Altenpfleger_in) ausgeübt werden. Es liegt nahe, dass sich wandelnde Arbeitsanforderungen in den Leistungsbereichen dazu führen, dass die Arbeitsorganisation restrukturiert wird. Dies kann dazu führen, dass sich die Arbeitsteilung zwischen bestehenden Institutionen verändert oder neue Institutionen entstehen und/oder dass Tätigkeiten zwischen

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

155

bestehenden Berufen verlagert werden und/oder neue Berufe erforderlich werden. In der Folge kann davon ausgegangen werden, dass gänzlich neue Qualifikationen entstehen oder dass bestehende Qualifikationen auf Berufsgruppen übertragen werden, welche diese bisher nicht benötigten. Dabei sind Verlagerungen von einem Tätigkeitsbereich zu einem anderen sowohl auf horizontaler Ebene auf gleicher Hierarchiestufe, als auch auf vertikaler Ebene zwischen den Berufs- bzw. Professionsstufen denkbar. Aus diesen Überlegungen folgt, dass sich die veränderten Qualifikationsanforderungen in einem dreidimensionalen Raum ergeben, der aufgespannt wird durch die beschriebenen Dimensionen: • •

Leistungsbereiche z. B. Prävention, Diagnostik, Kuration, Rehabilitation, Pflege, Pallation, etc. Berufe bzw. Berufsfelder Pflegeberufe, nicht-ärztliche Heilberufe, sozialpflegerische Berufe, technische Berufe, etc. • Organisationen z. B. Krankenhäuser, Arztpraxen, medizinische Versorgungszentren, ambulante Dienste, etc. Dieses Modell war eine gute Grundlage sowohl für die Entwicklung des Stichprobenplans zur Auswahl der zu befragenden Expert_innen als auch für die Entwicklung der Analyseschemata zur Auswertung der qualitativen Studienelemente. Erhebungsinstrumente, die auf ein solches dreidimensionales Modell zurückgreifen, wären jedoch für die Befragten zu komplex ausgefallen. Daher wurde das dreidimensionale Modell zu diesem Zweck in ein sequenzielles Modell überführt (siehe Abb. 1).

3 Studiendesign und Methode Die folgenden Abschnitte beginnen mit einer theoretischen Einordnung. Zunächst wird erläutert, warum – ausgehend von der Fragestellung – als Kernelement der Studie ein Delphi-Verfahren zur Anwendung kam. Anschließend wird darauf eingegangen, welchem Typ von Delphi-Verfahren die Studie zuzurechnen war und was daraus für das Studiendesign folgte. Anschließend wird das Studiendesign der PPH-Studie vorgestellt.

156

J. Leinert et al.

Abb. 1   Operationalisierung des Forschungsgegenstandes. (Quelle: eigene Darstellung nach Klaes et al. 2011, S. 30.)

3.1 Theoretische Einordnung Ziel der Studie war es, Expert_inneneinschätzungen darüber zu gewinnen, mit welchen Entwicklungslinien im Gesundheitssystem und seinen angrenzenden Bereichen künftig zu rechnen ist, und welche geänderten Qualifikationsanforderungen auf der mittleren Ebene damit verbunden sind. Zur Gewinnung von Expert_inneneinschätzungen kommen grundsätzlich mit Gruppendiskussionen, einfachen Expert_innenbefragungen und Delphi-Befragungen unterschiedliche Erhebungsvarianten in Betracht, die jeweils mit spezifischen Vor- und Nachteilen verbunden sind. In der nachfolgenden Tab. 1 werden die Charakteristika dieser drei Erhebungsvarianten in Anlehnung an Häder (2014, S. 66) zusammengefasst. Eine Gruppendiskussion schied zur Beantwortung der Fragestellung aus. Zum einen war die Anonymität der Befragung erforderlich, um eine Beeinflussung der Ergebnisse durch hierarchisch höher gestellte Berufsgruppen oder Meinungsführer_innen zu vermeiden. Zum waren für das Aufspüren innovativer, noch weitgehend unbekannter Entwicklungen hohe Fallzahlen erforderlich. Da die die

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

157

Tab. 1   Varianten von Expert_innenbefragungen im Vergleich Kriterium

Gruppendiskussion Expert_ Delphiinnenbefragung Befragung

Anonymität

nein

ja

ja

Beeinflussung durch Meinungsführer

ja

nein

nein

Beeinflussung durch Konformitätszwang

ja

nein

nur eingeschränkt

Möglichkeit hoher Fallzahlen

nein

ja

ja

Möglichkeit zu Feedback

ja

nein

ja

Möglichkeit, gezielt kognitive Prozesse auszulösen

ja

nein

ja

Zeitbedarf

gering

gering

hoch

Quelle: eigene Darstellung auf Basis von Häder (2014, S. 66)

Einschätzungen aller Expert_innen zu künftigen Entwicklungen in einer weiteren Erhebungsrunde zurückgebunden und bewertet werden sollten, kam eine „einfache“ Expert_innenbefragung ebenfalls nicht infrage. Zur Beantwortung der Fragestellung war vielmehr ein Delphi-Verfahren erforderlich. Die Grundidee von Delphi-Verfahren „besteht darin, in mehreren Wellen Expertenmeinungen zur Problemlösung zu nutzen und sich dabei eines anonymen Feedbacks zu bedienen“ (Häder 2014, S. 22). In der Literatur besteht in weiten Teilen Konsens drüber, dass „klassische“ Delphi-Verfahren durch folgende Schritte gekennzeichnet sind (Häder 2014, S. 24 f.): • Operationalisierung der allgemeinen Problemstellung, um konkrete Kriterien abzuleiten, die den Expert_innen in der standardisierten Befragung zur Beurteilung vorgelegt werden können • Entwicklung des Erhebungsinstrumentes für die standardisierte Expert_innenbefragung • Aufbereitung und anonymisierte Rückmeldung • Wiederholung der Befragung Auch wenn das Delphi-Verfahren bereits in den 1950er Jahren entwickelt wurde, gibt es bis heute keine einheitliche Begriffsdefinition (Niederberger und Renn 2018, S. 7). Vielmehr wurde es in einer Vielzahl von Studien weiterentwickelt

158

J. Leinert et al.

und studienspezifisch angepasst, so dass zahlreiche Varianten existieren. Zum Variantenreichtum des Delphi-Verfahrens tragen unterschiedliche Herangehensweisen insbesondere hinsichtlich der folgenden Designmerkmale bei: Auswahl und Anzahl der befragten Expert_innen, Anzahl der Befragungswellen, Ausgestaltung des Feedbacks an die Expert_innen, Abfrage der Selbsteinschätzung der Befragten zu ihrer Expertise, Abbruch- bzw. Konsenskriterien, zu bearbeitenden Aufgabenstellungen sowie Einsatz von Workshops zur Erhebung und Diskussion der Daten (Häder 2014, S. 25). Mit einer Typologie von Delphi-Verfahren unternimmt Häder (2014, S. 30–36) den Versuch, diese Vielfalt zu strukturieren (siehe Tab. 2). In dieser Typologie entspricht die PPH-Studie dem Typ 3, da die Ermittlung von Expert_ innenmeinungen im Vordergrund stand.

3.2 Umsetzung der studienspezifischen Anforderungen Mit der Zielsetzung der Delphi-Studie (Ermittlung von Expert_innenmeinungen) waren gemäß der Delphi-Typologie bereits zentrale Anforderungen an die Ausgestaltung der Studie definiert: Entscheidend war eine möglichst exakte Operationalisierung der zu bearbeitenden Fragestellung, für welche die qualitative Delphi-Runde genutzt werden konnte. Auf dieser Basis war ein standardisiertes Erhebungsinstrument mit überwiegend geschlossenen Fragen zu entwickeln (siehe Kap. 5). Zudem waren Kriterien für die bewusste Auswahl der zu befragenden Expert_ innen zu erarbeiten, da eine Vollerhebung angesichts der Größe der Grundgesamtheit – definiert als Personen mit Expertise im Gesundheitswesen und den angrenzenden Bereichen – nicht möglich war. Um die Expertise aller für die Fragestellung relevanten Akteursgruppen in die Studie einzubeziehen, war eine differenzierte, nach mehreren Kriterien geschichtete Stichprobe mit ausreichenden Fallzahlen in allen Subgruppen erforderlich. Hinsichtlich der zu erwartenden Antwortausfälle wurde eine Bruttostichprobe von n = 1500 festgelegt (siehe Kap. 4). Mit der PPH-Studie sollten im Sinne eines Screening-Ansatzes auch bislang weitgehend unbekannte Entwicklungen möglichst vollständig aufgespürt und durch alle Teilnehmenden bewertet werden. Mit der im Vorfeld der Delphi-Studie geplanten Literaturrecherche und qualitativen Expert_innenbefragung konnte dies nach Einschätzung des Projektteams nur teilweise gelingen. Daher wurde bewusst entschieden, die qualitative erste Delphi-Runde nicht bei einer kleinen Substichprobe vorzunehmen, sondern bereits in diesem Stadium die gesamte Bruttostichprobe zu den interessierenden Entwicklungen zu befragen. Erst dadurch war

Expertise

Kaum erforderlich

Ausschließlich qualitativ Kann zur Operationalisierung genutzt werden

Offene Fragen

Operationalisierung

Qualitative DelphiRunden

Fragentyp

Quelle: Eigene Darstellung auf Basis von Häder (2014, S. 37)

Überwiegend geschlossene Fragen

Möglichst exakte Operationalisierung der zu bearbeitenden Fragestellung

Hypothesen nötig, Regeln Vollerhebung oder nicht formalisierbar bewusste Auswahl

Ermittlung und Qualifikation von Expert_ innenmeinungen

Kriterium für Auswahl der Expert_innen

Verbesserung bei der Bestimmung eines Sachverhaltes (Vorhersagen)

Ideensammlung zur Problemlösung

Typ 3: Ermittlung von Expert_ innenmeinungen

Ziel

Typ 2: Bestimmung eines Sachverhaltes

Typ 1: Ideen-Aggregation

Kriterium

Tab. 2   Typen von Delphi-Verfahren nach Häder (2014)

Nur geschlossene Fragen

Kann entfallen, wird vom Monitoring-Team übernommen

Stark differenzierte Operationalisierung

Mittels bestimmbaren Rahmens möglich

Hohe Übereinstimmung bei den Teilnehmern

Typ 4: Konsens-Bildung

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft 159

160

J. Leinert et al.

sichergestellt, dass den Expert_innen in der standardisierten zweiten Delphi-Runde möglichst alle qualifikationsrelevanten Entwicklungen zur Bewertung vorgelegt werden konnten. Mit diesen beiden Delphi-Runden wurde den Expert_innen bereits ein sehr hohes Maß an Motivation und Mitwirkungsbereitschaft abverlangt. Um die Belastung der Befragten in Grenzen zu halten und um ihre Mitwirkung an beiden Erhebungsrunden zu sichern, wurde auf eine weitere standardisierte Rückmeldung und erneute Bewertung durch die Expert_innenstichprobe verzichtet, die klassische Delphi-Verfahren meist noch vorsehen. Anstelle einer dritten Erhebungsrunde wurden drei Expert_innenworkshops abgehalten. Diese erlaubten eine vertiefende Diskussion und Bewertung der Befragungsergebnisse und eine Erörterung der Konsequenzen, die sich aus den Einschätzungen zu den künftigen Entwicklungstrends für die Qualifizierung der Beschäftigten im Gesundheitswesen ergeben (Klaes et al. 2011, S. 69).

3.3 Überblick über das Studiendesign Das Studiendesign bestand aus einem Methodenmix aus qualitativen und quantitativen Erhebungen, die mehrstufig angelegt waren (siehe Abb. 2). Die ersten beiden Studienmodule dienten dazu, den aktuellen Sachstand der Diskussion

Abb. 2   Überblick über das Studiendesign. (Quelle: Klaes et al. 2011, S. 57)

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

161

und die unterschiedlichen Positionen und Argumentationslinien hinsichtlich der Veränderungen der Qualifikationserfordernisse zu ermitteln und daraus erfahrungsgesättigte Hypothesen abzuleiten. Zu diesem Zweck wurde zunächst eine Literaturrecherche und -analyse vorgenommen. Anschließend wurden leitfadenbasierte, qualitative Interviews mit Expert_innen in Schlüsselpositionen aus zentralen Institutionen des Gesundheitssystems und der angrenzenden Bereiche durchgeführt (Klaes et al. 2011, S. 56). Das Kernelement der PPH-Studie bildete ein darauf aufbauender dreistufiger Delphi-Prozess, der aus einer qualitativen und quantitativen Befragung einer Brutto-Stichprobe von etwa 1500 Expert_innen sowie drei abschließenden Expert_innenworkshops bestand. In der ersten Delphi-Runde wurden die Expert_ innenvorstellungen über zukünftige Entwicklungen im Gesundheitswesen und damit verbundene Qualifikationserfordernisse für die Beschäftigten auf der mittleren Ebene in einem Fragebogen mit offenen Fragen erhoben (Klaes et al. 2011, S. 56). Der standardisierte Fragebogen für die zweite Delphi-Runde wurde auf Basis einer inhaltsanalytischen Auswertung der ersten Delphi-Runde erstellt und ebenfalls an die Bruttostichprobe der ersten Delphi-Runde versendet. Die im standardisierten Fragebogen enthaltenen Aussagen sollten von den Befragten dahin gehend bewertet werden, für wie wahrscheinlich und wie handlungsrelevant sie jeweils das Eintreten der in der ersten Delphi-Runde benannten Entwicklungen und deren die Auswirkungen auf die Qualifikationsanforderungen hielten (Klaes et al. 2011, S. 56). Der standardisierte Fragebogen für die zweite Delphi-Runde wurde auf Basis der Ergebnisse der ersten Delphi-Runde erstellt. Dazu wurden – nach einer inhaltsanalytischen Aufbereitung und Hypothesenbildung – die Antworten der ersten Runde zu einem standardisierten Fragebogen verdichtet, der ebenfalls an die Bruttostichprobe der ersten Runde versendet wurde. Dadurch enthielten alle Befragten Kenntnis über die Entwicklungen und ihre Folgen für die Qualifikationsanforderungen, die von den anderen Expert_innen in der ersten Runde genannt worden waren. Durch die standardisierte Erhebung in der zweiten Runde beantworteten jetzt alle Teilnehmenden dieselben Sachverhalte vor ihrem spezifischen Erfahrungshintergrund. Dadurch kam quasi eine standardisierte, schriftliche Gruppendiskussion zustande (Klaes et al. 2011, S. 66). Abschließend wurden die Ergebnisse der zweiten Delphi-Runde auf drei Workshops diskutiert und vertieft.

162

J. Leinert et al.

4 Stichprobe 4.1 Vorgehensweise bei der Auswahl der Expert_innen Die Erstellung der Expert_innenstichprobe erfolgte in einem mehrstufigen Prozess. Zunächst wurde definiert, wer als „Expertin“ oder „Experte“ gilt. Anschließend wurden konkrete Kriterien entwickelt, anhand derer die Auswahl erfolgen sollte. Danach wurde auf Basis dieser Kriterien ein Konzept für eine geschichtete Stichprobe entwickelt. Für jede Schicht wurde die Auswahlgesamtheit recherchiert, aus der anschließend die Stichprobenziehung erfolgte. Schließlich wurde die Stichprobe noch aufbereitet. Diese Aufbereitung umfasste insbesondere die Ermittlung der konkreten Ansprechpartner_innen und ihrer Adressdaten sowie eine abschließende Bereinigung der Stichprobe um etwaige Doppelungen. Als Personen mit Expert_innenstatus wurden „Akteure des Systems verstanden, die aufgrund ihrer Tätigkeit in Verbänden, Organisationen oder auch als praktisch Handelnde Expertise für die Untersuchungsfragen entwickelt haben“ (Klaes et al. 2011, S. 57). Für die Auswahl der solchermaßen definierten Expert_innengruppe wurden als Kriterien definiert, dass erstens – entsprechend dem Modell des dreidimensionalen Raums der Qualifikationsanforderungen wie in Abschn. 2.2 beschrieben – in der Stichprobe Expert_innen aus allen Leistungsbereichen, Organisationen und Berufsfeldern vertreten sein sollten und zweitens Akteure der normativen, strategischen und operativen Ebene einbezogen werden sollten. Der Definition der Auswahlkriterien lagen zwei Überlegungen zugrunde. Aufgrund ihrer Aufgaben in der Gesundheitsversorgung, in Verbänden, Aufsichtsgremien oder in Wissenschaft und Ausbildung ist Expert_innen der Blick auf ganze Leistungsbereiche des Gesundheitssystems, auf einzelne Berufe bzw. Berufsfelder oder auf Arbeitsorganisationen näher. So könnte z.B. der Fokus von Fachvertreter_ innen eines Heilberufs vermutlich eher auf dieses Berufsfeld und den Arbeitsmarkt gerichtet sein, während der Blick von medizinischen oder pflegerischen Lehrkräften mutmaßlich eher auf die Leistungsbereiche und jener der Entscheidungsträger_ innen vermutlich eher auf die Arbeitsorganisation gerichtet sein. Die Expertinnen und Experten sind je nach institutioneller Situierung und Funktion eher in einer operativen, strategischen oder normativen Funktion tätig. Es ist zu erwarten, dass die Vertreter von Berufs- und anderen Verbänden, die beruflich eher mit den Wandlungsprozessen zu tun haben, sei es, dass sie diese wissenschaftlich analysieren, technische Entwicklungen vorantreiben oder ökonomische Steuerungsinstrumente kreieren, vorwiegend der normativen und strategischen Ebene des Gesundheits- und Pflegesystems angehören. Zugespitzt formuliert dürften diese in Hinblick auf den Leistungsbereich eher eine disponierende Einstellung haben mit der Intention, so weit wie möglich den Wandel zu steuern. Dagegen steht

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

163

zu erwarten, dass Expert_innen, die in erster Linie eine berufliche Nähe zur praktischen Leistungserbringungen haben, eher eine reorganisierende Perspektive einnehmen, indem sie auf Wandlungsdruck reagieren und versuchen, die Folgen des Wandels durch Neustrukturierung der Aufgaben bzw. Organisation den veränderten Bedingungen anzupassen (Klaes et al. 2011, S. 58).

Auf dieser Basis wurde ein Stichprobenkonzept entwickelt, das insgesamt 18 Stichprobenschichten plus eine Restkategorie sowie 75 Untergruppen enthielt (siehe nachfolgendes Kapitel). Mit dieser detaillierten Untergliederung sollte die einzubeziehende Expertise möglichst transparent und vollständig definiert werden. Zudem ermöglichte die tabellarische Übersicht die Stichprobenzusammensetzung eine intersubjektive Prüfung, ohne dass Namen und Institutionen offengelegt werden müssen, was die zugesagte Vertraulichkeit und den Datenschutz verletzt hätte (Klaes et al. 2011, S. 58). Für jede Stichprobenschicht bzw. deren Untergruppen begann anschließend die Recherche der Auswahlgesamtheit, aus der später die Stichprobe gezogen wurde. Ausgangspunkt der Recherche waren dabei in der Regel die Institution, in der die Expert_innen verortet waren sowie die Funktion, die sie innerhalb dieser Institution ausübten. Im Idealfall existierten auf Ebene der Institutionen vollständige Listen der interessierenden Grundgesamtheit, sodass die Auswahlgesamtheit identisch mit der jeweiligen Grundgesamtheit war. Dies war z. B. bei Krankenkassen, Ärzteoder Apothekerkammern oder kassenärztlichen Vereinigungen der Fall. In der Regel existierten solche Listen jedoch nicht. Dann wurden, wenn möglich, als Auswahlgrundlage Listen herangezogen, die zumindest einen großen Teil der Grundgesamtheit abdecken. Dabei handelte es sich beispielsweise um Mitgliederlisten von Verbänden, in denen ein großer Teil der Grundgesamtheit organisiert ist (z. B. Bundesverband der Arzneimittelhersteller, Verband medizinischer Fachberufe, Deutsches Netzwerk Versorgungsforschung) oder um Akkreditierungslisten von Akteur_innen im Gesundheitswesen (z. B. medizinische Laboratorien). Wenn derartige Listen nicht vorlagen oder als zu unvollständig eingeschätzt wurden, verblieb als zusätzliche Recherchemöglichkeit eine Internetrecherche nach Schlagwörtern (z. B. Lehrstühle für „Versorgungsforschung“). Nachdem für jede Untergruppe die Auswahlgesamtheit recherchiert worden war, wurde daraus die – nach Untergruppen geschichtete – Stichprobe gezogen. Bei sehr gering besetzten Untergruppen wurden alle recherchierten Institutionen bzw. Personen in die Stichprobe übernommen. In einem großen Teil der Fälle stand in diesem Stadium jedoch erst fest, welche Funktion der bzw. die zu befragende Experte bzw. Expertin in welcher Institution bekleidet; welche konkrete Person sich hinter einer bestimmten Funktion verbarg (z. B. Pflegerische

164

J. Leinert et al.

Leitung eines bestimmten Krankenhauses), war dagegen unbekannt. Nur in einem Teil der Fälle war von vornherein bekannt, welche konkrete Zielperson befragt werden sollte (z. B. Inhaber_innen des Lehrstuhls für Versorgungsforschung einer bestimmten Universität). Daher wurden zunächst – in der Regel per Internetrecherche – die Adress- und Kontaktdaten einer Zielperson in der interessierenden Institution recherchiert. In einer anschließenden Telefonrecherche wurde ermittelt, welche Person in der jeweiligen Institution die interessierende Funktion ausübt und somit als Expertin oder Experte in die Stichprobe einbezogen werden soll. In den meisten Fällen gelang es, diese Person namentlich zu recherchieren. War dies nicht möglich, wurde der Fragebogen der Delphi-Erhebung an eine bestimmte Funktion innerhalb der Institution versendet, die auf Basis von Organisationsplänen oder Internetverzeichnissen ermittelt worden war. (Klaes et al. 2011, S. 64). Abschließend erfolgte bei den namentlich bekannten Expert_ innen eine Bereinigung um Doppelungen.

4.2 Ergebnis der Expert_innenauswahl: Bruttostichprobe nach Haupt- und Untergruppen Die Erstellung der Bruttostichprobe wie im vorigen Kapitel beschrieben war ein langwieriger Prozess, der mehrere Monate in Anspruch nahm. Im Ergebnis umfasste die Bruttostichprobe n = 1508 Expert_innen. Die Struktur der Bruttostichprobe sowie die Zellbesetzung der jeweiligen Haupt- und Unterschichten sind in Abb. 3 dokumentiert. In der dritten Spalte ist darin zudem vermerkt, aus welchen Stichprobenschichten die Expert_innen für die 33 leitfadengestützten Interviews rekrutiert wurden.

5 Operationalisierung der Forschungsfrage Die Forschungsfrage wurde in einem mehrstufigen Prozess operationalisiert. Zunächst wurde in einer explorativen Phase auf Basis von Literaturrecherchen, Leitfadeninterviews und der ersten, qualitativen Delphi-Runde die allgemeine Problemstellung operationalisiert. Anschließend wurden auf dieser Grundlage Szenarien entwickelt und umfangreiche Itemlisten erarbeitet, anhand derer in der zweiten, quantitativen Delphi-Runde das Auftreten bestimmter Entwicklungen von den Expert_innen bewertet wurde.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

Hauptgruppe 1

2 3

4

5

6

7

8 9

10

11

12

13

14

Untergruppe 0 1 2 3 0 1 2 3 4 0 0 1 2 3 4 5 6 7 8 0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 0 1 2 3 4 5 6 0 0 1 2 3 0 1 2 3 4 0 1 2 3 4 5 0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 0 2 3 4 5

Auswahl für Experteninterviews x x

x

x x

x

x x

x x x x x

x x x x x

x

x x x

x

x x x

Krankenversicherungen KV gesetzlich/privat PV gesetzlich/privat Sonstige Ärzteschaft Kassenärztliche Vereinigungen Ärztekammern Interessenvertretungen Sonstige Zahnärzteschaft Krankenhaussektor (einschließlich Patientenhotels) KH: Ärztliche Leitung KH: Pflegerische Leitung KH: Kaufmännische Leitung Krankenhausträger (öffentliche, frei-gemeinnützige, private, auch FW) Krankenhausgesellschaften Qualitätssicherung im Krankenhaus Patientenhotels Sonstige Pflegesektor DPR- Der Deutsche Pflegerat Pflegeverbände (z.B. DBfK) Pflegelehrerverbände Ambulante Dienste (auch FW) Stationäre Pflegeeinrichtungen (auch FW) Qualitätssicherung in der Pflege Sonstige Pharmazeutischer Sektor Apothekerverbände Apothekenkammern Arzneimittelhersteller, -groß und -zwischenhändler Verband der forschenden Pharma-Unternehmen in Deutschland medizinische Labore (Großlabore) Sonstige Medizintechnik und Informationstechnologie Entwickler von Medizintechnik (Geräte) Entwickler von Medizintechnik (Hilfsmittel) Entwickler von Informationstechnologie Hersteller/Implementeure von Medizintechnik (Strategische Planung / Produktion) HomeCare Sonstige Psychotherapeutenschaft Bildungs- und Weiterbildungsbereich Weiterbildungsakademien (z.B. IST, Prävention) Deusche Angestellten Akademie (DAA) Sonstige Sonstige Heilberufe Ergotherapeuten (z.B. ErgoAkademie) Physiotherapeuten Logopäden Sonstige Medizinischen Fachberufe Arbeitsgemeinschaft der wissenschaftlich interessierten MFAs in der DEGAM Verband medizinischer Fachberufe e.V. Deutscher Verband Technischer Assistentinnen/Assistenten in der Medizin e.V. Hebammen Sonstige Wissenschaftliche Einrichtungen Lehrstühle, wissenschaftliche Institute (Pflegewissenschaft) Lehrstühle, wissenschaftliche Institute (Versorgungsforschung) Lehrstühle, wissenschaftliche Institute (Berufsforschung) BiBB Lehrstühle, wissenschaftliche Institute (Alternsforschung: DZA) Lehrstühle, wissenschaftliche Institute (Alternsforschung: Kompetenznetzwerk Köln/Bonn) Fraunhofer-Gesellschaft/-Institute Fachgesellschaften Sonstige Verwaltung und Aufsichtsbehörden obere Bundes- und Landesbehörden: Arbeit, Gesundheit, Soziales (z.B. Bundesagentur) obere Bundes- und Landesbehörden: Bildung/Ausbildung (z.B. für Ausbildung Zuständige) Öffentlicher Gesundheitsdienst Sonstige Vertretung von Betroffenen Behindertenverbände (Körperbehinderung) Verbraucher-/Patientenverbände (VZBV) Angehörigenverbände (z.B. Alzheimer-Initiativen, etc.) Sonstige

165

0 47 53 0 0 52 19 12 1 45 0 24 27 27 0 39 24 10 1 0 1 44 9 36 18 0 6 0 9 10 43 0 38 0 0 50 2 42 22 17 10 43 1 78 7 18 0 16 28 20 13 0 1 9 21 27 13 1 21 29 23 8 22 1 7 34 7 0 20 19 16 0 0 43 6 7 0

Anzahl Adressen insgesamt 100

84 45

152

114

100

143

43 104

77

71

153

55

56

Abb. 3   Struktur und Zellbesetzung der Expert_innenstichprobe. (Quelle: Klaes et al. 2011, S. 60; Banz et al. 2010, S. 45)

166

15 16 17

18

19 Insgesamt

J. Leinert et al. 0 1 2 3 0 0 1 2 3 4 0 1 2 3 4 5 0

x x x x

x x x

Tarifpartner Arbeitgeber Arbeitnehmer Sonstige Sozialarbeit Sektor Gesundheitsförderung Prävention und Wellness Gesundheitsförderung/Prävention Wellness Gesundheitshotels Sonstige Innovative Strukturen und Modellvorhaben Private Public Health Sektorenübergreifende Netzwerke Servicecenter Modellvorhaben Sonstige Weitere

0 27 36 2 30 0 15 40 12 0 0 2 7 3 34 0 3

65 30 67

46

3 1.508

Abb. 3   (Fortsetzung)

5.1 Literaturrecherche und -analyse Zu Beginn des Projektes wurde eine systematische Analyse von Veröffentlichungen vorgenommen. Zu diesem Zweck erfolgte eine Literaturrecherche, die sich nicht nur auf herkömmliche Publikationen stützte. Um einen möglichst vollständigen und aktuellen Stand einbeziehen zu können, schloss dies auch so genannte graue Literatur und Internetveröffentlichungen ein. Die Recherche erfolgte anhand eines Schlagwortkataloges, der sukzessive (weiter-)entwickeltet wurde (Klaes et al. 2011, S. 32). Anschließend wurden die recherchierten Veröffentlichungen eingehend analysiert; die Grundannahmen der Studie wurden auf dieser Basis kritisch geprüft und weiter differenziert. Aus den Erkenntnissen, die mit der Literaturrecherche und -analyse gewonnen wurden, wurden 52 Kernthesen abgeleitet, die zusammen mit den Ergebnissen der Leitfadeninterviews die Grundlage für die Entwicklung der Fragebögen für die Delphi-Erhebungen bildeten (siehe beispielhaft Abb. 4).

5.2 Leitfaden für die explorativen Expert_ inneninterviews Mit den qualitativ angelegten Expert_inneninterviews sollten zum einen die Ergebnisse der Literaturanalyse und die daraus abgeleiteten Kernthesen ergänzt werden oder aus dem Blickwinkel der Praxis modifiziert werden. Zum anderen sollten in den Interviews die Möglichkeiten und Grenzen von Expertise zur

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

167

Abb. 4   Entwicklung von Kernthesen aus der Literaturanalyse (Beispiel). (Quelle: Klaes et al. 2011, S. 71)

Beantwortung der Forschungsfrage ausgelotet werden. Damit unterstützte die Expert_innenbefragung unmittelbar die Entwicklung des Erhebungsinstruments für die erste Delphi-Runde. Für die Auswertung wurden die Expert_inneninterviews von infas und WIAD nach einem abgestimmten Analyseschema inhaltsanalytisch ausgewertet und in einer ACCESS-Datenbank aufgenommen. (Klaes et al. 2011, S. 62, 63). Der Leitfaden für die qualitativen Expert_inneninterviews wurde aufbauend auf dem operationalen Konzept zur Abgrenzung des Forschungsgegenstandes wie in Abschn. 2.2 skizziert und den Ergebnissen der Literaturanalyse entwickelt. Dokumentiert ist er in Klaes et al. (2011, S. 167–203). Nach einer kurzen Studienvorstellung und Abklärung der persönlichen Expertise – gefragt wurde nach beruflicher Position, Befassung mit der Thematik und weiteren relevanten Funktionen neben der Haupttätigkeit – wurden zunächst Hintergrund und Annahmen der Studie zu künftigen Entwicklungen im Gesundheitswesen

168

J. Leinert et al.

erläutert.2 Nach dieser Erläuterung sollten die Befragten Auskünfte auf die folgenden Leitfragen geben: • Welche Leistungsbereiche des Gesundheitssystems und der angrenzenden Bereiche sind von diesen Entwicklungen betroffen? • Wie wird sich die Relation zwischen öffentlicher und privater Versorgung verändern? • Welche Konsequenzen ergeben sich draus für die Tätigkeiten der dort Beschäftigten? • Welche neuen oder veränderten Anforderungen sind damit voraussichtlich für Erwerbstätige auf der mittleren Qualifikationsebene verbunden? Dabei wurden die Befragten gebeten, sich (zunächst) auf denjenigen Leistungsbereich zu beziehen, für den sie in den nächsten fünf bis sieben Jahren die größten Änderungen erwarteten bzw. für den sie die Leitfragen am besten beantworten konnten. Die erwarteten Veränderungen im gewählten Leistungsbereich sollten ungestützt beantwortet werden, d. h. ohne vorgegebene Antwortkategorien. Wurden vorab definierte zentrale Aspekte (beispielsweise Ursachen sowie fördernde und hemmende Faktoren für geschilderte Entwicklungen, eine möglichst genaue Beschreibung erwarteter Änderungen bei Arbeitsabläufen, Tätigkeiten und Qualifikationsanforderungen oder die Benennung der voraussichtlich betroffenen Berufsfelder und Qualifikationsbereiche) nicht angesprochen oder nicht erschöpfend beantwortet, stellten die Interviewer_innen standardisierte Nachfragen. Abschließend wurde danach gefragt, ob sich die eigene oder andere Institutionen bereits durch konkrete Planungen oder Konzepte auf die künftig zu erwartenden Entwicklungen einrichten.

5.3 Fragebogen für die erste Delphi-Runde In der ersten Delphi-Runde sollten, gemäß dem Screeningansatz, Expert_innenmeinungen über aktuelle und künftige Entwicklungen im deutschen Gesundheitssystem gesammelt und dadurch künftig relevante Aufgaben und Themen für das

2So

wurde erläutert, dass von veränderten Qualifikationserfordernisse für Ausbildungsberufe im Gesundheitssystem- und angrenzenden Bereichen in den nächsten 5–7 Jahren ausgegangen wird, die sich durch Wandlungsprozesse aufgrund von demografischem Wandel, einer Zunahme chronisch-degenerativer und psychischer Erkrankungen sowie technologischem Fortschritt ergeben.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

169

Berufsbildungssystem benannt werden. Dazu wurde ein achtseitiger Fragebogen zum selbst ausfüllen entwickelt, der in Klaes et al. (2011, S. 204 – 2013) dokumentiert ist. Der Fragebogen war als halbstandardisiertes Erhebungsinstrument mit offenen Fragen angelegt. Die Expert_innen sollten in eigenen Worten äußern, welche organisatorischen und technischen Änderungen sie im Gesundheitswesen im Prognosezeitraum erwarten und welche Auswirkungen sich daraus an die Qualifikationsanforderungen beruflicher Tätigkeiten auf der mittleren Qualifikationsebene ergeben. Im Mittelpunkt standen zwei übergeordneten Leitfragen, zu denen jeweils gezielte Nachfragen gestellt wurden. Die beiden Leitfragen lauteten • „Wie werden sich das Gesundheitssystem und seine angrenzenden Bereiche (z. B. Pflege, Altenhilfe, Home Care) aufgrund des soziodemografischen, technologischen und ökonomischen Wandels zukünftig entwickeln? Wie werden sich Angebote und Strukturen voraussichtlich verändern?“ • „Welche Auswirkungen werden die von Ihnen beschriebenen Entwicklungen für die Aufgabenteilung, die Tätigkeit und die Qualifikationsanforderungen der Beschäftigten der mittleren Qualifikationsebene in einem Zeitraum von fünf bis zehn Jahren haben? Welche neuen oder veränderten Anforderungen sind damit voraussichtlich für Erwerbstätige auf der mittleren Qualifikationsebene verbunden?“ Damit die von den Expert_innen skizzierten Veränderungen im Gesundheitssystem und den angrenzenden Bereichen besser zugeordnet werden konnten, wurden die Befragten gebeten, bei der Beantwortung der ersten Leitfrage im Fragebogen eine Zuordnung zu einem oder mehreren Leistungsbereichen vorzunehmen. Um eine soziostrukturelle Einordnung der Teilnehmenden zu ermöglichen, wurde am Ende des Fragebogens nach Alter, Geschlecht, ausgeübtem Beruf und der beruflichen Position in der Einrichtung gefragt. Abschließend wurde zudem um eine kurze Erläuterung gebeten, inwieweit sich die Befragten im Rahmen ihrer beruflichen Tätigkeit persönlich mit dem Wandel im Gesundheitssystem befassen. Die Ergebnisse der ersten Delphi-Runde wurden inhaltsanalytisch ausgewertet und bildeten die Grundlage für die Entwicklung des standardisierten Erhebungsinstrumentes für die zweite Delphi-Runde (Klaes et al. 2011, S. 64, 66).

170

J. Leinert et al.

5.4 Fragebogen für die zweite Delphi-Runde Bei der Entwicklung des Fragebogens für die zweite Delphi-Runde wurde auf die Szenario-Technik zurückgegriffen. Dabei wurden in einem mehrstufigen Verdichtungsprozess auf Basis der Ergebnisse von Literaturrecherche und Expert_inneninterviews sowie der Antworten aus der ersten Delphi-Runde sechs Entwicklungsszenarien entwickelt. Die in der ersten Delphi-Runde benannten Entwicklungen und ihre Auswirkungen auf Tätigkeit und Qualifikationsanforderungen wurden den Szenarien zugeordnet und in Items zusammengefasst, anhand derer eine Bewertung durch die Expert_innen erfolgte. Die qualifikationsrelevanten Entwicklungen waren in der Regel von mehreren Personen benannt worden. Entwicklungslinien, die vor dem Hintergrund der explorativen Leitfadeninterviews und der Literaturanalyse nicht eingeordnet werden konnten oder erkennbar einen singulären Sachverhalt beschrieben, wurden in der 2. Delphi-Runde ausgeklammert (Klaes et al. 2011, S. 66). Den Ausgangspunkt für die Entwicklung der Szenarien bildeten die in elf Themenfeldern zusammengefassten Kernthesen, die aus den Ergebnissen der Literaturrecherche abgeleitet worden waren. Diese Themenfelder wurden anschließend weiter verdichtet: Unter Einbezug der Ergebnisse der leitfadengestützten Expert_inneninterviews und der Nennungen aus der ersten Delphi-Runde wurden daraus zunächst neun Entwicklungsprozesse und Entwürfe für Szenarien in Versorgungsbereichen abgeleitet, die in der Literatur oder von den Befragten als qualifikationsrelevant eingestuft worden waren (Klaes et al. 2011, S. 75): • Ambulantisierung medizinischer und pflegerischer Leistungen • Telemonitoring (Ambient Assisted Living, AAL) und Assistenzsysteme im Dienste älterer und gesundheitlich eingeschränkter Menschen • Neue Aufgabenteilung im stationären Bereich • Neue Aufgabenteilung im ambulanten Bereich • Neue Versorgungsformen (Managed Care, Case Manager etc.) • Gesundheitsförderung, Prävention • Medical Wellness • Elektronische Dokumentation • Wohnortnahe Versorgung älterer Menschen Nach einem ausführlichen Diskussionsprozess wurden diese neun Entwürfe zu sechs Szenarien zusammengefasst, ohne dass dadurch substanzielle Verluste in

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

171

Kauf genommen werden mussten. Diese sechs Szenarien können als zentrale Entwicklungsströmungen im Gesundheitswesen angesehen werden. Sie beschreiben bereits damals ablaufende Prozesse, welche auch in den folgenden Jahren die Weiterentwicklung der gesundheitlichen Versorgung geprägt haben und neue Qualifikationen bei Gesundheitsberufen erforderlich machten. Diese Szenarien werden in den folgenden Punkten kurz zusammengefasst (Klaes et al. 2011, S. 75 f.): • Neue Dienste und Dienstleistungen zur Betreuung und Versorgung älterer und hochbetagter Menschen im häuslichen Bereich und im Wohnumfeld • Neue Aufgaben für die Fachkräfte in der ambulanten und stationären Versorgung (z. B. Delegation, arztentlastende Dienste, neue Aufgabenteilung) • Intensivierung von Gesundheitsförderung und Prävention in allen Tätigkeitsfeldern des Gesundheitswesens • Neue Angebote im Bereich Wellness und Fitness sowie ergänzende Gesundheitsdienstleistungen (z. B. Medical Wellness, Gesundheitstourismus) • Telemonitoring und Assistenzsysteme als Triebfedern neuer Angebotsstrukturen und Qualifikationserfordernisse (z. B. eHealth, Telemedizin, Telepflege, AAL, Smart House) • Zunehmende Vernetzung und steigender Bedarf an Prozesssteuerung in allen Bereichen des Gesundheitswesens (z. B. integrierte und sektorenübergreifende Versorgung) Die sechs Szenarien stellten den Ausgangspunkt für den standardisierten Fragebogen der zweiten Delphi-Runde dar, der in Klaes et al. (2011, S. 214–233) dokumentiert ist. Dort wurden sie zunächst näher erläutert (siehe beispielhaft für das erste Szenario Tab. 3); anschließend wurden sie mit ausführlichen Itemlisten eingehend untersucht. Pro Szenario wurde zunächst die Wahrscheinlichkeit dafür erfragt, dass mit dem Szenario verbundene Entwicklungen eintreten. Die Realisierungswahrscheinlichkeit sollte auf einer vierstufigen Skala angegeben werden („sehr unwahrscheinlich“, „eher unwahrscheinlich“, eher wahrscheinlich“, sehr wahrscheinlich“). Wenn die Expert_innen die Entwicklung für eher oder sehr wahrscheinlich hielten, sollten sie zudem angeben, in welchem Zeitraum sie mit dem Eintreten der genannten Entwicklung rechnen („bis in 5 Jahren“, „bis in 20 Jahren“, über 10 Jahren“). Anschließend sollten die Expert_innen annehmen, dass das Szenario eintreten wird. Unter dieser Prämisse sollten sie eine ausführliche Itemliste potenziell

172

J. Leinert et al.

Tab. 3   Beispiel für ein Szenario mit ergänzender Erläuterung Szenario

Neue Dienste und Dienstleistungen zur Betreuung und Versorgung älterer und hochbetagter Menschen im häuslichen Bereich und im Wohnumfeld

Erläuterung Momentan werden etwa 70 % der über 65-jährigen pflegebedürftigen Personen in Deutschland ambulant versorgt. Der sogenannte Sog ins Heim bewirkt jedoch, dass die Quote der ambulant versorgten pflegebedürftigen Personen leicht abnimmt. Dennoch verbindet sich in der gesellschaftspolitischen Debatte mit der Formulierung „ambulant vor stationär“ seit längerem die Absicht, neben der medizinischen auch die nicht ärztliche (pflegerische, sozialpflegerische und therapeutische) Versorgung stärker in den ambulanten Bereich hineinzuverlagern. Angesichts des stetigen Anstiegs der Zahl Älterer und Hochbetagter zielt eine Stärkung der ambulanten Versorgungsformen einerseits auf eine effizientere Betreuung. Andererseits soll damit dem Wunsch der Betroffenen entsprochen werden, möglichst lange zu Hause und im Wohnumfeld leben zu können. Im Ergebnis könnte künftig wieder ein deutlich steigender Anteil der pflegebedürftigen Personen zu Hause, d. h. ambulant betreut werden

sich ändernder Tätigkeitsanforderungen bewerten, die mit dem Szenario verbunden sein können. Zunächst sollten die Befragten angeben, ob sie den Items zu den Tätigkeitsänderungen zustimmen oder diese ablehnen. Im Falle einer Zustimmung sollten sie angeben, ob durch eine solche Tätigkeitsveränderung – im Vergleich zu den heutigen Anforderungen – zusätzliche oder veränderte Qualifikationen der Beschäftigten erforderlich sind. In einer offenen Frage wurden zudem abgefragt, ob aus Sicht der Expert_innen bei einer Realisierung des Szenarios noch weitere, bislang nicht abgefragte Qualifikationsanforderungen wichtig wären. Abschließend wurde, wiederum anhand ausführlicher Itemlisten pro Szenario, abgefragt, welche hinderlichen und förderlichen Faktoren für die skizzierten Entwicklungen bestehen. Im gesamten Fragebogen wurde bei jedem zu bewertenden Item die Antwortmöglichkeit „kann/möchte ich nicht beurteilen“ angeboten. Damit sollte erreicht werden, dass niemand bei unzureichender Expertise für eine spezifische Fragestellung zu einer Antwort gedrängt wird. Die Kombination von „kann/möchte ich nicht“ ließ dabei bewusst offen, aus welchem der beiden genannten Gründe keine Einschätzung abgegeben wurde. In den Abb. 5, 6, 7 ist der Fragebogen anhand von Ausschnitten für das erste Szenario beispielhaft dokumentiert. Insgesamt umfasste der Fragebogen zwanzig Seiten mit zusammen über 250 Items, die zu bewerten waren.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

Abb. 5   Fragebogenbeispiel 1: Szenario und Bewertung Entwicklungen

Abb. 6   Fragebogenbeispiel 2: Bewertung Tätigkeits- und Qualifikationsänderungen

173

174

J. Leinert et al.

Abb. 7   Fragebogenbeispiel 3: ergänzende Nennung und fördernde/hemmende Faktoren

6 Feldverlauf der Delphi-Runden 6.1 Erste Delphi-Runde: qualitative Befragung Die Fragebögen der ersten Delphi-Runde wurden in der letzten Augustwoche 2010 an insgesamt 1508 Personen bzw. Institutionen der Expert_innenstichprobe versendet. In der letzten Septemberwoche 2010 wurde nach gut vier Wochen Feldzeit ein erstes Erinnerungsschreiben versendet. Dieses Erinnerungsschreiben wurde an alle 1375 Personen bzw. Institutionen versendet, die bis zu diesem Zeitpunkt noch nicht auf das erste Anschreiben reagiert hatten.3 Dem Erinnerungsschreiben war der Fragebogen erneut beigefügt; zudem enthielt es das Angebot, auf Wunsch auch einen elektronischen Fragebogen auszufüllen. Wegen des schleppenden Fragebogenrücklaufs wurde Ende Oktober 2010 eine zusätzliche, nicht geplante, zweite Erinnerungsaktion durchgeführt und die Feldzeit bis Ende November 2010 verlängert. Dank dieser Ausschöpfungsbemühungen konnte schließlich eine Rücklaufquote erreicht werden, die für eine qualitative, schriftlich-postalische Expert_innenbefragung akzeptabel ist (Klaes et al. 2011, S. 64, 65). Die Feldstatistik für die erste Delphi-Runde wird in Tab. 4 dargestellt.

3Wenn bereits ein ausgefüllter Fragebogen eingegangen war, eine explizite Teilnahmeverweigerung vorlag, oder rückgemeldet worden war, dass in der ausgewählten Einrichtung niemand die Fragestellung beantworten kann (weil beispielsweise eine Person aus der Institution ausgeschieden ist), wurde auf das Erinnerungsschreiben verzichtet.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

175

Tab. 4   Feldstatistik für die 1. Runde der Delphi-Befragung Versendete Fragebögen (brutto) Neutrale Ausfälle (Zielperson verstorben, nicht in Zielgruppe, oder verzogen; Adressänderungen, erneute Zusendung erwünscht) Nettostichprobe Realisierte Interviews Ohne Rücklauf Systematische Ausfälle: ZP verweigert (grundsätzlich, kein Interesse am Thema, nicht in dieser Welle, sonstige Gründe)

Absolut

%

1512

100

141

 9,3

1371

100

203

14,8

1104

80,5

64

 4,7

Quelle: Klaes et al. (2011, S. 66)

6.2 Zweite Delphi-Runde: quantitative Befragung Bei Delphi-Befragungen wird die Stichprobe der ersten Runde auch der zweiten Runde zugrunde gelegt. Bei der PPH-Studie erfolge lediglich eine Adressaktualisierung auf Basis der Rückmeldungen aus der ersten Runde sowie eine Bereinigung um grundsätzliche Verweigerungen. Die Fragebögen der zweiten Runde wurden Ende März 2011 an 1361 Personen/Institutionen versendet. In den folgenden 13 Wochen wurden zwei Erinnerungsaktionen durchgeführt, die einen Neuversand des Fragebogens umfassten. Bis zum Ende der Feldzeit waren 243 auswertbare Fragebögen eingegangen, was einer Rücklaufquote von 18,5 % entspricht (Tab. 5). Nach Feldende gingen weitere 17 Fragebögen ein, die aber in den Auswertungen nicht mehr berücksichtigt werden konnten. Der Anteil der Missingwerte („kann/möchte ich nicht beurteilen“) war außerordentlich gering. Die Qualität der Datenbasis für die Auswertungen war damit sehr gut. (Klaes et al. 2011, S. 67).

6.3 Expert_innenworkshops anstelle dritter Erhebungsrunde Anstelle einer dritten Erhebungsrunde wurden in der PPH-Studie die Ergebnisse zusammen mit ausgewählten Expert_innen auf drei eintägigen Workshops diskutiert. Dieses Format war zum einen gewählt worden, um die Mitwirkungsbereitschaft der Expert_innen nicht durch eine dritte Delphi-Runde zu strapazieren. Zum anderen erlaubten die Workshops, die Ergebnisse in kleinen

176

J. Leinert et al.

Tab. 5   Feldstatistik für die 2. Runde der Delphi-Befragung Absolut In Prozent Versendete Fragebögen (brutto) Neutrale Ausfälle (Zielperson verstorben, nicht in Zielgruppe, oder verzogen; Adressänderungen, erneute Zusendung erwünscht) Nettostichprobe Realisierte Interviews Ohne Rücklauf Systematische Ausfälle: ZP verweigert (grundsätzlich, kein Interesse am Thema, nicht in dieser Welle, sonstige Gründe)

1361

100

47

3,5

1314

100

243

18,5

1040

79,1

31

2,4

Quelle: Klaes et al. (2011, S. 68)

Gruppen eingehend zu diskutieren, Anmerkungen und Hinweise auszutauschen und darüber sprechen zu können, mit welchen Konsequenzen der ermittelten Entwicklungen für die Qualifizierung von Beschäftigten des Gesundheitssystems zu rechnen war. Dies wäre im Rahmen einer standardisierten Befragung nicht möglich gewesen. Damit die Workshops trotz der umfangreichen Studienergebnisse arbeitsfähig waren, wurden diese nicht insgesamt besprochen. Die drei Veranstaltungen wurden vielmehr thematisch auf jeweils zwei der sechs abgefragten Szenarien fokussiert: • Workshop 1: Telematik, Vernetzung und Prozesssteuerung in der gesundheitlichen Versorgung • Workshop 2: Neue Dienstleistungen für ältere Patient_innen und neue Aufgaben für Fachkräfte in der gesundheitlichen Versorgung • Workshop 3: Gesundheitsförderung und Medical Wellness Die Expert_innenauswahl für jeden Workshop erfolgte dabei über ihre thematischen Bezüge. Zur Vorbereitung der Workshops erhielten die Teilnehmer_innen vorab eine statistische Ergebnisauswertung zu den jeweiligen beiden Szenarien sowie ergänzende methodische Informationen. An den Workshops nahmen 23 Expert_innen teil. Die Workshops fanden zwischen dem 12. und 14. Juli 2011 statt (Klaes et al. 2011, S. 69). Die differenzierenden Hinweise und Schlussfolgerungen der Teilnehmer_ innen zu den Befragungsergebnissen bildeten – auch unter dem Gesichtspunkt

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

177

der praktischen Umsetzbarkeit – eine wichtige Ergänzung der Ergebnisse von Literaturrecherche und Befragungen und flossen ebenfalls in den Abschlussbericht der PPH-Studie ein. So ließen sich, auch wenn diese Frage nicht mehr Teil des Forschungsauftrages war, aufgrund der recht eindeutigen Voten der Expert_ innen auf den Workshops, allgemeine Empfehlungen aussprechen, wie die neuen Qualifikationen vermittelt werden sollten (Klaes et al. 2011, S. 154). Darauf wird im nächsten Kapitel nach einer Zusammenfassung der erwarteten neuen Qualifikationsbedarfe eingegangen.

7 Studienergebnisse und Fazit In den folgenden Abschnitten wird im Sinne einer allgemeinen Ergebniszusammenfassung eine stark verdichtete Darstellung der Ergebnisse vorgenommen. Für die ausführlichen, Szenario spezifischen Ergebnisse sei auf den Abschlussbericht der PPH-Studie verwiesen (Klaes et al. 2011, S. 80–148). Mit welcher Wahrscheinlichkeit und in welcher Geschwindigkeit die Expert_ innen mit einem breiten Ausbau der jeweiligen Szenarioelemente rechneten, wird in Tab. 6 zusammengefasst. Darin wird zudem ausgewiesen, in welchem Maße sie von einem Bedeutungszuwachs spezifischer Tätigkeiten und Anforderungen ausgingen und dafür neue Qualifikationen für erforderlich hielten. Die mit Symbolen dargestellten Wertungen fassen dabei Häufigkeit und Ausprägung zustimmender Voten zu den jeweiligen Items zweier Szenario spezifischer Fragebatterien zusammen (Klaes et al. 2011, S. 149). Dabei wird deutlich, dass in den Szenarien 1 und 2 die zustimmenden Voten der Expert_innen zur Erfordernis neuer Qualifikationen am höchsten ausfielen. Beide Szenarien sind zugleich am stärksten durch die demografische Entwicklung und die damit verbundene Zunahme älterer, multimorbider und demenzkranker Menschen geprägt (Klaes et al. 2011, S. 149). Aus den in Tab. 6 zusammengefassten Befunden ließ sich eine zentrale Empfehlung ableiten: Im Sinne einer Priorisierung sollten diejenigen Qualifikationserfordernisse vorrangig in den Blick genommen werden, die aus den Szenarien 1, 2 und 3 resultieren. Mit ebenfalls hoher Priorität sollten die mit den Entwicklungen in den Szenarien 6 und 5 einhergehenden neuen Qualifikationserfordernisse in Angriff genommen werden, gefolgt von den im Zusammenhang mit Szenario 4 formulierten Anforderungen und neuen Qualifikationen (Klaes et al. 2011, S. 151).

+ +

3. Intensivierung von Gesundheitsförderung und Prävention in allen Tätigkeitsfeldern des Gesundheitswesens

4. Neue Angebote im Bereich Wellness und Fitness sowie ergänzende Gesundheitsdienstleistungen

Anteil und Ausprägung zustimmender Voten: ++ = sehr hoch… + = hoch… Quelle: Klaes et al. (2011, S. 150)

6. Zunehmende Vernetzung und steigender Bedarf an Prozesssteuerung in allen Bereichen des Gesundheitswesens = mittel

+

2. Neue Aufgaben für die Fachkräfte in der ambulanten und stationären Versorgung

5. Telemonitoring, technologische Entwicklung und Assistenzsysteme als Triebfedern neuer Angebotsstrukturen und Qualifikationserfordernisse

+

+

++

+

++

+

++

+

++

+

++

+

+

+

++

++

Neue Qualifikation erforderlich

Ja

Wahrscheinlichkeit

Geschwindigkeit

Bedeutungszuwachs von Tätigkeiten und Anforderungen

Breiter Ausbau der Szenarioelemente

1. Neue Dienste und Dienstleistungen zur Betreuung und Versorgung älterer und hochbetagter Menschen im häuslichen Bereich und im Wohnumfeld

Szenarien

Tab. 6   Verteilung der zustimmenden Antworthäufigkeiten auf die Fragen 1 (Wahrscheinlichkeit und Geschwindigkeit des Ausbaus des Szenarios) und 2 (Bedeutungszuwachs und zusätzliche Qualifikationserfordernisse) in der 2. Delphi-Runde im Vergleich der Szenarien

178 J. Leinert et al.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

179

Welche Qualifikationserfordernisse damit vorrangig angesprochen waren, fasst Tab. 7 für Qualifikationen zusammen, die Szenario übergreifend für erforderlich gehalten wurden. Ausgewiesen sind nur solche Erfordernisse, die nach Einschätzung der Exert_innen in mindestens zwei Szenarien einen hohen bis sehr hohen Qualifikationsbedarf mit sich brachten. Werden denjenigen Anforderungen betrachtet, die der Einschätzung zufolge in allen sechs Szenarien neuen Qualifikationsbedarf mit sich bringen, handelt es sich überwiegend um Querschnittsaufgaben: • interdisziplinäre Kommunikation • Zielgruppengerechte Kommunikation und Interaktion • Gesundheitsförderung und Prävention • Versorgungs- und Gesundheitsmanagement • Koordination und Vernetzung von Leistungserbringern • Qualitätsmanagement • Umgang mit Multimorbidität • elektronische Dokumentation und Evaluation Dieser Querschnittscharakter trifft größtenteils auch für die weiteren Qualifikationserfordernisse aus Tab. 7 zu, die nicht in allen Szenarien eine Rolle spielen. Allerdings treten hier neben die Querschnittaufgaben auch spezifische Anforderungen wie Palliativbetreuung und Medikamentenmanagement. Damit sind die wichtigsten übergreifenden Bereiche skizziert, in denen für die abgefragten Zeiträume von Gesundheitsfachberufen veränderte, ergänzte oder auch ganz neue Qualifikationen erwartet wurden. Dazu kommen die zusätzlichen spezifischen Qualifikationserfordernisse, die nur im jeweiligen Szenariokontext relevant sind. Diese sind in Tab. 8 zusammengefasst, wobei in nur Erfordernisse mit relativ hohen Zustimmungsvoten aufgenommen wurden (Klaes et al. 2011, S. 151, 153). Insgesamt ergab sich aus den Einschätzungen der Expert_innen, dass spezielle Qualifikationen in jedem Gesundheitsfachberuf auch in den abgefragten künftigen Zeiträumen noch einen wesentlichen Teil der erforderlichen Kernkompetenzen ausmachen werden. Gleichzeitig wurde erwartet, dass verstärkt zusätzliche Querschnittsqualifikationen erforderlich werden, die einen ergänzenden Kernbereich an Qualifikationen bilden. Vor dem Hintergrund der hohen Zustimmungsraten zu diesen Entwicklungen stand nicht infrage, ob diese Veränderungen aus Expert_innensicht eintreten bzw. welche Qualifikationsbereiche davon betroffen sein würden. Diese Fragen wurden mit der PPH-Studie

180

J. Leinert et al.

Tab. 7   Szenarienübergreifende Qualifikationserfordernisse im Vergleich der sechs Szenarien Tätigkeitsbereiche und Anforderungen mit relativ hohem zusätzlichem Qualifizierungsbedarf

Szenario 1

2

3

4

5

6

1. Interdisziplinäre Kommunikation, Teamorientierung, Multiprofessionalität













● 2. Zielgruppengerechte Kommunikation und Interaktion (insbes. mit alten Menschen, über Settings definierten Zielgruppen, Demenzkranken, Menschen mit Migrationshintergrund, Menschen mit Behinderung)











3. Auf Adressatenbedürfnisse und Settingbezüge zugeschnittene Gesundheitsförderung und Prävention













4. Versorgungs- und Gesundheitsmanagement (gemeindebzw. quartierbezogen)





o

o





5. Koordination und Vernetzung verschiedener Leistungserbringer





o

o





6. Qualitätsmanagement







o

o



7. Umgang mit Multimorbidität





o

o





8. Elektronische Dokumentation und Evaluation

o



o

o







9. Patientenedukation und -beratung





o



10. Schnittstellenmanagement









11. Kenntnisse der medizinischen Behandlungskette und der sektorübergreifenden Ablauforganisation





o



12. Anleitung von pflegenden Angehörigen





13. Fundierte Settingkenntnisse



o

o





14. Palliativbetreuung, Sterbebegleitung



o



15. Leitlinienorientiertes Handeln

o





16. Fachübergreifende Assessments





17. Medikamentenmanagement





18. Social Marketing 19. Datensicherheit und Datenschutz



● ●



● = hoher bis sehr hoher Qualifikationsbedarf o = mittlerer bis hoher Qualifikationsbedarf Quelle: Klaes et al. (2011, S. 152)

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

181

Tab. 8   Ausgewählte szenarienspezifische Qualifikationserfordernisse in den sechs Szenarien im Überblick Tätigkeitsbereiche und Anforderungen mit relativ hohem zusätzlichem Qualifizierungsbedarf Szenario 1

Berufsgruppen

Fachkräfte im ambulanten • Spezialisierte intensivpflegerische Kompetenzen in den Bereichen Schmerzversorgung, künstliche Ernährung und Bereich Beatmungspflege zur Sicherstellung einer ambulanten intensivmedizinischen Betreuung • Vertieftes Eingehen auf spezifische Patientengruppen (u. a. Demenzkranke, multimorbide Patientinnen und Patienten, Menschen mit Migrationshintergrund) Szenario 2

Fachkräfte im ambulanten Bereich

• Fachliche Beurteilung von Wohnumfeld, Hilfsmittelgebrauch, Gesundheitszustand und Mobilität der Patientinnen und Patienten

Fachkräfte im ambulanten Bereich

• Wahrnehmung von: – Lebensrettenden Maßnahmen auf der Basis neuer Technologien – Selbstständig durchgeführter Dialyse – Selbstständig durchgeführten einfachen chirurgischen Tätigkeiten – Radiologischer Diagnostik auf der Basis neuer Technologien unter ärztlicher Aufsicht – Erweiterten Aufgaben in der Anästhesie Szenario 3

Fachkräfte im klinischen Bereich

• Befähigung von Zielpersonen zur Reflexion und Verantwortungsübernahme bezüglich der eigenen Gesundheit (Empowerment)

Fachkräfte im Allgemeinen

Fachkräfte im Allgemeinen • Professionelle Planung und Organisation von Veranstaltungen zu Themen der Prävention und Gesundheitsförderung (Eventmanagement) Szenario 4 • Fachkenntnisse im Bereich Ernährungsberatung

Medizin. und heiltherapeutische Fachkräfte

• Fachkenntnisse im Bereich der alternativen Medizin

Medizinische Fachkräfte

• Grundkenntnisse der im Bereich Medical Wellness angebotenen Gesundheitsdienstleistungen

Touristikfachkräfte (Fortsetzung)

182

J. Leinert et al.

Tab. 8   (Fortsetzung) Tätigkeitsbereiche und Anforderungen mit relativ hohem zusätzlichem Qualifizierungsbedarf

Berufsgruppen

• Grundkenntnisse der medizinischen Angebote im Bereich Hotelfachkräfte in GesundMedical Wellness heits-, Sport- und Kurhotels • Grundkenntnisse aus der Hotellerie

Medizinische Fachkräfte

• Fremdsprachenkenntnisse

Fachkräfte im Bereich Medical Wellness

Szenario 5 Technische Fachkräfte • Zielgruppenadäquate Konfiguration der technischen Assistenzsysteme (z. B. für Hochbetagte, Demenzkranke, Pflegebedürftige, ältere Migrantinnen und Migranten) •G  rundkenntnisse der Abläufe in der pflegerischen und medizinischen Versorgung bei Installation und Wartung technischer Assistenzsysteme

Technische Fachkräfte

• Kenntnisse von alters- und patientenspezifischen Bedürfnissen und Besonderheiten bei Installation und Wartung technischer Assistenzsysteme

Technische Fachkräfte

• Fähigkeit zur Interpretation der beim Telemonitoring routinemäßig anfallenden Daten (Vorbefundung) Szenario 6

Medizinische Fachkräfte

• Interessenunabhängige Beratung • Betriebswirtschaftliche Kenntnisse • Grundkenntnisse der rechtlichen Rahmenbedingungen von Kooperationen und beteiligten Professionen • Ermittlung des Gesundheits- und Behandlungsstatus durch medizinische Interviews und die Anwendung von Assessmentverfahren

Koordinierende und prozesssteuernde Fachkräfte

• Kenntnisse in der Recherche u. Anwendung wissenschaftlicher Informationen Quelle: Klaes et al. (2011, S. 155 f.)

für die abgefragten Zeiträume beantwortet. Die Frage, wie diese neuen Qualifikationen vermittelt werden sollen, war damit jedoch nicht beantwortet; sie war auch nicht mehr Teil des Forschungsauftrages. Aufgrund recht eindeutiger Voten der Expert_innen in den thematischen Workshops konnten aber allgemeine Empfehlungen ausgesprochen werden (Klaes et al. 2011, S. 154):

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

183

Je nach Beruf sollten die neuen Querschnittsqualifikationen in unterschiedlicher Gewichtung sowohl in bestehende Ausbildungsgänge integriert als auch berufsbegleitend im Rahmen von Fort- und Weiterbildungen vermittelt werden. In den Workshops wurde mehrfach darauf hingewiesen, dass sich angesichts des Querschnittscharakters eine interdisziplinäre Ausrichtung solcher berufsbegleitenden Qualifizierungen anbietet. Es wurde auch darauf hingewiesen, dass es sich neben der Integration übergreifender Kompetenzen in bestehende oder ggf. zu ergänzende Berufe unter Umständen auch anbieten kann, neue Berufe zu entwickeln, die umgekehrt konzipiert sind: In Ihnen würden Querschnittsqualifikationen den eigentlichen Kern darstellen; spezifische Qualifikationen könnten berufsbegleitend in der Praxis sowie über Fort- und Weiterbildung vermittelt werden. So wären beispielsweise Fachkräfte für Quartiersmanagement, Fachkräfte für Qualitätsmanagement oder Fachkräfte für Gesundheitsförderung denkbar (Klaes 154). In jedem Fall käme der Berufseinstiegsphase eine neue Bedeutung zu, wenn Querschnittsqualifikationen in der Ausbildung ein höheres Gewicht erhielten. Denn dann wären in der Berufseinstiegsphase die für die jeweiligen Betätigungsfelder spezifischen Qualifikationen in dem Maße zu vertiefen, in dem sie in der Ausbildung zugunsten der neuen Querschnittsqualifikationen zurückgestellt wurden (Klaes et al. 2011, S. 156). Primäres Ziel der PPH-Studie war es, die Expert_inneneinschätzungen zur Forschungsfragestellung zu erheben, und nicht, einen Konsens herzustellen. Die Delphi-Methode war im Sinne eines schriftlichen Gruppendiskussionsverfahrens jedoch zugleich gut geeignet, unterschiedliche Standpunkte zu beleuchten und Handlungsspielräume auszuloten. Aus den Studienergebnissen wurde deutlich, dass es mit der aufwendig erstellten Stichprobe gelungen ist, die unterschiedlichen Interessenkonstellationen der befragten Akteursgruppen gut abzubilden: Die Studienergebnisse geben differenziert Auskunft darüber, in welchen Bereichen künftige Entwicklungen und Qualifikationsbedarfe über die Akteursgruppen hinweg ähnlich eingeschätzt wurden und in welchen Bereichen sich die Einschätzungen nach beruflichem Hintergrund unterscheiden. Dabei haben sich die unterschiedlich Handlungsinteressen der Akteursgruppen in der erwarteten Klarheit in den Ergebnissen widergespiegelt; häufig differierten die Einschätzungen der Befragten zwischen ärztlichen und nicht-ärztlichen Heilberufen. Beispielsweise zeigte die Ärzteschaft im Bereich Gesundheit und Prävention zu den abgefragten Qualifikationsanforderungen für die nicht-ärztlichen Gesundheitsberufe nahezu durchgängig geringere Zustimmungswerte als die anderen Gruppen. Eine mögliche Erklärung besteht darin, dass Ärzt_ innen die Prävention als eine nach wie vor originäre ärztliche Aufgabe verstehen

184

J. Leinert et al.

und auch künftig weniger als Aufgabe der Gesundheitsfachberufe ansehen (Klaes et al. 2011, S. 112). Inhaltlich war die PPH-Studie mit der Thematik „Public/Private Health“ in seinen unterschiedlichen Schattierungen sehr breit angelegt. Daraus resultierten eine breite Zielgruppe der zu befragenden Expert_innen und eine breite Fragestellung. Beides führte zu großen Informationsmengen, die gebündelt werden mussten. Daher waren die Erstellung der Stichprobe, die Entwicklung der Erhebungsinstrumente sowie die Analyse und Bewertung der Ergebnisse aus Literaturrecherche und den Erhebungen mit einem entsprechend hohen Aufwand verbunden. Eine Herausforderung bestand dabei insbesondere darin, die Vielzahl der Argumente aus der ersten Delphi-Runde so zu verdichten, dass sich in der standardisierten Erhebung der zweiten Delphi-Runde möglichst alle Argumentationsstränge wiederfinden. Insgesamt erwies sich das gewählte Studiendesign als gut geeignet, um trotz der breit angelegten Thematik die gewünschten detaillierten Expert_inneneinschätzungen zu künftigen Qualifikationsbedarfen bei Beschäftigten der mittleren Ebene im Gesundheitswesen und den angrenzenden Bereichen zu erhalten. Für die Verarbeitung der Informationsmengen war jedoch ein hoher Zeit- und Ressourceneinsatz erforderlich. Für ähnlich gelagerte künftige Studien wird daher eine kritische Überprüfung empfohlen, ob sich die zu untersuchende Fragestellung bereits eng genug abgegrenzt ist oder sich gegebenenfalls noch stärker zuspitzen lässt, als zunächst geplant. Durch eine stärkere Fokussierung der Fragestellung ließe sich zum einen eine Begrenzung der Informationsmenge in der Auswertung und den Delphi-Erhebungen erzielen. Zum anderen könnte dadurch ggf. der Kreis der potenziell einzubeziehenden Expert_innen bzw. der zu recherchierenden Adressen enger abgegrenzt werden. Beides würde den Aufwand für die Studiendurchführung entsprechend verringern, ohne Abstriche an der skizzierten methodischen Vorgehensweise vornehmen zu müssen. Eine Reduzierung der Expert_innenstichprobe ohne gleichzeitige Einschränkung der Fragestellungen ist nicht zu empfehlen. Die Aufwandsminimierung würde möglicherweise mit einem Informationsverlust erkauft. Da die Streuung der Expert_inneneinschätzungen ex ante nicht bekannt ist, bestünde im Falle zu kleiner Stichproben die Gefahr, ein systematisch verzerrtes oder zufällig untypisches Bild der Expert_inneneinschätzungen zu erhalten.

Neue Qualifikationsanforderungen in der Gesundheitswirtschaft

185

Literatur Banz, M., Klaes, L., Köhler, T., Leinert, J., Olthoff, C., Rommel, A., et al. (2010). Zukünftige Qualifikationserfordernisse bei beruflichen Tätigkeiten auf mittlerer Qualifikationsebene im Bereich Public private health. Unveröffentlichter erster Zwischenbericht für das Bundesministerium für Bildung und Forschung (BMBF), Bonn. Häder, M. (2014). Delphi-Befragungen. Ein Arbeitsbuch (3. Aufl.). Wiesbaden: Springer VS. Klaes, L., Köhler, T., Rommel, A., Schüler, G., & Schröder, H. (2011). Public private health. Zukünftige Qualifikationserfordernisse bei beruflichen Tätigkeiten auf mittlerer Qualifikationsebene im Bereich Public private health. Abschlussbericht. www.frequenz. net/uploads/tx_freqprojerg/Abschlussbericht_PPH_web.pdf. Zugegriffen: 26. Juni 2018. Klaes, L., Köhler, T., Rommel, A., Schüler, G., & Schröder, H. (2013). Public private health. Neue Qualifikationsanforderungen in der Gesundheitswirtschaft. Bielefeld: Bertelsmann. Niederberger, M., & Renn, O. (2018). Das klassische Delphi-Verfahren: Konzept und Vorgehensweise. In M. Niederberger & O. Renn (Hrsg.), Das Gruppendelphi-Verfahren. Vom Konzept bis zur Anwendung (S. 7–25). Wiesbaden: Springer. https://doi.org/10.1007/9783-658-18755-2. Schüler, G., Klaes, L., Rommel, A., Schröder, H., & Köhler, T. (2013). Zukünftiger Qualifikationsbedarf in der Pflege. Ergebnisse und Konsequenzen aus dem BMBF-Forschungsnetz FreQueNz. Bundesgesundheitsblatt – Gesundheitsforschung – Gesundheitsschutz, 56(8), 1135–1144. https://doi.org/10.1007/s00103-013-1754-x

Modifiziertes DelphiVerfahren zur Ermittlung von Handlungsempfehlungen für die strukturelle Weiterentwicklung der Bewegungsförderung in Deutschland Hannah Gohres und Petra Kolip Zusammenfassung

Nachdem national eine Vielzahl von Initiativen zur Bewegungsförderung angestoßen wurden, sollten die bestehenden Strukturen auf Handlungsbedarfe hin untersucht werden. Hierzu wurde eine Delphi-Befragung durchgeführt, die mit Expert_inneninterviews sowie einer Fokusgruppe vorbereitet wurde und an deren Ende Handlungsempfehlungen auf einem Workshop entwickelt wurden. Es wurden damit Elemente eines klassischen mit denen eines Gruppendelphis verknüpft. Das Feld wurde mittels entwickelter Thesen beschrieben, die in zwei Runden von 41 Expert_innen quantitativ und qualitativ beurteilt wurden. Prioritäre Handlungsbedarfe und divergierende Einschätzungen wurden mit 17 der Teilnehmenden auf dem Workshop diskutiert. Dies ermöglichte eine multiperspektivische Auseinandersetzung mit verschiedenen Bereichen der Bewegungsförderung und bot somit eine breitere Expert_innenbasis, als es mit bspw. Interviews der Fall gewesen wäre. Herausfordernd war die Fragebogenentwicklung (Thesen) für die Delphi-Befragung, für die praktisches Wissen erforderlich war. Die vorbereitenden Expert_inneninterviews und Fokusgruppe wurden dafür als sinnvoll erachtet, eine mögliche Verzerrung durch fehlende Perspektiven ist jedoch nicht ausgeschlossen.

H. Gohres () · P. Kolip  Universität Bielefeld, Public Health, Fakultät für Gesundheitswissenschaften, Bielefeld, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_8

187

188

H. Gohres und P. Kolip

Schlüsselwörter

Gruppendelphi · Bewegungsförderung · Körperliche Aktivität · Delphi-Methode · Strukturentwicklung · Aktionsplan IN FORM

1 Hintergrund zum Projekt Körperliche Aktivität ist eine Schlüsseldeterminante der Gesundheit. Umgekehrt ist körperliche Inaktivität ein bedeutender Risikofaktor für zahlreiche Erkrankungen und frühzeitige Sterblichkeit (Cavill et al. 2010; Wilson et al. 2016). Dennoch ist weltweit ein Großteil der Bevölkerung nicht ausreichend körperlich aktiv (Hallal et al. 2012; World Health Organization 2010, 2014). Die Weltgesundheitsorganisation (WHO) empfiehlt für Erwachsene körperliche Aktivität von mindestens 2,5 h pro Woche (World Health Organization 2010). Dieses Ausmaß erreichen in Deutschland etwa die Hälfte der Erwachsenen nicht, sie gelten damit als körperlich inaktiv (Finger et al. 2017). Dabei nimmt das Aktivitätsniveau bereits über das Kindes- und Jugendalter hinweg kontinuierlich ab (Finger et al. 2018). Dies begründete die Verabschiedung des Nationalen Aktionsplan zur Reduktion von Fehlernährung, Bewegungsmangel, Übergewicht und damit zusammenhängenden Krankheiten, welcher seit 2008 Impulse zur Stärkung der Bewegungsförderung setzt. Im Rahmen dessen wurden durch „IN FORM – Deutschlands Initiative für gesunde Ernährung und mehr Bewegung“ von dem Bundesministerium für Gesundheit (BMG) Zentren für Bewegungsförderung, Aktionsbündnisse und Modellvorhaben für gesunde Lebensstile und Lebenswelten gefördert, die auf die nachhaltige Verankerung von Bewegung und Bewegungsförderung in Prävention und Gesundheitsförderung, Rehabilitation, Pflege und Therapie abzielten (Bundesministerium für Ernährung und Landwirtschaft 2017). Inwieweit die Verankerung gelungen ist und wie sich das Feld der Bewegungsförderung insgesamt ausgestaltet, bleibt offen. Im Rahmen des Projektes „Strukturen der Bewegungsförderung in Deutschland – eine Delphi-Studie“, gefördert durch das BMG, sollte daher im Jahr 2015 eine expert-_innengestützte Einschätzung der derzeitigen Lage der Bewegungsförderung in Deutschland erfolgen, die Lücken, aber auch Doppelstrukturen aufzeigt, damit Handlungsempfehlungen abgeleitet werden können. Zur Beurteilung dieses fragmentierten Handlungsfelds wurde ein mehrstufiges Delphi-Verfahren angewandt, das mit weiteren Forschungsmethoden verknüpft wurde. Ziel war es, alle relevanten Perspektiven von Akteur_innen der

Modifiziertes Delphi-Verfahren zur Ermittlung …

189

Bewegungsförderung einzubringen, um ein möglichst ganzheitliches Bild der aktuellen Situation zu skizzieren sowie die verschiedenen Bedarfe und Bedürfnisse zu bündeln. In diesem Beitrag wird das methodische Vorgehen Schritt für Schritt beschrieben und anschließend reflektiert. Dabei sollen geklärt werden, ob die Methodenwahl rückwirkend betrachtet angemessen war und wo sich Chancen, aber auch Herausforderungen durch die Delphi-Methode ergeben haben. Die Ergebnisse der Delphi-Befragung und die auf dem Statusworkshop konsentierten Handlungsempfehlungen für die strukturelle Weiterentwicklung der Bewegungsförderung sind bei Gohres und Kolip (2017) nachzulesen.

1.1 Methodisches Vorgehen Die Bestandsaufnahme und Bewertung der Strukturen für Bewegungsförderung erfolgte mittels einer Delphi-Studie, die mit Expert_inneninterviews sowie einer Fokusgruppe vorbereitet wurde und an deren Ende Handlungsempfehlungen entwickelt wurden (vgl. Abb. 1). Hierbei wurden Verfahren eines klassischen Delphis um Elemente des Gruppendelphis erweitert (vgl. Kap. 5 in diesem Band; Häder 2014; Schulz und Renn 2009). Die eingeladenen Expert_innen beantworteten zunächst in zwei Runden einen Online-Fragebogen. Um die

Expert_inneninterviews

n=7 Auswahl durch Projektgruppe

Thesenermittlung Fokusgruppe

n=7 Interviewte, Projektgruppe, weitere Expert_innen

Thesenfestlegung

Delphi-Befragung (Welle 1)

n=55 Auswahl anhand festgelegter Kriterien, inkl. Interviewte

Thesenbewertung

Delphi-Befragung (Welle 2)

n=41 Teilnehmende aus Welle 1

n=17 Delphi-Teilnehmende

Thesenbewertung Statusworkshop Handlungsempfehlungen

Abb. 1   Übersicht über den Projektablauf, eigene Darstellung

190

H. Gohres und P. Kolip

Konsensbildung zu verbessern und einen dialogischen Austausch zu ermöglichen, wurden die Ergebnisse anschließend im Rahmen eines Workshops diskutiert. Weitere Besonderheit des Forschungsprozesses war die zweistufige Entwicklung des Fragebogens für die Delphi-Befragung. Der mehrstufige Prozess wird nachfolgend beschrieben.

1.1.1 Schritte 1 und 2: Fragebogenentwicklung Um zu vermeiden, dass die Delphi-Befragung zu einer Formulierung von Handlungsempfehlungen auf Metaebene mit wenig Praxisrelevanz führt, wurde als Basis ein detaillierter, multiperspektivischer Thesenkatalog zum Einsatz in der Befragung ausgearbeitet. Für den Thesenkatalog war es bedeutsam, dass die Möglichkeit zu einer kritischen Auseinandersetzung und Beurteilung der Strukturen der Bewegungsförderung gegeben wird. Hierzu war die Formulierung möglichst kontroverser Thesen zentral, die den damaligen Stand der Bewegungsförderung mit ihren Fortschritten und auch Lücken abbildeten. Im ersten Schritt des mehrstufigen Prozesses wurden hierzu leitfadengestützte Expert_inneninterviews (n = 7) durchgeführt, um eine Einschätzung des Status quo im Feld der Bewegungsförderung zu erhalten. Expert_inneninterviews stellen eine anwendungsfeldbezogene Form der leitfadengestützten Interviews dar. Das spezifische an Expert_inneninterviews ist nicht die Methodik, sondern vielmehr die Zielgruppe an sich. Sie ermöglichen es durch den Rückgriff auf Expert_ innenmeinungen, die Erfahrungen und das Wissen verschiedener Akteur_innen strukturiert zu erfassen (Kruse 2015). Für dieses Projekt wurden Expert_innen als Personen definiert, die einen umfassenden Überblick über die Bewegungsförderung und ihre strukturellen Entwicklungen in den letzten Jahren haben und einschlägig für ihr Wissen auf diesem Gebiet bekannt sind. Die Interviewten sollten sowohl inhaltlich als auch geografisch ein möglichst breites Spektrum der Bewegungsförderung abbilden können. Eingeladen wurden daher Expert_innen aus den Feldern Prävention/Gesundheitsförderung, Pflege und Rehabilitation auf Bundes-, Landes- oder Kommunalebene. Die Expertise stammte aus den Feldern Wissenschaft (Gesundheits-, Sport- und Pflegewissenschaft), Sportbünden und Zentren für Bewegungsförderung. Die Expert_innen stammten aus West-, Ost- und Süddeutschland, agieren z. T. jedoch auch bundesweit. Für die Datenerhebung wurden persönliche Interviews gewählt. Diese sind gegenüber unpersönlichen Interviewformen wie beispielsweise via Telefon, E-Mail oder Internet-Chatroom methodisch deswegen vorteilhaft, weil der Gesprächsverlauf direkt besser kontrolliert werden kann und visuelle Informationen, wie z. B. Körpersprache, mit einbezogen werden können. Ebenso ist anzunehmen, dass

Modifiziertes Delphi-Verfahren zur Ermittlung …

191

sich in einer face-to-face Situation eher eine angenehme und somit ergiebigere Interviewatmosphäre bildet (Gläser und Laudel 2009). Der als Gesprächsgrundlage eingesetzte Leitfaden umfasste insgesamt sieben Themenblöcke. Zu Beginn sollten die Interviewten eine subjektive Einschätzung der Entwicklung der Bewegungsförderung in den letzten zehn Jahren geben. Der Zeitraum wurde gewählt, da er die Verabschiedung des Nationalen Aktionsplans im Jahr 2008 einschließt. Soweit zu Beginn noch nicht angesprochen, wurden mit den folgenden Themenblöcken Zielgruppenerreichung (Block II) sowie die Ausrichtung und Arten von Interventionen (Block III) thematisiert. Themenblock IV diente der Vertiefung struktureller Entwicklungen. Hier sollte zunächst das jeweilige Verständnis von Strukturen erfasst und anschließend strukturelle Veränderungen, der Aufbau nachhaltiger Strukturen und ihrer Voraussetzungen ermittelt werden. Dies umfasste auch die Beurteilung bestehender Kooperationen und des politischen Engagements sowie Ressourcen für Bewegungsförderung. Die anschließenden Themenblöcke forderten die Interviewten zu einer Bewertung der Entwicklungen (Block V) und der Ableitung von Handlungsbedarfen (Block VI) auf. Die Interviews wurden mit der Formulierung von Thesen in Block VII abgeschlossen. Die Interviewten wurden dazu aufgefordert, möglichst kontrovers die Strukturen der Bewegungsförderung und damit zusammenhängende Handlungsbedarfe mit einer (oder mehreren) Thesen zu beschreiben. Konnten die Interviewpersonen dies nicht ohne weitere Vorgaben, wurden ihnen Sätze zur Vervollständigung mit ihrer Bewertung angeboten (z. B. „Handlungsbedarf in der Bewegungsförderung gibt es insbesondere bei…“; „Die Vernetzung von Bewegungsförderungsangeboten ist…“). Die Interviews wurden aufgezeichnet, anschließend für die Auswertung transkribiert bzw. in einem Fall paraphrasiert1 und strukturiert inhaltsanalytisch nach Mayring (2010) ausgewertet. Die qualitative Inhaltsanalyse wurde gewählt, da sie darauf zielt, sich frühzeitig vom ursprünglichen Material zu trennen, um die Informationen systematisch zu reduzieren und dem Untersuchungsziel entsprechend zu strukturieren (Gläser und Laudel 2009). So war es möglich, die Informationen der Expert_inneninterviews effizient zu nutzen und ein Abbild der Bewegungsförderungsstrukturen zu zeichnen. Es wurde auf Basis des Leitfadens,

1Ein

siebter Gesprächspartner hatte unerwartet nach Abschluss der Erhebungs- und Transkriptionsphase einem Interview zugestimmt. Um die Kenntnisse des Experten dennoch zu berücksichtigen, wurde das Interview geführt, für die Auswertung jedoch nicht transkribiert.

192

H. Gohres und P. Kolip

wie von Schmidt (2000) empfohlen, ein Hauptkategoriensystem festgelegt (deduktiv). Anschließend wurden relevante Passagen der Interviews anhand dieser Kriterien herausgefiltert und verdichtet (Mayring 2002, 2010). Dabei erfolgte die Auswertung zunächst getrennt durch zwei Personen. Die Ergebnisse wurden dann von den Auswertenden bei einem persönlichen Treffen zusammengetragen und diskutiert. Auf Basis der Auswertungen wurde ein erster Entwurf des Thesenkatalogs erstellt. Dieser umfasste eine hohe Zahl von Thesen, weshalb die Thesen in mehreren Schritten zusammengefasst und gekürzt wurden. Hierzu erfolgte eine Priorisierung durch alle Projektbeteiligten. In einer anschließenden Fokusgruppendiskussion (n = 7) wurden die Expert_ inneneinschätzungen mit einem Teil der Interviewten (n = 2), einer weiteren Expertin der Gesundheitsförderung (n  =  1) sowie den Projektmitarbeitenden (n = 4) diskutiert und zu Thesen verdichtet, die die Strukturen und Handlungsbedarfe der Bewegungsförderung pointiert beschreiben. Gruppendiskussionen bieten den Vorteil, dass die subjektiven Bedeutungsstrukturen der Individuen, die stark an soziale Zusammenhänge gebunden sind, erhoben und kollektive Einstellungen ermittelt werden können, sodass ein facettenreiches Bild zu dem betrachteten Thema gezeichnet werden kann (Mayring 2002; Schulz 2012). Fokusgruppen sind durch den kollektiven Wissensbestand leistungsfähiger als Einzelinterviews, und durch die Gruppendynamik können neue Ideen stimuliert werden (Schulz et al. 2012). Hierdurch wurde sichergestellt, dass die Auswertung der Interviews übertragbare Ergebnisse geliefert hat und die Thesen verständlich sind, dabei aber nicht zu „harmonisch“ ausfallen und zu einer kritischen Auseinandersetzung mit der Bewegungsförderung im Rahmen der Delphi-Befragung anregen, um nicht zu früh im Prozess einen Konsens nahezulegen. Die Fokusgruppe umfasste einen Zeitraum von fünf Stunden, wobei sie einen Workshopcharakter aufwies, um eine konkrete Thesenentwicklung zu ermöglichen. Als Grundlage diente eine Präsentation, die die ermittelten Thesen sowie ihre zugrunde liegenden Interviewzitate veranschaulichte, um den Herleitungsprozess nachvollziehbar zu gestalten. Zur Moderation wurde hierauf aufbauend ein Leitfaden erstellt. Der Diskurs wurde somit mittels der einzelnen Thesen und entsprechenden Hintergrundinformationen initiiert und strukturiert. Innerhalb der einzelnen Themenbereiche stand jedoch die Offenheit im Vordergrund, was auch eine neutrale Haltung der Moderatorin zuließ. Das Vorgehen ähnelte damit der Phasendynamik des Leitfadens der Expert_inneninterviews (Kruse 2015). Das Gespräch wurde mit einem Aufnahmegerät aufgezeichnet, um die Ergebniszusammenführung im Anschluss zu vereinfachen. Zudem wurde ein Ergebnisprotokoll geführt, welches die Änderungsvorschläge und konsentierten Thesen zusammenfasste.

Modifiziertes Delphi-Verfahren zur Ermittlung …

193

In dem Gruppengespräch wurden bereits konkrete Vorschläge zur Umformulierung der Thesen sowie Kürzung des Thesenkatalogs vorgenommen. Anschließend wurde der Katalog überarbeitet und den Teilnehmenden nochmals per E-Mail zugesandt. Der finale Thesenkatalog, der somit durch mehrere Feedbackschleifen entstand, umfasste 16 Thesen zu unterschiedlichen Bereichen der Bewegungsförderung und stellte die Grundlage für die eigentliche DelphiBefragung im dritten Schritt. Übergeordnet lassen sie sich unter den Aspekten „Ausrichtung der Angebote und Strategie“ (Thesen 5, 6, 11, 13 und 16), „Zielgruppen“ (Thesen 1–4), „Verantwortlichkeiten und Ressourcen“ (Thesen 10 & 12), „Vernetzung und Koordination“ (Thesen 7–9, 14) und „Qualifikation“ (These 15) zusammenfassen.

1.1.2 Schritt 3: Delphi-Befragung Die eigentliche Delphi-Befragung wurde onlinegestützt durchgeführt und umfasste zwei Befragungsrunden mit quantitativen und qualitativen Elementen. Der standardisierte Fragebogen wurde mithilfe der Software EFS Survey (Version 10.7, Fa. QuestBack) erstellt. Es wurde eine personalisierte Umfrage angelegt, die nur eingeladenen Personen zugänglich war. Hierzu wurden persönliche Links mit entsprechend pseudonymisiertem Code versendet (questback 2015). Um die Daten aus den beiden Befragungsrunden verknüpfen zu können, wurde zu Beginn der Befragung eine Identifikationsnummer (ID) angelegt. Die ID wurde getrennt von den persönlichen Daten erfasst, sodass keine Verknüpfung möglich war und die Anonymität der Antwortenden gewahrt werden konnte. In der ersten Runde wurden die Befragten um eine Einschätzung der Thesen gebeten. Die zweite Befragungsrunde diente der erneuten Beurteilung des Thesenkatalogs unter Bezugnahme auf die Meinungen der anderen Teilnehmenden. Hierzu wurde jeweils die „Durchschnittsmeinung“ (Mittelwert und Standardabweichung) im Vergleich zu der persönlichen Beurteilung aus der ersten Befragungsrunde präsentiert (vgl. Abb. 2). Die Einschätzung war dabei in beiden Runden schriftlich zu begründen und wurde ebenfalls zurückgespiegelt. In der zweiten Befragungsrunde sollte zudem eine Priorisierung der Handlungsbedarfe vorgenommen werden. Der Fragebogen umfasste im Kern die 16 entwickelten Thesen, die sowohl quantitativ als auch qualitativ zur Bewertung gestellt wurden und war in fünf Bereiche gegliedert (siehe Tab. 1): I) Anlegen einer Identifikationsnummer, II) Fragen zum beruflichen Hintergrund, III) Allgemeine Bewertung der Bewegungsförderung, IV) Thesenbeurteilung und V) weitere Anmerkungen. Die Thesenbewertung erfolgte mittels einer sechsstufigen Likert-Skala (1 = stimme überhaupt nicht zu bis 6 = stimme vollständig zu) sowie einer schriftlichen Begründung.

194

H. Gohres und P. Kolip

Abb. 2   Beispiel für das quantitative Feedback in Delphi-Runde 2, eigene Darstellung

Es wurden 113 Akteur_innen der Bewegungsförderung eingeladen. Die Auswahl erfolgte auf Grundlage zuvor festgelegter Kriterien und wurde innerhalb der Projektgruppe sowie mit den Interviewpartner_innen diskutiert und festgelegt. Ausgewählt wurden daher Personen auf Bundes-, Landes- oder Kommunalebene, die für ihre Expertise im Bereich Prävention/Gesundheits- bzw. Bewegungsförderung bekannt sind und unterschiedliche Akteursebenen abdecken. Von Interesse war die Einschätzung von Akteur_innen mit entsprechender Expertise aus unterschiedlichen Berufsfeldern, nicht aber von politischen Entscheidungsträgern. Als wichtige Handlungsfelder wurden Landeszentren/-vereinigungen für Gesundheit (inkl. Zentren für Bewegungsförderung), Sozialversicherungsträger, Vereine und Verbände, Kommunen sowie wissenschaftliche Einrichtungen identifiziert. Um die Zusammensetzung der Expert_innen einschätzen zu können, wurden die Teilnehmenden zu Beginn der Befragung gebeten, ihre institutionelle Zugehörigkeit (Wissenschaft, Politik, Verein/Verband, Sozialversicherung, sonstiges) sowie ihr Fachwissen (subjektive Kompetenz) in den Bereichen Prävention/Gesundheitsförderung, Pflege und Rehabilitation zu beurteilen (fachfremd bis hoch). Da von einer Selbsteinschätzung zu jeder Frage abgesehen wurde, wurde bei jeder

Modifiziertes Delphi-Verfahren zur Ermittlung …

195

Tab. 1   Schematische Darstellung des Delphi-Fragebogens, eigene Darstellung Abschnitt Variablen

Ausprägungen/Inhalt

I

Identifikationsnummer

8 Zeichen

II*

Subjektive Kompetenzeinschätzung in den Bereichen • Prävention/Gesundheitsförderung • Rehabilitation • Pflege Beruflicher Hintergrund Bundesland

Beurteilung des Fachwissens (sechsstufige Likert-Skala hohes bis kein Fachwissen) Zuordnung zu den Kategorien Wissenschaft, Politik, Verein/Verband, Sozialversicherung, sonstiges Bundesland, in dem die Tätigkeit ausgeübt wird

III*

• Stand der Bewegungsförderung in Deutschland • Stand der Bewegungsförderung im Bundesland

Beurteilung allgemein (sechsstufige Likert-Skala ausbaufähig bis gut ausgebaut)

IV

Thesen 1 bis 16

Sechsstufige Likert-Skala und schriftliche Begründung Themenfelder: • Zielgruppen (Thesen 1–4) • Ausrichtung (Thesen 5–6) • Strategien und Rahmenbedingungen (Thesen 7, 10–12) • Vernetzung und Koordination (Thesen 8–9) • Pflege (These 13) • Reha (These 14) • Qualifikationen (These 15) • Wirksamkeit/Evidenzbasierung (These 16)

V

Weitere Handlungsbedarfe Anmerkungen

Offene Angabe (optional)

VI**

Prioritäten

Auswahl 4 prioritärer Handlungsbedarfe

*nur in Befragungsrunde 1; **nur in Befragungsrunde 2

Thesenbeurteilung die Antwortmöglichkeit „kann ich nicht beurteilen“ gegeben, die fehlendes Expert_innenwissen für den spezifischen Fall impliziert. Im Rahmen der quantitativen Analyse wurde deskriptiv die Verteilung der Thesenbeurteilung bestimmt. Grafisch wurde das Antwortverhalten mittels Boxplots beurteilt. Um das Ausmaß der Konsensbildung zu bestimmen, wurden die

196

H. Gohres und P. Kolip

Veränderung der Standardabweichungen von Runde 1 zu Runde 2 verglichen. Der Delphi-Prozess sollte zu einer Verstärkung des Konsens und damit zu einer Verringerung der Streuung führen (Vorgrimler und Wübben 2003). Des Weiteren wurde das Urteilsverhalten bestimmt, um die Wirkung der Rückspiegelung des Gruppenmittels zu ermitteln. Der Effekt der Rückspiegelung der Ergebnisse kann drei verschiedene Richtungen annehmen: 1) Die Gesamtmeinung wird nicht beachtet (stabile Haltung); 2) Das Urteil wird von der Durchschnittsmeinung weg verändert, um diese z. B. näher an die eigene zu bewegen (Kontrasthaltung), oder 3) das Urteil wird zur Durchschnittsmeinung hin verändert (Assimilationshaltung) (Bardecki 1991 zit. nach Vorgrimler und Wübben 2003; Novakowski und Wellar 2008). Die Antworten der beiden Befragungsrunden wurden für jede These in Abhängigkeit vom Mittelwert verglichen (T-Test für verbundene Stichproben; α = 0,05) und das Urteilsverhalten wie in Tab. 2 erläutert klassifiziert. Dabei konnten zwei weitere Ausprägungen beobachtet werden: neue Urteile (keine Angabe in Runde) sowie Meinungsänderungen (entgegengesetzte Einschätzung von Runde 1 zu 2). Zur Bestimmung von Gruppenunterschieden zwischen den Tätigkeitsfeldern sowie der subjektiven Kompetenz wurden einfaktorielle Varianzanalysen mit einem Signifikanzniveau von α = 0,05 durchgeführt. Die qualitative Analyse umfasste die Auswertung der schriftlichen Begründungen zu den Thesenbeurteilungen. Ziel war es, die abgegebenen Begründungen zusammenzufassen, um diese für die zweite Befragungsrunde aufzubereiten und den Teilnehmenden präsentieren zu können, um diese in der abschließenden Beurteilung der Thesen und bei der Beantwortung der Ausgangsfragestellungen berücksichtigen zu können. In Anlehnung an die zusammenfassende Inhaltsanalyse nach Mayring (2010) wurden die Begründungen daher für jede These einzeln ausgewertet. Bei der Zusammenfassung gilt es, das Tab. 2   Kategorisierung des Urteilsverhaltens zwischen den Delphi-Runden, eigene Darstellung Ausprägung

Definition

Stabiles Urteil

Keine Änderung von Runde 1 zu 2

Angleichungsurteil

Meinungsänderung hin zum Mittelwert

Kontrasturteil

Kontrast vom Mittelwert hin zur Ursprungsmeinung (Verstärkung)

Neues Urteil

Erstmalige Einschätzung in Runde 2

Über Durchschnitt hinaus Von Ursprungsmeinung über Mittelwert hinaus Meinungsänderung

Entgegengesetzte Einschätzung von Runde 1 zu 2

Modifiziertes Delphi-Verfahren zur Ermittlung …

197

Untersuchungsmaterial auf die wesentlichen Inhalte zu reduzieren. Zudem ist es möglich, induktiv Kategorien zu bilden. Dieses Vorgehen wurde für die Delphi-Befragung als angemessen beurteilt. Nach Durchsicht der ersten Begründungen konnten übergeordnete Kategorien gebildet werden: Handlungsbedarf, Handlungsempfehlungen und Kritikpunkte an der These. Nach diesen wurde das weitere Material geordnet und auf die wesentlichen Inhalte reduziert. Ergebnis waren stichpunktartige Zusammenfassungen der Begründungen zur Thesenbeurteilung, die einen weiteren Blick auf die einzelnen Thesen ermöglichten. Einen Eindruck über die Form des Feedbacks in Runde 2 liefert Abb. 4 im Abschnitt Ergebnisse.

1.1.3 Statusworkshop Um die Ergebnisse vertieft zu diskutieren und in einen interdisziplinären Austausch zu kommen, wurde im letzten Schritt des Projektes ein Statusworkshop mit den Delphi-Teilnehmenden durchgeführt. Ziel war die Ableitung konkreter, konsentierter Handlungsempfehlungen, nachdem die zweite Delphi-Runde noch nicht für alle Thesen zu einem Konsens führte. Zu dem Statusworkshop eingeladen wurden alle Teilnehmenden der ersten Runde der Delphi-Befragung (n = 55). Als Gast war zudem eine Vertreterin des BMGs eingeladen. Teilgenommen haben 17 Expert_innen. Die Teilnehmenden bildeten einen guten Querschnitt der zuvor befragten Akteur_innen ab. Vertreten waren wissenschaftliche Einrichtungen, Landesgesundheitsämter/-zentren (inkl. eines Zentrums für Bewegungsförderung), Landessportbünde sowie der Deutsche Behindertensportverband, Sozialversicherungen (Krankenkassen), die Bundeszentrale für gesundheitliche Aufklärung, die Plattform Ernährung und Bewegung e. V. sowie die Reinhard Mohn Stiftung. Es handelte sich um einen eintägigen Workshop. Nach einer Präsentation der Ergebnisse der Einschätzung aller Thesen, erfolgte eine Diskussion in thematisch abgegrenzten Kleingruppen. Diese wurden von den Projektmitarbeitenden moderiert und fokussierten die konkrete Formulierung der prioritären Handlungsbedarfe sowie möglicher Lösungsansätze, die anschließend im Plenum zusammengetragen und diskutiert wurden. Anders als von Schulz und Renn (2009) vorgeschlagen, wurden aufgrund der vorangegangenen schriftlichen Teilnahme keine rotierenden Kleingruppen zur mehrmaligen Diskussion und Beantwortung des Fragebogens gebildet. Vielmehr ging es um die Diskussion vorab eher heterogen beantworteter Fragen, um einen Konsens voranzutreiben. Die Abschlussdiskussion wurde mithilfe eines Aufnahmegerätes festgehalten. Die Protokolle, Aufnahmen sowie das erstellte Material wurden anschließend gesichtet, um die in der Abschlussdiskussion festgehaltenen Handlungsempfehlungen zu verschriftlichen, zu ergänzen

198

H. Gohres und P. Kolip

und auszuarbeiten. Die ausgearbeiteten Empfehlungen wurden im Anschluss an den Workshop im Umlaufverfahren nochmals zur Kommentierung an die Teilnehmenden geschickt, um einen Konsens sicherzustellen.

1.2 Ergebnisse: Konsens oder Dissens über strukturelle Handlungsbedarfe in der Bewegungsförderung? In Tab. 3 werden die Beurteilungen der Thesen in den beiden Delphi-Runden dargestellt. Vielen Thesen wurde in der Delphi-Befragung bereits in der ersten Runde eher zugestimmt (Mittelwert > 4), gleichzeitig wurden die Skalen bei der Hälfte der Thesen vollständig ausgeschöpft, womit heterogene Einschätzungen angezeigt waren. Nur eine These (9) wurde bereits in der ersten Runde von niemandem abgelehnt (Minimum = 3). Insgesamt zeigte sich nach der zweiten Delphi-Runde überwiegend (7 von 16 Thesen) eine Angleichung zur Durchschnittsmeinung und Verringerung der Streuung, was einen Konsens nahelegt. Viele der Thesen (6 von 16), die schon zuvor auf hohe Zustimmung stießen wurden überwiegend stabil beurteilt. Die Mittelwertunterschiede zwischen den Runden sind nur für These 1 signifikant (p = 0,003). Die stärkste Zustimmung (Mittelwert > 5,0) zeigte sich nach beiden Runden für • ein Präventionsdilemma (These 1), • die Notwendigkeit für Verbesserung zielgruppenspezifischer Strategien, insbesondere für sozial benachteiligte Zielgruppen (These 2), • das Problem der Einzelprojekte (These 7), • die Notwendigkeit übergeordneter KoordinatorInnen (These 9), • die Stärkung des Stellenwertes und von Zuständigkeiten in der Bewegungsförderung auf kommunaler Ebene (These 10), • die Stärkung und den Ausbau von Bewegungsförderung in der Pflege (These 13), • die Verbesserung der Übergänge im Rahmen stationärer Rehamaßnahmen (These 14). In drei Fällen führte das Rückspiegeln der Einschätzungen aus Runde eins hingegen zu einer Ausdifferenzierung der Urteile und damit stärkeren Kontroverse bzw. verringerter Zustimmung über • den Bedarf zielgruppenspezifischer Maßnahmen für Menschen mit Migrationshintergrund (These 3),

Modifiziertes Delphi-Verfahren zur Ermittlung …

199

Tab. 3   Thesenbewertung und Urteilsverhalten in den beiden Delphi-Runden, eigene Darstellung These

M (SD) M (SD) Runde 2 Runde 1 (n = 37–55) (n = 32–41)

1. Maßnahmen der Bewegungsförderung erreichen meist sport- und bewegungsaffine Menschen

4,9 ± 0,8*

5,2 ± 0,6*

2. Handlungsbedarf besteht in der Bewegungsförderung in Hinblick auf zielgruppenspezifische Strategien und Maßnahmen. Bedarf sehe ich insb. bei sozial benachteiligten Zielgruppen

5,5 ± 0,8

5,4 ± 0,8

3. Handlungsbedarf besteht in der Bewegungsförderung in Hinblick auf zielgruppenspezifische Strategien und Maßnahmen. Bedarf sehe ich insb. bei Menschen mit Migrationshintergrund

5,0 ± 1,1

4,7 ± 1,1

4. Handlungsbedarf besteht in der Bewegungsförderung in Hinblick auf zielgruppenspezifische Strategien und Maßnahmen. Bedarf sehe ich insb. bei Menschen mit chronischen Erkrankungen

4,9 ± 1,1

4,8 ± 1,1

5. Die meisten Angebote in der Bewegungsförderung werden mit Sportangeboten gleichgesetzt, dadurch fehlt der Bewegungsförderung der Aspekt der Alltagsbewegung

4,4 ± 1,6

4,5 ± 1,4

6. Bewegungsförderung fokussiert den Bereich Verhaltensprä- 4,6 ± 1,2 vention (individuelle Maßnahmen). Verhältnisprävention, wie ein bewegungsaktivierender Städtebau oder bewegungsfördernde Schulen, bleibt auf der Strecke

4,7 ± 1,0

7. Bewegungsförderung besteht vor allem aus Einzelprojekten, 5,2 ± 1,0 jedoch werden integrierte, intersektorale Handlungsstrategien benötigt

5,2 ± 1,0

4,8 ± 1,2

4,9 ± 1,0

5,2 ± 0,9 9. Bewegungsförderung benötigt KoordinatorInnen, die ‚organisationsempathisch‘ (d. h. interdisziplinär und intersektoral) denken und handeln können, damit eine effektivere Zusammenarbeit entsteht

5,2 ± 0,9

10. Der Stellenwert von Bewegungsförderung auf kommunaler 5,2 ± 1,1 Ebene muss gestärkt, entsprechende Zuständigkeiten und Ressourcen klar geregelt und verteilt werden

5,1 ± 1,1

8. Bewegungsförderung benötigt bessere Koordinierungsund Vernetzungsstrukturen auf Bundes-, Landes- und Kommunalebene, die Impulse setzen

(Fortsetzung)

200

H. Gohres und P. Kolip

Tab. 3   (Fortsetzung) These

M (SD) M (SD) Runde 2 Runde 1 (n = 37–55) (n = 32–41)

11. Die Stärkung der Strukturen für Bewegungsförderung benötigt langfristige Planungsstrategien und eine Umverteilung der finanziellen Ressourcen, weg von der Individualprävention hin zur Investition in Verhältnisprävention

4,4 ± 1,5

4,2 ± 1,4

12. Nachhaltige Strukturen für Bewegungsförderung müssen politisch stärker unterstützt werden und benötigen mehr gesetzliche Rahmenbedingungen

4,6 ± 1,4

4,5 ± 1,2

5,2 ± 0,9 13. Im Bereich Pflege hat Sturzprävention einen hohen Stellenwert erlangt, es wird jedoch oft nicht darüber hinausgedacht. Daher muss verhältnis- und verhaltensbezogene Bewegungsförderung in der Pflege gestärkt und ausgebaut werden

5,4 ± 0,7

5,1 ± 1,1

5,2 ± 0,9

5,0 ± 1,4 15. Bewegungsförderung benötigt qualifiziertes Personal, daher muss Bewegungsförderung Bestandteil von Curricula entsprechender Ausbildungen und Studiengänge (z. B. Gesundheitsberufe, Gesundheits- und Pflegewissenschaften, Lehramt, ErzieherInnen) sein. Derzeit spielt dort Bewegungsförderung oftmals kaum eine Rolle

4,9 ± 1,2

16. Für die Strukturentwicklung in der Bewegungsförderung muss die Wirksamkeit von Interventionen gesichert werden

4,8 ± 1,2

14. Die Übergänge von Bewegungsförderung im Rahmen stationärer Rehabilitationsmaßnahmen und zurück in den Alltag der Menschen müssen klar geregelt werden. Dazu muss sich auch der Rehabilitationsbereich stärker mit anderen Strukturen vernetzen

5,0 ± 1,3

M = Mittelwert, SD = Standardabweichung; * = signifikante Mittelwertunterschiede, Skala sechsstufig 1 „stimme überhaupt nicht zu“ 6 „stimme vollständig zu“

• die Verstärkung von Bewegungsförderung in Curricula relevanter Ausbildungen und Studiengänge (These 15), • die Sicherung der Wirksamkeit von Interventionen (These 16). Anhand der 3. These „Handlungsbedarf besteht in der Bewegungsförderung in Hinblick auf zielgruppenspezifische Strategien und Maßnahmen. Bedarf sehe ich insbesondere bei Menschen mit Migrationshintergrund“ soll die Meinungsbildung

Modifiziertes Delphi-Verfahren zur Ermittlung …

201

über die beiden Delphi-Runden und den Statusworkshop hinweg illustriert werden. Ein großer Teil der Teilnehmenden stimmte einem Handlungsbedarf bei zielgruppenspezifischen Maßnahmen für Menschen mit Migrationshintergrund eher zu (siehe Abb. 3). Der Anteil einer hohen Zustimmung ist im Vergleich zu Runde eins jedoch gesunken, während Einschätzungen in Richtung Ablehnung zugenommen haben. So ist der Mittelwert auf der Antwortskala von 5,0 auf 4,7 leicht gesunken (n = 39). Der Anteil der stabilen Urteile von Runde eins zu zwei ist im Vergleich zu anderen Thesen geringer (56,4 %). Teilnehmende, die ihre Meinung geändert haben, haben diese größtenteils hin zum Mittelwert korrigiert (17,9 %). Weitere 12,8 % haben ihre Einschätzung über den Durchschnitt hinaus in Richtung Ablehnung angepasst oder Kontrasturteile gebildet (5,1 %). Es zeigt sich somit eine eher kontroverse Einschätzung des Handlungsbedarfs bei Menschen mit Migrationshintergrund. Die Einschätzungen unterschieden sich dabei zwischen den Tätigkeitsfeldern und der subjektiven Kompetenz nicht signifikant. Die Meinungsänderungen und kontroversen Einschätzungen können anhand der Begründungen (siehe Abb. 4) daran festgemacht werden, dass vielfach angemerkt wurde, einen Migrationshintergrund nicht global als Kategorie für einen Handlungsbedarf auszumachen, da es sich um heterogene Gruppen handele. Es sei eine stärke Differenzierung bei der Zielgruppenauswahl notwendig. So wurde zugestimmt, dass Bedarf in einer höheren Zielgruppenspezifität bei Strategien der Bewegungsförderung bestünde, einzelne Gruppen seien aber jeweils differenziert zu betrachten. Hierzu wären fundierte Bedarfsanalysen und ein Abgleich mit dem bestehenden Angebot notwendig, sodass handlungsorientierte

Antwortskala stimme überhaupt nicht zu (1) bis stimme vollständig zu (6)

6

Urteilsverhalten (Anteil in %)

5

stabiles Urteil

4 3

Kontrasturteil

5.1 17.9

2 1

Angleichungsurteil

12.8 7.7 56.4

neues Urteil über Durchschnitt hinaus

Runde 1

Runde 2

Abb. 3   Beurteilung von These 3 in beiden Befragungsrunden (links) sowie Urteilsverhalten von Runde 1 zu Runde 2 (rechts) (n = 39), eigene Darstellung (Erläuterung: Die Boxplots (links) zeigen: Mittelwert = Raute, Quartilsabstand = Box, Median = horizontale Linie in der Box sowie Minimum/Maximum = Whiskers/vertikale Linie)

202

H. Gohres und P. Kolip

Handlungsbedarf

• Es gibt zu wenig spezifische Angebote • Es bestehen zahlreiche Barrieren für sozial Benachteiligte und/oder Menschen mit Migrationshintergrund wie Sprache, Kosten, Bildung • Insgesamt zu wenig Zielgruppenspezifität, sodass entsprechende Zielgruppen bisher nicht in größerem Umfang erreicht werden/zu wenig Wissen über Bedarfe und Bedürfnisse einzelner Zielgruppen • Angebote und Strukturen für Menschen mit chron. Erkrankungen bestehen grundsätzlich, allerdings nur für einzelne Indikationen • chron. Erkrankungen: sowohl Patient_innen als auch Ärzt_innen nicht ausreichend informiert; zu geringer Stellenwert von Bewegungsförderung • nicht ausreichend stigmafreie finanzielle Unterstützung vorhanden • Gute, etablierte Angebote gibt es, es fehlt aber an Transfer

Handlungsempfehlungen/ Lösungsvorschläge

• Partizipatorische Ansätze in Lebenswelten • Fundierte Bedarfsanalysen und Abgleich mit bestehendem Angebot (handlungsorientiere Erkenntnisse über Merkmale/Präferenzen von spezifischen Personengruppen sammeln) • Qualifikation von Multiplikator_innen bewegungsferner Fachbereiche • Hürden abbauen (z.B. Verwaltungsaufwand Kostenübernahme Krankenkasse) sowie Schaffung von barrierefreien oder -armen Zugangswegen • Transfer guter Beispiele; Transparenz/Information von Patient_innen und Ärzt_nnen; Schnittstellenmanagement

Kritikpunkte

• Flächendeckend gibt es bereits gute Ansätze und viele spezifische Bewegungsangebote in Vereinen, Fitnessstudios u.a. • Es ist eine stärkere Differenzierung bei den Zielgruppen notwendig und kann nicht nach globalen Merkmalen wie Migrationshintergrund erfolgen • Im Fokus von Gesundheitsförderung sollte stärker das Erreichen der großen Mehrheit der Bevölkerung stehen • Fehlende Angebote sind nicht der Grund, sondern fehlender Wille • Bewegung ist ein nachrangiges Problem bei sozial Benachteiligten

Abb. 4   Qualitative Zusammenfassung der Begründungen zu den Thesen 2–4 zur Zielgruppenspezifität, eigene Darstellung

Erkenntnisse über Merkmale und Präferenzen von spezifischen Personengruppen gewonnen werden können. Diese fehlten bislang größtenteils. Bedarf bei sozial benachteiligten Zielgruppen wurde am ehesten gesehen, hier wurden Lebensweltansätze als Lösungsmöglichkeit beschrieben. Auch auf dem Workshop wurde die mangelnde Zielgruppenspezifität als grundlegendes Problem als Konsens formuliert. Handlungsbedarfe bei spezifischen Zielgruppen müssten über fundierte Bedarfsanalysen kleinräumig ausgemacht werden, um bedarfs- und bedürfnisgerecht planen zu können. Eine pauschale Beurteilung des Bedarfs einzelner Gruppen sei nicht möglich. Ziel der Bewegungsförderung sollte es sein, Barrieren für einzelne Zielgruppen zu erkennen und systematisch abzubauen. Diese Systematik sei derzeit noch nicht gegeben. Um vielfältige Zielgruppen zu erreichen, sollte des Weiteren über neue Zugänge mit zielgruppengerechter Ansprache nachgedacht werden. Die konsentierte Beschreibung der

Modifiziertes Delphi-Verfahren zur Ermittlung …

203

Zielgruppenerreichung lautet: Handlungsbedarf besteht in der Bewegungsförderung in Hinblick auf zielgruppenspezifische Strategien und Maßnahmen. Es mangelt an handlungsorientierten Erkenntnissen über die Merkmale spezifischer Personengruppen und damit einhergehend kleinräumigen, fundierten Bedarfsanalysen. Globale Merkmale wie ein Migrationshintergrund sollten kein ausschließlicher Indikator für die Zielgruppenauswahl und Interventionsgestaltung sein. Für alle Thesen, bei denen sich in der zweiten Delphi-Runde eher ein Dissens entwickelt hatte, konnte auf dem Workshop ein Konsens hergestellt werden. Auf Grundlage der Thesenbeurteilungen der beiden Delphi-Runden wurden prioritäre Handlungsbedarfe formuliert. Aus den Ergebnissen der Delphi-Befragung und des Statusworkshops wurden 21, zum Teil ineinandergreifende bzw. aufeinander aufbauende, Handlungsempfehlungen abgeleitet. Im Rahmen der Diskussionen stellte sich die Verstärkung der politischen Unterstützung als übergreifendes und grundlegendes Element für die Weiterentwicklung der strukturellen Verankerung der bislang eher fragmentierten Bewegungsförderungslandschaft heraus. Von den Expert_innen wurde eine gemeinsame, nationale Strategie gefordert, um Synergien effektiver zu nutzen und Nachhaltigkeit zu schaffen. Lücken und Doppelspurigkeiten könnten durch eine übergeordnete Strategie und mehr Koordination und Vernetzung systematisch erkannt und geschlossen werden. Als zielführend wurde von den Befragten einheitlich eingeschätzt, den Austausch unter Expert_ innen, wie sie im Rahmen des Delphi-Projektes erfolgte, fortzusetzen und zu fördern und somit Kooperationsstrukturen zu verbessern. Die Delphi-Befragung hat insgesamt aufgezeigt, dass die Bewegungsförderungslandschaft derzeit noch als fragmentiert einzuschätzen ist. Es sind bereits erste positive Entwicklungen zu verzeichnen, welche ausgebaut und weitergeführt werden müssen. Eine strukturelle Verankerung muss auf mehreren Ebenen jedoch noch erfolgen bzw. verstärkt werden. Eine Herausforderung ist der Transfer und die Verstetigung bestehender Angebote und Strukturen. Im Rahmen der Studie ist ein vielfältiges Repertoire möglicher Lösungsansätze entstanden. Dieses kann Grundlage für die weitere Prioritätensetzung im Feld der Bewegungsförderung sein und bedarf künftig einer weiteren detaillierten Diskussion. Einige Vorschläge, z. B. die Erarbeitung nationaler Empfehlungen für Bewegung (Pfeifer und Rütten 2017), wurden mittlerweile umgesetzt. Jedoch konnten nicht alle abgeleiteten Handlungsbedarfe und -empfehlungen abschließend diskutiert und geklärt werden. So blieb bspw. offen, von wem ein Impuls zur Entwicklung langfristiger Planungsstrategien ausgehen kann. Die angewandten Methoden haben somit verschiedene Stärken, aber auch Schwächen zur Beantwortung der Ausgangsfragestellungen mitgebracht, die abschließend diskutiert werden.

204

H. Gohres und P. Kolip

1.3 Reflexion der methodischen Vorgehensweise Die Studie zielte auf die Erstellung einer expert_innengestützten Bestandsaufnahme zu den Strukturen der Bewegungsförderung und die Entwicklung von Handlungsempfehlungen zu ihrer Weiterentwicklung. Diese Ziele konnten vollständig erreicht werden. Die erfolgreiche Umsetzung des Projektes zeigt, dass die angewandten Methoden adäquat und zielführend waren. Dennoch zeigten sich in der Umsetzung Herausforderungen und Schwächen, die zur Interpretation der Ergebnisse bzw. für die Planung ähnlicher Vorhaben berücksichtigt werden sollten. Sowohl Stärken als auch Schwächen sollen schrittweise beurteilt werden. Zur Vorbereitung der eigentlichen Delphi-Befragung wurde ein umfassender qualitativer Ansatz verfolgt. Für die Fragebogenentwicklung wurde die übliche Herangehensweise über einen theoretischen Zugang (Schulz und Renn 2009) als nicht zielführend erachtet. Zur Einschätzung und Bewertung der Strukturen war vielmehr praktisches Wissen erforderlich, das mittels des qualitativen Forschungsansatzes der Expert_inneninterviews und einer Fokusgruppe gebündelt wurde. Die vorbereitenden Expert_inneninterviews stellten eine gute Methode dar, um die Bewegungsförderungslandschaft grundlegend zu beurteilen und einen Handlungsrahmen abzustecken. Die Abstimmung der Thesen im Rahmen der Fokusgruppe hat die Gültigkeit der aus den Interviews abgeleiteten Thesen zusätzlich abgesichert. Durch den Einbezug möglichst breit gefächerter Expertise konnte so bereits von Beginn an eine möglichst facettenreiche Sicht auf den status quo der Bewegungsförderung sichergestellt werden. Mit der Delphi-Befragung konnte im Vergleich zu Expert_inneninterviews eine breitere Expert_innenbasis in die Beurteilung eingeschlossen werden. Herauszustellen ist der diskursive Charakter der Delphi-Befragung, der einen zielgerichteten Kommunikationsprozess angestoßen hat und so nicht nur Einzelmeinungen abbildet, sondern konsensorientiert Gruppenmeinungen erfasst (Häder 2014; Vorgrimler und Wübben 2003). Es bestehen damit Ähnlichkeiten zum Verfahren der Gruppendiskussion, wobei sich die Delphi-Methode durch die mehrfache Befragung sowie die Anonymität der Einzelbeiträge hiervon abhebt. Es können so gruppendynamische Prozesse ausgelöst, gleichzeitig die Offenheit des Einzelnen gewahrt, aber die Meinungsführerschaft dominanter Teilnehmender verhindert werden (Döring und Bortz 2016; Häder 2014). Ein Informationsgewinn war insbesondere durch die Kopplung quantitativer und qualitativer Befragungselemente festzustellen. Durch die Rückspiegelung der schriftlichen Begründungen der ersten Delphi-Runde wurde in der zweiten Runde oftmals eine weitergehende Reflexion der zu bewertenden Thesen angestoßen, um eine

Modifiziertes Delphi-Verfahren zur Ermittlung …

205

Zustimmung oder Ablehnung der Durchschnittsmeinung abzuwägen. Hierdurch wurden mehrfach weitere Betrachtungsweisen und Lösungsansätze eingebracht, die eine Diskussionsgrundlage für den anschließenden Workshop boten. Somit konnte ein multiperspektivisches Bild der Bewegungsförderung gezeichnet werden, auf dessen Basis eine thesengeleitete Ableitung und Diskussion von Handlungsempfehlungen im Rahmen des Workshops möglich wurde. Für die Urteilsbewertung muss jedoch beachtet werden, dass keine vollkommene Objektivität bei der Darstellung gewährleistet werden kann. Dies gilt insbesondere für das qualitative Feedback. Es sind Zusammenfassungen, Neuformulierungen und Auswahlentscheidungen nötig, sodass nicht alle abgegebenen Begründungen berücksichtigt werden können und eine Beeinflussung des Meinungsbildungsprozesses der Teilnehmenden nicht ausgeschlossen werden kann (Vorgrimler und Wübben 2003). Fehlende Kontextinformationen konnten jedoch durch den anschließenden Workshop zur Diskussion gebracht werden. In rein quantitativen Delphis werden häufig so viele Wiederholungsrunden durchgeführt, bis die Streuung der Antworten unterhalb eines definierten Wertes liegt, um von einem Konsens zu sprechen (Häder 2014). Im Rahmen des Bewegungsdelphis wurden die Ergebnisse der ersten Runde in der zweiten Feedbackrunde zwar zurückgespiegelt, es war jedoch nicht das ausgewiesene Ziel, die Ansichten der Expert_innen – bestimmt durch die statistische Streuung – zu harmonisieren, sondern vorrangig zu qualifizieren. Auch wenn davon ausgegangen werden kann, dass sich ein Teil der Teilnehmenden weiter in Richtung Durchschnittsmeinung positioniert (Vorgrimler und Wübben 2003). So konnte nach der zweiten Befragungsrunde bei etwa der Hälfte der Thesen durch die Streuungsreduktion von einem Konsens ausgegangen werden. Widersprüche und Thesen, bei denen sich nach den Delphi-Runden eher ein Dissens zeigte wurden anschließend mit den Teilnehmenden im Rahmen des Workshops diskutiert und Handlungsempfehlungen entwickelt und konsentiert. Es ist dabei zu beachten, dass nur bei zwei der 16 Thesen signifikante Mittelwertdifferenzen zwischen den beiden Delphi-Runden beobachtet werden konnten, was mit der insgesamt hohen Zustimmung schon in Runde eins zusammenhängen kann. Der Workshop ersetzte ein Gruppendelphi. Er war eine hilfreiche und notwendige Ergänzung der Delphi-Befragung, um Abweichungen bei der Theseneinschätzung sowie schriftliche Begründungen Einzelner nochmals zur Diskussion zu stellen, zu konsentieren und fehlende Kontextinformationen einzuholen, wie die exemplarische Meinungsbildung zu einer der Thesen zeigt. Die Vorteile der Anonymität der Delphi-Befragung bergen zudem gleichzeitig das Risiko, dass sich die Teilnehmenden weniger für ihre Einschätzung verantwortlich sehen und

206

H. Gohres und P. Kolip

sie möglicherweise zu einer übereilten, nicht ausreichend durchdachten Urteilsfindung kommen (Vorgrimler und Wübben 2003). Dieser Effekt wurde in dem durchgeführten Projekt durch den Workshop abgemildert. Die persönlichen Einschätzungen aus der Delphi-Befragung bleiben zwar anonym, dennoch wurde im Plenum über Aussagekraft und Gültigkeit der Antworten gesprochen. Im Zusammenhang mit der Anonymität der Delphi-Teilnehmenden war vielmehr zu beobachten, dass die schriftliche Begründung der Beurteilungen zum Teil sehr knapp ausfiel. So war der Informationsgewinn bei einzelnen Einschätzungen gering. Darüber hinaus neigen Expert_innen nach Vorgrimler und Wübben (2003) dazu, vorsichtige Urteile abzugeben. Somit könnte die Konsensbildung eine Verstärkung der konservativen Einschätzungen herbeiführen. Dies bestätigt sich dadurch, dass nach Rückspiegelung der Ergebnisse häufig eher von einer vollständigen Zustimmung abgerückt wurde. Für diese Studie wurden somit Elemente eines klassischen mit denen eines Gruppendelphis verknüpft (Häder 2014; Schulz und Renn 2009). Die Variante, den Fragebogen zunächst in zwei Runden schriftlich und anonym zu beantworten und die Ergebnisse anschließend auf einem Workshop zu diskutieren birgt Vor-, aber auch Nachteile. Die schriftliche Befragung ermöglicht eine gleichwertige Beteiligung des teilnehmenden Expert_innenkreises und bietet diesem ausreichend Zeit, sich inhaltlich mit den Fragestellungen auseinanderzusetzen. Auf dem Workshop kann dann effektiver über heterogene Einschätzungen und prioritäre Handlungsbedarfe gesprochen werden. An dieser Stelle besteht das Risiko, bei der Konzeption des Workshops relevante Aspekte des Fragebogens herauszunehmen, da auf Basis der schriftlichen Einschätzungen von einem Konsens ausgegangen wurde. An dieser Stelle sind jedoch Fehlinterpretationen möglich, die durch ein rein persönliches Gruppendelphi ausgeschlossen werden sollen (Schulz und Renn 2009). Auch im Rahmen des Bewegungs-Delphis wurde eine Priorisierung der Workshopinhalte auf Basis der schriftlichen Erhebung vorgenommen. Dort wo Expert_innen jedoch Gesprächsbedarf über konsentierte Thesen hatten, wurde dieser soweit möglich auch aufgegriffen. Zudem wird dieser Effekt durch die qualitativen Begründungen in der schriftlichen Befragung etwas abgemildert. Ausgeschlossen werden kann ein unzureichendes Diskutieren über einzelne Thesen jedoch nicht. Entscheidende Grundlage einer Delphi-Befragung ist ihr Teilnehmer_innenkreis. Ziel ist es nicht, die Grundgesamtheit der Expert_innen vollständig abzubilden. Vielmehr geht es um „Interaktionsprozesse zur Wissensgenerierung“, die durch das Feedback angestoßen werden (Häder 2014). Delphi-Befragungen sind durch die gezielte Auswahl von Expert_innen auf dem interessierenden Gebiet auch ohne hohe Teilnehmer_innenzahl aussagekräftig. Wichtig sind

Modifiziertes Delphi-Verfahren zur Ermittlung …

207

eine breite Streuung des Expert_innenwissens innerhalb der Gruppe sowie eine interdisziplinäre Zusammensetzung, um den Informationsgewinn zu erhöhen (Novakowski und Wellar 2008). Die Aussagekraft der Expert_innenmeinung hängt jedoch nicht nur vom Expert_innenstatus, sondern auch von der Bereitschaft zur Teilnahme ab. So nehmen nicht alle als relevant identifizierten Expert_innen auch an der Befragung teil. Dies wird zwar durch die Bildung eines Gruppenurteils über die Spannbreite der Expert_innenmeinungen hinweg teilweise kompensiert, ein Abgleich von Ziel und Response ist dennoch notwendig (Goodman 1987 zit. nach Häder 2014). In der dargestellten Delphi-Studie zur Bewegungsförderung war es Ziel, die Felder Prävention/Gesundheitsförderung, Pflege und Rehabilitation abzudecken. Insgesamt konnten viele unterschiedliche Expert_innen verschiedenster Bereiche eingeschlossen werden. Allerdings waren Akteur_innen aus dem Bereich Prävention/Gesundheitsförderung überproportional vertreten. Dies war bereits der Rekrutierung geschuldet, da für diesen Bereich mehr Anfragen gestellt wurden. So wurden Gruppenvergleiche durch ungleich große Gruppen erschwert. Die Varianzanalysen zeigten für keine These signifikante Unterschiede für die verschiedenen Kompetenzbereiche. Die Unterschiede zwischen den Tätigkeitsfeldern fielen bei zwei Thesen signifikant aus (These 5, p = 0,024; These 9, p 10 % Zucker- oder >20 % Fettanteil) in Schulen und KITAs verbieten.

Abschätzung gesundheitsbezogener Maßnahmen …

273

• Ausbau von wohnquartiernahen Spiel- und Sportstätten und Garantie des freien Zutritts, damit Kinder und Jugendliche bewegungsintensive Freizeitalternativen haben • Schaffung von Stellen zur Koordination von Maßnahmen der Adipositasbekämpfung auf kommunaler, Länder- und Bundesebene. • Durchsetzung einer leicht verständlichen Kennzeichnung von Lebensmitteln entsprechend dem britischen Ampel-System. • Durchsetzung eines Werbeverbots für hochkalorische Lebensmittel (>10 % Zucker- oder >20 % Fettanteil). • Umsetzung eines an Nachhaltigkeit orientierten Unternehmensrating, mit steigenden Kapitalbeschaffungskosten für risikoproduzierende Unternehmen (mit möglichen Einflüssen auf Adipositas bei Kindern und Jugendlichen). • Durchführung von Studien zur Erreichbarkeit (z. B. Mediennutzung) von Kindern und Jugendlichen in Problemgruppen (Zwick und Schröter 2009, S. 66).

3.3 Die Fragebogengestaltung Die Einzelmaßnahmen sollten von den Expert_innen danach eingeschätzt werden, wie sinnvoll sie aus institutioneller Sicht sind (Orientierungswissen), wie effektiv sie hinsichtlich der Problemlösungskapazität erscheinen (Systemwissen) und inwieweit sie von den Expert_innen für umsetzbar gehalten werden (Transformationswissen). Im Erhebungsinstrument boten wir die Items in Form intervallskalierter Ratingskalen von eins bis zehn Skalenpunkten an. Bei der Einschätzung der Effektivität von Maßnahmen erhoben wir zusätzlich auf einer vier Ausprägungen umfassenden Ordinalskala die Selbsteinschätzung der Urteilssicherheit von „sehr unsicher“ bis „sehr sicher“. Der Frage nach der Sinnhaftigkeit der einzelnen Maßnahmen fügten wir die offene Frage danach an, ob, und wenn ja, welche relevanten Maßnahmen vergessen wurden und es wert seien, mit in den Katalog aufgenommen zu werden. Über die drei oben genannten Dimensionen hinaus, wollten wir mit dem Gruppendelphi in Erfahrung bringen, welche der nachfolgend genannten Institutionen für die Umsetzung der jeweiligen Maßnahme in erster Linie die Verantwortung übernehmen soll: Bund, Länder, Kommunen, die Industrie, Wohlfahrtsverbände, Krankenkassen oder -versicherungen, ‚niemand‘ und – offen gefragt – „wer sonst“? Als Eisbrecherfrage wurde dem Erhebungsinstrument die Frage vorangestellt, für wie gravierend man Adipositas im Kindes- und Jugendalter verglichen mit neun

274

M. M. Zwick et al.

weiteren Problemen für unser Land in den kommenden fünf bis zehn Jahren halte. Angeboten wurden einmal mehr Ratingskalen zwischen einem und zehn Punkten.4

3.4 Die Auswahl der Expert_innen Häder beschreibt die Suche nach und Rekrutierung von geeigneten Expert_ innen für ein Delphi als wichtige, zugleich aber ausgesprochen komplizierte und aufwendige Aufgabe (2002, S. 96 f.) – Probleme, die, verglichen mit einem konventionellen, internetgestützten Delphi, beim Gruppendelphi noch deutlich schwerer wiegen. Gilt es doch, die ausgewählten Expert_innen an einem bestimmten Tag zu einem Workshop an einem bestimmten Ort zu versammeln. Dies macht eine langfristige und aufwendige Terminsuche erforderlich, bei der wir eine internetbasierte Terminfindungsplattform zu Hilfe nahmen. Zumindest die Auswahl der Expert_innen wurde in unserem Falle stark vereinfacht: Die Arbeit unseres Adipositasprojekts wurde begleitet von einem Projektbeirat mit 20 Akteuren aus thematisch einschlägigen Institutionen. Seine Mitglieder repräsentierten die unterschiedlichsten einschlägigen Institutionen, die von Projektbeginn an mit Fragestellung, Projektdesign, theoretischer und methodischer Ausrichtung vertraut waren und Projektzwischenergebnisse turnusmäßig mit dem interdisziplinären Wissenschaftler_innenteam erörterten. Da die Beiratsmitglieder einerseits professionell mit dem Thema Adipositas beschäftigt und andererseits mit den Projektergebnissen vertraut waren, bot es sich an, die Delphiteilnehmenden aus diesem Expert_innenkreis zu rekrutieren. Insgesamt erklärten sich 13 Expert_ innen aus unserem Projektbeirat hierzu bereit und fanden sich am 5. Mai 2008 in einem Stuttgarter Tagungshotel zum Gruppendelphi ein. Der institutionelle Hintergrund der Expert_innen umfasste Versicherungen, Ministerien, Ämter, Verbände, Lebensmittelhersteller und Universitäten bzw. Forschungseinrichtungen. Häder problematisiert in seinen Ausführungen zum Thema Delphi auch die geeignete Größe der Expert_innengruppe. Sein Blick in die Fachliteratur offenbart eine enorme Spannbreite der Empfehlungen, die zwischen sieben und einer nach oben offenen Zahl rangieren; an einem japanischen Delphi nahmen im Jahr 1996 nicht weniger als 4196 Expert_innen teil (Häder 2002, S. 94 f.). Zwar hängt

4Das

komplette Erhebungsinstrument ist im Anhang der Publikation von Zwick und Schröter (2009) abgedruckt.

Abschätzung gesundheitsbezogener Maßnahmen …

275

die optimale Expert_innenzahl von einer Reihe von Faktoren ab – nicht zuletzt vom Zuschnitt der Aufgabenstellung und der Zahl dafür relevanter Institutionen und Akteur_innen. Für ein Gruppendelphi sind aber, verglichen mit den bei Häder genannten Zahlen, schon aus rein praktischen Gründen wesentlich engere Grenzen der Gruppengröße zu ziehen: Um das diskursive Element zu stärken, beabsichtigten wir, die Fragebögen in Kleingruppen von drei bis vier Expert_ innen gemeinsam diskutieren und ausfüllen, und danach divergierende Ergebnisse im Plenum erörtern zu lassen. Das Tagungshotel konnte uns fünf Räume verfügbar machen, einen großen für die Plenumsdiskussionen und vier kleinere Seminarräume für die Fragebogenbearbeitung in den Expert_innengruppen. Dieses Prozedere hat sich in unserem Fall als sinnvoll und praktikabel erwiesen. Aufgrund unserer Erfahrung halten wir vier bis sechs Gruppen mit jeweils drei bis vier Teilnehmenden für optimal. Damit ist zum einen gewährleistet ist, dass alle Expert_innen ihre Sichtweise in Arbeitsgruppe und Plenum ausreichend darlegen können. Zum anderen können die Auswertungen in vertretbar kurzer Zeit erfolgen. Hieraus errechnen sich als grober Anhaltspunkt und Empfehlung, zwischen einem und zwei Dutzend Teilnehmende für das Gruppendelphi einzuladen. Mit 13 Personen lagen wir innerhalb dieser Marge.

3.5 Die Durchführung des Gruppendelphis Das Gruppendelphi folgt der Logik eines iterativen, zwei- oder mehrstufigen Diskurses, mit dem im Prinzip drei Ziele verfolgt werden: Die Einschätzung von Sachverhalten auf standardisierten, metrisch skalierten Skalen in kleinen Expert_ innengruppen und die anschließende Diskussion stark abweichender Urteile im Plenum, mit dem Ziel einer (sukzessiven) Annäherung der Expert_innenurteile in einer oder mehreren nachfolgenden Bearbeitungswellen. Dabei werden alle Items, über die weitgehender Konsens unter den Expert_innen besteht, ad acta gelegt und in jeder nachfolgenden Bearbeitungsphase nur noch Items diskutiert, die unter den Expert_innen nach wie vor strittig sind. Wird das erste Ziel, Konsens unter den Expert_innen herzustellen nicht erreicht, eröffnen die Diskussionen im Plenum zum Zweiten die Möglichkeit, zu entscheiden, ob der nach wie vor bestehende Dissens semantisch in der Itemformulierung oder aber in der Sache begründet liegt. Bei semantischen Unklarheiten können Items umgehend diskutiert, aufgeklärt und in optimierter Form im Delphi weiterverarbeitet werden. Bei Dissens in der Sache bietet das Delphi die Chance, ausführliche Begründungen, die zu unterschiedlichen Einschätzungen Anlass bieten, diskursiv einzuholen und als Ergebnis festzuhalten. Hierin liegt der dritte, wesentliche Nutzenaspekt des Gruppendelphis.

276

M. M. Zwick et al.

Nachdem wir große Probleme antizipierten, Expert_innen für mehr als einen Arbeitstag für unsere Zwecke in Anspruch zu nehmen, planten wir unser Delphi als eintägigen Workshop, an dem wir zwei Bearbeitungsrunden anvisierten. Am Vor- und am Nachmittag jeweils eine Gruppenarbeitsphase, gefolgt von der Ad-hoc-Auswertung der Ergebnisse und einer ausführlichen Erörterung abweichender Expert_innenurteile im Plenum. Nach zwei knappen Impulsreferaten – einem vom Moderator zur Methode des Delphi und einem weiteren von einem Mitglied des Projektteams zu Inhalt und Fragestellung – und einigen organisatorischen Hinweisen, bildeten wir aus den angereisten Expert_innen für jede der beiden Delphi-Runden je vier unterschiedlich zusammengesetzte Arbeitsgruppen mit drei bzw. vier Teilnehmenden, denen wir die vorbereiteten Erhebungsinstrumente aushändigten. Gegenüber der individuellen Fragebogenbearbeitung besteht der Vorteil, die Bearbeitung in kleinen Gruppen vornehmen zu lassen, darin, das diskursive Element bei der Bearbeitung des Fragebogens zu stärken, aber auch, den Bearbeitungsaufwand zu begrenzen, da lediglich vier in Gruppen ausgefüllte Fragebögen auszuwerten waren. Diese Strategie hat sich, im Nachhinein betrachtet, sehr gut bewährt. Ebenfalls sehr bewährt hat sich die Entscheidung, einen im Hinblick auf Gruppendelphis besonders erfahrenen Moderator für die Leitung der Plenumsdiskussionen zu verpflichten. Vom Moderator, will er den Respekt der geladenen Expert_innen genießen, sind, neben einem angemessenen sozialen Status, hohe soziale und kommunikative aber auch außerordentliche Sachkompetenz und Unparteilichkeit gefordert. Es empfiehlt sich, bei der Auswahl eines geeigneten Moderators große Sorgfalt walten zu lassen, denn sein Geschick entscheidet in wesentlichem Maße über Ge- oder Misslingen eines Gruppendelphis (vgl. Schulz und Renn 2009b, S. 115). Die geforderten Eigenschaften des/der Moderators/in sollten sich in unserem Fall als maßgeblich für den Erfolg des Gruppendelphiworkshops herausstellen. Denn vor allem die institutionellen Eigenlogiken der Stakeholder sorgten für massiven Dissens in Arbeitsgruppen und Plenum – nur dank seines außerordentlichen kommunikativen Geschicks gelang es dem Moderator, das Zerbrechen der Expert_innengruppe zu verhindern. Die erste Gruppenarbeitsphase nahm gut eineinhalb Stunden in Anspruch. Während der nachfolgenden Mittagspause bewerkstelligte unser Team, bestehend aus je zwei Wissenschaftler_innen und Hilfskräften die Auswertung der vier Fragebögen. In Anbetracht der geringen Zahl, bereitete die Auswertung mit Paper, Stift und Taschenrechner keine nennenswerte Mühe. Infolge der gezielten Auswahl und der geringen Zahl der Expert_innen mussten wir uns bei der

Abschätzung gesundheitsbezogener Maßnahmen …

277

­ uswertung auf basale deskriptive Statistik – arithmetisches Mittel und Range – A beschränken (Sahner 2005, S. 133), wobei wir abweichende Urteile bis maximal drei Skalenpunkte noch als hinreichend „konsensuell“ akzeptierten. Der Fragebogen lag in Form einer Excel-Datei vor, in die wir zum einen die Ergebnisse für die Präsentation der Ergebnisse auf dem mitgebrachten Beamer übertrugen. Parallel bereiteten wir den Druck des Fragebogens für die zweite Delphirunde vor, wofür wir einen schnellen Laserdrucker bereithielten. Allerdings erwies sich das Dateiformat Excel als unvorteilhaft, weil Bildschirm- und Druckausgabe des Fragebogens nicht übereinstimmten und die Formatierung mehrmals nachjustiert werden musste.

3.6 Die Ergebnisse Die Ergebnisse des Gruppendelphis wurden bereits ausführlich publiziert (Zwick und Schröter 2009; 2011). Sie werden nachfolgend nur insoweit aufgegriffen, als sich daran die Arbeitsweise, Wirkung, Chancen und Limitierungen der Gruppendelphimethode darstellen lassen. Unserem Gruppendelphi ermangelte es nicht an intensiven und auch kontroversen Debatten, von denen wir für die Auswertung eine Audioaufzeichnung anfertigten und sie außerdem protokollieren ließen. Die Auswertung des Textmaterials mithilfe von MAXQDA geschah auf der Grundlage von Paraphrasen, für welche die angefertigten Diskursprotokolle anhand des Mitschnitts der Plenumsdiskussionen verfeinert, ergänzt und dergestalt indexiert wurden, dass bei Bedarf unmittelbar in die O-Töne der Mitschnitte gewechselt und Zitate daraus gewonnen werden konnten. Für die Publikation der Gruppendelphiergebnisse hat sich dieses Verfahren ausgesprochen gut bewährt. Die Meinungsverschiedenheiten der Expert_innen drückten sich bereits in der Einschätzung der Fettleibigkeit bei Kindern und Jugendlichen verglichen mit neun weiteren gesellschaftlichen Problemen aus. Am gravierendsten wurde von den Expert_innen – mit einem Mittelwert von 7,0 Punkten auf einer Skala von eins bis zehn – die Problematik der Finanzierung des Gesundheitssystems eingeschätzt, knapp gefolgt von Arbeitslosigkeit und globalem Klimawandel (jeweils 6,8 Punkte) sowie der Sicherung des Energiebedarfs (6,0). Sodann folgt die Adipositas mit einem durchschnittlichen Punktescore von 5,6, noch vor der Sicherung der Renten (5,5) und dem Problem der „neuen Armut“ (5,3). Die Schlusslichter bilden mit jeweils 4,8 Punkten Jugendgewalt, Rechtsextremismus

278

M. M. Zwick et al.

und Terrorismus. Keine einzige dieser Problemlagen wurde von den Expert_innen konsensuell bewertet. Bei der Einschätzung der gesellschaftlichen Folgenschwere der Adipositas rangierten die Urteile nach den Gruppendiskussionen von drei bis neun Skalenpunkte und evozierte zudem ein Minderheitsvotum. Ursächlich hierfür waren die schwer bezifferbaren direkten und vor allem indirekten, durch Folgeerkrankungen ausgelösten Kosten. Zudem seien die Folgen von Übergewicht und Fettleibigkeit „weder quantitativ noch hinsichtlich ihrer Schwere hinreichend wissenschaftlich belegt“ (Zwick und Schröter 2011, S. 246). Im Plenum entwickelte sich eine lange und intensive Diskussion um Dramatik und Folgenschwere der juvenilen Adipositas mit dem positiven Effekt, dass sich die Spannweite der Urteile von zuerst sechs auf nunmehr vier Skalenpunkte verringerte, bei einer durchschnittlich etwas geringeren Bewertung der gesellschaftlichen Auswirkungen (5,3 gegenüber 5,6 Skalenpunkten in der ersten Delphirunde). Erkauft wurden die Angleichung der Urteile und die intensive Begründung ihrer Variabilität durch einen beträchtlichen Zeitaufwand, der dazu führte, dass die übrigen Fragen in der zweiten Delphirunde nicht mehr von allen Arbeitsgruppen vollständig bearbeitet werden konnten. Aus diesem Grund beschränken wir die nachfolgenden Darstellungen auch auf das Merkmal „Sinnhaftigkeit der Präventionsmaßnahmen“, zu welchem die meisten Informationen aus beiden Delphirunden vorliegen. Außerdem mussten wir feststellen, dass die Expert_innenurteile zu der Sinnhaftigkeit und Effektivität der Maßnahmen nahezu vollständig zur Deckung kamen. Die Diskursbeiträge bestärkten uns in dem Eindruck, dass sich bei Präventivmaßnahmen „Sinnhaftigkeit“ im eigentlichen Sinne auf „Effektivität“ bezieht. Hieraus kann die Empfehlung abgeleitet werden, sich bei der Fragebogengestaltung auf semantisch distinkte Dimensionen zu beschränken. Möchte man an der Idee eines eintägigen Gruppendelphis mit intensiven Diskussionen festhalten, empfehlen sich unseres Erachtens folgende Maßnahmen: Der Fragebogen für die erste Delphirunde ist auf das absolute Mindestmaß an distinkten und unverzichtbar erscheinenden Items und Dimensionen zu beschränken. Außerdem kann auf die beiden Impulsreferate verzichtet werden, wenn man die Fragebögen für die erste Delphirunde, zusammen mit einem knappen, informativen Begleitschreiben im Vorfeld des Delphiworkshops elektronisch verschickt, ausfüllen und zurücksenden lässt, die Daten vorab auswertet, und den Delphiworkshop direkt mit der Ergebnispräsentation und anschließenden Aussprache im Plenum beginnen lässt. Wenngleich hiermit auf die Gruppenarbeit in der ersten Delphirunde verzichtet wird, erscheint uns dieser Kompromiss rückblickend als günstig, weil

Abschätzung gesundheitsbezogener Maßnahmen …

279

dadurch Zeitnot und – wie in unserem Falle – ein Abbruch der zweiten Runde bei der Bearbeitung der Fragebögen in Kleingruppen, vermieden werden können. Kehren wir zurück zur Sinnhaftigkeit der unterbreiteten Präventionsmaßnahmen. Tab. 1 wartet mit einigen interessanten Einsichten auf. Zunächst, dass eine klare Mehrheit der unterbreiteten Optionen im Mittel über 5,5 Punkte erzielten und damit als ausgesprochen sinnvoll eingeschätzt wurden. Dessen ungeachtet zeigt ein Blick auf die Spannweite (Range) der Urteile, dass unter den Expert_innen Dissens über die Sinnhaftigkeit der Maßnahmen herrschte. Die einzige Ausnahme hiervon bildet die starke Präferierung eines Ausbaus wohnquartiernaher Spiel- und Sportstätten für Kinder und Jugendliche, vermutlich mangels eines Kommunalpolitikers/einer Kommunalpolitikerin im Expert_innenpanel. Konträre Einschätzungen und heftige Debatten zogen vor allem jene drei Maßnahmen auf sich, die einen restriktiven Umgang mit Nahrungsmitteln zum Ziel haben. Zwei dieser drei Optionen riefen in der ersten Delphirunde sogar Minderheitsvoten bei der Fragebogenbearbeitung in den Arbeitsgruppen hervor. Im Plenum wurde anschließend eine Kontroverse von über einer Stunde um diese Items geführt, bei welcher der Abbruch des Gruppendelphis nur dank des außerordentlichen Geschicks des Moderators vermieden werden konnte. Vergleicht man die Expert_innenurteile der ersten und zweiten Delphirunde bei diesen drei Items, dann wird aber auch deutlich, wie fruchtbar derartige Debatten trotz institutioneller Sichtweisen und Eigenlogiken verlaufen können und dass – um eine These von Jürgen Habermas aufzugreifen (1972) – in einer gut moderierten, transparent und fair geführten Debatte, bessere Argumente Überzeugungskraft entfalten und wenigstens ansatzweise Konsens zu stiften vermögen: In allen drei Fällen nahm die Spannweite der Expert_innenurteile in der zweiten Delphirunde, also nach der Plenumsdebatte, deutlich ab, und zwar im Fall eines Werbeverbots für hochkalorische Lebensmittel von acht auf fünf Skalenpunkte bei gleichzeitigem Verschwinden des Minderheitsvotums. Bei der Kennzeichnung von Lebensmitteln entsprechend dem britischen „Ampelsystem“ von acht auf drei Skalenpunkte und beim Verbot, hochkalorische Lebensmitteln in Schulen und Kitas zu verkaufen sogar von acht auf nur mehr einen Skalenpunkt. Und auch bei der Einschätzung der Durchführung von Studien zur Erreichbarkeit von Kindern und Jugendlichen in Problemgruppen gelang es, die Streuung der Expert_­innenurteile von neun auf drei Skalenpunkte zu reduzieren und damit weitgehenden Konsens herzustellen. Angesichts der konträren Haltungen bei diesen Optionen zu Beginn des Delphis liefern die sehr beachtlichen, diskursiv erwirkten Annäherungen der Expert_innenurteile in der zweiten Phase, unseres Erachtens überzeugende Belege für die Wirksamkeit sorgfältig moderierter, fairer Diskurse wie auch für die Methode des Gruppendelphis.

280

M. M. Zwick et al.

Tab. 1   Wie sinnvoll sind die folgenden Präventionsmaßnahmen? Maßnahme

1. Delphi-Runde Arithm. Mittel

2. Delphi-Runde

Range

Minderheitsvotum

Arithm. Mittel

Range

Minderheitsvotum

Ausbau von wohnquartier­ nahen Spiel- und Sportstätten und Garantie des freien Zutritts, damit Kinder und Jugendliche bewegungsintensive Freizeitalternativen haben

9,0

0*

Nein







Ausweitung des Sportangebots an allen Schulen auf zwei Doppelstunden wöchentlich

7,0

4

Nein

n.v.

n.v.



Schaffung von Stellen zur Koordination von Maßnahmen der Adipositasbekämpfung auf kommunaler, Länder- und Bundesebene

7,0

5

Nein

n.v.

n.v.



Den Verkauf von hoch kalorischen Lebensmitteln (>10 % Zucker- oder >20 % Fettanteil) in Schulen und KITAs verbieten

6,6

8

Ja

8,7

1

Nein

Durchsetzung einer leicht verständlichen Kennzeichnung von Lebensmitteln entsprechend dem briti-schen Ampel-System

6,0

8

Nein

8,5

3

Nein

Die Aufnahme des Faches Gesundheitserziehung in die Curricula aller Jahrgangsstufen an den allgemeinbildenden Schulen

5,8

8

Nein







(Fortsetzung)

Abschätzung gesundheitsbezogener Maßnahmen …

281

Tab. 1   (Fortsetzung) Maßnahme

1. Delphi-Runde Arithm. Mittel

2. Delphi-Runde

Range

Minderheitsvotum

Arithm. Mittel

Range

Minderheitsvotum

Neu: Die Aufnahme von thoretischer und praktischer Gesundheitsförderung als Querschnittsaufgabe in den Unterricht aller Schulen







8,5

2

Nein

Durchsetzung eines Werbeverbots für hochkalorische Nahrungsmittel (>10 % Zucker- oder >20 % Fettanteil)

5,4

9

Ja

5,0

5

Nein

Durchführung von Studien zur Erreichbarkeit (z. B. Mediennutzung) von Kindern und Jugendlichen in Problemgruppen

5,3

9

Nein

7,7

3

Nein

Umsetzung eines an Nachhaltigkeit orientierten Unternehmensrating, mit steigenden Kapitalbeschaffungskosten für risikoproduzierende Unternehmen (mit möglichem Einfluss auf Adipositas bei Kindern und Jugendlichen)

4,0

4

Nein

n.v.

n.v.



Quelle: Zwick und Schröter (2011, S. 249) *konsensuelle Items schieden nach der ersten Runde aus. n.v.: nicht verfügbar

Tab. 1 verweist auf einen weiteren Vorteil des Gruppendelphi. In der ersten Plenumsdiskussion wurde deutlich, dass mehr Gesundheitserziehung an allgemein bildenden Schulen im Grunde wünschenswert sei. Nur habe sich die Einführung eines speziellen Schulfachs hierfür als kontraproduktiv erwiesen, weshalb die Maßnahme insgesamt höchst kontrovers und im Mittel nur mit 5,8

282

M. M. Zwick et al.

Punkten bewertet wurde. In der Plenumsdiskussion wurde die Option ad hoc hinsichtlich der „Aufnahme von theoretischer und praktischer Gesundheitsförderung als Querschnittsaufgabe in den Unterricht aller Schulen“ angepasst und postwendend in den Fragebogen für die zweite Delphirunde aufgenommen. Das neue Item erzielte Konsens (nunmehr um zwei Skalenpunkte voneinander abweichende Urteile) und wurde hinsichtlich seiner Sinnhaftigkeit von zuvor 5,8 auf nunmehr 8,5 Skalenpunkte aufgewertet. Für weitere drei Items lagen infolge von Zeitnot in der zweiten Delphirunde keine Urteile vor (n.v.). Zusammenfassend hat sich das Gruppendelphi unseres Erachtens bewährt und zwar ungeachtet offensichtlicher Unzulänglichkeiten, die vor allem dem entstandenen Zeitdruck geschuldet waren: Unsere Ergebnisse aus Tab. 1 dokumentieren überzeugend die konsensbildende Kraft gut moderierter Diskurse, die – um Jürgen Habermas (1981) zu bemühen – durchaus geeignet sein können, Geltungsansprüche strategisch handelnder Akteure zu entkräften, auf Konsens hinzuwirken, aber auch semantische Klärungs- und inhaltliche Präzisierungsprozesse in nur kurzer Zeit herzustellen. Hierfür scheint es lohnend, heftige Debatten und inhaltliche Kontroversen in stark reglementierter und moderierter Form auszutragen. Das Gruppendelphi stellt, auch das sollte klar geworden sein, eine überaus effektive Diskursund Analysemethode dar, da zum einen mit Ende des Gruppendelphis das Gros der Ergebnisse gut dokumentiert in Form der ausgefüllten Fragebögen vorliegt. Zum anderen erlaubt es die Protokollierung und Audioaufzeichnung, die im Diskurs gefallenen Argumente in nur wenigen Tagen aufzubereiten und zu analysieren.

4 Zusammenfassung Das hier dargestellte Fallbeispiel eines Gruppendelphis hat sich auf die transdisziplinäre Bewertung von Handlungsempfehlungen bezogen. Selbstverständlich kann das Gruppendelphi – wie auch das klassische Delphi – in ganz unterschiedlichen Kontexten verwendet werden. Wie das vorangegangene Kapitel bereits gezeigt hat, hat die Methode spezifische Stärken und Schwächen, derer man sich bewusst sein sollte, wenn man beabsichtigt, ein Gruppendelphi durchzuführen. Daher möchten wir an dieser Stelle nun abschließend eine kritische Würdigung der Gruppendelphimethode vornehmen. Als Stärken des Gruppendelphi sind insbesondere folgende Punkte hervorzuheben:

Abschätzung gesundheitsbezogener Maßnahmen …

283

• Probates Verfahren, um geeignete Interventionsmaßnahmen auch in institutionell umstrittenen Feldern zu identifizieren. • Geeignete Strategie zur Reduktion von Unsicherheit bei der Abschätzung zukünftiger Ereignisse. • Tauglich, um Dissens unter Expert_innen aufzuklären und zu verringern. • Klärung, ob Dissens unter Expert_innen sachlich oder semantisch begründet ist. • Rasche, diskursive und kompetente Identifizierung von Gründen für abweichende Expert_innenmeinungen. • Schnelles und preiswertes Verfahren; das eigentliche Gruppenverfahren ist in ein bis maximal zwei Tagen abgeschlossen; die Ergebnisse liegen in kurzer Zeit nach dem Delphiworkshop vor. Schwächen bzw. besondere Herausforderungen bestehen unseres Erachtens vor allem im Hinblick auf die folgenden Punkte: • In der Regel lange und intensive Vorbereitungsphase bei der Identifizierung und Rekrutierung einschlägiger Expert_innen und bei der Terminfindung (Terminknappheit). • Auswahl und Verpflichtung eines/einer professionellen, erfahrenen Moderators/Moderatorin; bei konfliktreichen Themen kann der Erfolg des Gruppendelphis maßgeblich von seinem Geschick abhängen. • Hoher Zeitdruck bei eintägigem Gruppendelphi und intensiven Debatten. • Hoher organisatorischer Stress durch Ad-hoc-Auswertungen, Neukonzeption und Druck der Fragebögen. • Ausblendung sozialer Präferenzen, da am Delphi nur Expert_innen und Stakeholder beteiligt sind, die Öffentlichkeit jedoch ausgeschlossen bleibt. • Frustration der Beteiligten, wenn trotz hohen Aufwands, großer Expertise und beachtlichen Resultaten keine der als geeignet identifizierten Maßnahmen politisch umgesetzt wird. Alles in allem ist das Gruppendelphi unseres Erachtens eine geeignete Methode, um auf transdisziplinäre Weise sozial robuste Handlungsempfehlungen zu identifizieren. Der besondere Charme des Gruppendelphis liegt dabei in der Kombination eines sehr systematischen, standardisierten Vorgehens mit diskursiven Elementen.

284

M. M. Zwick et al.

Literatur Barlösius, E., & Philipps, A. (2011). Die Gesellschaft und das Selbst der ‚Dicken‘. Wie Kinder und Jugendliche gesellschaftliche Haltungen und Erwartungen in ihre Selbstkonstitution hineinnehmen. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 181–201). Wiesbaden: Springer VS. Brandt, P., Ernst, A., Gralla, F., Luederitz, C., Lang, D. J., & Newig, J., et al. (2013). A review of transdisciplinary research in sustainability science. Ecological Economics, 92, 1–15. Defila, R., & Di Giulio, A. (2015). Integrating knowledge: Challenges raised by the „Inventory of Synthesis“. Futures, 65, 123–135. Defila, R., & Di Giulio, A. (2019). Eine Reflexion über Legitimation, Partizipation und Intervention im Kontext transdisziplinärer Forschung. In M. Ukowitz & R. Hübner (Hrsg.), Partizipation und Intervention. Wege der Vermittlung in der transdisziplinären Forschung: Bd. 3. Interventionsforschung. Wiesbaden: Springer VS. Deuschle, J., & Sonnberger, M. (2011). Zum Stereotypus des übergewichtigen Kindes. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 161–180). Wiesbaden: Springer. Fankhänel, S. (2007). Epidemie Adipositas. Jahrestagung der Deutschen Adipositas-Gesellschaft. Ernährung – Wissenschaft und Praxis, 1(9), 418–420. Habermas, J. (1972). Vorstudien und Ergänzungen zur Theorie des kommunikativen Handelns. Frankfurt a. M.: Suhrkamp. Habermas, J. (1981). Theorie des kommunikativen Handelns. Erster Band. Frankfurt a. M.: Suhrkamp. Häder, M. (2002). Delphi-Befragungen. Ein Arbeitsbuch. Opladen: Springer VS. Helmert, U., Schorb, F., Fecht, C., & Zwick, M. M. (2011). Epidemiologische Befunde zum Übergewicht und zur Adipositas bei Kindern, Jugendlichen und jungen Erwachsenen. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 49–70). Wiesbaden: Springer VS. Jahn, T. (2008). Transdisziplinarität in der Forschungspraxis. In M. Bergmann (Hrsg.), Transdisziplinäre Forschung. Integrative Forschungsprozesse verstehen und bewerten (S. 21–37). Frankfurt a. M.: Campus. Jahn, T., Bergmann, M., & Keil, F. (2012). Transdisciplinarity. Between mainstreaming and marginalization. Ecological Economics, 79, 1–10. Krömker, D., & Vogler, J. (2011). Übergewicht und Adipositas – Eine Diätgeschichte. Ergebnisse einer bundesweiten Befragungsstudie mit Kindern und Jugendlichen aus psycho-sozialer Sicht. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 115–135). Wiesbaden: Springer VS. Mittelstraß, J. (2005). Methodische Transdisziplinarität. Technikfolgenabschätzung – Theorie und Praxis, 14(2), 18–23. Müller, C., Roscher, K., Parlesak, A., & Bode, C. (2011). Systemische Risikofaktoren relativieren den alleinigen Einfluss von Ernährung und Bewegung bei der Entstehung von Übergewicht und Adipositas bei Kindern und Jugendlichen. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 91–114). Wiesbaden: Springer VS.

Abschätzung gesundheitsbezogener Maßnahmen …

285

Peter, C. (2011). Essen ohne Maß? Zu Formen der Essensorganisation in Familien mit ‚dicken Kindern‘. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 137–159). Wiesbaden: Springer VS. Pohl, C., & Hirsch Hadorn, G. (2008). Core terms in transdisciplinary research. In G. Hirsch Hadorn, H. Hoffmann-Riem, S. Biber-Klemm, W. Grossenbacher-Mansuy, D. Jove, & C. Pohl (Hrsg.), Handbook of transdisciplinary research (S. 427–432). Dordrecht: Springer. Renn, O., Webler, T., & Wiedemann, P. M. (1995). The persuit of fair and competent citizen participation. In O. Renn, T. Webler, & P. M. Wiedemann (Hrsg.), Fairness and competence in citizen participation. Evaluating models for environmental discourse (S. 339– 668). Dordrecht: Kluwer. Sahner, H. (2005). Schließende Statistik. Wiesbaden: Springer VS. Schiek, D. (2011). Körper von Gewicht. Zur Geschlechterdifferenz in den Ernährungs- und Körpernormen. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 203–218). Wiesbaden: Springer VS. Schulz, M., & Renn, O. (2009a). Einleitung. In M. Schulz & O. Renn (Hrsg.), Das Gruppendelphi (S. 7–21). Wiesbaden: Springer VS. Schulz, M., & Renn, O. (2009b). Diskussion der Befunde. In M. Schulz & O. Renn (Hrsg.), Das Gruppendelphi (S. 111–117). Wiesbaden: Springer VS. Wabitsch, M., Hebebrand, J., Kiess, W., & Zwiauer, K. (Hrsg.). (2005). Adipositas bei Kindern und Jugendlichen. Grundlagen und Klinik. Berlin: Springer. WHO. (2000). Obesity: Preventing and managing the global epidemic. Report of a WHO Consultation. WHO Technical Report Series 894. http://whqlibdoc.who.int/trs/WHO_ TRS_894.pdf. Zugegriffen: 12. März 2018. Zwick, M. M. (2008). Maßnahmen wider die juvenile Adipositas. In Interdisziplinärer Forschungsschwerpunkt Risiko und nachhaltige Technikentwicklung der Universität Stuttgart (Hrsg.), Stuttgarter Beiträge zur Risiko und Nachhaltigkeitsforschung (Bd. 9). http://michaelmzwick.de/UPLOAD/ab09_zwick.pdf. Zugegriffen: 20. März 2018. Zwick, M. M. (2011). Die Ursachen der Adipositas im Kindes- und Jugendalter in der modernen Gesellschaft. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 71–90). Wiesbaden: Springer VS. Zwick, M. M., & Renn, O. (2011). Adipositas im Kindes- und Jugendalter – Ein systemisches Risiko? In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 279–287). Wiesbaden: Springer VS. Zwick, M. M., & Schröter, R. (2009). Begrenzter Konsens. Präventions- und Therapiemaßnahmen von Übergewicht und Adipositas im Kindes- und Jugendalter. Analyse eines Expertendelphi. In Interdisziplinärer Forschungsschwerpunkt Risiko und nachhaltige Technikentwicklung der Universität Stuttgart (Hrsg.), Buchreihe Stuttgarter Beiträge zur Risiko- und Nachhaltigkeitsforschung (Bd. 11). http://www.michaelmzwick.de/ UPLOAD/ab011.pdf. Zugegriffen: 14. März 2018. Zwick, M. M., & Schröter, R. (2011). Wirksame Prävention? Ergebnisse eines Expertendelphi. In M. M. Zwick, J. Deuschle, & O. Renn (Hrsg.), Übergewicht und Adipositas bei Kindern und Jugendlichen (S. 239–259). Wiesbaden: Springer VS.

Delphi-Studie zur Förderung von Sicherheits- und Gesundheitskompetenz bei der Arbeit Clarissa Eickholt

Zusammenfassung

Um Ansätze zur betrieblichen Förderung von Sicherheits- und Gesundheitskompetenz herauszuarbeiten, wurde eine Delphi-Studie durchgeführt. Diese Delphi-Studie fokussierte auf die Frage welche Kompetenzen zu Sicherheit und Gesundheit in kleinen und mittleren Unternehmen (KMU) von Bedeutung sind und zielte darauf ab, Maßnahmen abzuleiten und notwendige Kontextfaktoren bestimmen zu können. Sie wurde im Auftrag der Bundesanstalt für Arbeitsschutz und Arbeitsmedizin im Rahmen eines Projektes zur Förderung von Sicherheits- und Gesundheitskompetenz durch informelles Lernen im Prozess der Arbeit durchgeführt und stellte sich der Herausforderung neben allgemeinen Aussagen, spezifische Bedingungen aus den Branchen Zeitarbeit und Pflege zu generieren. Die Expert_innen aus Wissenschaft und betrieblicher Praxis stammten aus unterschiedlichen gesundheits- und sozialwissenschaftlichen Fachdisziplinen ebenso wie die Techniker_innen, Ingenieur_innen und Mediziner_innen. Insbesondere für die Auswertung der zweiten Erhebungswelle spielte die Branche, auf die die Expert_innen ihre Antworten bezogen, eine vorgeordnete Rolle. Schlüsselwörter

Delphi-Studie · Kompetenz · Kompetenzentwicklung · Gesundheitskompetenz · Informelles Lernen · Arbeitsschutz · Arbeitsprozess

C. Eickholt (*)  systemkonzept GmbH, Köln, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_12

287

288

C. Eickholt

1 Delphi-Studie zur Förderung von Sicherheitsund Gesundheitskompetenz bei der Arbeit Die im folgenden beschriebene Delphi-Studie erfolgte im Rahmen des Projektes „Ansätze zur betrieblichen Förderung von Sicherheits- und Gesundheitskompetenz durch informelles Lernen im Prozess der Arbeit“. Auftraggeber des Projektes war die Bundesanstalt für Arbeitsschutz und Arbeitsmedizin (kurz BAuA, Forschungsprojekt F2141 – Hamacher et al. 2012). Das Projekt sollte im Wesentlichen eine Bestandsaufnahme bestehender Studien und Modelle zu Sicherheit und Gesundheit bei der Arbeit im Kontext des Lernens und der Kompetenzentwicklung liefern. Außerdem ging es um die Entwicklung eines Konzeptes zur arbeitsprozessorientierten Förderung von Sicherheit und Gesundheit einschließlich der Ansatzpunkte zur Verbreitung und Implementation. Letzteres sollte für kleine und mittlere Unternehmen (KMU) zweier Branchen geschehen. Die spätere Auswahl der Branchen Zeitarbeit und Pflege lag aufgrund der damaligen Schwerpunktprogramme der BAuA nahe, da gerade dort Bedarfe aufgrund des Wandels der Arbeitsbedingungen und damit der Belastungen der Mitarbeiter_innen identifiziert wurden. KMU, d. h. Unternehmen mit weniger als 50 bzw. 250 Beschäftigte waren von besonderem Interesse für das Projekt, da hier (vor allem in Kleinunternehmen) seltener formalisierte Strukturen der Personalentwicklung vorzufinden sind. Während die Bestandsaufnahme bestehender Studien und Modelle in erster Linie über Literaturanalysen und Sekundäranalysen erfolgte, wurde als Fundament für die Konzeptentwicklung die Delphi-Methode ausgewählt. Das Projekt setzte bei der Suche nach niedrigschwelligen Möglichkeiten der betrieblichen Kompetenzentwicklung zu Sicherheit und Gesundheit an. Das war wichtig, weil der wirtschaftliche Erfolg von Unternehmen auch von leistungsfähigen und leistungsbereiten Beschäftigten abhängt. Leistungsfähigkeit und -bereitschaft sind ohne Gesundheit nicht denkbar und entsprechende Kompetenzen zum Erhalt der gesundheitlichen Ressourcen sind notwendig.

1.1 Forschungsfragen der Delphi-Studie Übergeordnet wurde mit der Delphi-Studie das Ziel verfolgt, Ansätze zur Förderung von Sicherheits- und Gesundheitskompetenz durch informelles Lernen im Prozess der Arbeit zu entwickeln. Hierzu wurden zwei Fragestellungen formuliert:

Delphi-Studie zur Förderung von Sicherheits- …

289

1. Welchen Lernbedarf zu Sicherheit und Gesundheit gibt es in KMU? 2. Welche Maßnahmen und Rahmenbedingungen im Unternehmen sind geeignet, um ein informelles Lernen zu Sicherheit und Gesundheit im Prozess der Arbeit zu ermöglichen?

1.2 Methodenauswahl Da die Sachverhalte zwar abgegrenzt, aber dennoch nicht objektiv bestimmbar waren, fiel die Wahl auf die Delphi-Methode. Ziel war es, der Befragung von Expert_innen aus Wissenschaft und Praxis eine methodische Systematik zu geben. Darüber hinaus ermöglicht die Methode eine Form der (indirekten) Gruppenkommunikation, mit der die inhaltlichen Fragestellungen vertiefend bearbeitet werden können, obwohl zu den Sachverhalten zunächst ein unsicheres und unvollständiges Wissen existiert (Häder 2014; Häder und Häder 1995). Es werden in der Literatur verschiedenste Typen von Delphi-Befragungen unterschieden. In der durchgeführten Studie wurde ein zweistufiges Verfahren gewählt, entlang des Typs 3 nach Häder und Häder (2014), d. h. mit dem Ziel Expert_innenaussagen zu ermitteln. In der ersten Welle wurden in einer qualitativ orientierten Befragung (offene) Antworten der Expert_innen generiert. In der zweiten Welle wurden die Erkenntnisse der ersten Welle in einem standardisierten Fragebogen überführt und hinsichtlich ausgewählter Kriterien bewertet.

1.3 Expert_innenauswahl, -ansprache und -teilnahme Die Expert_innenauswahl erfolgte anhand verschiedener Kriterien. Zum einen sollten Expert_innen aus der Forschung gewonnen werden, die über (wissenschaftliche) Expertise in mindestens einem der relevanten Inhaltsbereichen verfügten. Zum anderen wurden aufgeschlossene Praktiker_innen gesucht, um die Expertise über die Unternehmenswirklichkeit erfassen zu können. Somit wurden einerseits Verfasser_innen einschlägiger Veröffentlichungen identifiziert und andererseits Expert_innen aus der (guten) Praxis ausgewählt, wie beispielsweise über die Seiten der Initiative Neue Qualität der Arbeit (INQA). Aufgrund der Rücklaufquote (s. u.) wurde für die zweite Erhebungswelle nachrekrutiert, in dieser Phase wurde die Recherche ausgedehnt auf relevante Berufsverbände und Kontakte über Berufsgenossenschaften. Insgesamt wurden über 530 Expert_innen recherchiert.

290

C. Eickholt

Die Befragungen der Expert_innen fanden schriftlich statt. Die Teilnahme erfolgte dezentral, d. h. die Expert_innen kamen nicht zu einem Workshop o. ä. zusammen und konnten sich nicht direkt miteinander austauschen. Etwa ein Drittel der Expert_innen erhielt auf Wunsch oder über eine Nachfassaktion die Unterlagen in elektronischer Form. Die Teilnahme erfolgte grundsätzlich anonym. Die Ansprache der Expert_innen erfolgte in erster Linie postalisch. Bereits beim Erstkontakt wurde der Fragebogen mitgeschickt, ebenso ein freigemachter und voradressierter Rückumschlag. Eine Nachfassaktion zur ersten Welle erfolgte nach knapp sechs Wochen per E-Mail mit angehängten Fragebogen und der Möglichkeit der elektronischen Abgabe. Bei der zweiten Welle wurden wieder alle Expert_innen der ersten Welle angeschrieben (ausgenommen derjenigen, die ausdrücklich nicht teilnehmen wollten) und zusätzlich wurden die neu recherchierten Expert_innen mit einem Versatz von ca. vier Wochen angeschrieben. Von zunächst etwa 130 angeschriebenen Expert_innen nahmen 15 an der umfassenden und aufwendigen ersten Welle teil (Rücklauf von 11 %). Bei der Frage nach der Perspektive der Beantwortung waren Mehrfachnennungen möglich. Die Antworten aus überbetrieblicher Perspektive beantworteten überwiegend Wissenschaftler_innen (n = 8), wovon zwei auch aus ihrer Position als Führungskräfte antworteten. Expert_innen von Unternehmensberatungen (4) und Arbeitsschutzakteur_innen (Berufsgenossenschaften (2), Fachkraft für Arbeitssicherheit (1)) beanspruchten für sich die betriebliche Sicht, gaben aber teils als Mehrfachnennung die überbetriebliche Sicht zusätzlich an. Die innerbetriebliche Sicht stammte vor allem von Führungskräften (4), Beschäftigten (2) und betrieblichen Arbeitsschutzakteur_innen (2) sowie einen weiteren betrieblichen Akteur/ Akteurin. Zusätzlich zu den 130 Expert_innen aus der ersten Welle wurden je etwa 200 weitere Expert_innen aus der Pflegebranche und der Zeitarbeitsbranche für die zweite Welle nachrekrutiert. An der zweiten Welle nahmen letztlich insgesamt 44 Expert_innen (Rücklaufquote ca. 8,3 %). Die Branchenperspektiven waren damit angemessen vertreten: Pflegebranche mit 19 Teilnehmenden (43,2 %), Zeitarbeitsbranche mit 16 Teilnehmenden 36,4 %) und weitere neun übergreifende Expert_innen, vornehmlich mit wissenschaftlichem Hintergrund. Insgesamt verschob sich der Schwerpunkt – gewollt – auf die betriebliche Perspektive (weitere Details s. Hamacher et al. 2012).

Delphi-Studie zur Förderung von Sicherheits- …

291

Tab. 1   Komponenten der Befragungen. (Hamacher et al. 2012) Welle I

Welle II

Teil I Erfassung notwendiger Kompetenzen zu Beurteilung des Bedarfs der SicherSicherheit und Gesundheit in KMU heits- und Gesundheitskompetenz bei Beschäftigten in KMU Teil 2 Erfassung von Ansätzen zur Förderung Beurteilung der Praxistauglichkeit der Ansätze zur Förderung der Sicherheitsder Sicherheits- und Gesundheitskompetenzen der Beschäftigten in KMU und Gesundheitskompetenz in KMU durch informelles Lernen

1.4 Aufbau des Fragebogens Die Fragebögen sind für beide Erhebungswellen gleichartig aufgebaut und bestehen aus zwei Teilen (siehe Tab. 1). Im ersten Teil stehen Fragen zu den Lernbedarfen zu Sicherheit und Gesundheit (in KMU) im Fokus, während im zweiten Teil Maßnahmen und Rahmenbedingungen in KMU behandelt werden, die laut der vorherigen Literaturanalysen und Auswertung von Beispielen Guter Praxis geeignet sind, um informelles Lernen im Prozess der Arbeit zu ermöglichen.

1.4.1 Fragebogen der ersten Erhebungswelle Die teilnehmenden Expert_innen wurden in der ersten Erhebungswelle angeregt, Fragen aufgrund ihrer Expertise und ihrer Erfahrung heraus zu beantworten. • Teil I: Blick auf die Beschäftigten in KMU (ihrer Branche), Kompetenzen, Fähigkeiten, Kenntnisse und Wissensinhalte. Die Kategorien wurden unter Bezugnahme auf das Strukturmodell von Lenartz (2011) abgeleitet, um verschiedene Kompetenzdimensionen grob vorgeben zu können. Dazu gehören: – Sicherheits- und gesundheitsrelevantes Wissen und Grundfertigkeiten zu Sicherheit und Gesundheit am Arbeitsplatz – Kompetenzen im Umgang mit der eigenen Person (Selbststeuerung und Selbstwahrnehmung) in sicherheits- und gesundheitsrelevanten Arbeitskontexten – Kompetenzen zur Übernahme von Verantwortung in Bezug auf eigene Sicherheit und Gesundheit am Arbeitsplatz und relevante Fragestellungen im Unternehmen

292

C. Eickholt

– Kompetenzen im Umgang mit sicherheits- und gesundheitsrelevanten Informationen im Kontext der Arbeit (Informationen beschaffen, bewerten, für sich nutzbar machen etc.) – Kompetenzen zur sicherheits- und gesundheitsbezogenen Kommunikation und Kooperation im Kontext der Arbeit – Weitere Kompetenzen zum Erhalt der individuellen gesundheitlichen Ressourcen bezogen auf Sicherheits- und Gesundheitsfaktoren im Kontext der Arbeit Die Expert_innen sollten beliebig viele Nennungen anführen und wurden geben, so lange bei den einzelnen Fragen zu bleiben, bis ihre Expertise und Erfahrung – ihrer Meinung nach – erschöpfend abgebildet ist. • Teil II: Blick auf begünstigende Aspekte für informelle Lernprozesse zu Sicherheits- und Gesundheitskompetenz aus Expert_innensicht. Der Fragenkatalog war wie folgt aufgebaut: „Welche Möglichkeiten sehen Sie, das informelle Lernen zu Sicherheit und Gesundheit in kleinen und mittelständischen Unternehmen … – … ganz allgemein zu fördern? – … durch die Gestaltung der Arbeitsaufgaben, der Arbeitsorganisation, der Technik und der Arbeitsumgebung zu unterstützen? – … durch die Gestaltung der sozialen Bedingungen im Unternehmen und der Unternehmenskultur zu unterstützen? – … durch die Gestaltung des Führungsverhaltens und des Personalmanagements zu unterstützen? – … durch die Gestaltung der Unternehmensstrukturen und Unternehmensentwicklung zu unterstützen? – … durch die Verknüpfung mit Maßnahmen der formalen Weiterbildung (Schulungen, Aus- und Fortbildungen etc.) zu unterstützen? – … durch individuelle Fördermaßnahmen zu unterstützen? – … durch sonstige Maßnahmen im Unternehmen zu unterstützen?“ Auch in diesem Teil war die Anzahl der Antworten offen.

Delphi-Studie zur Förderung von Sicherheits- …

293

1.4.2 Fragebogen der zweiten Erhebungswelle Für die zweite Erhebungswelle wurde der Fragebogen vollständig aus den Ergebnissen der ersten Erhebungswelle generiert. Dafür wurden die Ergebnisse der ersten Welle gruppiert und Doppelnennungen bereinigt. Zielsetzung dieser zweiten Welle war es, die Gesamtheit der gesammelten Aussagen hinsichtlich des Lernbedarfs der Beschäftigten zu Sicherheits- und Gesundheitskompetenz zu bewerten und die gesammelten Rahmenbedingungen und Maßnahmen einzuschätzen. In dieser zweiten Welle wurde den Expert_innen ein standardisierter Fragebogen vorgelegt. • Teil I: Bewertung von 71 Items zu Aspekten von Sicherheits- und Gesundheitskompetenz (Fähigkeiten, Kenntnisse etc.), in folgenden Kategorien: Itemgruppen und Kriterien in Teil II der zweiten Welle. (Eigene Darstellung) Kriterium I Kriterium II Wichtigkeit Vorhanden-sein 1) Wissen und Grundfertigkeiten zu Sicherheit und Gesundheit am Arbeitsplatz Allgemeine Kenntnisse (13 Items) Betriebsspezifische Kenntnisse (5 Items) Tätigkeitsspezifische Kenntnisse (7 Items) 2) Kompetenzen im Umgang mit der eigenen Person (12 Items) 3) Kompetenzen zur Übernahme von Verantwortung (10 Items) 4) Kompetenzen zur sicherheits- und gesundheitsbezogenen Kommunikation und Kooperation (14 Items) 5) Umgang mit sicherheits- und gesundheitsrelevanten Informationen im Kontext der Arbeit (10 Items)

• Teil II: Einschätzung der Ansätze und Kontextfaktoren zur Förderung der Sicherheits- und Gesundheitskompetenz im Betrieb hinsichtlich ihrer Praxisrelevanz entlang von 81 Rahmenbedingungen und Maßnahmen, in folgenden Kategorien:

294

C. Eickholt

Itemgruppen und Kriterien in Teil II der zweiten Welle. (Eigene Darstellung) Kriterium I Kriterium II Eignung Umsetzungs-grad 1) Maßnahmen und Kontextfaktoren auf Ebene der Organisation (17 Items) 2) Maßnahmen und Kontextfaktoren zur Unternehmenskultur (10 Items) 3) Maßnahmen und Kontextfaktoren zur Personalentwicklung und Lernkultur (12 Items) 4) Maßnahmen und Kontextfaktoren zum Führungsverhalten (11 Items) 5) Maßnahmen und Kontextfaktoren zur Information und Kommunikation im Betrieb (12 Items) 6) Maßnahmen und Kontextfaktoren der Arbeitsgestaltung und Arbeitsumgebung (11 Items) 7) Weiterbildung (4 Items) 8) Gesundheitsangebote (4 Items) Kriterium I: Wie geeignet ist die Maßnahme bzw. der Kontextfaktor, um in kleinen und mittelständischen Betrieben das informelle Lernen zu Sicherheit und Gesundheit zu verbessern? (1 = gar nicht, 2 = etwas, 3 = gut, 4 = sehr gut) Kriterium II: Wie hoch schätzen Sie den aktuellen Umsetzungsgrad der Maßnahme bzw. des Kontextfaktors in KMU der von Ihnen gewählten Branche ein? (1 = gar nicht, 2 = etwas, 3 = gut, 4 = sehr gut)

In beiden Wellen wurden zusätzlich Angaben zur Person, insbesondere zur Profession bzw. dem fachlichen Hintergrund abgefragt sowie die Perspektive (betrieblich oder überbetrieblich), um die Meinung der Expert_innen und ihren Blickwinkel besser einordnen zu können.

1.5 Auswertungen Die erste Welle lieferte aufgrund der qualitativen Ausrichtung offene Antworten. Diese galt es zunächst zu erfassen und zu clustern. In einem zweiten Schritt wurden innerhalb der geclusterten Antworten die Redundanzen bereinigt und sprachliche Glättungen vorgenommen, allerdings nur wo es – neben der Korrektur von Schreibfehlern – zur Verständlichkeit notwendig war. Dieser aufwendige Schritt wurde vorgenommen, damit für die zweite Welle die Gesamtheit der Nennungen bestmöglich repräsentiert wurde, aber auch ein finaler Itemsatz vorlag, der

Delphi-Studie zur Förderung von Sicherheits- …

295

überschaubar (und zumutbar) war, ohne inhaltliche Verluste hinzunehmen. Aus ursprünglich etwa 300 Nennungen flossen bereinigt 71 Items in den Teil I und 81 Items in den Teil II des standardisierten Fragebogens für die zweite Welle. Die statistische Auswertung der zweiten Welle beschränkte sich auf deskriptive Häufigkeiten, differenziert nach Items, Skalen und Branchen. Schritt 1: Betrachtung auf Skalen-Ebene Alle Items einer Itemgruppe wurden eindimensional abgestuft bewertet, sodass eine Betrachtung als Skala möglich war. Für alle Items einer Itemgruppe wurde der Skalenmittelwert (M – mean) gebildet und die Standardabweichung betrachtet, da für die meisten Items keine groben Ausreißer festgestellt werden konnten, wurde die Weiterarbeit mit dem Mittelwert dem Median vorgezogen. Für jede Skala wurde zwischen den Antworten der beiden Ausgangsfragen die Differenz gebildet. Also in Teil I des Fragebogens zwischen der Wichtigkeit der jeweiligen Kompetenzen für Sicherheit und Gesundheit in KMU und deren Vorhandensein bei den Beschäftigten und in Teil II zwischen der Eignung der Maßnahmen und Rahmenbedingungen für KMU und deren bisherigen Umsetzung. Prinzipiell wurde damit dem Skalierungsverfahren nach Likert gefolgt, nur dass statt der häufigeren Verwendung einer 7er-Skala eine 4er-Skala zugrunde lag. Der theoretische Erwartungswert einer 4er-Likert Skala liegt bei 2.5, womit Werte unter 2.5 demnach als tendenziell weniger wichtig und Werte über 2.5 als tendenziell wichtig interpretiert werden konnten. Schritt 2: Betrachtung auf Item-Ebene Auf Item-Ebene wurde für jedes Item ebenfalls der Mittelwert und die Standardabweichung berechnet. Auch hier erhält man für jeden Fragebotenteil zwei Mittelwerte. In Teil I ergibt sich der Bedarf aus der Einschätzung der Wichtigkeit einzelner Kompetenzaspekte im Kontrast zum geschätzten Vorhandensein. (Wichtigkeit – Vorhandensein = (Lern-)Bedarf). Die Handlungsrelevanz von betrieblichen Ansätzen oder Rahmenbedingungen ergab sich aus der Eignung der vorgeschlagenen Maßnahme oder Rahmenbedingung in Bezug zur Einschätzung des bisherigen Umsetzungsstands (Geeignetheit – Umsetzung in KMU = Handlungsrelevanz). Da über die rein sprachliche Interpretation keine objektiven oder normativen Kriterien zur Beurteilung der Differenzstärke möglich sind, wurde aus den Items einer Skala jeweils eine Rangreihe gebildet. Je höher ein Item im Rang liegt, umso größer ist der jeweilige Lern- bzw. Handlungsbedarf. Schritt 3: Branchenspezifische Auswertung Neben den übergreifenden Auswertungen in Schritt 1 und 2 wurden branchenspezifische Betrachtungen vorgenommen. Im Zentrum stand dann die erneute Auswertung der branchenspezifischen Differenzen je Item einschließlich der

296

C. Eickholt

Bildung spezifischer Rangreihen für die Pflege- und die Zeitarbeitsbranche. So konnten abweichende Rangreihen beobachtet werden, die den jeweiligen Bedarf an Kompetenzen bzw. Maßnahmen und Rahmenbedingungen charakterisiert.

1.6 Ausgewählte Ergebnisse aus der Delphi-Studie Im Folgenden werden die wichtigsten Erkenntnisse kurz vorgestellt. Ausführlich sind die Ergebnisse in dem online frei verfügbaren Forschungsbericht von Hamacher et al. (2012 – Link siehe Literaturverzeichnis) nachzulesen. Die Expert_inneneinschätzung gibt im ersten Teil Hinweise auf einen deutlichen Bedarf in allen erfassten Kompetenzbereichen. Eine durchweg hoch eingeschätzte Wichtigkeit (mit leichten Schwankungen in einzelnen Items) trifft dabei auf eine kritische Einschätzung der Kompetenzen in den KMU. Für die Branchenbetrachtung ergaben sich wichtige Akzente hinsichtlich des Lernbedarfs: Zeitarbeit Für Beschäftigte der Zeitarbeitsbranche kann festgehalten werden, dass ein Förderbedarf darin besteht, konsequentes Verhalten zu Sicherheit und Gesundheit (bei der Arbeit im Entleihunternehmen) zu erreichen, den Umgang mit gesundheitlichen Ressourcen zu fördern sowie das Wissen über psychische Gefährdungen zu erhöhen. Das betriebliche Arbeitssystem und relevante Arbeitstechniken müssen besser bekannt sein und beherrscht werden. Den Zeitarbeitnehmer_innen müsste ein selbstbewusstes Auftreten beim Ansprechen von relevanten Arbeitsschutzaspekten im Entleihunternehmen ermöglicht werden und sie sollten über vorhandene Maßnahmen im Arbeitsschutz beim Entleiher umfassend informiert werden. Weiterhin brauchen sie Unterstützung beim Nutzen sicherheits- und gesundheitsrelevanter Informationen in ihrer betrieblichen Praxis. Pflege Stark vereinfacht wurde festgestellt, dass den Beschäftigten in der Pflege grundlegende betriebswirtschaftliche Zusammenhänge im Arbeitsschutz nahegebracht werden sollten: „Inwieweit ist ein gegebener Mehraufwand durch Maßnahmen des Arbeitsschutzes betriebswirtschaftlich sinnvoll und notwendig?“ Auch in der Pflege ist die Förderung von Selbstdisziplin und eines konsequenten Verhaltens in Fragen zu Sicherheit und Gesundheit geboten. In diesem Kontext ist hier bei den Beschäftigten besonders das Erkennen negativer Folgen aus sicherheitswidrigem und gesundheitsbelastendem Verhalten für das Unternehmen zu fördern. Mehr Unterstützung der Beschäftigten wird benötigt, beim konstruktiven Umgang mit

Delphi-Studie zur Förderung von Sicherheits- …

297

Konflikten bzw. bei deren Bewältigung. Die Kenntnis über die im Betrieb vorhandenen Angebote zu Sicherheit und Gesundheit ist zu verbessern, und die tätigkeitsrelevanten Kenntnisse zur gesundheitsgerechten und ergonomischen Arbeitsplatzgestaltung sind zu fördern. Dies gilt auch für die Fähigkeit, sich eigenständig sicherheits- und gesundheitsrelevante Informationen zu beschaffen. Im dem zweiten Untersuchungsteil, also der Erfassung der Eignung benannter Maßnahmen und der Einschätzung des Umsetzungsstandes, konnte die Handlungsrelevanz abgeleitet werden. In allen Gestaltungsbereichen wurde eine Reihe Maßnahmen als geeignet zur Förderung des informellen Lernens eingestuft. Der Umsetzungsgrad wurde jedoch durchweg als sehr gering eingeschätzt. Hier liegt ein deutlicher Handlungsbedarf und entsprechend Potenzial zur Förderung des informellen Lernens zur Sicherheits- und Gesundheitskompetenz in KMU. Es wurde aber auch der Bedarf an eher formalen Weiterbildungsmaßnahmen benannt. Konkret für die Branchen ergab sich folgendes Bild: Zeitarbeit Für die Zeitarbeitsbranche weisen die Expert_innenaussagen auf einen ressourcenerhaltenden Umgang mit den Beschäftigten hin. Auch Weiterbildungsmaßnahmen – also eine formale Weiterbildung – fördert in erheblicher Weise informelle Lernprozesse, schafft Wissen bzw. aktiviert und sensibilisiert dazu. Zur Förderung von Lernprozessen am Arbeitsplatz wird einer angemessenen Fehlertoleranz und einem offenen, konstruktiven Umgang mit Fehlern eine große Bedeutung zugesprochen. Partnerschaftliche Lernformen werden als besonders hilfreich angesehen, ebenso wie die lern- und entwicklungsförderliche Methoden Arbeitsorganisation und Arbeitszeitgestaltung. Die Expert_innen sehen ein hohes Entwicklungspotenzial bei konkreten Angeboten zu sicherheits- und gesundheitsgerechtem Verhalten am Arbeitsplatz, z. B. bei einem gesunden Nahrungsmittelangebot, Entspannungsräumen und Bewegung. Wesentlich sind laut den Expert_innen die hohe Sichtbarkeit und Präsenz der Thematik „Sicherheit und Gesundheit“ im Betrieb sowie eine Personalpolitik, die langfristig ausgerichtet die Kompetenzen bei den Beschäftigten aufbaut und sie an das Unternehmen bindet. Pflege In der Pflegebranche besteht höchste Handlungsrelevanz bei der Evaluation durchgeführter Maßnahmen zu Sicherheit und Gesundheit, was als Hinweis darauf gedeutet werden kann, dass bisherige Maßnahmen in ihrer Umsetzung und Reichweite kritisch eingeschätzt werden und eine Evaluation eine qualitative Verbesserung einleiten könnte. Der Berücksichtigung nicht direkt wertschöpfender Aspekte bei der Gestaltung von Arbeitsplätzen wird ebenfalls eine

298

C. Eickholt

hohe Handlungsrelevanz zugeschrieben. Wie in der Zeitarbeitsbranche wird der Sichtbarkeit der Thematik „Sicherheit und Gesundheit“ von den Expert_innen einen hohen Stellenwert zugesprochen. Als hilfreich wird ein enger Kontakt des Betriebs zu Akteuren in der Weiterbildung zu Sicherheit und Gesundheit gesehen. Ein solcher Kontakt erlaubt es beispielsweise Weiterbildungsmaßnahmen gezielt auf die Situation und Bedürfnisse im Betrieb abzustimmen und so nachhaltig ein informelles Lernen anzustoßen. In der Pflegebranche wird individuellen und gruppenbezogenen Beratungsangeboten zu Sicherheit und Gesundheit eine hohe Wirksamkeit unterstellt, z. B. auf die Beschäftigte zugeschnittene Angebote zu Ernährung, Bewegung oder Stress. Eine Qualifikation der Führungskräfte in Fragen zu Sicherheit und Gesundheit wird für das informelle Lernen der Beschäftigten als sehr hilfreich angesehen. Letztlich wird auch in der Pflegebranche wird offener und konstruktiver Umgang mit Fehlern benötigt. Ebenso wie die Förderung von kollegialen Lernpromotoren und Kümmerern im Betrieb seitens der Expert_innen als förderlich gesehen wird. Integration der Ergebnisse im Gesamtprojekt Die empirischen Ergebnisse der Delphi-Studie flossen in das im Projekt erarbeitete Zusammenhangsmodell zum informellen Lernen zu Sicherheit und Gesundheit in kleinen und mittleren Unternehmen ein. Dieses stellt ein wesentliches Ergebnis des Projekts dar (siehe Abb. 1). Mithilfe der Expert_innenaussagen wurden für die beiden untersuchten Branchen konkrete Aussagen zu Rahmenbedingungen zur Förderung des informellen Lernens zu Sicherheit gemacht werden. Gleichzeitig wurden angrenzende Lernfelder branchenspezifisch definiert. Zusammen wurden damit die Gestaltungsfelder zum informellen Lernen zu Sicherheit und Gesundheit herausgearbeitet. Mit Blick auf die Zielgröße dieses Lernprozesses geben die Erkenntnisse der Untersuchung insgesamt Auskunft darüber, welche konkreten Fähigkeiten, Fertigkeiten und Kenntnisse in kleinen und mittleren Unternehmen der jeweiligen Branchen von Bedeutung sind und wo der größte Lernbedarf zu sehen ist. Im Projekt wurden die herausgearbeiteten Gestaltungsansätze weiterhin mit einer Reihe von Beispielen guter betrieblicher Praxis in Verbindung unterlegt. Die praxisbezogene Aufbereitung der Ergebnisse mündete in zwei branchenbezogene Handbücher sowie einem Leitfaden zur Erstellung weiterer branchenspezifischer Handlungshilfen.

Delphi-Studie zur Förderung von Sicherheits- …

299

Externe Antreiber_innen informeller Prozesse

Angrenzende Lernfelder Formale Weiterbildung Gesundheitsangebote

Rahmenbedingungen der Arbeit

Informelles Lernen zu Sicherheit und Gesundheit

Andere

Organisational Unternehmenskultur Personalentwicklung, Lernkultur Führung Information, Kommunikation Arbeitsgestaltung, Arbeitsumgebung

Sicherheits- und Gesundheitskompetenz im Unternehmen Grundlegende Fähigkeiten und Kenntnisse Weiterentwickelte Fähigkeiten und Kenntnisse

Reflexive Handlungsfähigkeit und Handlungsbereitschaft im Umgang mit Sicherheit und Gesundheit im Unternehmen

Abb. 1   Empirisch ausformuliertes Zusammenhangsmodell zum informellen Lernen zu Sicherheit und Gesundheit im Prozess der Arbeit. (Eigene Darstellung)

1.7 Rückblick auf die Delphi-Studie Bei der Organisation und Durchführung der Studie zeigte sich, dass die Panelmortalität wesentlich höher ausfiel als erwartet und nur über eine Nachrekrutierung gegengesteuert werden konnte. Die Teilnahme an der ersten Welle kann als recht aufwendig für die Expert_innen eingestuft werden. Wie viel Zeit diese letztlich mit der Beantwortung der Fragen verbracht haben, kann nicht abgeschätzt werden. Fraglos ist jedoch, dass ein erheblicher kognitiver und zeitlicher Aufwand mit der Teilnahme verbunden ist. Die Teilnahme an der zweiten Erhebungswelle nahm etwa 30 min Zeit in Anspruch, doch auch hier war die Anzahl der zu bewertenden Items hoch. Entsprechend lohnt sich der kritische Rückblick, nicht nur auf die Expert_innenauswahl und -ansprache, sondern insbesondere auf die Transparenz über den Teilnahmeaufwand an einer solchen Studie. So könnte neben einer von vorneherein breiteren Aufstellung des Expert_ innenpools (sofern inhaltlich angemessen) die direktere Expert_innenansprache bzw. -anfrage eine relevante Möglichkeit sein das Panel besser aufrechtzuerhalten.

300

C. Eickholt

Die Delphi-Studie lieferte jedoch wie erhofft vielfältige Erkenntnisse und Ansatzpunkte zur Förderung der Sicherheits- und Gesundheitskompetenz durch informelles Lernen. Zudem war die Delphi-Studie als Verfahren in einem „Arbeitsschutz“-Projekt eine völlig neue Herangehensweise und ermöglichte den Expert_innen sich ausführlich einzubringen.

Literatur Häder, M. (2014). Delphi-Befragungen. Ein Arbeitsbuch (3. Aufl.). Wiesbaden: Springer VS. Häder, M., & Häder, S. (1995). Delphi und Kognitionspsychologie. Ein Zugang zur theoretischen Fundierung der Delphi-Methode. ZUMA-Nachrichten, 19(37), 8–34. Hamacher, W., Eickholt, C., Lenartz, N., & Blanco, S. (2012). Ansätze zur betrieblichen Förderung von Sicherheits- und Gesundheitskompetenz durch informelles Lernen im Prozess der Arbeit. In Bundesanstalt für Arbeitschutz und Arbeitsmedizin (Hrsg.), Projekt F2141. Dortmund: BAuA. https://www.baua.de/DE/Angebote/Publikationen/ Berichte/F2141.pdf?__blob=publicationFile&v=3. Zugegriffen: 27. Juni 2018. Lenartz, N. (2011). Gesundheitskompetenz und Selbstregulation. Modellbildung zur Gesundheitskompetenz unter besonderer Berücksichtigung selbstregulativer Kompetenzen. Göttigen: V&R.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines systematischen Reviews Marlen Niederberger, Ann-Kathrin Käfer und Laura König

Zusammenfassung

Delphi-Verfahren bieten in der Gesundheitsförderung ein großes Potenzial, weil sie Expert_innenurteile disziplinübergreifend berücksichtigen und die Integration evidenzbasierter und lebensweltlicher Wissensstände erlauben. Sie werden in der Gesundheitsförderung vor allem zur Erfassung unterschiedlicher Expert_innenurteile und als Konsensverfahren eingesetzt. Allerdings gibt es bisher keinen systematischen Überblick über den Einsatz von Delphi-Verfahren in der Gesundheitsförderung. Aus diesem Grund wurde ein systematischer Review auf Basis von Publikationen in einschlägigen internationalen Fachzeitschriften durchgeführt. Ziel ist die Herausarbeitung der Forschungspraxis mit einem besonderen Augenmerk auf Aspekten des Forschungsanliegens, der Expert_innenauswahl, des Forschungsdesigns und der Ergebnispräsentation.

M. Niederberger (*)  Pädagogische Hochschule Schwäbisch Gmünd, Schwäbisch Gmünd, Deutschland E-Mail: [email protected] A.-K. Käfer  Pädagogische Hochschule Schwäbisch Gmünd, Schwäbisch Gmünd, Deutschland E-Mail: [email protected] L. König  Münster, Deutschland E-Mail: [email protected] © Springer Fachmedien Wiesbaden GmbH, ein Teil von Springer Nature 2019 M. Niederberger und O. Renn (Hrsg.), Delphi-Verfahren in den Sozial- und Gesundheitswissenschaften, https://doi.org/10.1007/978-3-658-21657-3_13

301

302

M. Niederberger et al.

Schlüsselwörter

Delphi-Verfahren · Gesundheitsförderung · Systematischer Review · Konsens · Expert_innen.

1 Einleitung Delphi-Verfahren werden in zahlreichen Disziplinen und zu unterschiedlichen Themenfeldern eingesetzt. Das Anwendungspotenzial erstreckt sich auf Bereiche wie die Technik- und Umweltforschung, die Arbeits- und Organisationsentwicklung und auf die Pflege- und Gesundheitswissenschaften (vgl. Cuhls et al. 1998; Jorm 2015; Jung und Bleyer 2017; Linstone und Turoff 1975). Auch in der Gesundheitsförderung bieten Delphi-Verfahren ein großes Potenzial. Die Gesundheitsförderung verbindet verschiedene wissenschaftliche Disziplinen (u. a. Psychologie, Sport- und Ernährungswissenschaft) und arbeitet vor allem bei der Entwicklung und Evaluation von gesundheitsfördernden Interventionen eng mit der Praxis (z. B. mit Schulen und Städten) zusammen. Delphi-Prozesse können hier bei der Berücksichtigung und Integration disziplinspezifischer Denkmuster bzw. lebensweltlicher Expertisen unterstützen. Allerdings fehlen bisher sowohl ein systematischer Überblick als auch eine kritische Reflexion über den Einsatz von Delphi-Verfahren in der Gesundheitsförderung. Aus diesem Grund wurde ein systematischer Review auf Basis von Publikationen in einschlägigen internationalen Fachzeitschriften durchgeführt. Ziel ist die Analyse der eingesetzten Delphi-Verfahren im Hinblick auf die Fragestellung, die Expert_innenauswahl, das Vorgehen und die Ergebnispräsentation.

2 Hintergrund: Delphi-Verfahren in der Gesundheitsförderung Gesundheitsförderung ist definiert als Prozess, allen Menschen ein höheres Maß an Selbstbestimmung über ihre Gesundheit zu ermöglichen und sie dadurch zur Stärkung ihrer Gesundheit zu befähigen. Das Konzept setzt an der Analyse der Gesundheitsressourcen und –potenziale der Menschen sowie auf allen gesellschaftlichen Ebenen an. Dabei spielen insbesondere sozialwissenschaftliche, psychologische, sport- und ernährungswissenschaftliche sowie wirtschaftswissenschaftliche Aspekte eine wichtige Rolle (WHO 1986, S. 1 ff.).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

303

Um als Schnittstelle zwischen Wissenschaft und Praxis geeignete Interventionen zu identifizieren, zu entwickeln, umzusetzen und zu evaluieren, benötigt die Gesundheitsförderung Konzepte mit empirischer Evidenz, subjektorientierte Ansätze und partizipative Instrumente. In diesem Sinne spielen in der Gesundheitsförderung qualitative und quantitative Forschungsmethoden sowie inter- und transdisziplinäre Sichtweisen eine wichtige Rolle. Delphi-Verfahren erscheinen vor allem unter der Perspektive inter- und transdisziplinärer Wissensintegration ein wichtiges Erhebungsverfahren für die Gesundheitsförderung zu sein. Sie erlauben die Integration von Wissensständen unterschiedlicher Disziplinen und berücksichtigen theoretische und lebensweltliche Expertisen. Allerdings sind Delphi-Verfahren eminenzbasierte Verfahren, die der Evidenzbasierung qua Definition in den Gesundheitswissenschaften (zu der auch die Gesundheitsförderung zählt) nachgeordnet werden (vgl. Tab. 1). Delphi-Verfahren werden in dieser Lesart vor allem relevant, wenn Verfahren einer höheren Evidenzstufe (wie randomisierte kontrollierte Studien) nicht möglich sind (Steurer 2011, S. 960). Detaillierte und systematische Aufarbeitungen über den konkreten Einsatz und die Potenziale von Delphi-Verfahren in den verschiedenen Feldern der Gesundheitswissenschaften gibt es bisher nur wenige. Dazu gehören der Palliativbereich (Jünger 2017), die Radiologie (Steurer 2011), die Gesundheitsversorgung (Boulkedid et al. 2011) und die Pflegewissenschaft (Keeney et al. 2001, 2006). Für die Gesundheitsförderung im Speziellen fehlt eine entsprechende Analyse. Diese Lücke ist der Anlass für die Durchführung eines systematischen Reviews über die Anwendung von Delphi-Verfahren in der Gesundheitsförderung. Das Vorgehen und die Ergebnisse dieses Reviews werden im Folgenden vorgestellt. Tab. 1   Evidenzklassen. (Evidenzbasierung 2018) Klasse Ia: Ev. aufgrund wenigstens einer Metaanalyse auf der Basis meth. hochwertiger RCTs Klasse Ib: Ev. aufgrund mind. einer methodisch hochwertigen RCT Klasse IIa: Ev. aufgrund mind. einer hochwertigen kontrollierten, nicht randomisierten Studie Klasse IIb: Ev. aufgrund einer hochwertigen quasi-exp. Studie (Quasi-Experiment) Klasse III: Ev. aufgrund methodisch hochwertiger, nicht exp. deskriptiver Studien, z. B. Korrelationsstudie (Korrelation), Fall-Kontroll-Studie Klasse IV: Ev. aufgrund von systematisch integrierter Expert_innenmeinungen; beschreibende Studien Klasse V: Fallserie oder eine oder mehrere Expert_innenmeinungen


304

M. Niederberger et al.

3 Delphi-Verfahren in der Gesundheitsförderung: Ein systematisches Review Fragestellung Delphi-Verfahren erlauben die Bearbeitung einer großen Bandbreite an Fragestellungen. Die methodologischen Diskurse zeugen von der Relevanz des Verfahrens und vom Anwendungspotenzial (Aengenheyster et al. 2017; Diamond et al. 2014; Häder 2014; Linstone und Turoff 2011; Niederberger und Kuhn 2013; von der Gracht 2012). Über die Einsatzgebiete und die Forschungspraxis in der Gesundheitsförderung gibt es bisher keine systematisch erarbeiteten Erkenntnisse. Dieser Fragestellung widmet sich ein systematischer Review, bei dem internationale Delphi-Studien aus der Gesundheitsförderung auf Basis von Artikeln analysiert werden. Im Zentrum steht dabei folgende Forschungsfrage:

Wie werden Delphi-Verfahren in der Forschungspraxis der Gesundheitsförderung eingesetzt?

Das methodische Vorgehen bei dem Review wird im Folgenden dargestellt. Anschließend erfolgt die Präsentation der Ergebnisse.

3.1 Suche und Selektion der Studien Die Suche der Delphi-Studien erfolgte über die Datenbank PubMed. Gesucht wurde im November 2017. Die verwendeten Schlüsselwörter lauten „delphi“ AND „health promotion“ sowie „delphi“ AND „Gesundheitsförderung“. Die Suche wurde beschränkt auf englisch- und deutschsprachige Artikel im Zeitraum von 2012 bis 2016. Insgesamt wurden 107 Artikel angezeigt. Bei allen Treffern wurden die Titel und Abstracts gelesen und zur Identifizierung relevanter Artikel genutzt. In den Review eingeschlossen wurden Artikel, die alle folgenden Kriterien erfüllten: empirische Durchführung eines Delphi-Verfahrens, Anwendung in einem Bereich der Gesundheitsförderung und Publikation in englischer oder deutscher Sprache (vgl. Tab. 2). Ausgeschlossen wurden Artikel, die keine eigenen Delphi-Verfahren durchgeführt haben, sondern auf solche verweisen bzw. sie geplant haben. Zudem wurden reine Literaturübersichten sowie Tagungs- und Konferenzbeiträge ausgeschlossen. Insgesamt erfüllten 16 Artikel die Einschlusskriterien nicht.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

305

Tab. 2   Einschluss- und Ausschlusskriterien. (Eigene Darstellung) Einschluss

Eigene Delphi-Studie Thema aus der Gesundheitsförderung Englisch oder Deutsch publiziert

Ausschluss

Geplante Delphi-Studie bzw. keine eigene Delphi-Studie Keine Beschreibung des Delphi-Vorgehens, sondern reine Nennung Rein methodische Artikel Tagungs- bzw. Kongressbeiträge Literaturübersichten

Im Anschluss wurden die Volltexte der verbliebenen Artikel gesichtet und erneut im Hinblick auf die Einschlusskriterien untersucht. Sofern die Volltexte nicht frei zugänglich waren, wurden sie über die Fernleihe der Hochschulbibliothek bestellt. Bei der Durchsicht der Volltexte wurden weitere acht Artikel ausgeschlossen. Schlussendlich flossen 84 Delphi-Studien in die Analyse ein. Der vollständige Ablauf der Studienselektion ist in Abb. 1 dargestellt.

3.2 Analyseraster Bei der Analyse der Artikel geht es um die Erfassung der Forschungspraxis. Entsprechend wurden Aspekte erfasst, welche die Rolle des Delphi-Verfahrens im Forschungsprozess und den typischen Ablauf von Delphi-Verfahren erfassen. Um die Vergleichbarkeit mit anderen Reviews über Delphi-Verfahren zu gewährleisten, wurden auch diese zur Entwicklung des Analyserasters heranzogen (vgl. Boulkedid et al. 2011; Jünger et al. 2017). Im Gesamten wurden 82 Items zu neun Frageblöcken gebildet. Einen ausführlichen Überblick über die untersuchen Dimensionen und Items zeigt Tab. 3.

3.3 Auswertung Die Analyse der Artikel erfolgt inhaltsanalytisch durch eine Kombination qualitativer und quantitativer Vorgehensweisen. Dabei ging es vor allem um die Darstellung der Bandbreite und der Häufigkeiten möglicher Konzepte und Vorgehensweisen. Dazu werden zunächst die entsprechenden Textstellen inhaltsanalytisch erfasst, anschließend in Variablen transformiert und abschließend ausgezählt.

306

M. Niederberger et al.

107 Studien wurden in PubMed identifiziert (Suchwörter: „Delphi“ AND „Health promotion“ sowie „Delphi“ AND „Gesundheitsförderung“) 16 Studien wurden aufgrund der Zusammenfassung ausgeschlossen andere Sprache als Englisch/ Deutsch (n=8) Publikation ist keine empirische Untersuchung (n=3) Delphi soll erst in der Zukunft stattfinden (n=2) keine Verwendung der Delphi-Methode (n=1) keine Zusammenfassung vorhanden (n=1) Delphi nicht im Bereich der Gesundheitsförderung (n=1) Von 91 Studien wurden die Volltexte gelesen Weitere acht Studien wurden bei der Durchsicht ausgeschlossen keine Beschreibung des Delphis (n=5) Delphi soll erst in der Zukunft stattfinden (n=2) keine Verwendung der Delphi-Methode (n=1) 83 +1 Studien wurden vollständig analysiert (ein Artikel enthält zwei Delphi-Studien)

Abb. 1   Ablauf der Studienselektion. (Eigene Darstellung)

3.4 Pretest Das entwickelte Kategoriensystem wurde anhand von drei zufällig ausgewählten Artikeln durch drei Reviewer_innen getestet. Die Codierungen wurden verglichen und unterschiedliche Werte bzw. etwaige Unklarheiten gemeinsam diskutiert. Danach erfolgten eine Überarbeitung des Kategoriensystems und die Erstellung eines Codebuches. Anhand des überarbeiteten Kategoriensystems fand eine weitere Erprobung der Reliabilität anhand von drei zufällig ausgewählten Artikeln statt. Die Codierungen der Reviewer_innen stimmten zu 100 % überein. Danach wurden die Artikel zufällig auf die Reviewer_innen verteilt und bei Unsicherheiten gemeinsam diskutiert.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

307

Tab. 3   Themenblöcke und Dimensionen des systematischen Reviews. (Eigene Darstellung) Themenblöcke

Relevante Dimensionen

1. Allgemeine Angaben zum Artikel

– Anzahl der Autor_innen – Hinweise zu Institutionen und Disziplinen – Publikationsjahr

2. Angaben zum Thema und Zielstellung des Delphi-Verfahrens

– Thema des Delphis – Ziele des Delphis (Konsensfindung, Ideenaggregation, Expert_innenurteile, Vorhersage) – Begründung der Verwendung der Delphi-Methode

3. Konzeptionelle Angaben – Allgemeine Definition Delphi-Verfahren zum Delphi-Verfahren –H  inweise zur Delphi-Art (z. B. klassisch schriftliches oder online Delphi, Realtime-, Policy-, Gruppen- und Hybriddelphi) – Erfassung von Modifikationen am Verfahren – Ziele des Delphi-Verfahrens – Angaben zur Limitierung des Verfahrens 4. Angaben zum allgemeinen Forschungsprozess

– Kombination mit anderen Forschungsmethoden – Stellenwert des Delphis im Forschungsprozess – Dauer des Forschungsprozesses

5. Zusammensetzung des Expert_innenpanels

– Definition des Expert_innenbegriffs (Selbst- und Fremdwahrnehmung) – Institutionelle Zugehörigkeit der Expert_innen – Anzahl der eingeladenen Expert_innen – Art der Rekrutierung – Erfassung soziodemografischer Angaben der Expert_ innen (Geschlecht, Alter und Profession) – Rücklauf zwischen den Delphi-Runden – Anonymität der Expert_innen

6. Ablauf des Delphi-Verfahrens

– Anzahl der Delphi-Runden und deren jeweiliger Zweck – Art des Feedbacks zwischen den Delphi-Runden – Abbruchkriterium des Delphi-Prozesses

7. Hinweise zu den Erhebungsinstrumenten

– Erhebungsinstrument jeder Delphi-Runde – Fragenformulierung (offen oder geschlossen) – Angaben zur Entwicklung des Fragebogens – Umfang und Gestaltung des Fragebogens

8. Hinweise zur Konsensfindung

– Konsensdefinition – Art der Erfassung – Prozentualer Anteil von Items mit erreichtem Konsens (Fortsetzung)

308

M. Niederberger et al.

Tab. 3   (Fortsetzung) Themenblöcke

Relevante Dimensionen

9. Ergebnisdarstellung

– Darstellung in einem Flowchart – Art der statistischen Auswertung (Deskriptiv- oder Interferenzstatistik) – Verwendung der statistischen Maße zur Analyse (z. B. Median, Mittelwert) – Grafische Aufarbeitung der Ergebnisse – Umgang mit offenen Statements (z. B. wörtliche Zitate) – Fokus der Auswertung (auf qualitativen oder quantitativen Daten)

4 Ergebnisse des systematischen Reviews Die Ergebnisse des systematischen Reviews werden im Folgenden anhand der neun untersuchten Blöcke präsentiert.

4.1 Allgemeine Angaben zum Artikel Die meisten Artikel sind englischsprachig. Deutschsprachige Artikel gibt es zwei. Die Anzahl der Autor_innen variiert bei den untersuchen Artikeln zwischen eins und 31. Im Durchschnitt sind sechs Autor_innen an einem Artikel beteiligt. Entsprechend breit fällt die Anzahl beteiligter Institutionen aus. Im Durchschnitt sind Autor_innen von fünf Institutionen an einem Artikel beteiligt. Sie vertreten zudem häufig verschiedene Disziplinen. Die Anzahl der beteiligten Disziplinen liegt im Schnitt bei drei. Bei 66 % (n = 50) der Artikel wird angegeben, dass die Delphi-Studie extern gefördert wurde. Die untersuchten Delphi-Studien werden weltweit eingesetzt (u. a. China, Irland, Australien, Finnland). Teilweise sind sie auch länderübergreifend angelegt. Jeweils acht Delphi-Studien (je 10 %) werden als länderübergreifende Projekte EU-weit (ID6, ID13, ID19, ID22, ID69, ID75, ID83) bzw. international (ID2, ID9, ID24, ID49, ID68, ID73, ID89, ID90) durchgeführt. Für Deutschland konnten zwei Delphi-Studien identifiziert werden (ID33, ID91). Die Analyse des Publikationsjahres zeigt, dass Delphi-Verfahren regelmäßig zwischen den untersuchten Jahren 2012 bis 2016 publiziert wurden und zwar mit leicht steigender Tendenz (Tab. 4).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines … Tab. 4  Publikationsjahr. (Eigene Darstellung)

Publikationsjahr 2012

Häufigkeit

309 In Prozent

8

9,5

2013

11

13,1

2014

20

23,8

2015

24

28,6

2016

21

25,0

Gesamt

84

100

Fazit: Die allgemeinen Angaben der Artikel zeigen, dass Delphi-Verfahren international in der Gesundheitsförderung eingesetzt werden. Sie werden als interdisziplinäre Forschungsprojekte mit mehreren Institutionen durchgeführt und in Publikationen wissenschaftlich aufbereitet.

4.2 Angaben zum Thema und Zielstellung des Delphi-Verfahrens Delphi-Verfahren werden in den untersuchten Artikeln für verschiedene Themen angewendet. Entwickelt bzw. identifiziert werden mit Delphi-Verfahren Indikatorensysteme zur Analyse bestimmter Outcomes (z.  B. ID10, ID39), Kompetenzprofile für bestimmte Berufsgruppen (z. B. ID90), Erfolgskriterien bzw. „do-not“ Kriterien von Interventionen (z. B. ID44, ID64), strukturelle bzw. organisationale Rahmbedingungen (z. B. ID15), Handlungsempfehlungen für die Politik bzw. Entscheidungsträger (z. B. ID82), prioritäre Forschungs- bzw. Handlungsaktivitäten (z. B. ID13) und neue Messinstrumente (z. B. ID7). Delphi-Verfahren werden auch zur Identifikation von Strategien bzw. Interventionen der Gesundheitsförderung eingesetzt (z. B. ID31, ID54). Auf einem aggregierten Niveau geht es bei den Delphi-Studien der Gesundheitsförderung oftmals um die Entwicklung von Richtlinien und neuen Standards (50 %, n = 42), gefolgt von Fragestellungen, die sich auf die (Weiter-)Entwicklung von spezifischen Forschungsschwerpunkten bzw. -aktivitäten (z. B. bei der Interventionsentwicklung) im Bereich der Gesundheitsförderung beziehen (25 %, n = 21). In den untersuchten Delphi-Studien zeigt sich eine hohe Relevanz von Konsensprozessen. Untersucht nach den vier Zielen von Delphi-Verfahren nach Häder (2014) wird deutlich, dass 76 % (n = 64) der Delphi-Studien explizit als Konsensverfahren ausgelegt sind bzw. Konsens als zentrales Ziel des Delphi-Prozesses definieren (vgl. Tab. 5). Zur Erfassung von Expert_innenurteilen werden 19 % (n = 16)

310 Tab. 5  Berichtete DelphiArt nach Häder (2014). (Eigene Darstellung)

M. Niederberger et al. Primäres Ziel des Delphis

Häufigkeit

In Prozent

Konsens

64

76,2

Vorhersage/Prognose

 1

1,2

Erfassung der Expert_innenurteile

16

19,0

Sonstiges

 3

3,6

Gesamt

84

100

der Delphi-Studien eingesetzt. Unter „Sonstiges“ fallen drei Studien. Das sind Delphi-Verfahren zur Validierung bzw. Bestätigung von Forschungsergebnissen aus vorhergehenden Erhebungen bzw. eines Fragebogens (ID3, ID12, ID60). Eine Studie nutzt das Delphi-Verfahren zur Vorhersage (ID25). Zur Ideenaggregation wie von Häder (2014) vorgeschlagen, finden sich in den untersuchen Artikeln keine Delphi-Studien. 54 % (n = 45) der untersuchten Artikel begründen explizit den Einsatz des Delphi-Verfahrens. Zu den Gründen gehören: • Delphi-Verfahren sind innovativ, systematisch und reliabel (z. B. ID28). • Die Expert_innen werden anonym befragt und Gruppeneffekte, die bei persönlicher Interaktionen entstehen, werden verhindert (z. B. ID91, ID2, ID49, ID8, ID64). • Delphi-Verfahren erlauben die Einbindung einer großen Anzahl an Expert_ innen (z. B. ID1, ID14). • Es können Expert_innen aus unterschiedlichen, auch weit entfernten Regionen integriert werden (z. B. ID75, ID23, ID43, ID44, ID61, ID49). • Delphi-Verfahren erlauben die Identifikation von Konsens (z. B. ID72). • Mit Delphi-Verfahren können Wissenslücken geschlossen werden, vor allem wenn zu wenig empirische Daten vorliegen bzw. keine erhoben werden können (z. B. ID20, ID42, ID57). • Delphi-Verfahren eignen sich bei komplexen Themen, die interdisziplinäre Perspektiven benötigen (z. B. ID31, ID49). • Sie sind relativ kostengünstige Verfahren (z. B. ID2). • Delphi-Verfahren ermöglichen Expert_innen die Revision bzw. Festigung ihrer Urteile (z. B. ID61, ID87). • Sie können die Legitimität und Akzeptanz der Ergebnisse vorheriger Studien untersuchen und validieren (z. B. ID85).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

311

Zentrale Argumente für die Durchführung von Delphi-Verfahren sind die Einbindung einer größeren Anzahl von Expert_innen, die geografisch weit entfernt und anonym befragt werden können. Oftmals nennen die Autor_innen mehrere Gründe für den Einsatz des Delphi-Verfahrens (z. B. ID2, ID49, ID61), was einen bewussten und reflexiven Umgang mit der Methode andeutet. Fazit: Delphi-Verfahren werden in der Gesundheitsförderung vor allem zur Ermittlung von Konsens und zur Erfassung von Expert_innenurteilen durchgeführt. Häufig geht es um die Entwicklung von Richtlinien und Standards. Sie sind nach Ansicht der Autor_innen eine geeignete Methode zur Befragung einer größeren Anzahl von Expert_innen, unterschiedlicher Disziplinen und geografischer Zuordnung. Die Methodenwahl erfolgt in den Publikationen reflektiert und begründet.

4.3 Konzeptionelle Angaben zum Delphi-Verfahren In 61 % (n = 51) der untersuchten Artikel wird die Delphi-Methode definiert. Dabei verweisen fast alle Artikel auf andere Literaturquellen (mit Ausnahme von sechs Artikeln: ID9, ID6, ID27, ID29, ID64, ID65). Zur Definition wird am häufigsten auf Linstone und Turoff (2002, n = 9) und auf Hasson et al. (2000, n = 6) verwiesen (vgl. Abb. 2). Linstone und Turoff (2002) verstehen unter einem Delphi-Verfahren einen strukturierten Gruppenkommunikationsprozess, um aggregierte Expert_innenmeinungen zu einem komplexen Phänomen zu untersuchen. Hasson et al. (2000) betonen zusätzlich den Konsensaspekt. Delphi-Verfahren werden in den meisten Studien mit vier Merkmalen assoziiert: 1) Expert_innenbefragung, 2) Konsens-Verfahren, 3) Befragung in mehreren Runden und 4) Feedback-Möglichkeit. Insgesamt fällt bei den Definitionen auf, dass Delphi-Verfahren häufig über den Prozess und das Ziel definiert

Delphi-Definitionen − Linstone und Turoff (2002, S. 3): “Delphi may be characterized as a method for structuring a group communication process so that the process is effective in allowing a group of individuals, as a whole, to deal with a complex problem.” − Hasson et al. (2000, S. 1008): „The Delphi survey is a group facilitation technique, which is an iterative multistage process, designed to transform opinion into group consensus.”

Abb. 2   Die am häufigsten verwendeten Delphi-Definitionen in den untersuchten Artikeln. (Eigene Darstellung)

312

M. Niederberger et al.

Tab. 6   Berichtete Definitionsmerkmale von Delphi-Verfahren in den untersuchten Artikeln. (Eigene Darstellung) Merkmal

Häufigkeit

In Prozent (n = 84)

Expert_innen

38

45,2

Konsens-Verfahren

33

39,3

Befragung in mehreren Runden/Iteration

30

35,7

Integration von Feedbacks

20

23,8

Anonymität der Befragten

14

16,7

Quantitatives Verfahren

11

13,1

Quantitatives und qualitatives Verfahren

4

4,8

Qualitatives Verfahren

3

3,6

­ erden, weniger über wissenschaftstheoretische oder paradigmenspezifische w Argumentationslinien oder das Erhebungsinstrument (z. B. qualitativ oder quantitativ, vgl. Tab. 6). Die Analyse der Art der Delphi-Verfahren zeigt eine eindeutige Tendenz: Die meisten Artikel beruhen auf einem klassischen Delphi-Verfahren (76 %, n = 59). Diese werden online oder als schriftliche Befragung durchgeführt. Am zweithäufigsten (17 %, n = 13) finden sich sogenannte Hybrid-Delphis, bei denen qualitative und quantitative Erhebungsinstrumente kombiniert werden. Dabei wird typischerweise die erste Welle als qualitative Interviewstudie konzipiert und die Ergebnisse fließen in die Entwicklung eines standardisierten Fragebogens ein, der dann für die kommenden Delphi-Runden genutzt wird (z. B. ID7, ID42, ID43, ID44). Andere Delphi-Verfahren wie das Policy Delphi (zur Erfassung einer Bandbreite an Aussagen, n = 3, ID36, ID87, ID90) oder Gruppendelphi-Verfahren (n = 2, ID67, ID78) bilden die Ausnahme.1 In den meisten Artikeln (65 %, n = 54) werden explizit Limitierungen des gewählten Delphi-Verfahrens diskutiert. Unter Limitierungen werden Aspekte erfasst, über die die Autor_innen mit ihrer Studie keine Aussage machen können. Explizierte Limitierungen der Autor_innen beziehen sich vor allem auf die Übertragbarkeit und Generalisierbarkeit der Ergebnisse. Begründet werden die Limitierungen durch:

1Zur

Definition der verschiedenen Delphi-Varianten sei auf andere Kapitel in diesem Buch verwiesen.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

313

• eine kleine Sample-Größe, u. a. aufgrund geringer Rücklaufquote und Ausfällen (z. B. ID31, ID 36, ID43, ID81) • eine spezifische Expert_innenauswahl (z. B. ID1, ID55) • geografische Aspekte bzw. Besonderheiten (z. B. ID7, ID46) • sprachliche Restriktionen (z. B. englischer Prozess – Expert_innen anderer Sprachen konnten nicht mitmachen, ID2, ID25) • die Spezifika von Erhebungszeitpunkten (z. B. Delphi-Befragung liegt Jahre zurück, ID42, ID44). Fazit: Eingesetzt werden in der Gesundheitsförderung vor allem Delphi-Verfahren, die dem klassischen Design mit einer mehrmaligen schriftlichen Befragung der Expert_innen folgen. Über die Hälfte der Artikel definiert Delphi-Verfahren und diskutiert auch entsprechende Limitierungen hinsichtlich der Güte, Reichweite und Übertragbarkeit der Ergebnisse. Allerdings werden diese Punkte in mehr als jedem dritten Artikel nicht thematisiert.

4.4 Angaben zum allgemeinen Forschungsprozess Delphi-Verfahren finden auch in komplexen Forschungsprozessen in Kombination mit anderen Erhebungsverfahren eine Anwendung. Bei 45 % (n = 38) der untersuchten Artikel werden Delphi-Verfahren mit anderen Verfahren kombiniert. In fast 40 % (n = 14) der Studien stellte die Delphi-Befragung die zentrale Forschungsmethode dar. In knapp 40 % (n = 14) werden sie zur Vertiefung vorhergehender Forschungsbefunde eingesetzt. Als Vorstudie finden Delphi-Verfahren nur in Ausnahmefällen Anwendung (vgl. Tab. 7). 41 % (n = 34) der untersuchten Artikel geben die Dauer des Delphi-Prozesses an. Die Spanne reicht von einem bis zu vier Jahren (erfasst in Jahren). Fast 80 % (n = 27) geben ein Jahr Laufzeit an.

Tab. 7  Berichtete Relevanz von DelphiVerfahren in kombinierten Forschungsprozessen. (Eigene Darstellung)

Relevanz des Delphis Vorstudie

Häufigkeit

In Prozent

5

13,9

Zentral

14

38,9

Vertiefung

14

38,9

Sonstiges

3

8,3

36

100

Gesamt

314

M. Niederberger et al.

Fazit: Delphi-Verfahren sind im Forschungsprozess flexibel einsetzbar und mit anderen Erhebungsverfahren kombinierbar. Wenn sie in den Studien der Gesundheitsförderung kombiniert werden, dann sind sie meist das zentrale Erhebungsinstrument oder sie werden zur Vertiefung vorangegangener Studien nachgeschaltet. Delphi-Prozesse können bis zu mehreren Jahren dauern.

4.5 Zusammensetzung des Expert_innenpanels Der Expert_innenbegriff wird in der Methodenliteratur sehr unterschiedlich definiert (Bogner et al. 2014; Niederberger und Renn 2018). Wissenssoziologisch werden mit dem Begriff Experte bzw. Expertin spezifische soziale Positionen, Spezialwissen und institutionelle Zugehörigkeiten assoziiert. Die Zuschreibung, wer Experte bzw. Expertin ist und wer nicht, erfolgt meist durch die Forschenden (Bogner et al. 2014). Bei Delphi-Verfahren ist das zugrunde liegende Verständnis des Expert_innenbegriffs besonders zentral, weil sie qua Definition diejenigen sind, die am Verfahren teilnehmen. Der Expert_innenbegriff wird in den untersuchten Artikeln sehr unterschiedlich operationalisiert. Identifiziert wurden Definitionen über die institutionelle Zugehörigkeit bzw. die berufliche Position (z. B. ID14, ID36), die Anzahl bzw. Themen der Publikationen (z. B. ID31, ID54), den akademischen Titel (z. B. ID3), die persönliche Betroffenheit (z. B. ID36) sowie über die Berufserfahrung, teilweise in Jahren gemessen (z. B. ID42, ID44, ID55). Aber auch der Willen zur Teilnahme (z. B. ID49) und das unterstellte Wissen spielen eine Rolle (z. B. ID7, ID46). Die meisten Artikel definieren Expert_innen über die vermutete Expertise (definiert über Fachwissen oder Erfahrung, 52 % n = 35), gefolgt von der institutionellen bzw. organisationalen Zugehörigkeit (50 %, n = 34) und akademischen Faktoren wie Titel, Publikationsanzahl oder Berufsbzw. Studienabschluss (22 %, n = 15). Häufig wird auch eine Kombination von Merkmalen angegeben (35 %, n = 24 z. B. ID39, ID81). Im Hinblick auf die institutionelle Zugehörigkeit zeigt sich, dass die beteiligten Expert_innen häufig aus der Wissenschaft und der Praxis kommen (44 %, n = 36). In einigen Studien werden auch Vertreter_innen bestimmter betroffener Gruppen bzw. Institutionen (z. B. Patient_innen) integriert (13 %, n = 11, z. B. ID7, ID25, ID36, ID49, vgl. Tab. 8). In den meisten Artikeln wird angegeben, wie die Expert_innen identifiziert und rekrutiert wurden (70 %, n = 58). Typischerweise werden die Expert_innen bewusst, entsprechend der zugrunde liegenden Definition ausgewählt. Identifiziert werden Expert_innen durch:

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

315

Tab. 8   Berichtete Zusammensetzung der Expert_innengruppe. (Eigene Darstellung) Expert_innengruppe

Häufigkeit

In Prozent

Wissenschaft

13

15,9

Praxis

22

26,8

Wissenschaft und Praxis

36

43,9

Wissenschaft und Zielgruppe

1

1,2

Praxis und Zielgruppe

8

9,8

Wissenschaft, Praxis und Zielgruppe Gesamt

2

2,4

82*

100

*bei zwei Artikeln fehlt hierzu die Angabe

• Empfehlungen dritter Personen, im Schneeballverfahren (z. B. ID2, ID7, ID29, ID71, ID81) • Recherche in wissenschaftlichen Datenbanken, wie google scholar, PsycINFO oder PubMed (z. B. ID20, ID31) • institutionelle Zugehörigkeit bzw. Mitgliedschaft in einer Organisation (z. B. ID31, ID42, ID44, ID54, ID55, ID57, ID64, ID68, ID77, ID81, ID85) • akademische Nachweise, wie einen bestimmten H-Index2 oder einschlägige Publikationen (z. B. ID2, ID19, ID35). Nur jeweils einmal wurden die Expert_innen durch eine Zufallsauswahl (ID58) bzw. ein theoretisch begründetes Auswahlverfahren (ID91) identifiziert. Die Zuschreibung des Expert_innenstatus erfolgt in den untersuchten DelphiStudien also durch die Forschenden. Nur in einem der untersuchten Artikel wird berichtet, dass die angesprochenen Expert_innen vor der Befragung nach ihrer Selbstwahrnehmung gefragt wurden (ID88, S. 1063: „All authors had to agree that the invited persons were ‚experts‘ in the field“). Während der Delphi-Befragung integrieren 6 % (n = 5) der Studien Fragen zur selbstwahrgenommenen Urteilssicherheit bzw. Kompetenz der Expert_innen. In den meisten Fällen wird aber nicht geprüft, ob die beteiligten Personen sich auch selbst als Experte bzw. Expertin des Themas sehen.

2Der

H-Index ist eine Kennzahl für das Ansehen von Wissenschaftler_innen. Der Index basiert auf der Anzahl der Zitationen der Publikationen in anderen Veröffentlichungen.

316

M. Niederberger et al.

Die Anzahl der angeschriebenen Expert_innen ist sehr unterschiedlich. Bei den Artikeln, welche die Gesamtzahl angegeben haben, reicht die Spanne von fünf bis 731 Personen. Im Durchschnitt werden bei einer Delphi-Studie 94 Expert_innen (Standardabweichung  = 19, n =  52) um ihre Unterstützung gebeten. Der Median, also die Mitte der Verteilung, liegt mit 39 eingeladenen Expert_innen deutlich unter dem Durchschnitt. Das deutet darauf hin, dass die Anzahl der eingeladenen Personen sehr stark variiert. Eine Überprüfung des Zusammenhangs der Expert_innenanzahl mit der Delphi-Art zeigt einen starken Effekt (eta = 0,760). Die meisten Expert_innen werden bei klassischen OnlineDelphi-Verfahren eingeladen. Die größte Anzahl findet sich bei einem Delphi zur Vorhersage im Bereich Informations- und Kommunikationstechnologien in der Gesundheitsförderung (ID25). Die kleinste Anzahl gibt es bei einem OnlineDelphi mit zwei Runden zur Validierung eines Evaluationsinstruments von Maßnahmen der Gesundheitsförderung im Setting Schule (ID60). 16 % (n = 10) der Artikel geben bei der Gesamtzahl der Experte_innen „all eligible“ (deutsch: alle geeigneten) an. In 70 % (n = 57) der Artikel wird die Höhe des Rücklaufes thematisiert. Der Rücklauf liegt in der ersten Welle im Schnitt bei 72 %, in der zweiten Welle bei 83 % und in der dritten Welle bei 89 % (jeweils gemessen an der Fallzahl der vorherigen Runde). Die Ergebnisse belegen zwei Aspekte: 1. Der Rücklauf bei Delphi-Verfahren ist höher als bei deutschen repräsentativen Bevölkerungsumfragen. Dort wird seit Jahren das Phänomen abnehmender Teilnahmebereitschaft diskutiert und Rücklaufquoten von über 15 % als hoch bezeichnet (Ramm 2014). 2. Wenn Expert_innen bei einem Delphi-Verfahren mitmachen, sind sie auch zu einem großen Teil bereit, sich an mehreren Befragungswellen zu beteiligen. Allerdings ist ein rückgängiger Rücklauf pro Erhebungswelle erwartbar. Entsprechend der unterschiedlichen Anzahl eingeladener Expert_innen, variiert auch die Anzahl der eingebundenen Expert_innen sehr stark (vgl. Tab. 9). Die konkrete Anzahl reicht von niedrigen einstelligen Zahlen bis zu mehreren hundert Personen. Auffällig ist, dass gemessen am Durchschnitt die Anzahl der beteiligten Expert_innen pro Delphi-Runde zunimmt. Dies zeigt, dass sich die Zusammensetzung der Expert_innengruppe pro Runde unterscheiden kann (z. B. ID1, ID22). Bewusst werden in einigen der untersuchten Delphi-Verfahren unterschiedliche Gruppen ausgewählt oder die letzte Runde mit einer größeren Anzahl an Expert_ innen durchgeführt. Teilweise unterscheiden sich auch die Erhebungsinstrumente

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

317

Tab. 9   Überblick berichtete Anzahl teilgenommener Expert_innen pro Delphi-Runde. (Eigene Darstellung) Anzahl teilgenommener Fallzahl Range Expert_innen

Median Mittelwert Standard-abweichung

Erste Runde

81

5 bis 255 26

40

5

Zweite Runde

77

5 bis 270 26

40

5,1

Dritte Runde

41

6 bis 331 23

43

8,7

pro Delphi-Runde, was Auswirkungen auf die Teilnehmer_innenzahl hat. So beruhen einige Delphi-Verfahren in der ersten Runde auf qualitativen Interviews und erst in der zweiten Runde wird standardisiert befragt (z. B. ID42, ID43, ID44). In einer anderen Studie wurde eine Form des Policy-Delphis durchgeführt, bei der zunächst ein Fragebogen eingesetzt wurde, dann eine Gruppendiskussion und in der dritten Delphi-Runde wieder eine schriftliche Befragung (ID75). Dabei wurden in Runde eins und zwei unterschiedliche Expert_innen eingebunden und in der dritten Delphi-Runde beide Expert_innengruppen integriert, um die Ergebnisse zu validieren. In allen untersuchten Artikeln werden die Expert_innen anonym behandelt. Allerdings werden in einigen Fällen aggregierte Informationen zur Soziodemografie des Expert_innenpanels gemacht. 26 % (n = 21) geben das Geschlecht der Expert_innen und 20 % (n = 16) das Alter der Expert_innen an. Weitaus häufiger finden sich Angaben zur Profession bzw. zum Beruf (77 %, n = 64). Im Fazit zeigen sich folgende Tendenzen hinsichtlich des zugrunde liegenden Expert_innenbegriffs bei Delphi-Verfahren in der Gesundheitsförderung: • Die Zuschreibung von Expertise erfolgt durch das Forscherteam. Sie wird nur in Ausnahmefällen durch die Expert_innen selbst oder andere Personen validiert. • In den untersuchten Delphi-Studien werden Expert_innen sehr unterschiedlich definiert, zum einen über objektive Faktoren, wie Titel oder Anzahl an Publikationen und zum anderen über die zugeschriebene Expertise zum jeweiligen Thema. • Integriert werden in den Delphi-Prozessen häufig Personen mit einer theoretisch-wissenschaftlichen und Personen mit einer lebensweltlich-praktischen Expertise. Mithilfe von Delphi-Verfahren werden dadurch unterschiedliche Wissensarten integriert. • Die Ansprache und Identifikation der Expert_innen erfolgt in der Regel über ihre institutionelle bzw. organisationale Zugehörigkeit.

318

M. Niederberger et al.

• Die Anzahl an eingeladenen und tatsächlich eingebundenen Expert_innen variiert sehr stark und hängt mit der Art des Delphi-Verfahrens zusammen. Mitunter werden alle erreichbaren Personen befragt. Die Auswirkungen der Samplegröße auf die Reichweite und Qualität der Ergebnisse wird allerdings selten begründet bzw. reflektiert. • Die Zusammensetzung der Expert_innengruppe kann sich zwischen den DelphiRunden ändern, d. h. mitunter werden in folgenden Delphi-Runden Personen mit anderer Expertise integriert oder weitere Personen rekrutiert.

4.6 Ablauf des Delphi-Verfahrens Delphi-Verfahren werden in der Regel mit mehreren Befragungsrunden durchgeführt. In bisherigen Reviews über Delphi-Verfahren deutet sich an, dass in der Forschungspraxis meist zwei Delphi-Runden angesetzt werden (Nowack et al. 2011, S. 1611). Auch in den untersuchten Studien der Gesundheitsförderung werden im Durchschnitt zwei bis drei Runden durchgeführt. Die Spanne reicht bis zu fünf Runden (vgl. Tab. 10). Dass ein vorher definierter Konsens erreicht wurde, stellte bei 19 % (n = 13) der untersuchten Delphi-Studien das Abbruchkriterium dar. Bei den meisten Delphi-Studien werden allerdings forschungspragmatische Gründe für den Abbruch genannt (77 %, n = 53). Mit den verschiedenen Delphi-Runden werden in den Artikeln bestimmte Anliegen formuliert. Die erste Runde dient häufig der Identifikation zentraler Aspekte und der (Weiter-)Entwicklung eines standardisierten Fragebogens. In den nachfolgenden Runden wird das Ziel verfolgt, standardisierte Urteile zu erhalten, Streuungen zu minieren, die Aussagekraft zu erhöhen und häufig Konsens bzw. Dissens zu erhalten. Das Vorgehen entspricht damit weitestgehend dem methodischen Vorgehen bei einem klassischen Delphi-Verfahren (Linstone und Turoff 2002, S. 5–6).

Tab. 10  Berichtete Anzahl der Delphi-Runden. (Eigene Darstellung)

Anzahl der Delphi-Runden

Häufigkeit

In Prozent

2

33

42,3

3

42

53,8

4

1

1,3

5

2

2,6

78

100

Gesamt

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

319

Beispiel für den Zweck der Delphi-Runden (ID14, S. 2665)

1. „In the first stage, basic questions were sent (via email or fax) in an unstructured or open-ended format for the sample population, and they were asked to brain storm and express their ideas freely and then return their responses…. 2. In the second stage, we used a structured questionnaire, and the responses that were received were sent to people who were asked to rate the responses using a Likert scale. 3. In the third stage, the results of the second phase were sent to the participants, and they were asked to review the responses again and to revise their comments and judgments, if necessary, and to mention their reasons for the lack of consensus and grade their importance considering the mean and median scores.“

Erfasst wurde in dem Review auch die Art des Feedbacks zwischen den DelphiRunden. Bisherige Studien belegen, dass dies meist in Form von quantitativen, aggregierten Gruppenantworten erfolgt (Boulkedid et al. 2011, S. 6). Auch in den Delphi-Verfahren der Gesundheitsförderung werden Expert_innen typischerweise die aggregierten und anonymisierten Gruppenantworten zurückgemeldet (74 %, n=50). Dies erfolgt häufig integriert im Fragebogen (57 %, n = 39) oder in extra Berichten (10 %, n = 7). Nur in Ausnahmefällen werden dabei auch die individuellen Antworten zurückgespielt (29 %, n=9, z. B. ID35, ID38, ID48a, ID48b). Wie sich die Urteile der Expert_innen verändern, ob sie beispielsweise ihre Antworten bestätigen, revidieren oder radikalisieren, wird in keiner der untersuchten Delphi-Studien thematisiert. Aussagen über das Urteilsverhalten sind damit nicht möglich. Über die Gesamtergebnisse des Delphi-Prozesses erhalten die Expert_innen nach den Hinweisen in den untersuchten Artikeln eher selten eine Rückmeldung. Nur in sieben der untersuchten Delphi-Studien (11 %) wird explizit eine Form der kommunikativen Validierung angegeben. Im Fazit werden die Delphi-Verfahren in der Gesundheitsförderung meist mit zwei bis drei Runden durchgeführt. Die Anzahl der Runden wird in der Regel nicht auf Basis theoretisch-inhaltlicher Aspekte begründet, sondern scheint vielmehr ein Ergebnis forschungspragmatischer Abwägungen. Das Vorgehen bei den Delphi-Studien in der Gesundheitsförderung entspricht im Ergebnis weitestgehend den Befunden aus anderen Reviews. Allerdings werden deutlich seltener

320

M. Niederberger et al.

individuelle Feedbacks berichtet (Boulkedid et al. 2011, S. 6). Aussagen über das Urteilsverhalten von Expert_innen durch die wiederholte Befragung mit Feedback sind auf Basis der analysierten Artikel nicht möglich.

4.7 Hinweise zu den Erhebungsinstrumenten Das typische Erhebungsinstrument eines Delphi-Prozesses ist ein Fragebogen, bei dem geschlossene und offene Fragen kombiniert werden (Boulkedid et al. 2011; Niederberger und Renn 2018). Auch die Analysen der untersuchten Delphi-Studien der Gesundheitsförderung beruhen auf der Verwendung von Fragebögen. Nach den Angaben in den Artikeln setzen in der ersten Runde 88 % (n = 71), in der zweite Runde 91 % (n = 71) und in der dritten Runde 92 % (n = 43) einen Fragebogen ein. Die zunehmende Verwendung von Fragebögen pro Delphi-Runde zeigt, dass zum Teil mit einem qualitativen Instrument (Interviews oder Workshop) begonnen wird und erst in einer zweiten Runde quantitative Instrumente zum Einsatz kommen (z. B. ID7, ID36, ID42). Die Entwicklung der Fragebögen beruht nach den Angaben in den Artikeln meist auf Literaturrecherchen (46 %, n = 30) oder vorhergehenden empirischen Analysen (41 %, n = 27). Bei einigen Delphi-Verfahren werden die Items auf Basis der Erkenntnisse einer ersten qualitativen Delphi-Runde formuliert. Die Güte des Fragebogens wird in den untersuchten Artikeln nicht reflektiert, weder über theoretische Konzepte bzw. Modelle noch über messbare Gütekriterien. Insgesamt gleicht der Prozess von der Fragestellung, über die Identifikation zentraler Items und der Entwicklung des Fragebogens einer „black box“, auf die in den untersuchten Artikeln kaum eingegangen wird. Es fehlen weitestgehend Hinweise auf systematische und nachvollziehbare Vorgehensweisen der Fragebogenentwicklung. In 97 % (n = 75) der Artikel wird deutlich, dass vor allem geschlossene Fragen verwendet werden. Aber auch offene Fragen finden sich sehr häufig (82 %, n = 63). In 79 % (n = 60) der Artikel wird explizit angegeben, dass der Fragebogen geschlossene und offene Fragen beinhaltet. Die Länge der Fragebögen ist sehr unterschiedlich. Berichtet wird von Fragebögen mit bis zu 311 Items. Im Durchschnitt werden 44 Items pro Fragebogen integriert. Die meisten Studien verwenden fünfstufige Likertskalierungen (54 %, n = 35; ID2, ID14, ID29, ID39, ID42). Die Skalenbreite reicht von zwei bis elf Ausprägungen. Dabei zeigt sich, dass die Skalenbreite mit der Konsensdefinition zusammenhängt (vgl. Abschn. „Hinweise zur Konsensfindung“). Geht es darum, dass ein bestimmter Prozentsatz an Expert_ innen einem Item zustimmt, werden geringe Skalenbreiten verwendet (z. B. ID36,

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

321

ID70), geht es dagegen um Streuungsmaße, werden breitere Skalen eingesetzt (z. B. ID89). Basis dieser Entscheidungen sind vermutlich mathematisch-statistische Überlegungen über die Angemessenheit von Messniveau und statistischer Auswertung. Im Fazit werden für jedes Delphi-Verfahren eigene Fragebögen entwickelt, die auf Analysen von Literaturstudien oder anderen Erhebungen basieren. Mit durchschnittlich über 40 Items sind es in der Regel eher umfangreiche Fragebögen, die auf einer Kombination offener und geschlossener Fragen beruhen. Die Formulierung der Fragen und Skalen wird durch das Ziel des Delphi-Verfahrens beeinflusst. Das deutet auf eine bewusste und reflektierte Entwicklung der Fragebögen hin. Die genaue Herleitung der Items sowie die Güte des Erhebungsinstruments werden in den Artikeln kaum reflektiert.

4.8 Hinweise zur Konsensfindung Viele der untersuchten Delphi-Studien der Gesundheitsförderung sind als Konsensverfahren angelegt (vgl. Abschn. „Angaben zum Thema und Zielstellung des Delphi-Verfahrens“). Das bedeutet idealiter, dass keine weiteren Befragungen der Expert_innen erfolgen, wenn ein vorher definierter Konsens erreicht wurde. Deshalb wird an dieser Stelle genauer betrachtet, was die Autor_innen unter Konsens verstehen. In der Methodenliteratur zu Delphi-Verfahren werden unterschiedliche Konsensdefinitionen vorgeschlagen (Keeney et  al. 2011; von der Gracht 2012). Verschiedene Autor_innen schlagen die Verwendung einer fünfstufigen ­Likertskala vor und definieren Konsens, wenn mindestens 75 % der Expert_innen einem bestimmten Wert auf dieser Skala zustimmen (Jirwe et al. 2009; Keeney et al.  2006; Witt und de Almeida 2008). Auch bei den vorliegenden Konsensstudien (n = 64) wird meist (81 %, n = 52) ein konkretes Konsenskriterium angegeben (Beispiele in Tab. 11). In den meisten Fällen (42 %, n = 27) wird Konsens über einen bestimmten Prozentsatz definiert. Daneben wird Konsens über ordinale (15 %, n = 9) und über metrische Maßzahlen (6 %, n = 4) definiert. In einigen Fällen werden auch mehrere Kriterien kombiniert, wie die Angabe einer prozentualen Zustimmung mit einem Streuungsmaß. Die Anzahl der Items im Konsens variiert sehr stark. Gemessen an der Gesamtlänge des Fragebogens werden Werte zwischen zehn und 100  % angegeben. Im Durchschnitt wird nach dem berichteten Antwortverhalten bei über 60 % der Items ein Konsens zwischen den Expert_innen erreicht. Die Chance einen Konsens zu finden, hängt nach bisherigen Erfahrungen unter anderem mit

322

M. Niederberger et al.

Tab. 11   Beispiele für Konsensdefinitionen in den untersuchten Delphi-Studien. (Eigene Darstellung) Über Prozentwerte ID70, S. 107 „The participants were asked to score each item using five-point Likert scale (extremely important = 5, very important = 4, moderately important = 3, slightly important = 2, not important = 1). …. we defined consensus as at least 80 % of the participants in the Delphi team ticking the same answer category (e.g. 5 ‚extremely important‘) and no more than 15 % an answer category two or three categories away (e.g. 2 ‚slightly important‘ or 1 ‚not important‘).“ Über Interquartilsabstand (IQR bzw. In Englisch IQD) ID68, S. 191–192 „A nine-point Likert scale was used to evaluate the importance: a score of 9 is considered to be critical, and a score of 1 is of limited importance to patientcare. …An IQR of ≤ 2 in the second round was pre-specified to indicate consensus from the first round.“ Über Standardabweichung ID33, S. 4 „The same experts are sent the proposed item versions to rate on a 5-point Likert scale with regard to their meaning apart from the perspective (1–no conformity with regard to contents, 5–total conformity with regard to contents) …. For all items with at least one version with a mean ≥ 3, the item-version with the highest mean is included in the final version of the questionnaire. All item-versions with a mean lower than three are revised by the study team (under consideration of the comments by experts from step 4).“ Über komplexe Definitionen ID23, S. 53 „It was decided that consensus on descriptions was reached if a similar concept name was chosen by ≥ 70 % of the experts with an IQD of ≤ 1.“

dem Thema, der Expert_innenauswahl und der empirischen Datenlage zusammen (Hart et al. 2009; Vidgen und Galllegos 2011, S. 6). In den untersuchten Artikeln korreliert die Konsenserreichung mit der Art der Konsensdefinition (eta = 0,558, n = 41) und der Skalenbreite (eta = 0,584, n = 40). Kaum einen Effekt auf den Konsens zeigt dagegen die Anzahl der Delphi-Runden (r = −0,101, n = 45) und die Anzahl der eingebundenen Expert_innen in der ersten Runde (r = 0,104, n = 45). Im Fazit zeigt sich, dass die meisten Konsensstudien ein konkretes Kriterium angeben. Allerdings kann am Ende eines Delphi-Prozesses nicht bei allen Items Konsens hergestellt werden. Die Hintergründe für divergierende Urteile werden kaum reflektiert. Es deutet sich aber an, dass vor allem die Konsensdefinition und messtheoretische Implikationen hier relevant sind. Die Definitionen der Delphi-Forschenden haben somit einen entscheidenden Einfluss auf den Ausgang des Verfahrens.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

323

4.9 Ergebnisdarstellung Untersucht wurde auch, wie in der Gesundheitsförderung Delphi-Verfahren berichtet werden. Dies ist insofern von Interesse, weil es hier bisher keine verbindlichen Vorgaben gibt, wie es sie beispielsweise für Ergebnispräsentationen von systematischen Reviews vorliegen (siehe PRISMA nach Moher et al. 2009). Allerdings werden in verschiedenen Studien Empfehlungen, u. a. für die Ergebnisdarstellung ausgesprochen (Boulkedid et al. 2011; Jünger et al. 2017). Hierbei wird empfohlen, Erhebungsinstrumente und Ergebnisse rundenweise zu präsentieren, um auch Veränderungen zwischen den Runden transparent zu machen.

Jünger et al. (2017, S. 702): Empfehlungen für die Ergebnisdarstellung

„Reporting of results for each round separately is highly advisable in order to make the evolving of consensus over the rounds transparent. This includes figures showing the average group response, changes between rounds, as well as any modifications of the survey instrument such as deletion, addition or modification of survey items based on previous rounds“

In den untersuchten Artikeln liegt der Fokus der Darstellung eindeutig auf den Endergebnissen. Meist werden entgegen der genannten Empfehlungen weder die Erhebungsinstrumente noch die Ergebnisse pro Delphi-Runde dargestellt (vgl. Tab. 12). Die Ergebnisdarstellung beruht zumeist auf den quantitativen Befunden (n=58, 76 %, vgl. Tab. 13). Statistische Befunde werden über deskriptive Analysen präsentiert (96 %, n=76), häufig in Form von Häufigkeitstabellen (n = 54, 64 %). Inferenzstatistische Analysen sind die Ausnahme (n = 8, 10 %). Bei den Studien mit einem qualitativen Fokus, werden immer auch wörtliche, anonymisierte Zitate der Expert_innen eingebunden. Bei den Studien, die qualitative und quantitative Befunde präsentieren, nutzen die Hälfte (n = 4) wörtliche Zitate der Expert_innen. Der Delphi-Prozess selbst wird in knapp jeder dritten Publikation (33 %, n = 27) über einen Flowchart präsentiert, aus dem die einzelnen Arbeitsschritte hervorgehen. In den anderen Studien ist der Ablauf allerdings häufig sehr unpräzise beschrieben und somit schwer nachvollziehbar. Dies ist bei Artikeln festzustellen, bei denen der Fokus auf andere im Projekt durchgeführte Analysen liegt (z. B. ID4, ID47), aber auch bei Artikeln, bei denen das Delphi-Verfahren eine zentrale Rolle im Forschungsprozess eingenommen hat (z. B. ID38, ID41).

324

M. Niederberger et al.

Tab. 12   Art der Berichterstattung über Delphi-Prozesse. (Eigene Darstellung) Rundenweise Darstellung der Ergebnisse Häufigkeit

In Prozent

Ja

31

36,9

Nein

53

63,1

Gesamt

84

100

Rundenweise Darstellung der Erhebungsinstrumente Ja

1

1,2

Nein

83

98,8

Gesamt

84

100

Tab. 13  Fokus der Berichterstattung. (Eigene Darstellung)

Fokus der Berichterstattung

Häufigkeit

In Prozent

Quantitativ

58

76,3

Qualitativ

10

13,2

8

10,5

76

100

Gleichrangig Gesamt

Im Fazit fällt bei der Berichterstattung auf, dass die Delphi-Verfahren sehr unterschiedlich dargestellt werden und Vorgehensweisen mitunter sehr kurz präsentiert werden. Bei knapp einem Viertel der untersuchten Artikel (n = 23) werden die Informationen sehr kurz dargestellt. Dadurch fällt es zum Teil schwer, Vorgehensweisen, inhaltliche Entscheidungsprozesse und eventuelle Modifikationen am Delphi-Verfahren nachzuvollziehen (z. B. wenn in einer folgenden Delphi-Runde mehr Expert_innen integriert werden als vorher).

5 Fazit Delphi-Verfahren werden international in der Gesundheitsförderung eingesetzt. Sie werden vor allem dann durchgeführt, wenn es darum geht, konsentierte Leitlinien bzw. Standards mithilfe von Expert_innen zu entwickeln. Aber auch zur Erfassung von Expert_innenurteilen spielen sie eine große Rolle. Für Prognosen oder Zukunftsstudien werden sie im Bereich der Gesundheitsförderung bisher kaum eingesetzt, obwohl sie sich in diesen Bereichen etabliert haben und zum festen Methodenkanon gehören (Cuhls 2012; Rowe und Wright 2011).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

325

In der Regel folgen die untersuchten Delphi-Verfahren dem Vorgehen eines klassischen Delphi-Verfahrens. Die Ergebnisse des systematischen Reviews zeigen, dass die in der methodischen Diskussion entwickelten Varianten von Delphi-Verfahren sehr unterschiedlich in der Gesundheitsförderung rezipiert werden. Das Realtime-Delphi und das Gruppendelphi werden kaum bzw. gar nicht eingesetzt. Stattdessen hat sich eine „Kultur der Modifikation“ etabliert, das heißt eigene, den Forschungsauftrag berücksichtigende Modifikationen werden entwickelt und eingesetzt. So gibt es eine Vielzahl an Variationen im Hinblick auf Rundenanzahl, Zusammensetzung des Expert_innenpanels, Erhebungsinstrument und Konsensdefinition. Diese Variationen belegen zum einen die Flexibilität des Delphi-Verfahrens, erschweren zum anderen aber auch die Nachvollziehbarkeit von Prozessen und Ergebnissen auf Basis von Publikationen. Diese Modifikationen bedingen auch, dass die ursprünglich konstituierenden Merkmale von Delphi-Verfahren zunehmend variabel werden. Das betrifft vor allem den Expert_innenbegriff und das Konzept der Iteration. • Einige Autor_innen haben sich explizit vom Expert_innenbegriff distanziert. Im Grunde kann damit jeder Experte bzw. Expertin sein, der/die über spezifisches Erfahrungswissen verfügt. Entsprechend sprechen sie von der Integration von Nutzer_innen, Patient_innen oder informierten Bürger_innen (z. B. ID36, ID54, ID49, ID82). • Vor allem durch die häufige Kombination von qualitativen mit quantitativen Erhebungsinstrumenten hat sich das Konzept der Iteration verändert. Ging es ursprünglich darum, dass der Fragebogen mit jeder Welle auf die strittigen bzw. unklaren Items gekürzt wird, dienen die Expert_innenurteile der ersten qualitativen Runde zunehmend zur Entwicklung eines standardisierten Instruments, der in der folgenden Runde eingesetzt wird (z. B. ID42, ID43, ID44). Der konkrete Prozess der Fragebogenentwicklung bleibt dabei allerdings unklar. Bei einigen Delphi-Verfahren werden zudem in jeder Delphi-Runde andere Expert_innen eingebunden, sodass im Grunde keine Iteration möglich ist (z. B. ID55). Bei einigen der untersuchten Delphi-Verfahren ist das Vorgehen allerdings kaum nachvollziehbar, weil Angaben zur Rundenanzahl, zur Expert_innen- und Konsensdefinition oder zur Feedbackgestaltung schlichtweg fehlen (z. B. ID46, ID59). Im Hinblick auf die Art der Darstellung von Delphi-Verfahren in Publikationen erscheinen verbindliche Richtlinien bzw. Vorgaben absolut notwendig, auch um ein einheitliches Vorgehen und eine gewisse Vergleichbarkeit gewährleisten zu können.

326

M. Niederberger et al.

Anhang: Analysierte Artikel ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 1

Abidi, L., Oenema, A., Nilsen, P., Anderson, P. & van de Mheen, D. (2016). Strategies to Overcome Barriers to Implementation of Alcohol Screening and Brief Intervention in General Practice: a Delphi Study Among Healthcare Professionals and Addiction Prevention Experts. Prevention Science, (17(6), S. 689– 699). https://doi. org/10.1007/s11121-016-0653-4.

2

Amir, L.H., Ryan, K. & Barnett, C. (2015). Delphi survey of international pharmacology experts: an attempt to derive international recommendations for use of medicine in breastfeeding women. Breastfeeding Medicine, (10(3), S. 168–174). https://doi. org/10.1089/bfm.2014.0144.

3

Anbari, Z., Mohammadbeigi, A. & Jadidi, R. (2015). Barriers and challenges in researches by Iranian students of medical universities. Perspectives in Clinical Research, 6(2), (S. 98–103).

4

Anderson, L. A., Slonim, A., Yen, I. H., Jones, D. L., Allen, P., Hunter, R. H., Goins, R. T., Leith, K. H., Rosenberg, D., Satariano, W. A. & McPhillips-Tangum, C. (2014). Developing a framework and priorities to promote mobility among older adults. Health Education & Behavior, 41(1S), (S. 10–18).

6

Barry, M.M., Battel-Kirk, B. & Dempsey, C. (2012). The CompHP core competencies framework for health promotion in Europe. Health Education & Behavior, 39(6), (S. 648–662).

7

Bing-Jonsson, P.C., Bjørk, I.T., Hofoss, D., Kirkevold, M. & Foss, C. (2014). Competence in advanced older people nursing: development of ‚Nursing older people – competence evaluation tool. International Journal of Older People Nursing, (10(1), S. 59–72). https://doi.org/10.1111/opn.12057.

8

Birko, S., Dove, E.S. & Özdemir, V. (2015). A Delphi Technology Foresight Study: Mapping Social Construction of Scientific Evidence on Metagenomics Tests for Water Safety. PLOS ONE, (10(6)). https://doi.org/10.1371/journal.pone.0129706. eCollection 2015.

9

Bloomfield, S.F., Rook, G.A., Scott, E.A., Shanahan, F., Stanwell-Smith, R. & Turner, P. (2016). Time to abandon the hygiene hypothesis: new perspectives on allergic disease, the human microbiome, infectious disease prevention and the role of targeted hygiene. Perspect Public Health, (136(4), S. 213–224). https://doi. org/10.1177/1757913916650225.

10 Camps, C., Albanell, J., Antón, A., Aranda, E., Carrato, A., Cassinello, J., Castellano, D., Cruz, J.J., Garrido, P., Guillem, V., Grávalos, C., López, G., Llorente, C., Lorenzo, A., Lluch, A., Ignacio, E. & Díaz-Rubio, E. (2016). Quality Indicators to Assure and Improve Cancer Care in Spain Using the Delphi Technique. National Comprehensive Cancer Network, 14(5), (S. 553–558).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

327

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 11 Chang, Y.K., Chuang, K.Y., Tseng, J.M., Lin, F.C. & Su, T.S. (2013). Hazardous workplace review program in Taiwan. Industrial Health, 51(4), (S. 432–442). 12 Chen, F.L. & Lee, A. (2016). Health-promoting educational settings in Taiwan: development and evaluation of the Health-Promoting School Accreditation System. Global Health Promotion, (23(1), S. 18–25). https://doi. org/10.1177/1757975916638286. 13 Elfeddali, I., van der Feltz-Cornelis, C.M., van Os, J., Knappe, S., Vieta, E., Wittchen, H.U., Obradors-Tarragó, C. & Haro, J.M. (2014). Horizon 2020 priorities in clinical mental health research: results of a consensus-based ROAMER expert survey. International Journal of Environmental Research and Public Health, 11(10), (S. 10915–10939). 14 Emadzadeh, A., Moonaghi, H.K., Bazzaz, M.M. & Karimi, S. (2016). An investigation on social accountability of general medicine curriculum. Electronic Physician Journal, (8(7), S. 2663–2669). https://doi.org/10.19082/2663. 15 Fakhri, A., Harris, P. & Maleki, M. (2015). Proposing a framework for Health Impact Assessment in Iran. BMC Public Health, (15(335)). https://doi.org/10.1186/s12889015-1698-1. 17 Fernandes, L., Hagen, K.B., Bijlsma, J.W., Andreassen, O., Christensen, P., Conaghan, P.G., Doherty, M., Geenen, R., Hammond, A., Kjeken, I., Lohmander, L.S., Lund, H., Mallen, C.D., Nava, T., Oliver, S., Pavelka, K., Pitsillidou, I., da Silva, J.A., de la Torre, J., Zanoli, G., Vliet Vlieland, T.P. & European League Against Rheumatism (EULAR) (2013). EULAR recommendations for the non-pharmacological core management of hip and knee osteoarthritis. Annals of the Rheumatic Diseases, 72 (7), (S. 1125–1135). 19 Forsman, A.K., Wahlbeck, K., Aarø, L.E., Alonso, J., Barry, M.M., Brunn, M., Cardoso, G., Cattan, M., de Girolamo, G., Eberhard-Gran, M., Evans-Lacko, S., Fiorillo, A., Hansson, L., Haro, J.M., Hazo, J.B., Hegerl, U., Katschnig, H., Knappe, S., Luciano, M., Miret, M., Nordentoft, M., Obradors-Tarragó, C., Pilgrim, D., Ruud, T., Salize, H.J., Stewart-Brown, S.L., Tómasson, K., van der Feltz-Cornelis, C.M., Ventus, D.B., Vuori, J., Värnik, A. & ROAMER Consortium (2015). Research priorities for public mental health in Europe: recommendations of the ROAMER project. European Journal of Public Health, (25(2), S. 249–254). https://doi.org/10.1093/ eurpub/cku232. 20 Francis, C.E., Londmui, P.E., Boyer C., Andersen, L.B., Barnes, J.D., Boiarskaia, E., Cairney J., Faigenbaum, A.D., Faulkner, G., Hands, B.P., Hay, J.A., Janssen, I., Katzmarzyk, P.T., Kemper, H.C., Knudson D., Lloyd, M., McKenzie, T.L., Olds, T.S., Sacheck, J.M., Shephard, R.J., Zhu, W. & Tremblay, M.S. (2016). The Canadian Assessment of Physical Literacy: Development of a Model of Children’s Capacity for a Healthy, Active Lifestyle through a Delphi Process. Journal of Physical Activity and Health, (13(2), S. 214–222). https://doi.org/10.1123/jpah.2014-0597.

328

M. Niederberger et al.

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 22 Galatsch, M., Moser-Siegmeth, V., Blotenberg, B., Große Schlarmann, J., Schnepp, W. & Team des Internationalen Family Health Nursing Projektes (2014). Family Health Nursing – a challenge for education and training? Results of an European project. Pflege, 27(4), (S. 269–277). 23 Gevers, D.W., Kremers, S.P., de Vries, N.K. & van Assema, P. (2014). Clarifying concepts of food parenting practices. A Delphi study with an application to snacking behavior. Appetite, 79, (S. 51–57). 24 Guzman J., Tompa E., Koehoorn M., de Boer, H., Macdonald, S. & Alamgir, H. (2015). Economic evaluation of occupational health and safety programmes in health care. Occupational Medicine, (65(7), S. 590–597). https://doi.org/10.1093/occmed/ kqv114. 25 Haluza, D. & Jungwirth, D. (2015). ICT and the future of health care: aspects of health promotion. International Journal of Medical Informatics, (84, S. 48–57). https://doi.org/10.1016/j.ijmedinf.2014.09.005. 26 Han, H., Ahn, D.H., Song, J., Hwang, T.Y. & Roh, S. (2012). Development of mental health indicators in Korea. Psychiatry Investigation, 9(4), (S. 311–318). 27 Harris, N. & Sandor, M. (2013). Defining sustainable practice in community-based health promotion: a Delphi study of practitioner perspectives. Health Promotion Journal of Australia, 24(1), (S. 53–60). 28 Hatamabadi, H.R., Sum, S., Tabatabaey, A. & Sabbaghi, M. (2016). Emergency department management of falls in the elderly: A clinical audit and suggestions for improvement. International Emergency Nursing – Journal, (24, S. 2–8). https://doi. org/10.1016/j.ienj.2015.05.001. 29 Hawk, C., Schneider, M., Evans, M.W. Jr. & Redwood, D. (2012). Consensus process to develop a best-practice document on the role of chiropractic care in health promotion, disease prevention, and wellness. Journal of Manipulative and Physiological Therapeutics, 35(7), (S. 556–567). 30 Holtzhausen, L.J., van Zyl, G.J. & Nel, M.M. (2014). Developing a strategic research framework for sport and exercise medicine. British Journal of Sports Medicine, 48(14), (S. 1120–1126). 31 Jander, A., Crutzen, R., Mercken, L. & De Vries, H. (2015). Web-based interventions to decrease alcohol use in adolescents: a Delphi study about increasing effectiveness and reducing drop-out. BMC Public Health, (15(340)). https://doi.org/10.1186/ s12889-015-1639-z. 32 Jones, M.L. & Boyd, L.D. (2012). Interdisciplinary approach to care: the role of the dental hygienist on a pediatric feeding team. Journal of Allied Health, 41(4), (S. 190–197).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

329

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 33 Junne, F., Ziser, K., Mander, J., Martus, P., Denzer, C., Reinehr, T., Wabitsch, M., Wiegand, S., Renner, T., Giel, K.E., Teufel, M., Zipfel, S. & Ehehalt, S. (2016). Development and psychometric validation of the ‚Parent Perspective University of Rhode Island Change Assessment-Short‘ (PURICA-S) Questionnaire for the application in parents of children with overweight and obesity. BMJ Open, (6(11)). https:// doi.org/10.1136/bmjopen-2016-012711. 34 Junod Perron, N., Cerutti, B., Picchiottino, P., Empeyta, S., Cinter, F. & van Gessel, E. (2014). Needs assessment for training in interprofessional skills in Swiss primary care: a Delphi study. Journal of Interprofessional Care, 28(3), (S. 273–275). 35 Kelly, B., King, L., Bauman, A. E., Baur, L. A., Macniven, R., Chapman, K. & Smith, B. J. (2014). Identifying important and feasible policies and actions for health at community sports clubs: a consensus-generating approach. Journal of Science and Medicine in Sport, 17(1), (S. 61–66). 36 Kelly, M., Wills, J., Jester, R. & Speller, V. (2016). Should nurses be role models for healthy lifestyles? Results from a modified Delphi study. Journal of Advanced Nursing, (73(3), S. 665–678). https://doi.org/10.1111/jan.13173. 38 Lauriks, S., de Wit, M. A., Buster, M. C., Arah, O. A. & Klazinga, N. S. (2014). Composing a core set of performance indicators for public mental health care: a modified Delphi procedure. Administration and Policy in Mental Health and Mental Health Services Research, 41(5), (S. 625–635). 39 Li, Y., Ehiri, J., Hu, D., Oren, E., & Cao, J. (2015). Framework of behavioral indicators evaluating TB health promotion outcomes: a modified Delphi study of TB policymakers and health workers. Infectious Diseases of Poverty, (4(56)). https://doi. org/10.1186/s40249-015-0087-4. 40 Li, Y., Ehiri, J., Hu, D., Zhang, Y., Wang, Q., Zhang, S. & Cao, J. (2014). Framework of behavioral indicators for outcome evaluation of TB health promotion: a Delphi study of TB suspects and Tb patients. BMC Infectious Diseases, (14(268)). https:// doi.org/10.1186/1471-2334-14-268. 41 Liu, X., Erasmus, V., Sun, X., Cai, R., Shi, Y. & Richardus, J.H. (2014). Preventing HIV transmission in Chinese internal migrants: a behavioral approach. The Scientific World Journal. https://doi.org/10.1155/2014/319629. 42 Maijala V., Tossavainen K. & Turunen H. (2016). Primary health care registered nurses‘ types in implementation of health promotion practices. Primary Health Care Research & Development, (17(5), S. 453–563). https://doi.org/10.1017/ s1463423615000547. 43 Maijala, V., Tossavainen, K. & Turunen, H. (2015). Identifying nurse practitioners‘ required case management competencies in health promotion practice in municipal public primary health care. A two-stage modified Delphi study. Journal of Clinical Nursing, (24, S. 2554–2561). https://doi.org/10.1016/j.ienj.2015.05.001.

330

M. Niederberger et al.

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 44 Maijala, V., Tossavainen, K., & Turunen H. (2016). Health promotion practices delivered by primary health care nurses: Elements for success in Finland. Applied Nursing Research, (30, S. 45–51). https://doi.org/10.1016/j.apnr.2015.11.002. 45 Manavi, S., Olyaee Manesh, A., Yazdani, S., Shams, L., Nasiri, T., Shirvani, A. & Emami Razavi, H. (2013). Model for implementing evidence based health care system in Iran. Iranian Journal of Public Health, 42(7), (S. 758–766). 46 Mao, F., Han, Y., Chen, J., Chen, W., Yuan, M., Hong, A.Y. & Fang, Y. (2016). Development of a Multidimensional Functional Health Scale for Older Adults in China. Community Mental Health Journal, (52(4), S. 466–471). https://doi. org/10.1007/s10597-015-9945-6. 47 McGladrey, B.W., Hannon, J.C., Faigenbaum, A.D., Shultz, B.B. & Shaw, J.M. (2014). High school physical educators‘ and sport coaches‘ knowledge of resistance training principles and methods. Journal of Strength and Conditioning Research, 28(5), (S. 1433–1442). 48 McKenna, H., McDonough, S., Keeney, S., Hasson, F., Lagan, K., Ward, M., Kelly, G. & Duffy, O. (2014). Research priorities for the therapy professions in Northern Ireland and the Republic of Ireland: a comparison of findings from a Delphi consultation. Journal of Allied Health, 43(2), (S. 98–109). 49 McVeigh, J., MacLachlan, M., Gilmore, B., McClean, C., Eide, A.H., Mannan, H., Geiser, P., Duttine, A., Mji, G., McAuliffe, E., Sprunt, B., Amin, M. & Normand, C. (2016). Promoting good policy for leadership and governance of health related rehabilitation: a realist synthesis. Global Health, (12(1)). https://doi.org/10.1186/ s12992-016-0182-8. 50 Melnyk, B.M., Gallagher-Ford, L., Long, L.E. & Fineout-Overholt, E. (2014). The establishment of evidence-based practice competencies for practicing registered nurses and advanced practice nurses in real-world clinical settings: proficiencies to improve healthcare quality, reliability, patient outcomes, and costs. Worldviews on Evidence-Based Nursing, 11(1), (S. 5–15). 51 Milat, A.J., King, L., Bauman, A.E. & Redman, S. (2013). The concept of scalability: increasing the scale and potential adoption of health promotion interventions into policy and practice. Health Promotion International, 28(3), (S. 285–298). 54 Morgan, A.J., Chittleborough, P.& Jorm, A.F. (2016). Self-help strategies for sub-threshold anxiety: A Delphi consensus study to find messages suitable for population-wide promotion. Journal of Affective Disorders, (206, S. 68–76). https://doi. org/10.1016/j.jad.2016.07.024. 55 Morgan, D.J., Croft, L.D., Deloney, V., Popovich, K.J., Crnich, C., Srinivasan, A., Fishman, N.O., Bryant, K., Cosgrove, S.E. & Leekha, S. (2016). Choosing Wisely in Healthcare Epidemiology and Antimicrobial Stewardship. Infection Control & Hospital Epidemiology, (37(7), S. 755–760). https://doi.org/10.1017/ice.2016.61.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

331

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 56 Mostert-Phipps, N., Pottas, D. & Korpela, M. (2013). Guidelines to encourage the adoption and meaningful use of health information technologies in the South African healthcare landscape. In C.U. Lehmann, E. Ammenwerth & C. Nøhr (Hrsg.), MEDINFO 2013: Proceedings of the 14th World Congress on Medical and Health Informatics (S. 147–151). IOS Press. 57 Moynihan, S., Paakkari, L., Välimaa, R., Jourdan, D. & Mannix-McNamara P. (2015). Teacher Competencies in Health Education: Results of a Delphi Study. PLOS ONE, (10(12)). https://doi.org/10.1371/journal.pone.0143703. 58 Nematollahi, M., Khalesi, N., Moghaddasi, H. & Askarian, M. (2012). Second Generation of HIV Surveillance System: A Pattern for Iran. Iranian Red Crescent Medical Journal, 14(5), (S. 309–312). 59 Norris, S.A., Anuar, H., Matzen, P., Cheah, J.C., Jensen, B.B. & Hanson, M. (2014). The life and health challenges of young Malaysian couples: results from a stakeholder consensus and engagement study to support non-communicable disease prevention. BMC Public Health, (14(2)). https://doi.org/10.1186/1471-2458-14-s2-s6. 60 Pinto, R.O., Pattussi, M.P., Fontoura Ldo, P., Poletto, S., Grapiglia, V.L., Balbinot, A.D., Teixeira, V.A. & Horta, R.L. (2016). Validation of an instrument to evaluate health promotion at schools. Revista de Saúde Pública, (50(2)). https://doi. org/10.1590/s01518-8787.2016050005855. 61 Pollack, L.A., Plachouras, D., Sinkowitz-Cochran, R., Gruhler, H., Monnet, D.L., Weber, J.T. & Transatlantic Taskforce on Antimicrobial Resistance (TATFAR) Expert Panel on Stewardship Structure and Process Indicators (2016). A Concise Set of Structure and Process Indicators to Assess and Compare Antimicrobial Stewardship Programs Among EU and US Hospitals: Results From a Multinational Expert Panel. Infection Control & Hospital Epidemiology, (37(10), S. 1201–1211). https://doi. org/10.1017/ice.2016.115. 62 Poole, N., Schmidt, R.A., Green, C. & Hemsing, N. (2016). Prevention of Fetal Alcohol Spectrum Disorder: Current Canadian Efforts and Analysis of Gaps. Substance Abuse and Rehabilitation, (10(1), S. 1–11). https://doi.org/10.4137/sart. s34545. 63 Porcheret, M., Grime, J., Main, C. & Dziedzic, K. (2013). Developing a model osteoarthritis consultation: a Delphi consensus exercise. BMC Musculoskeletal Disorders, (14(25)). https://doi.org/10.1186/1471-2474-14-25. 64 Quecedo Gutiérrez, L., Ruiz Abascal, R., Calvo Vecino, J.M., Peral García, A.I., Matute González, E., Muñoz Alameda, L.E., Guasch Arévalo, E. & Gilsanz Rodríguez, F. (2016). „Do not do“ recommendations of the Spanish Society of Anaesthesiology, Critical Care and Pain Therapy. „Commitment to Quality by Scientific Societies“ Project. Revista Española de Anestesiología y Reanimación, (63(9), S. 519–527). https://doi.org/10.1016/j.redar.2016.05.002.

332

M. Niederberger et al.

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 65 Quinn, C.& Bonuck, K. (2012). Identifying breastfeeding-sensitive conditions by expert consensus. Journal of Human Lactation, (28(4), S. 535–542). https://doi. org/10.1177/0890334412456603. 66 Rangraz, J.F.& Rezaiimofrad, M.R. (2013). Development of Common Data Elements to Provide Tele self-Care Management. Acta Informatica Medica, 21(4), (S. 241–245). 67 Ridde, V. & Sombie, I. (2012). Street-level workers‘ criteria for identifying indigents to be exempted from user fees in Burkina Faso. Tropical Medicine and International Health, 17(6), (S. 782–791). 68 Rogozinska, E., D’Amico, M.I., Khan, K.S., Cecatti, J.G., Teede, H., Yeo, S., Vinter, C.A., Rayanagoudar, G., Barakat, R., Perales, M., Dodd, J.M., Devlieger, R., Bogaerts, A., van Poppel, M.N., Haakstad, L., Shen, G.X., Shub, A., Luoto, R., Kinnunen, T.I., Phelan, S., Poston, L., Scudeller, T.T., El Beltagy, N., Stafne, S.N., Tonstad, S., Geiker, N.R., Ruifrok, A.E., Mol, B.W., Coomarasamy, A., Thangaratinam, S. & International Weight Management in Pregnancy (iWIP) Collaborative Group (2015). Development of composite outcomes for individual patient data (IPD) meta-analysis on the effects of diet and lifestyle in pregnancy: a Delphi survey. BJOG: An International Journal of Obstetrics, (123(2), S. 190–198). https://doi.org/10.1111/14710528.13764. 69 Rubinstein, S.M., Bolton, J., Webb, A.L. & Hartvigsen, J. (2014). The first research agenda for the chiropractic profession in Europe. Chiropractic & Manual Therapies, (22(1)). https://doi.org/10.1186/2045-709x-22-9. 70 Salehi, A., Hashemi, N., Saber, M. & Imanieh, M.H. (2015). Designing and conducting MD/MPH dual degree program in the Medical School of Shiraz University of Medical Sciences. Journal of Advances in Medical Education & Professionalism, 3(3), (S. 105–110). 71 Schaffalitzky,E., Leahy, D., Cullen, W., Gavin, B., Latham, L., O’Connor, R., Smyth, B.P., O’Dea, E. & Ryan, S. (2015). Youth mental health in deprived urban areas: a Delphi study on the role of the GP in early intervention. Irish Journal of Medical Science, (184(4), S. 831–843). https://doi.org/10.1007/s11845-014-1187-z. 72 Schneider, F., van Osch, L. & de Vries, H. (2012). Identifying factors for optimal development of health-related websites: a delphi study among experts and potential future users. Journal of Medical Internet Research, (14(1)). https://doi.org/10.2196/ jmir.1863. 73 Setiyawati, D., Colucci, E., Blashki, G., Wraith, R. & Minas, H. (2014). International experts‘ perspectives on a curriculum for psychologists working in primary health care: implication for Indonesia. Health Psychology & Behavioural Medicine, 2(1), (S. 770–784).

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

333

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 75 Syed, A.M., Camp, R., Mischorr-Boch, C., Houÿez, F.& Aro, A.R. (2015). Policy recommendations for rare disease centres of expertise. Evaluation and Program Planning, (52, S. 78–84). https://doi.org/10.1016/j.evalprogplan.2015.03.006. 76 Taymoori, P. & Moshki, M. (2014). A Delphi study to curriculum modifying through the application of the course objective and competencies. Journal of Education and Health Promotion, (3(124)). https://doi.org/10.4103/2277-9531.145936. 77 Ter Haar, M., Aarts, N. & Verhoeven, P. (2015). Finding common ground in implementation: towards a theory of gradual commonality. Health Promotion International, (31(1), S. 214–230). https://doi.org/10.1093/heapro/dau077. 78 Teyhen, D.S., Aldag, M., Edinborough, E., Ghannadian, J.D., Haught, A., Kinn, J., Kunkler, K.J., Levine, B., McClain, J., Neal, D., Stewart, T., Thorndike, F.P., Trabosh, V., Wesensten, N. & Parramore, D.J. (2014). Leveraging technology: creating and sustaining changes for health. Telemedicine and e-Health, 20(9), (S. 835–849). 79 Tomasik, T., Gryglewska, B., Windak, A. & Grodzicki, T. (2013). Hypertension in the elderly: how to treat patients in 2013? The essential recommendations of the Polish guidelines. Polish Archives of Internal Medicine, 123 (7–8), (S. 409–416). 80 Tompa, E., de Boer, H., Macdonald, S., Alamgir, H., Koehoorn, M., & Guzman, J. (2016). Stakeholders‘ Perspectives About and Priorities for Economic Evaluation of Health and Safety Programs in Healthcare. Workplace Health & Safety, (64(4), S. 163–174). https://doi.org/10.1177/2165079915620201. 81 Uribe Guajardo, M.G., Slewa-Younan, S., Santalucia, Y.& Jorm, A.F. (2016). Important considerations when providing mental health first aid to Iraqi refugees in Australia: a Delphi study. International Journal of Mental Health Systems, (10(1)). https://doi.org/10.1186/s13033-016-0087-1. 82 Van Hasselt, F.M., Oud, M.J.& Loonen, A.J. (2015). Practical recommendations for improvement of the physical health care of patients with severe mental illness. Acta Psychiatrica Scandinavica, (131(5), S. 387–396). https://doi.org/10.1111/ acps.12372. 83 Van Scheppingen, A. R., ten Have. K.CJM., Zwetsloot, G. JIM, Kok, G. & van Mechelen, W. (2015). Determining organisation-specific factors for developing health interventions in companies by a Delphi procedure: Organisational Mapping. Journal of Health Psychology, (20(12), S. 1509–1522). https://doi. org/10.1177/1359105313516030. 84 Vankova, D., Kerekovska, A., Kostadinova, T. & Todorova L. (2016). Researching health-related quality of life at a community level: results from a population survey conducted in Burgas, Bulgaria. Health Promotion International, (31(3), S. 534–541). https://doi.org/10.1093/heapro/dav016.

334

M. Niederberger et al.

ID *Hinweis: Fehlende Nummern sind Quellen, die nicht den Einschlusskriterien entsprachen. 85 Vanmeerbeek, M., Govers, P., Schippers, N., Rieppi, S., Mortelmans, K. & Mairiaux, P. (2016). Searching for consensus among physicians involved in the management of sick-listed workers in the Belgian health care sector: a qualitative study among practitioners and stakeholders. BMC Public Health, (16(164)). https://doi.org/10.1186/ s12889-016-2696-7. 86 Vantamay, N. (2015). Using the delphi technique to develop effectiveness indicators for social marketing communication to reduce health- risk behaviors among youth. The Southeast Asian Journal of Tropical Medicine and Public Health, 46(5), (S. 949–957). 87 Vasudevan, V., Rmmer, J.H. & Kviz F. (2015). Development of the Barriers to Physical Activity Questionnaire for People with Mobility Impairments. Disability and Health Journal, (8(4), S. 547–556). https://doi.org/10.1016/j.dhjo.2015.04.007. 88 Vermandere, M., Lepeleire, J. D., Van Mechelen, W., Warmenhoven, F., Thoonsen, B. & Aertgeerts, B. (2013). Spirituality in palliative home care: a framework for the clinician. Supportive Care in Cancer, 21(4), (S. 1061–1069). 89 Vestjens, L., Kempen, G.I., Crutzen, R., Kok, G. & Zijlstra, G.A. (2015). Promising behavior change techniques in a multicomponent intervention to reduce concerns about falls in old age: a Delphi study. Health Education Research, (30(2), S. 309– 322). https://doi.org/10.1093/her/cyv003. 90 Walpole, S.C., Shortall, C., van Schalkwyk, M.C., Merriel, A., Ellis, J., Obolensky, L., Casanova Dias, M., Watson, J., Brown, C.S., Hall, J., Pettigrew, L.M. & Allen, S. (2016). Time to go global: a consultation on global health competencies for postgraduate doctors. International Health, (8(5), S. 317–323). https://doi.org/10.1093/ inthealth/ihw019. 91 Wright, M.T., Lüken, F. & Grossmann, B. (2013). Quality in prevention and health promotion. Developing a common framework for quality development for members of the Federal Association for Prevention and Health Promotion in Germany. Bundesgesundheitsblatt, (56(4), S. 466–472). https://doi.org/10.1007/s00103-0121628-7.

Literatur Aengenheyster, S., Cuhls, K., Gerhold, L., Heiskanen-Schüttler, M., Huck, J., & Muszynska, M. (2017). Real-Time Delphi in practice – A comparative analysis of existing software-based tools. Technological Forecasting & Social Change, 118, 15–27. Bogner, A., Littig, B. & Menz, W. (2014). Interviews mit Experten. Eine praxisorientierte Einführung. Springer VS: Wiesbaden. https://doi.org/10.1007/978-3-531-19416-5_4.

Delphi-Verfahren in der Gesundheitsförderung. Ergebnisse eines …

335

Boulkedid, R., Abdoul, H., Loustau, M., Sibony, O., & Alberti, C. (2011). Using and reporting the Delphi method for selecting healthcare quality indicators: A systematic review. PLoS ONE, 6(6) 1–9. https://doi.org/10.1371/journal.pone.0020476. Cuhls, K. (2012). Zu den Unterschieden zwischen Delphi-Befragungen und „einfachen“ Zukunftsbefragungen. In R. Popp (Hrsg.), Zukunft und Wissenschaft: Wege und Irrwege der Zukunftsforschung 139–158. Berlin: Springer. Cuhls, K., Blind, K., Grupp, H., Bradke, H., Dreher, C., Harmsen, D. -M., Hiessl, H., Hüsing, B., Jaeckel, G., Schmoch, U., & Zoche, P. (1998). Delphi ‚98. Studie zur globalen Entwicklung von Wissenschaft und Technik. Karlsruhe: Fraunhofer Institut für Systemtechnik und Innovationsforschung. Diamond, I. R., Grant, R. C., Feldman, B. M., Pencharz, P. B., Ling, S. C., Moore, A. M., & Wales, P. W.(2014). Defining consensus: A systematic review recommends methodologic criteria for reporting of Delphi studies. Journal of Clinical Epidemiology, 67(4), 401–409. https://doi.org/10.1016/j.jclinepi.2013.12.002. Evidenzbasierung. (2018). In M. A. Wirtz (Hrsg.), Dorsch – Lexikon der Psychologie. https://portal.hogrefe.com/dorsch/evidenzbasierung/. Zugegriffen: 7. Mai 2018. Häder, M. (2014). Delphi-Befragungen: Ein Arbeitsbuch. Wiesbaden: Springer Fachmedien. Hart, M. L., Jorm, A. J., Kanowski, L. G., Kelly, C. M., & Langlands, R. L. (2009). Mental health first aid for indigenous Australians: Using Delphi consensus studies to develop guidelines for culturally appropriate responses to mental health problems. BMC Psychiatry, 9(47). https://doi.org/10.1186/1471-244x-9-47. Hasson, F., Keeney, S., & McKenna, H. (2000). Research guidelines for the Delphi survey technique. Journal of Advanced Nursing, (32(4), 1008–1015). https://doi. org/10.1046/j.1365-2648.2000.t01-1-01567.x. Jirwe M., Gerrish K., & Keeney S. (2009). Identifying the core components of cultural competence: Findings from a Delphi study. Journal of Clinical Nursing, 18(18), 2622–2634. Jorm, A. (2015). Using the Delphi expert consensus method in mental health research. Australian & New Zealand Journal of Psychiatry, 49(10), 887–897. https://doi. org/10.1177/0004867415600891. Jung, Mt, & Bleyer, T. (2017). Technologien in einer Altenpflege der Zukunft- Eine Delphi-Studie. Dortmund: Bundesanstalt für Arbeitsschutz und Arbeitsmedizin. Jünger, S., Payne, S. A., Brine, J., Radbruch, L., & Brearley, S. G. (2017). Guidance on conducting and reporting Delphi studies (CREDES) in palliative care: Recommendations based on a methodological systematic review. Palliative Medicine, (31(8), 684– 706). https://doi.org/10.1177/0269216317690685. Keeney, S., Hasson, F., & McKenna, H. (2001). A critical review of the Delphi technique as a research methodology for nursing. International Journal of Nursing Studies, 38(2), 195–200. Keeney S., Hasson F., & McKenna H. (2006). Consulting the oracle: Ten lessons from using the Delphi technique in nursing research. Journal of Advanced Nursing, 53, 205–212. Keeney, S., Hasson, F., & McKenna, H. (2011). The Delphi technique in nursing and health research. West Sussex: Wiley-Blackwell.

336

M. Niederberger et al.

Linstone, H. A., & Turoff, M. (Hrsg.). (1975). The Delphi method: Techniques and applications. Reading: Addison-Wesley. Linstone, H. A., & Turoff, M. (2002). The Delphi method: Techniques and applications. Newark: New Jersey Institute of Technology. Linstone, H. A., & Turoff, M. (2011). Delphi: A brief look backward and forward. Technological Forecasting & Social Change, 78, 1712–1719. Moher, D., Liberati, A., Tetzlaff, J., Altman, D. G., & The PRISMA Group. (2009). Preferred reporting items for systematic reviews and meta-analyses: The PRISMA statement. PLoS Medicine, 6(6). https://doi.org/10.1371/journal.pmed1000097. Niederberger, M., & Kuhn, R. (2013). Das Gruppendelphi als Evaluationsinstrument. Zeitschrift für Evaluation, 1, 53–77. Niederberger, M. & Renn, O. (2018). Das Gruppendelphi-Verfahren. Vom Konzept bis zur Anwendung. Springer VS: Wiesbaden. https://doi.org/10.1007/978-3-658-18755-2_3. Nowack, M., Endrikat, J., & Guenther, E. (2011). Review of Delphi-based scenario studies: Quality and design considerations. Technological Forecasting & Social Chance, 78, 1603–1615. Ramm, M. (2014). Response, Stichprobe und Repräsentativität: Zwei Dokumente zum Deutschen Studierendensurvey (DSS). Hefte zur Bildungs- und Hochschulforschung, 72, 14–21. Rowe, G., & Wright, G. (2011). The Delphi technique: Past, present, and future prospectsIntroduction to the special issue. Technological Forecasting & Social Change, 78, 1487–1490. Steurer, J. (2011). The Delphi method: An efficient procedure to generate knowledge. Skeletal Radiology, 40(8), 959–961. https://doi.org/10.1007/s00256-011-1145-z. Von der Gracht, H. A. (2012). Consensus measurement in Delphi studies review and implications for future quality assurance. Technological Forecasting & Social Change, 79(8), 1525–1536. Vidgen, H., & Gallegos, D. (2011). What is food literacy and does it influence what we eat: A study of Australian food experts. Brisbane: Queensland University of Technology. Witt, R. R., & de Almeida, M. C. P. (2008). Identification of nurses’ competencies in primary health care through a Delphi study in southern Brazil. Public Health Nursing, 25(4), 336–343. World Health Organization (WHO). (1986). Ottawa Charter for Health Promotion. http://www.euro.who.int/__data/assets/pdf_file/0006/129534/Ottawa_Charter_G.pdf. Zugegriffen: 3. Mai 2018.