Zur Wissenschaftlichkeit des Enneagramm

Zu dem Thema gibt es diese Kernversion und eine ergänzende lange Version in vier Teilen. Diejenigen, die Interesse am "darum herum" haben, sind eingeladen, sich nach dem Lesen dieser Kernversion in die Langversion zu vertiefen.

Es wurde nur ausgewählte Literatur verarbeitet, die m. E. ausreichend für eine Beurteilung ist; hier ein erster Überblick zur Enneagramm-Literatur, dem ich aber nicht gefolgt bin.

Ich erlaube mir mit der Kern- und Langversion zur Wissenschaftlichkeit eine kritische Einseitigkeit, um den in der Regel unkritischen Enneagramm-Webseiten einen Kontrapunkt zu setzen. Die kritischen Webseiten, die ich gefunden habe, sind zu knapp in Ihrer Kritik. Das Enneagramm verdient eine ausführliche Kritik - auch wenn sich die Kritik im Ergebnis darin zusammenfassen lässt, dass es ein wissenschaftlich nicht belegtes und auch nicht belegbares Modell ist, weil das Konstrukt dogmatisch-esoterisch ist. Eine ausführliche Kritik verdient das Modell, weil dem Modell eine gute Absicht zu Grunde liegt - es geht um die persönliche Entwicklung des Menschen und der Menschheit im Ganzen. Zusätzlich ermöglicht das Modell mit seiner entwicklungsgeschichtlichen "Story" eine religions- und kulturübergreifende Akzeptanz, was gerade in der heutigen Zeit wünschenswert ist. Und schließlich wird das Enneagramm von Personen an Hochschulen, Unternehmen, Institutionen und Organisationen herangetragen, die aufgrund ihres beruflichen Hintergrundes oder ihrer Bildungsbiographie Glaubwürdigkeit ausstrahlen - oder einfach sich und das Enneagramm gut verkaufen können.

Diese Kernversion beinhaltet drei Kapitel:
Einleitung
Der Schein von Wissenschaftlichkeit
Enneagramm-Tests

Einleitung

Nach jetzigem Stand der Dinge ist sowohl das Wort Enneagramm als auch das Symbol des Enneagramm nicht vor Gurdjieff nachgewiesen.

Dies ist wichtig festzuhalten. Es bedeutet, dass alle andersartigen Aussagen, die Sie in der Enneagramm-Literatur finden, ein Gerücht sind. Bartels fasst das so zusammen: "Die Umdeutung des Enneagramms zur Charaktertypologie beginnt erst in der zweiten Hälfte des 20. Jahrhunderts. Alle Versuche, das fertige Enneagramm schon bei den Derwischen des Mittelalters, bei den Wüstenvätern oder gar bei den Chaldäern nachzuweisen, basieren auf einer mangelnden Unterscheidung zwischen Parallele, Vorstufe und Resultat." (Bartels 2005: 15)

Sollte jemand einen schriftlichen Beleg haben, der das Wort Enneagramm oder das Enneagramm-Symbol vor dem Jahr 1916 enthält, bitte ich um Nachricht an: eberhard ( at ) motivatoren.de

In diesem Zusammenhang seien folgende Äußerungen ergänzt, die diese Webseite zur Wissenschaftlichkeit gut einleiten und die Kritik am psychologischen Enneagramm auf einen wesentlichen Punkt bringen: "Es fragt sich, weshalb sich die These vom hohen Alter des Enneagramms als Typologie so hartnäckig hält und bis heute immer wieder reproduziert wird. Offenbar soll das Modell durch die lange Tradition legitimiert und die mangelnde wissenschaftliche Fundierung damit ausgeglichen werden. Dabei wird die vermeintliche Verankerung des Enneagramms in alten spirituellen Traditionen einer wissenschafltichen Legitimation gegenüber sogar als überlegen angesehen. [...] ... das Aufrufen alter Zeugen kann nicht darüber hinweg täuschen, dass das Enneagramm erst nachträglich zur Charakterlehre umgedeutet worden ist - und zwar willkürlich. Die Prinzipien der Typologie folgen also nicht aus ihrem Gegenstand, der menschlichen Persönlichkeit, sondern aus dem vorgegebenen Zeichen." (Bartels 2005: 69f)

Bartels kommt zu dem Schluss:
"Doch nicht nur eine genauere Untersuchung der in Frage kommenden Quellen, sondern auch die nach-Gurdjieffsche Traditionsgeschichte des Enneagramms deutet darauf hin, dass die Charaktertypologie erst nach dem Tod des Kaukasiers entstanden ist. Der früheste Beleg für eine typologische Interpretation des Enneagramms, also Rodney Collins Verknüpfung alchemistischer Spekulationen über planetare Charaktere mit der neuneckigen Figur, haben noch etwas sehr Tastendes. Und im Gegensatz zu Ichazo, der sein Modell mal auf direkte Offenbarung, mal auf geheime Quellen zurückführt, deklariert Collin seine Konzeption als Ergebnis eigener Überlegungen. [...] Die neunfältige Charakterlehre basiert also i. W. auf einer willkürlichen Setzung. Diese Einsicht ist vielleicht das wichtigste Ergebnis der historischen Rekonstruktion. Damit verbunden ist ein zweites Resultat: Die Psychologie des Enneagramms ist weisheitlicher Natur. Ichazos Typbeschreibungen basieren nicht auf methodisch kontrollierter oder gar empirischer Forschung, sondern auf der intuitiven Menschenkenntnis des charismatischen Beobachters. Sie werden daher auch nicht begründet, sondern tragen durchgängig den Charakter von Setzungen, die nur unmittelbar einleuchten - oder gar nicht. Auch wenn dann durch Ichazos Schüler Naranjo wissenschaftliche Elemente, z.B. die aus der psychologischen Forschung bekannten Abwehrmechanismen, in das System einflossen, bleibt die Grundlage doch eine weisheitliche. Alle Versuche einer nachträglichen wissenschaftlichen Validierung ändern daran nichts." (Bartels 2005: 69, 70f; eigene Hervorhebung)

Beesing/ Nogosek/ O´Leary waren es, die wesentliche Bestandteile der heute üblichen Enneagramm-Theorie für das breite Publikum veröffentlichten (z. B. die Triaden-Einteilung in Leibmitte/Instinkt [Typen 8, 9, 1], Herz/Fühlen [Typen 2, 3, 4] und Kopf/Denken [Typen 5, 6, 7], die Zentral- und Seitenpunkte, Flügelpunkte, die Pfeiltheorie [die bereits bei Collin angelegt war] und auch die Einteilung in Stress- und Entspannungspunkte). Die geistige Urheberschaft für das in dem Buch Gesagte liegt allerdings nur zu einem sehr geringen Teil bei der Autorengemeinschaft. Das 1984 erschienene Buch stellt eher eine Zusammenführung der unveröffentlichten Dissertation von Jerome Wagner (1981), den von Lilly/Hart veröffentlichten Ichazo-Ideen (1975) und den Vorlesungen (Sommer-Semester 1980 an der Creighton Universität in Omaha/Nebraska) von Tad Dunne dar.

Ich gehe nicht auf die Inhalte der enneagrammatischen Persönlichkeitsstrukturen ein. Für die nun folgende Kritik ist das nicht notwendig. Ich möchte lediglich zum Rahmen des Modells sagen, dass es um die Herausarbeitung von Charaktermustern geht, die sich in neun verschiedenen Stilen "des Wahrnehmens, Denkens, Fühlens und Verhaltens" äußern. (Gallen/ Neidhardt 1994: 55) Diese Stile werden freigelegt u. a. durch den Blick auf die eigene Biographie, die eigenen Vorlieben und Abneigungen sowie die Ziele und Träume (vgl. Palmer [1988]/ 1991: 25). In diesem Zusammenhang sei auf folgende Äußerung hingewiesen, die leicht vergessen wird: "Menschen sind sehr viel beweglicher und komplexer als alles, was durch eine Liste von Charakterzügen beschrieben werden könnte." (ebd.: 29)

Der Schein von Wissenschaftlichkeit

Schon 1991 äußerte sich Bruder Mitch Pacwa sehr kritisch zum Enneagramm - er war damals Professor of Scripture and Hebrew at Loyola University of Chicago (jene Universität, an der Jerome Wagner 1981 zum Enneagramm promovierte): "What is the evidence that a resentful perfectionist (one) should seek the virtue of the happy-go-lucky planner (seven) ? Why should the vengeful, power-hungry person (eight) become a helper (two) rather than seek other virtues ? Besides faith in the antiquity of the system, which it does not possess, how can anyone know the best virtues to pursue for any individual type ?
[...]
I do not have much respect for the enneagram industry at this point. Its occultic roots have not been thoroughly purged (if they can be), and it has opened itself to theological error and social and psychological misuse. The lack of scientific investigation means there are no controls to determine who actually is an expert, nor which advice is helpful or detrimental, nor whether the goals of the enneagram system are sound."

Es folgen drei Punkte, die ich in den Mittelpunkt meiner Kritik stellen möchte.

Erstens

Jerome Wagner ist ein bekannter Name in der Enneagramm-Szene; er promovierte 1981 mit der Arbeit A Descriptive, Reliability, and Validity Study of the Enneagram Personal Typology. Diese Arbeit habe ich nicht gesichtet, doch bezweifle ich wegen der noch folgenden Informationen, dass die Arbeit wirklich das geleistet hat, was der Titel verspricht.

Selbst Lendt/ Schwarzlmüller sehen in angemessener Bescheidenheit ihre eigene Arbeit noch nicht als vollständige Validierung der Typeneinteilung des Enneagramms (und das, obwohl die methodische Grundlage ihrer Diplomarbeit aufgrund der Betreuung durch Burghard Andresen besser sein wird als bei der Dissertation von Wagner [Näheres siehe im Kapitel "Enneagramm-Tests"]):
"Im Gesamtergebnis lässt sich sagen, dass sich die Konzepte der Enneagramm-Typen mit geringen Einschränkungen durch diese Untersuchung bestätigen lassen. [...] ... sich das Enneagramm im wesentlichen bei einer naiven Stichprobe nachweisen ließ. Insgesamt ergeben sich meist Übereinstimmungen mit den Typbeschreibungen. Gleichwohl zeigten sich auch einige Diskrepanzen zur Enneagramm-Theorie: ... [...] Außerdem wäre eine Validierung der Ergebnisse durch Fremdeinschätzungen wichtig, ... [...] Abschließend sei noch angemerkt, dass eine Untersuchung allein den klaren Beweis oder Gegenbeweis des Enneagramms nicht liefern kann. Erst replizierbare Ergebnisse machen in der Psychologie die Existenz eines Phänomens wahrscheinlich. Demzufolge kann diese Untersuchung lediglich einen ersten Hinweis auf Sachverhalte liefern, die dringend einer Überprüfung durch nachfolgende Forschung bedürfen." (Lendt/ Schwarzlmüller 2004: 457f, eigene Hervorhebung)

Die Autoren räumen ein, dass sie bedauerlicher Weise einige amerikanische Dissertationen nicht gesichtet haben und "viele wichtige Titel weder in öffentlichen Bibliotheken, noch im Buchhandel oder Antiquariaten verfügbar" waren. (Lendt/ Schwarzlmüller 2004: 453)

Die entscheidende Frage ist, ob es unter den von Lendt/ Schwarzlmüller nicht gesichteten Arbeiten eine Untersuchung mit naiver Stichprobe gibt und ob deren Methode(n) und Ergebnisse die Verwendung der Formulierung "validated by experiental observations" rechtfertigen. Das habe auch ich nicht weiter recherchiert. Die Wahrscheinlichkeit ist hoch, dass wir nichts Brauchbares darunter finden würden, wie die weiteren Ausführungen zeigen werden.

Ein weiterer Versuch, dem Enneagramm mehr Ansehen zu verschaffen, erfolgte im Jahr 2005 durch eine Zusammenarbeit des Enneagram Institute von Riso/Hudson mit der Firma SHL. Ein Ergebnisbericht Relationship beween OPQ and Enneagram Types und die Broschüre Putting the Person into Personality wurden von SHL auf dem Server des Enneagram Institute veröffentlicht. Das Problem dieser Studie war aus Sicht von SHL u. a., dass die Versuchspersonen keine naive Stichprobe darstellten (die Vp wurden vom Enneagram Institute vermittelt). Die Studie wurde von Anna Brown und Dave Bartram geleitet. Dave Bartram ist Research Director für die SHL Group und ein anerkannter Forscher, der 2002/3 die sogenannten "Great Eight Competencies" ermittelt hat; wenige Jahre zuvor hatte die SHL-Gruppe den Occupational Personality Questionaire entwickelt. Welchen (wissenschaftlichen) Stellenwert die SHL-Gruppe der Kooperationsstudie mit dem Enneagram Institute gibt, lässt sich aus der Tatsache ableiten, dass bei Eingabe des Wortes "enneagram" in der Suchfunktion der SHL-Webseite kein Suchergebnis erscheint.

In einem Artikel des Jahres 2010 im EnneaForum, Nr. 37, mit dem Titel "Enneagramm und Wissenschaft" finden wir in einem Test-Bericht folgende interessante Anmerkung: "Der Enneagramm-Haupttyp wird nicht festgelegt. (Anmerkung: kein Test kann das auf verlässliche Art bieten)." (Pulver 2010: 14, eigene Hervorhebung) Anknüpfend an Vorarbeiten von Sibylle Heunert-Doulfakar wurde ein diagnostisches Verfahren mit drei Hauptelementen entwickelt ("erstens der psychometrische Test mit 9 Enneagramm-Skalen, mit je durchschnittlich 4 psychometrischen Skalenwerten untermauert, zweitens das »Enneagramm« als dynamisches Modell zur Persönlichkeitsentwicklung und drittens das Gespräch zwischen Klient/Klientin und akkreditierter Profil-hp-Fachperson", so Pulver per e-mail). Dazu sagt er im Artikel: "Die Enneagramm-Stile sind mit je durchschnittlich 4 psychometrischen Skalenwerten untermauert, die auf Basis von verschiedenen Persönlichkeitstheorien (Transaktionsanalyse, Big5, Murray, u.a.) ermittelt werden. Die psychologischen Dimensionen des Enneagramms werden so sinnvoll ergänzt." (Pulver 2010: 14)

Doch bereits auf Seiten der Theorie gibt es Unklarheiten: "Beim Studium der verschiedenen Enneagramm-Autoren fällt auf, dass die Typbeschreibungen nur in groben Zügen übereinstimmen. Jeder Autor setzt andere Schwerpunkte, trägt neue Aspekte bei, entwickelt Theorien, stellt Behauptungen auf, findet Beispiele, so dass es unmöglich erscheint, nur die Eigenschaften zu benennen, die wirklich von allen Autoren übereinstimmend genannt werden. Bei dem Versuch, eine Art Zusammenfassung der wichtigsten Autoren zu erstellen, wurde deutlich, dass lediglich einige wenige Eigenschaften übrig bleiben, die dann dem Enneagrammtyp in seiner Breite nicht mehr gerecht werden." (Lendt/ Schwarzlmüller 2004: 95)

Zweitens

Enneagrammer verweisen gelegentlich auf eine Studie von Alexander Thomas und Stella Chess (interessanter Unterschied zwischen der englischen und deutschen Wikipedia-Seite zum Begriff "Temperament": Link 1 und Link 2), die angeblich bei Babys bereits eine enneagrammatische Strukturierung in Form einer "Aufmerksamkeitsorganisation des Neugeborenen" belegt. (Lendt/ Schwarzlmüller 2004: 243) David Daniels bezog sich 1996 und 2000 auf diese Studie und spricht laut Lendt/ Schwarzlmüller "selber von einer Übersimplifizierung bei dem Versuch der Zuordnung". (eigene Hervorhebung) Lendt/ Schwarzlmüller vermuten deshalb, "dass sich diese Einteilungen nicht notwendigerweise aus dem Originalmaterial der Untersuchung von Thomas und Chess ergeben." Entsprechend kritisch kommentieren sie weiter: "Wie stark die Veränderungen, die Daniels vorgenommen hat, »zugunsten des Enneagramms« sind, bleibt deshalb unklar. Dass er zum Abschluss seiner Darlegung noch betont, dass »solche Art der unabhängigen Forschung die Wahrheit des Enneagramms unterstützt«, erscheint kurios, da der Bericht über das Forschungsprojekt kaum dessen »unabhängigen« Charakter zur Geltung bringt und Daniels selber als Professor einer Universität entscheidend zur kritischen Würdigung des Enneagramms durch seriöse Forschung beitragen könnte. Eine kritischere und ausführlichere Auseinandersetzung mit diesem Projekt hätte nach unserem Dafürhalten in der Enneagram Monthly einen sehr passenden Rahmen gefunden, da die Leser dieser Zeitschrift wohl am ehesten Interesse an einer differenzierten und nachdenklichen Berichterstattung hätten und nicht etwa vom Potential des Enneagramms »überzeugt« werden müssen." (Lendt/ Schwarzlmüller 2004: 245; eigene Hervorhebung)

Drittens

Ging es bei den obigen Ausführungen hauptsächlich um die Richtigkeit des psychologischen Enneagramm-Modells als Neuner-Modell, das bislang nicht wissenschaftlich erwiesen ist, so ist das nur ein Punkt von vielen. Das psychologische Enneagramm-Modell wäre damit noch nicht erklärt. Neben den neun unterschiedlichen Strukturen beinhaltet das psychologische Enneagramm-Modell auch die Annahmen,

dass es einen Unterschied zwischen Persönlichkeit und höherem Selbst (Essenz) gibt
unsere Persönlichkeitsstruktur uns als Charakterfixierung das ganze Leben begleitet
es je Struktur eine "Wurzelsünde" bzw. "Hauptlaster", "Leidenschaft" oder "Kernmotivation" gibt
es unsere Entwicklungsaufgabe ist, unsere (maskenhafte) Persönlichkeit zu überwinden, um uns zu unserem höheren Selbst zu entwickeln
sich die neun Persönlichkeitsstrukturen triadisch verteilen (also 3x3) und die Triaden in der Regel als Bauch-, Herz- und Kopftypen bezeichnet werden
jede Struktur zusätzlich drei Sub-Strukturen hat (also 9x3)
jede Struktur zusätzlich zwei Flügel-Strukturen hat (die jeweiligen numerischen Nachbarn auf dem Enneagramm-Kreis)
unsere Aufmerksamkeit nicht nur durch unsere Leidenschaft/ Kernmotivation,sondern auch durch unsere Sub-Struktur bestimmt wird
jede Struktur einen Sicherheits- und einen Stresspunkt hat, der von einer bestimmten Linienführung innerhalb des Enneagramm-Symboles bestimmt wird

"Was dabei vielfach nicht erklärt wird, ist die Tatsache, dass einerseits zwei völlig verschiedene Motivationen zu gleichem Verhalten führen können, andererseits aber auch die gleiche zugrunde liegende Motivation ganz unterschiedliche Reaktionen hervorrufen kann. [...] ... können Individuen, die völlig anderen Enneagramm-Typen angehören, äußerlich völlig identisches Verhalten zeigen." (Lendt/ Schwarzlmüller 2004: 22, 23)
Betrachten wir die Gesamtheit der zum psychologischen Enneagramm-Modell gehörenden Merkmale sind wir weit entfernt davon, das psychologische Enneagramm als wissenschaftlich untermauert betrachten zu können !

Nach dem Dargelegten ist das Enneagramm auch heute noch mit den einleitenden Worten von Lendt/ Schwarzlmüller aus dem Jahre 2004 "ein esoterisches, spirituelles System mit psychologischem Anteil, dessen Wahrheitsgehalt eine reine Glaubensfrage ist." Der von Lendt/ Schwarzlmüller unternommene Validierungsversuch ist methodisch vorbildlich und wartet auf eine Überprüfung.

So sei an die bereits 1988 von Helen Palmer ausgeprochene Mahnung erinnert: "Das Enneagramm wird den ihm zustehenden Platz im psychologischen Denken des Westens nur durch gründlichste Forschung einnehmen." (Palmer [1988]/ 1991: 92, eigene Hervorhebung)

Enneagramm-Tests

Ein Verfahren zur Objektivierung ist ein Enneagramm-Test. Im deutschen Sprachraum gilt seit 1991 der Test von Markus Becker als richtungsweisend. Dabei brach Becker die faktorielle Typ-Beschreibung ab, "wenn mindestens 50% der kumulierten Varianz aufgeklärt waren." (Lendt/ Schwarzlmüller 2004: 252) Im Ergebnis war dann jede Enneagramm-Struktur mit zwei oder drei Faktoren charakterisiert, die zwischen rund 52 bis 62 Prozent der Varianz aufklärten. "Die Faktoren beschrieben die Haupt-Einflussgrößen auf das Verhalten der einzelnen Typen". (ebd.) Der praktische Hintergrund der 50%-Regel ist, dass für eine höhere aufgeklärte Varianz zuviele Faktoren mit abnehmender Varianzaufklärung nötig sind und das "Typische" dann nicht mehr deutlich hervorscheint. Trotzdem dürfen wir nicht vergessen: es bleibt ein Rest von 38 bis 48 Prozent nicht geklärter Varianz !

Ein wichtiger Kritikpunkt am Becker-Test ist, "dass exakt die Hälfte aller Versuchspersonen bereits mit dem Enneagramm vertraut war", was von Becker aber in der Analyse seiner Daten nicht entsprechend berücksichtigt wurde. (vgl. Lendt/ Schwarzlmüller 2004: 250-255, 262f)

Lendt/ Schwarzlmüller entwickelten für ihre Arbeit einen eigenen Test. Sie versuchten damit zwei Hypothesen zu überprüfen (Seiten 258f):

1. "Die im Enneagramm von allen maßgeblichen Autoren übereinstimmend genannten Eigenschaften der neun Typen lassen sich auf entsprechenden Skalen psychologischer Tests nachweisen."

2. "Auf den Skalen geeigneter psychologischer Tests lassen sich die Enneagramm-Typen, den Theorien der maßgeblichen Autoren entsprechend, jeweils bestimmten Persönlichkeitsstörungen zuordnen."

Lendt/ Schwarzlmüller entwickelten zur Hypothesenklärung einen eigenen Test, arbeiteten aber auch mit anderen Tests (Becker-Test und SEDIG zur Selbsteinschätzung), erwogen ein Fremdrating, verwarfen dies dann aber.

Der SEDIG steht auf wackeligen Beinen, weil die Reliabilität von David Daniels und Virginia Price "an einer kleinen Stichprobe (n=62) von naiven Studenten überprüft" wurde - sie betrug 0.589. Die für den eigentlichen Test verwendete Vp-Gruppe umfasste zwar 970 Personen aus den USA, doch waren es hauptsächlich Teilnehmer/innen aus Enneagramm-Kursen. Der Anteil der vorhandenen naiven Probanden wurde von Daniels/Price nicht genannt. Zur näheren Beschreibung des Testverfahrens siehe Lendt/ Schwarzlmüller 2004: 264f. Die Übereinstimmung von Selbsteinschätzung der Probanden mit der Einschätzung durch Daniels/Price war für die einzelnen Typen 1 bis 9 unterschiedlichen hoch (66%, 65%, 54%, 61%, 65%, 66%, 52%, 37%, 68%). Lediglich die Übereinstimmung bei Typ 8 ist auffallend niedrig. Die anderen Werte sind bei einer maximalen Übereinstimmung von rund zwei Dritteln aber auch nicht gerade hoch. Lendt/ Schwarzlmüller entwickelten für ihre Arbeit eine eigene Form des SEDIG (vgl. Lendt/ Schwarzlmüller 2004: 265f).

Mit Unterstützung des Diplomarbeits-Betreuers Burghard Andresen wurde der eigene Test, das Hamburger Enneagramm Inventar (HEI), mit 234 Items (26 für jeden Typ) entwickelt.

"Auf Anregung von Jürgen Gündel, einem der Leiter des »Professional Trainings« für das Enneagramm in Mannheim, entschlossen wir uns, unserer Untersuchung noch ein qualitatives, an keine Form gebundenes Verfahren beizufügen. Nach der Enneagramm-Theorie kann der Typ sehr deutlich werden, wenn jemand einfach frei redet oder schreibt. Durch den Ausdruck, den Stil, die Schrift, die Themen, die Länge des Textes lassen sich aller Wahrscheinlichkeit nach zusätzlich Rückschlüsse auf den Typ ziehen." Die Probanden wurden gebeten, "eine Selbstschilderung vorzunehmen, in der Sie Ihre hervorstechendsten Eigenschaften beschreiben." (Lendt/ Schwarzlmüller 2004: 269f) "Tatsächlich stellte sich allerdings oftmals die Selbstbeschreibung als so reichhaltig dar, dass eher sie den Ausschlag für manche Entscheidung gaben, als die Testwerte selber. Bei fehlenden Selbstbeschreibungen wurde in seltenen Fällen ein Blatt aus den Untersuchungsunterlagen von Andresen konsultiert, in dem die VP beschreiben sollten, was sie als ihr größtes persönliches Problem ansähen." (Lendt/ Schwarzlmüller 2004: 342) "Wir sahen uns bei der freien Selbsteinschätzung mit Fragen konfrontiert, die wir so nicht vorausgesehen hatten: Welchen Einfluss hat eine körperliche Behinderung auf die Ausprägung des Typs ? Ist bei einer in der Kindheit sexuell missbrauchten Frau das Misstrauen gegenüber Menschen ein Beweis für ihren Typ oder für ihr Schicksal ? Wie typisiert man bei schweren Depressionen, akuten Selbstmordgefährdungen und gerade überstandenen affektiven Psychosen ?" (Lendt/ Schwarzlmüller 2004: 346)

Für die Auswertung der Selbstbeschreibungen zeigte sich auch ein Auswertungsproblem des enneagrammatischen Persönlichkeitsmodells: "Unsere erste Idee, eine bei qualitativen Untersuchungen übliche Kategorienbildung vorzunehmen und die Selbsteinschätzungen dabei einer dieser Kategorien zuzuordnen, scheiterte an der großen Bandbreite der Typbeschreibungen im Enneagramm. Es ging oft um Nuancen, z. B. kleine Nebensätze, in denen ein »typisches« Verhalten deutlich wurde, und um den allgemeinen »Geschmack« der Beschreibung. Eine Auswertung war stark abhängig von unserem eigenen, intuitiven Verständnis der Typen und so kamen wir überein, die Typisierungen getrennt voneinander vorzunehmen, um eine gewisse Auswertungsobjektivität zu erreichen." Die Beurteilerübereinstimmung nach Cohens Kappa-Koeffizient weist bei Lendt/ Schwarzlmüller "auf höchstem Signifikanzniveau ... eine Korrelation von r = .734" auf. (Lendt/ Schwarzlmüller 2004: 344)

"r = .734" klingt ja ganz nett, aber was heißt das praktisch ?
Schauen wir uns dafür folgende Tabelle aus der Arbeit von Lendt/ Schwarzlmüller an:

Hier können wir sehen, dass Lendt und Schwarzlmüller unabhängig voneinander aufgrund der Selbstbeschreibungen der Probanden zu den oben abgebildeten Einschätzungen kamen. D. h. eine/r der beiden fand die Persönlichkeitsstruktur 1 insgesamt 12 Mal und die/der Andere insgesamt 16 Mal in den Selbstbeschreibungen, wobei beide Rater bei 10 Personen übereinstimmten. Das wiederum heißt, in der Summe wurde 18 Mal die Persönlichkeitsstruktur 1 in den Selbstbeschreibungen gefunden. Bei 10 Übereinstimmungen ist das eine Beurteilerübereinstimmung von 55,6%. Übertragen auf sämtliche Persönlichkeitsstrukturen 1 bis 9 (inkl. der Aufteilung in 6 und 6k [k = kontraphobisch]) ergeben sich folgende zehn gerundete Prozentwerte für die Beurteilerübereinstimmung: 56%, 68%, 67%, 66%, 63%, 69%, 47%, 46%, 58%, 67%.

Zeitgleich mit der Arbeit von Lendt/ Schwarzlmüller wurde ein Schweizer Projekt beendet. Bei diesem Projekt wurde untersucht, inwieweit sich ein an der Universität Lausanne entwickelter Persönlichkeitstest (L.A.B.E.L. = Liste d'Adjectifs Bipolaires en Echelles de Likert) mit dem Enneagramm kombinieren lässt. Die Schweizer haben daran anknüpfend den sogenannten "Profil hp"-Test entwickelt. Der Fragebogen enthält 174 Adjektive von denen 87 zweipolig und 87 einpolig abgefragt werden. An dem Projekt nahmen 10 Enneagramm-Expert(inn)en und 52 von diesen Experten vorgeschlagene Probanden teil. "Dabei wurde speziell beachtet, dass alle neun Enneagramm-Haupttypen »vertreten« sind 4." Die Anmerkung 4 beinhaltet eine sehr interessante Aussage: "Die Enneagramm-Experten gehen davon aus, dass die Einschätzung eines Probanden durch ihren eigenen Enneagramm-Typ beeinflusst werden kann." (Profil hp 2009: 5) Das Projekt prüfte vier Hypothesen, wovon für diese Webseite nur die erste Hypothese von Bedeutung ist:

"Die Enneagramm-Experten unter sich schätzen die Probanden gleich ein. Für eine Expertenvalidierung gilt eine weitgehende Übereinstimmung als Voraussetzung, damit der Test anhand einer homogenen Referenz verglichen werden kann." (Profil hp 2009: 4)

Für die Beurteilerübereinstimmung wurden Korrelationswerte zwischen ".60 bis .80" erwartet - heraus kam aber lediglich ein Wert von .38. (vgl. Profil hp 2009: 8) Wichtig anzumerken ist, dass der eine Beurteiler, die Versuchsperson kannte "(eigene Klientin, eigener Klient)" und der/die andere Beurteiler/in, die Versuchsperson nicht kannte. Die Autoren nennen als Erklärungsversuche für die schlechte Beurteilerübereinstimmung:
"- Die Enneagramm-Experten haben unterschiedliche oder keine einheitliche Ausbildung im Enneagramm.
- Die Enneagramm-»Theorie« ist nicht konsistent bzw. eindeutig klar (standardisiert)." (Profil hp 2009: 8)
Zu diesem Projekt gab es anschließend noch einen Workshop. Dabei wurden zwei weitere Erklärungen genannt: Erstens, dass der/die jeweilige Enneagramm-Experte/in "den initialen oder den bereits transformierten Typ einschätzt. Eine weitere mögliche Erklärung ist, dass der eigene Enneagramm-Typ des Experten »als blinder Fleck« die Einschätzung beeinflusst hat. Dies kann vor allem bedingt sein durch die Enneagramm-Subtypen, d.h. durch die grosse (phänotypische) Vielfalt innerhalb jedes Typs." (Profil hp 2009: 11)

Eine Beurteilerübereinstimmung ist m. E. erst ab einem Wert von .80 erwähnenswert - besser wäre aber .90 ! Diese Äußerung erlaube ich mir aufgrund der Datenlage zum Kasseler Kompetenzraster (KKR), bei dem für geübte Anwender einer Inter-Rater-Reliabilität von .90 erreicht wird. Ein Enneagramm-"Experte" sollte als "geübter Anwender" betrachtet werden dürfen.

Fairer Weise muss zunächst darüber gesprochen werden, was beurteilt wird. Wird lediglich Verhalten nach einem festgelegten Schema beurteilt, so ist meine Forderung vertretbar. Wird hingegen Verhalten nach einem nicht festgelegten Schema beurteilt, so können die Übereinstimmungswerte nicht mehr sehr hoch sein. Werden neben dem Verhalten noch Merkmale beurteilt, die darauf abzielen, etwas über die Motivationsstruktur oder einen Persönlichkeitstyp zu erkunden, so wird es noch schwieriger. Beim Enneagramm ist es m. E. so, dass erstens nicht nach einem festgelegten Schema beobachtet und beurteilt wird, zweitens das Ziel ist, etwas über die Motivationsstruktur zu sagen und drittens ein Typ bestimmt werden soll. Da ist es nicht verwunderlich, dass die Korrelationswerte zur Beurteilerübereinstimmung niedrig sind. Die Tatsache, dass dies nicht verwundert, darf aber nicht dazu führen, derart schlechte Ergebnisse zu akzeptieren, sondern muss dazu führen, erstens den wissenschaftlichen Vierschritt beobachten-reflektieren-bewerten-schlussfolgern nachvollziehbar und transparent zu gestalten und zweitens ein Verfahren zu entwickeln, welches eine Beurteilerübereinstimmung von .80 gewährleistet. Ich persönlich akzeptiere nur Verfahren, die zu einer sehr starken Korrelation führen. Hierbei orientiere ich mich an Brosius:

Betrag des Korrelationskoeffizienten	Mögliche Interpretation
0	Keine Korrelation
über 0 bis 0,2	Sehr schwache Korrelation
über 0,2 bis 0,4	Schwache Korrelation
über 0,4 bis 0,6	Mittlere Korrelation
über 0,6 bis 0,8	Starke Korrelation
über 0,8 bis unter 1	Sehr starke Korrelation
1	Perfekte Korrelation

(Brosius 2002: 501 und 2011: 523)

Bei Duller finden wir eine andere Einteilung:

Betrag des Korrelationskoeffizienten	Mögliche Interpretation
0	kein Zusammenhang
über 0 bis 0,3	schwacher Zusammenhang
über 0,3 bis 0,7	mittlerer Zusammenhang
über 0,7 bis unter 1	starker Zusammenhang
1	vollständiger Zusammenhang

(vgl. Duller 2007: 131 und 135)

Dass in zwei wissenschaftlichen Publikationen zwei unterschiedliche Deutungsmuster von Korrelationskoeffizientwerten angeboten werden, spricht nicht gerade für die Seriösität statistischer Bewertung und ist für mich ein ebenso unhaltbarer Zustand, wie die schlechte Beurteilerübereinstimmung sogenannter Enneagramm-Experten. Dass es in der Wissenschaft Ungenauigkeiten oder Uneinigkeiten gibt, ist aber kein Freifahrtschein für ungenaues und nicht-wissenschaftliches Vorgehen in der Praxis der enneagrammatischen Typisierung. Insbesondere ist ein Absatz zu berücksichtigen, den Brosius in der Ausgabe von 2002 noch nicht formuliert hatte:

Hinweis

Beachten Sie bei der Interpretation von Korrelationskoeffizienten stets, dass auch eine starke Korrelation kein Beleg für einen kausalen Zusammehang zwischen den Variablen ist. Vielmehr ist es auch denkbar, dass sich zwei Variablen etwa durch den Einfluss einer dritten Größe tendenziell in die gleiche bzw. in entgegengesetzte Richtung entwickeln, so dass zwar eine Korrelation beobachtet werden kann, jedoch ohne dass sich die Variablen direkt gegenseitig beeinflussen.

(Brosius 2011: 523; siehe auch Kapitel "8.6 Korrelation und Kausalität" bei Duller 2007: 138f)

Diese statistische Binsenweisheit wird allerdings von Wissenschaftlern gelegentlich übersehen - sowohl von denen, die die Werte ermittelt haben als auch von denen, die wissenschaftliche Arbeiten mit Korrelationswerten lesen. Starke Korrelationswerte sind erstmal nichts weiter als der Aufruf, den jeweiligen Zusammenhang auf Kausalität zu prüfen !

Die Motivationsstruktur eines Menschen und seine Persönlichkeit sind prinzipielle Dunkelräume (black-box), die sich psychologisch und statistisch zu taghellen Nebelschwaden erhellen lassen, aber nicht zu einem taghellen Bergpanorama-Blick. Das Bestmögliche ist, eine Wetterveränderung zu erfassen, die für kurze Momente den Blick zum Bergpanorama freigibt. Die gesamte Persönlichkeitspsychologie ist in ihrer Praxis als wissenschaftlich fragwürdig zu betrachten, weil sie sich mit statistischen Werten zufrieden gibt, die m. E. unbefriedigend sind.

Im Jahr 2012 oder 2013 wird voraussichtlich ein Buch veröffentlicht, das die statistischen Unzulänglichkeiten, die in der wissenschaftlichen Persönlichkeitspsychologie üblich sind, am Beispiel der Big-Five-Forschung ins Tageslicht rücken wird. (Nachtrag: es erschien im Juli 2015)

Weiter unten werden bei einem Blick über den Tellerrand des Enneagramms einige Aussagen von Rüdiger Hossiep zitiert, die bereits für starkes Stirnrunzeln sorgen. Typentests sind ein Marketing-Instrument, mit dem sich Geld verdienen lässt, so dass kritisierte Testanbieter gelegentlich Anwälte einschalten. "Der Status quo heute: Der Graben zwischen Befürwortern und Gegnern ist unverändert tief - aber die Vorwürfe werden nicht mehr öffentlich geäußert, aus Angst vor einem juristischen Nachspiel. Ein Beispiel: Der Satz »Ich habe bis heute keine Studie gesehen, die die Validität von Typentests nachweist«, fällt unter Diagnostik-Experten häufiger, zitieren lassen will sich damit keiner mehr. Allerdings, das können auch die Kritiker nicht übersehen: »Die Tests verkaufen sich wie geschnitten Brot«, sagt ein Marktbeobachter." (Moser 2011: 72)

Davon unberrührt wäre es zur Objektivierung der Beurteilerübereinstimmung (Interrrater-Reliability) vielleicht hilfreich, wenn Enneagramm-Lehrer/innen sich von (a) einem Kriminalpsychologen, der als Profiler arbeitet, (b) einem Psychoanalytiker und (c) einem qualitativ forschenden Sozialwissenschaftler supervidieren lassen. Die drei Personen sollten das Enneagramm-Modell nicht kennen. Übrigens hat der Enneagrammer Gerhard Heck bereits 2005 darauf hingewiesen, wie wichtig eine Supervidierung ist - allerdings mit einem anderen wichtigen Hintergrund.

Lendt/ Schwarzlmüller verweisen auf die Dissertation Interrater Reliabilität und Validität von Urteilen über Enneagramm-Persönlichkeitstypen von William Sumner Gamard aus dem Jahre 1986, die sie leider aus Zeit- und Kostengründen nicht angefordert haben. (vgl. Lendt/ Schwarzlmüller 2004: 247) Vielleicht ist das eine Arbeit, an die angeknüpft werden kann.

Lendt/ Schwarzlmüller und ihrer Einschätzung der Probanden: "Es wurde im Zuge der statistischen Auswertung jedoch notwendig, für jeden Probanden zu einem übereinstimmenden Typurteil zu kommen. Daher gab es nach der ersten Typisierung noch ein Treffen beider Rater, in dem für jeden Probanden mit abweichenden Einschätzungen ein gemeinsames Urteil angestrebt wurde. Hier wurde deutlich, dass es nach teilweise sehr ausschweifenden Diskussionen immer möglich war, zu einem übereinstimmenden Urteil zu gelangen. Die Interpretationen der Selbsteinschätzungen hingen sehr von der individuellen Argumentation ab und es ließen sich aufgrund der Breite der Typbeschreibungen auch Begründungen für einen anderen Typ finden." (Lendt/ Schwarzlmüller 2004: 354)

Zur Überprüfung der beiden Hypothesen von Lendt/ Schwarzlmüller war die Verwendung üblicher psychologischer Tests notwendig, was anhand des 16-PF-R, des NEO-PI-R und des noch neuen und unbekannten IKP geschah. (vgl. Lendt/ Schwarzlmüller 2004: 271-302)

Die Probanden hatten jeweils "1097 Fragebogen-Items plus Selbstbeschreibung und SEDIG zu bearbeiten". "Dass sich die gesamte Stichprobe durch eine extrem hohe Motivation auszeichnet, geht eindeutig aus der Fülle des bearbeiteten Materials hervor. Der größte Teil der Stichprobe rekrutierte sich aus der bereits erwähnten Untersuchung von P. D. Burghard Andresen. Jeder der Probanden hatte bereits ein - unseres Wissens nach - in der Forschung nie da gewesenes Arsenal von dreizehn Fragebögen mit insgesamt 3065 Items bearbeitet und sich trotzdem freiwillig für weitere Untersuchungen bereitgestellt." (Lendt/ Schwarzlmüller 2004: 337, 336) Burghard Andresen hatte mit einer bundesweiten Umfrage in der Zeitschrift stern Antworten von 600 Personen bekommen, von denen 366 einen vollständigen Datensatz lieferten. "Dabei wurden 14 renommierte Persönlichkeitsinventare (NEO-PI-R, CPS, EPP, MPQ, HIP, 6FPQ, TPQ, FFPI, ZKPQ, 16-PF-R, BSI, IKP, RR-FI und HPI-L) mit insgesamt rund 3000 Items abgefragt. [...] Im Ergebnis konnte das Fünf-Faktoren-Modell als überholt bewiesen werden. Sechs Faktoren stellen das nicht zu unterschreitende Minimum normaler Persönlichkeitsdimensionen dar." (Lendt/ Schwarzlmüller 2004: 170)

Von den auswertbaren 213 Fragebögen der Umfrage von Lendt/ Schwarzlmüller stammten lediglich 13 von Personen mit Vorwissen zum Enneagramm. Sicherheitshalber wurden 8 Personen für die Auswertung ausgeschlossen, so dass die Aussagen von 205 Personen in die Auswertung eingingen.

Insgesamt stellen Lendt/ Schwarzlmüller fest, "dass die Ergebnisse die Theorie des Enneagramms in überraschend hohem Maße bestätigen. Die beiden statistischen Verfahren Korrelationsanalyse und Varianzanalyse erbrachten in den wesentlichen Grundzügen die gleichen Ergebnisse." (Lendt/ Schwarzlmüller 2004: 407f) Allerdings konnten die Autoren die grundlegenden Leidenschaften der Typen nicht erfassen, sondern erreichten die Bestätigung lediglich auf der Ebene der Eigenschaften. Einschränkend sei auch angemerkt, dass die Theorie des Enneagramms nicht nur aus der Behauptung besteht, es gäbe neun unterschiedliche Persönlichkeitsstrukturen, sondern auch noch eine Reihe anderer Behauptungen enthält (siehe oben unter "Drittens"), die von Lendt/ Schwarzlmüller nicht geprüft wurden. Trotzdem setzt die Arbeit von Lendt/ Schwarzlmüller methodisch eine Messlatte, an der sich zukünftige Arbeiten orientieren können. Und schließlich: "Im Sinne der Transparenz wäre es sicher erstrebenswert gewesen, die qualitativen Daten der Untersuchung, die sich aus den freien Selbstbeschreibungen ergaben, durch eindeutige Regeln und streng operationalisierte Schritte zu quantifizieren und somit dem Außenstehenden den Prozess der Urteilsfindung durch die Rater nachvollziehbar zu machen." (Lendt/ Schwarzlmüller 2004: 455)

Wie bereits oben unter "Erstens" sei eine wichtige Anmerkung hier wiederholt erwähnt: "Abschließend sei noch einmal angemerkt, dass eine Untersuchung allein den klaren Beweis oder Gegenbeweis des Enneagramms nicht liefern kann. Erst replizierbare Ergebnisse machen in der Psychologie die Existenz eines Phänomens wahrscheinlich. Demzufolge kann diese Untersuchung lediglich einen ersten Hinweis auf Sachverhalte liefern, die dringend einer Überprüfung durch nachfolgende Forschung bedürfen." (Lendt/ Schwarzlmüller 2004: 458, eigene Hervorhebung)

Abschließend noch ein Vergleich der Reliabilitätswerte des Enneagramm-Typen-Test (ETT) von Becker mit denen des Hamburger Enneagramm Inventar (HEI). Als Hintergrund sei erwähnt, dass sich Lendt/ Schwarzlmüller für ihre Arbeit "stark an Claudio Naranjo, dem Pionier des Enneagramms", orientierten, aber "jede Typbeschreibung aus dem gemeinsamen Verständnis der Autoren heraus entwickelt[en] und auf die einzelnen Bücher nur noch als Referenz Bezug genommen [haben]". (Lendt/ Schwarzlmüller 2004: 3, 363) Becker hingegen hat sich "in der Testkonzeption sehr streng an die Aussagen in den Büchern von Riso, Jaxon-Bear und Ebert/Rohr gehalten". Anerkennend verweisen Lendt/ Schwarzlmüller darauf, "dass das Verfahren Beckers im strengen Sinne genommen sehr wissenschaftlich ist, da er sich meist wörtlich auf die Literatur bezieht und damit diese zur Disposition stellt und nicht seine Auffassung von den Typen. Es wird damit quasi zugleich getestet, wie gut sich eine am Enneagramm interessierte Person mit Hilfe der Beschreibungen der Literatur einzuordnen vermag." (Lendt/ Schwarzlmüller 2004: 363)

Lendt/ Schwarzlmüller haben mit den Datensätzen von Becker eine Neuberechnung durchgeführt und dabei leicht abweichende Werte festgestellt:

Skala	1	2	3	4	5	6	7	8	9
ETT lt. Becker	0,71	0,74	0,67	0,78	0,64	0,78	0,65	0,72	0,64
ETT berechnet	0,68	0,76	0,75	0,78	0,62	0,83	0,67	0,65	0,60
Differenz	- 0,03	0,02	0,08	0	- 0,02	0,05	0,02	- 0,07	- 0,04

Für einen Vergleich mit den Reliabilitätswerten der eigenen Untersuchung haben Lendt/ Schwarzlmüller die von Becker berechneten Werte zugrunde gelegt (vgl. Lendt/ Schwarzlmüller 2004: 362):

Skala	1	2	3	4	5	6	7	8	9
ETT lt. Becker	0,71	0,74	0,67	0,78	0,64	0,78	0,65	0,72	0,64
HEI roh	0,85	0,88	0,91	0,85	0,87	0,78	0,84	0,88	0,70
Differenz	0,14	0,14	0,24	0,07	0,23	0	0,19	0,16	0,06

Der HEI kann also durchweg (bis auf Typ 6) bessere Reliabilitätswerte vorweisen (lediglich in der Zeile der neuberechneten ETT-Werte ist beim Typ 6 ein um 0,05 besserer Wert zu erkennen - ETT: 0,83, HEI: 0,78). Zu den möglichen Ursachen der schlechteren Becker-Werte siehe Lendt/ Schwarzlmüller 2004: 363f. Wir dürfen davon ausgehen, dass im deutschsprachigen Raum der HEI der derzeit aussagekräftigste Test ist. Es bleibt die Frage, warum die Autoren ihre Arbeit nicht fortgeführt haben ? Die während der Arbeit von ihnen ins Leben gerufene Webseite ist bis heute nicht mit Inhalt gefüllt worden. Auf der Webseite von Lendt befand sich ein mit seiner Schwester geschriebener zusammenfassender Rückblick auf die gemeinsame Arbeit, die einen 2.100 Seiten umfassenden Anhang mit statistischen Tabellen hat.

Schauen wir nun über den Tellerrand des Enneagramms auf Persönlichkeitstests im Allgemeinen. Seit Jahrzehnten sind Wissenschaftler am Tüfteln von Persönlichkeitstests, die immer dann wichtig werden, wenn das Unternehmen von der Formel "»Hired for competence, fired for personality«" (Moser 2011: 69) überzeugt ist. Dabei wird es immer wichtiger, die wirkliche Motivation potentieller Mitarbeiter herauszufinden, denn: "wo die Motivation stimmt, kann das Unternehmen in Nachschulungen investieren." (ebd.: 70) Doch es ist nicht so, dass nur Arbeitgeber sich dafür interessieren: "»Arbeitnehmer interessieren sich verstärkt für ihre individuellen Treiber, Motivationsfaktoren und Verhaltenspräferenzen, um festzustellen, in welchen Bereichen sie Entwicklungspotenzial haben und ob sie mit einer angestrebten Stelle auch zufrieden sein werden.«" - so "Malte Hansen, Präsidiumsmitglied des Bundesverbands der Personalmanager e.V." (ebd.: 70).

Doch viele Tests haben eine unzureichende theoretische Grundlage. "»Viele Verfahren basieren auf dem Persönlichkeitsmodell von C. G. Jung, das hoffnungslos veraltet ist«, gibt Hossiep ein Beispiel für eine untaugliche Testbasis." (Moser 2011: 70) Das Urteil von Rüdiger Hossiep über Typentests: "»Sie werden einfach nach dem Faktor Plausibilität konstruiert und nicht auf der Grundlage wissenschaftlicher Untersuchungen« ... Damit alle Probanden der überschaubaren Anzahl von Grundtypen zugeordnet werden können, setzt das Testdesign oft auf Ja-Nein-Antworten: »Bewerber wählen dann beispielsweise nicht auf einer fünfstufigen Skala aus, wie gut die Aussage zu ihnen passt, sondern sie müssen sich auf einer bipolaren Skala verorten.« Das führt nach Meinung Hossieps zu einer Überbetonung von Varianzen, letztlich zu extremen und damit verzerrten Profilen. Sein Gesamturteil fällt vernichtend aus: »Die Verfahren haben häufig die Aussagekraft eines Gesellschaftsspiels.«" (ebd.: 72)

Im Jahr 2006 veröffentlichte der Soziologe Walter Simon das Buch Persönlichkeitsmodelle und Persönlichkeitstests nachdem er verschiedene Persönlichkeitstests im Selbstversuch unter die Lupe genommen hatte. Er kommt zu einem milderen Urteil als Hossiep: "Es gibt viele Gemeinsamkeiten in den Aussagen über die exemplarische Testperson dieses Buches, aber auch Unterschiede in der Einschätzung, ja sogar entgegengesetzte Meinungen. Gemeinsamkeiten und Unterschiede werden zum Teil schon in der Grundtypbeschreibung deutlich. Einige Instrumente sehen in der Testperson vorrangig den zupackenden Macher, andere erkennen in ihm weichere Wesenszüge. Dennoch finden sich auch die von anderen Instrumenten erkannten Persönlichkeitsmerkmale in diesem oder jenem Verfahren wieder, jedoch anders proportioniert. Experten sehen die Ursache darin, dass die Testperson sehr viele unterschiedliche Persönlichkeitsmerkmale in sich vereinigt, also nicht nach der einen oder anderen Seite hin signifikant ausschlägt. Je nach Antwortnuance und Anzahl der Fragen (Items) verschieben sich die Diagrammdarstellungen." (Simon 2006: 385)

Herr Simon knüpft als Herausgeber an das vier Jahre zuvor im gleichen Verlag mit dem Titel PersönlichkeitsModelle von Schimmel-Schloo/ Seiwert/ Wagner herausgegebene Buch an. Waren es beim Herausgeber-Dreier-Gespann noch 11 Modelle sind es bei Simon 15 Modelle. Simon hat bis auf das Interplace-Modell zur Teamanalyse und das Reiss-Modell zur Persönlichkeitsanalyse die neun verbleibenden Modelle auch in sein Werk aufgenommen und größtenteils von den selben Autoren beschreiben lassen. Interessanter Weise wird das in 2002 noch von Marion Küstenmacher beschriebene Enneagramm-Modell nun vom Herausgeber Simon selber beschrieben (übrigens das einzige der 15 Modelle, welches er selbst beschreibt). Dabei lauten seine ersten beiden Sätze: "Das Enneagramm passt im streng wissenschaftlichen Sinne nicht in den Rahmen dieses Buches. Es handelt sich hierbei zwar um ein Persönlichkeitsmodell, aber eines, dem die Fundierung moderner Wissenschaft fehlt. Es ist kein Verfahren, das die Gütekriterien der DIN 33430 erfüllt oder das mit anderen in diesem Buch vorgestellten Verfahren vergleichbar wäre." (Simon 2006: 204) Als Ursache dafür nennt Simon die historische Genese des Enneagramms und sitzt dabei dem durch die Enneagramm-Literatur verbreiteten Mythos auf (vgl. ebd.) - verweist aber auch darauf, dass die Geschichte des Enneagramms "noch aus vielen Fragezeichen" besteht. (Simon 2006: 205) Bei ihm fndet sich im Zusammenhang mit dem amerikanischen Jesuitenorden der Hinweis auf das Enneagramm als "»Psychoplacebo«" für die Seelsorge. (Simon 2006: 206) Insgesamt nehme ich Simons Beschreibung des Enneagramms als sachlich und wertschätzend wahr. Wie sich aus dem Gesagten ableiten lässt, hat Simon das Enneagramm am Ende seines Buches nicht in den Modellvergleich mit aufgenommen. Neben dem Enneagramm hat er zwei weitere Modelle nicht in den Vergleich einbezogen (zu den Gründen siehe Simon 2006: 384)

Ein tragischer Nebenaspekt bei Simon ist die fehlende Berücksichtigung der Arbeiten von Lendt/ Schwarzlmüller und Bartels. Simon gibt sechs Quellen für seinen Enneagramm-Beitrag an, wovon die fünfte Quelle in der sechsten enthalten ist. Die fünf Quellen stammen aus den Jahren 2002 (Ebert/ Rohr), 2004 (Becker) und drei Mal 2005 (Baron/ Wagele, Gruhl, Küstenmacher). Die Diplomarbeit von Lendt/ Schwarzlmüller ist von 2004 und die veröffentlichte Dissertation von Bartels aus 2005 - beide fanden keine Berücksichtigung.

Tatsache ist aber auch, dass sich die Typentests "wie geschnitten Brot" verkaufen lassen. (Moser 2011: 72) Der inzwischen als HR-Berater arbeitende Mühlhaus hat deshalb einen pragmatischen Standpunkt eingenommen: "»Wissenschaftler haben eben einen wissenschaftlichen Anspruch, Praktiker einen pragmatischen.«" Mit einem Beispiel aus seiner Teamentwicklungsarbeit erläutert Mühlhaus dann, dass ein Test sein Ziel erreicht habe, "wenn am Ende eine Erkenntnis des Teams stehe: »Schau an, wir sind verschieden, und es ist gut, dass wir verschieden sind.«" (ebd.: 73) Diese Erkenntnis bei ihren Kursteilnehmern zu erreichen, ist eine Kernmotivation von Enneagramm-Trainern.

Eine interessante Anekdote ist, dass sowohl der eben zitierte Artikel von Corinna Moser als auch ein Artikel von der Enneagrammerin Maria-Anne Gallen mit dem Titel Postmoderne Erkenntnistheorien und das Enneagramm auf das Experiment von Bertram Forer hinweisen. Bei Frau Moser ist der Hinweis auf "die menschliche Neigung, vage und allgemeingültige Aussagen über die eigene Person als zutreffende Beschreibung zu empfinden" ein Kritikpunkt für den Einsatz von Persönlichkeitstests (Moser 2011: 73), für Frau Gallen ist das Ergebnis des Forer-Experiments der Ausdruck des menschlichen Bedürfnisses "uns alle tendenziell lieber in allgemein gehaltenen Beschreibungen unserer Persönlichkeit [zu] erkennen, als uns nicht darin zu erkennen." Anders ausgedrückt: "unser Bedürfnis, jemand bestimmter zu sein, [ist] sehr viel größer, als uns nicht festlegen zu können. Nicht zu wissen, wer wir sind, verunsichert sehr! Die Vorstellung, kein geformtes Ich oder keine Identität zu haben, macht uns Angst. Durch Identifikation mit einer Typen-Beschreibung können wir dieser Verunsicherung entgegen wirken." (Gallen 2010: 4)

Damit bringt Frau Gallen treffend den Marketing-Anker für das Enneagramm und alle anderen Persönlichkeitsmodelle auf den Punkt: Verunsicherung und Angst. Dies sind die beiden Grundgefühle, die Psychologen und vielen Unternehmensberatern ihr Geschäftsfeld eröffnen. Der Mythos ist, es gäbe Sicherheit in einer Identität - die Wahrheit ist, es gibt keine Identität.

Bartels hat sehr gut die Selbstüberschätzung der Enneagrammer auf den Punkt gebracht, indem er Richard Rohr zitiert, der meint im Enneagramm eine Art "Weltformel" der Menschenkenntnis zu erblicken, die laut Bartels "mit mathematischer Präzision die Seele des Menschen beschreibt." (Bartels 2005: 268) Das lässt sich nur noch durch den "Absolutheitsanspruch" übertreffen, "den Gurdjieff vertrat: »Allgemein gesprochen, muß man verstehen, daß das Enneagramm ein universales Symbol ist. Alles Wissen kann im Enneagramm zusammengefaßt und mit Hilfe des Enneagramms gedeutet werden. Und so kann man sagen, daß man nur weiß, beziehungsweise versteht, was man im Enneagramm einfügen kann. Was man nicht im Enneagramm einfügen kann, versteht man nicht.«" (Bartels 2005: 269 zitiert hier Ouspensky [1950]/ [1966]/ 91997: 432)

Treffend verweist Bartels auch auf den geometrischen "Systemzwang" des Symboles, welches ja nicht nur auf einen Typ verweist, sondern auch noch die Theorie der Triade Kopf-Herz-Bauch, die Theorie der Zentral- und Seitenpunkte und die Pfeiltheorie der Stress- und Entspannungspunkte beinhaltet (vgl. Bartels 2005: 270).

Stand dieser Kernversion ist 2011-10-09.

nach oben