HAWIE-R Hamburg-Wechsler Intelligenztest f r Erwachsene Revision 1991

2. Gliederung Einf�hrung Ziele und Aufbau Praktische Handhabung G�tekriterien Studie von Peter Steck Auswertung Kritik

3. HAWIE-R deutsche Version des WAIS-R (Wechsler Adult Intelligence Scale - Revised 1981, Tewes 1991) l�st HAWIE von 1956 ab (=Aktualisierung der Iteminhalte) ist ausschlie�lich ein Individualtestverfahren mi�t Intelligenzleistungen von Altersstufe 16 bis 74 Jahre vor allem f�r klinisch- psycholog. Diagnostik entwickelt, in der es vorrangig um die Untersuchung von Ausfallerscheinungen geht Die wesentlichen Unterschiede zum HAWIE sind: �ber die H�lfte der Items wurden ver�ndert, wobei insbesondere veraltete Items (z.B. der �fehlende Schlips�) ausgetauscht wurden. Die Anzahl der Items in den einzelnen Untertests wurde z.T. ver�ndert (z.B. im Wortschatz-Test auf 332 reduziert, im Zahlen-Symbol-Test von 67 auf 93 erh�ht). Es wird nunmehr eine die Testsituation auflockernde gemischte Vorgabe der Untertests aus dem Verbal- und Handlungsteil vorgesehen. Der Wortschatz-Test ist nicht mehr fakultativ, sondern obligatorisch. Die Verrechnungsmodi haben sich bei den Untertests Zahlennachsprechen, Wortschatz-Test, Bildordnen und Figurenlegen leicht ver�ndert. Der Protokollbogen enth�lt dankenswerterweise selbst die Umrechnungstabelle Rohpunkte in Wertepunkte.Die wesentlichen Unterschiede zum HAWIE sind: �ber die H�lfte der Items wurden ver�ndert, wobei insbesondere veraltete Items (z.B. der �fehlende Schlips�) ausgetauscht wurden. Die Anzahl der Items in den einzelnen Untertests wurde z.T. ver�ndert (z.B. im Wortschatz-Test auf 332 reduziert, im Zahlen-Symbol-Test von 67 auf 93 erh�ht). Es wird nunmehr eine die Testsituation auflockernde gemischte Vorgabe der Untertests aus dem Verbal- und Handlungsteil vorgesehen. Der Wortschatz-Test ist nicht mehr fakultativ, sondern obligatorisch. Die Verrechnungsmodi haben sich bei den Untertests Zahlennachsprechen, Wortschatz-Test, Bildordnen und Figurenlegen leicht ver�ndert. Der Protokollbogen enth�lt dankenswerterweise selbst die Umrechnungstabelle Rohpunkte in Wertepunkte.

4. Gliederung Einf�hrung Ziele und Aufbau Praktische Handhabung G�tekriterien Studie von P. Steck Auswertung Kritik

5. Definition von Intelligenz Intelligenz ist �die zusammengesetzte oder globale F�higkeit des Individuums, zweckvoll zu handeln, vern�nftig zu denken und sich mit seiner Umgebung wirkungsvoll auseinander zu setzen.� (nach David Wechsler, 1956; S.13) Wechslers �berlegungen zielen von vornherein nur auf die Messung (!) der Intelligenz: Gerade f�r seinen pragmatischen Standpunkt, mehr am Produkt der Intelligenz als am Konstrukt selbst interessiert zu sein, haben auch Einfl�sse gro�e Bedeutung, die zwar nicht unmittelbar intellektueller Natur sind, jedoch mittelbar zum Zustandekommen intellektueller Leistungen beitragen. Explizit nennt er: Trieb und Anreiz, in gewisser Weise ist aber auch das Ged�chtnis und die F�higkeit zur sozialen Anpassung zu subsumieren. Vorstellung basiert auf Alexander (1935): Er best�tigte (Spearmans Zweifaktorentheorie) mittels Faktorenanalyse, da� alle Leistungstests durch einen gemeinsamen Faktor bestimmt werden, der jedoch nicht ausreicht, um die Korrelationsmatrix aller verwendeten Tests vollst�ndig zu erkl�ren. Alexander zieht daraus den Schlu�, da� sich neben einem allgemeinen Faktor der �Intelligenz� je ein Faktor �abstrakter� und �praktischer� F�higkeiten f�r alles intellektuelle Verhalten verantwortlich zeichnet - da dieses zur Erkl�rung der Korrelationsmatrix nicht ausreicht, nimmt er erg�nzende Faktoren, wie Temperaments- und Pers�nlichkeitsfaktoren an. Wechslers �berlegungen zielen von vornherein nur auf die Messung (!) der Intelligenz: Gerade f�r seinen pragmatischen Standpunkt, mehr am Produkt der Intelligenz als am Konstrukt selbst interessiert zu sein, haben auch Einfl�sse gro�e Bedeutung, die zwar nicht unmittelbar intellektueller Natur sind, jedoch mittelbar zum Zustandekommen intellektueller Leistungen beitragen. Explizit nennt er: Trieb und Anreiz, in gewisser Weise ist aber auch das Ged�chtnis und die F�higkeit zur sozialen Anpassung zu subsumieren. Vorstellung basiert auf Alexander (1935): Er best�tigte (Spearmans Zweifaktorentheorie) mittels Faktorenanalyse, da� alle Leistungstests durch einen gemeinsamen Faktor bestimmt werden, der jedoch nicht ausreicht, um die Korrelationsmatrix aller verwendeten Tests vollst�ndig zu erkl�ren. Alexander zieht daraus den Schlu�, da� sich neben einem allgemeinen Faktor der �Intelligenz� je ein Faktor �abstrakter� und �praktischer� F�higkeiten f�r alles intellektuelle Verhalten verantwortlich zeichnet - da dieses zur Erkl�rung der Korrelationsmatrix nicht ausreicht, nimmt er erg�nzende Faktoren, wie Temperaments- und Pers�nlichkeitsfaktoren an.

6. Theoret. Konzept von Wechsler �Allgemeine Intelligenz� = Gesamt-IQ resultiert aus der durchschnittl. Leistung in allen 11 Untertests sie teilt sich in : �Verbal-Intelligenz� = Verbal-IQ setzt sich aus der durchschnittl. Leistung in den dazugeh�rigen Untertests zusammen �Handlungs-Intelligenz� = Handlungs-IQ; erfasst vor allem die nicht-intellektuellen Faktoren intelligenten Verhaltens Zitat von Wechsler, 1956, S.22 (Text Kubinger 2 Seite links oben): �Bisher haben Verfasser von Intelligenzskalen ... diese Faktoren als st�rende Elemente angesehen und so weit wie m�glich zu beseitigen versucht. Die Erfahrung hat jedoch gezeigt, da� die Tests um so wirkungsloser in der Messung der allgemeinen Intelligenz sind, je erfolgreicher man bei der Beseitigung dieser Faktoren ist. Es werden keine Tests ben�tigt, bei denen die nicht-intellektuellen Faktoren ausgeschaltet sind (selbst wenn dieses m�glich w�re), sondern im Gegenteil Tests, bei denen diese Faktoren deutlich vorhanden und objektiv absch�tzbar sind. Die Handlungstests ... sind ein Versuch in diese Richtung.� theoretisches Konzept von Wechsler ist implizit hierarchisch: Spitze bildet die �Allgemeine Intelligenz� (= Gesamt-IQ) sie teilt sich in : �Verbal-Intelligenz� �Handlungs-Intelligenz� (erfasst auch die nicht-intellektuellen Faktoren intelligenten Verhaltens) ! Jeder der beiden entsprechenden, gleichwertigen Testteile besteht aus einem breiten Spektrum verschiedenartiger Untertests, die jeweils eine Vielzahl spezifischer F�higkeiten - im Sinne von Spearmans Zweifaktorentheorie - erfassen und untereinander als funktional �quivalend f�r die Messung der Intelligenz betrachtet werden.Zitat von Wechsler, 1956, S.22 (Text Kubinger 2 Seite links oben): �Bisher haben Verfasser von Intelligenzskalen ... diese Faktoren als st�rende Elemente angesehen und so weit wie m�glich zu beseitigen versucht. Die Erfahrung hat jedoch gezeigt, da� die Tests um so wirkungsloser in der Messung der allgemeinen Intelligenz sind, je erfolgreicher man bei der Beseitigung dieser Faktoren ist. Es werden keine Tests ben�tigt, bei denen die nicht-intellektuellen Faktoren ausgeschaltet sind (selbst wenn dieses m�glich w�re), sondern im Gegenteil Tests, bei denen diese Faktoren deutlich vorhanden und objektiv absch�tzbar sind. Die Handlungstests ... sind ein Versuch in diese Richtung.� theoretisches Konzept von Wechsler ist implizit hierarchisch: Spitze bildet die �Allgemeine Intelligenz� (= Gesamt-IQ) sie teilt sich in : �Verbal-Intelligenz� �Handlungs-Intelligenz� (erfasst auch die nicht-intellektuellen Faktoren intelligenten Verhaltens) ! Jeder der beiden entsprechenden, gleichwertigen Testteile besteht aus einem breiten Spektrum verschiedenartiger Untertests, die jeweils eine Vielzahl spezifischer F�higkeiten - im Sinne von Spearmans Zweifaktorentheorie - erfassen und untereinander als funktional �quivalend f�r die Messung der Intelligenz betrachtet werden.

7. Testaufbau Wechsler stellte Testbatterien zusammen, die aus zwei gleichwertigen Testteilen bestehen (=Verbalteil & Handlungsteil) Testteile bestehen aus mehreren Untertests (m�glichst viele spezifische F�higkeiten im Sinne Spearmans sollen erfasst werden) Wechsler erhebt nicht den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat) w�hlt Untertests, die sich in Voruntersuchungen als einigerma�en zuverl�ssig, g�ltig und trennscharf erwiesen haben; nicht nach Repr�sentativit�t Wechsler versucht also Testbatterien zusammenzustellen, die aus zwei gleichwertigen Testteilen, dem Verbalteil und dem Handlungsteil bestehen, wobei letzterer vor allem die nicht-intellektuellen Determinanten intelligenten Verhaltens erfassen soll Wechsler wollte aber auch zwischen den abstrakten bzw. verbalen F�higkeiten, also der Gewandheit im Benutzen von Symbolen, und den praktischen F�higkeiten, also der Geschicklichkeit im Handhaben von Objekten, differenzieren Da� jeder der beiden Testteile seinerseits aus einer Reihe von Untertests besteht, soll dem Bestreben Rechnung tragen, auch m�glichst viele spezifische F�higkeiten im Sinne Spearmans zu erfassen. Wechsler erhebt dabei keinesfalls den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat) Zitat Wechsler 1956, S.22: �denn kein Test w�rde dazu gegenw�rtig in der Lage sein. Wir k�nnten lediglich von einer Intelligenzskala verlangen, hinreichende Teile der Intelligenz zu messen, damit wir sie als einigerma�en zuverl�ssigen Index der globalen Leistungsf�higkeit des Pr�flings ben�tzen k�nnen.� Er stellt sich daher erst gar nicht dem Problem, die Untertests in Hinblick auf ihre Repr�sentativit�t auszuw�hlen; vielmehr wurden diejenigen Tests bzw. Aufgaben in die Testbatterien aufgenommen, welche sich in entsprechenden Voruntersuchungen als einigerma�en zuverl�ssig, g�ltig und trennscharf erwiesen haben. Wechsler versucht also Testbatterien zusammenzustellen, die aus zwei gleichwertigen Testteilen, dem Verbalteil und dem Handlungsteil bestehen, wobei letzterer vor allem die nicht-intellektuellen Determinanten intelligenten Verhaltens erfassen soll Wechsler wollte aber auch zwischen den abstrakten bzw. verbalen F�higkeiten, also der Gewandheit im Benutzen von Symbolen, und den praktischen F�higkeiten, also der Geschicklichkeit im Handhaben von Objekten, differenzieren Da� jeder der beiden Testteile seinerseits aus einer Reihe von Untertests besteht, soll dem Bestreben Rechnung tragen, auch m�glichst viele spezifische F�higkeiten im Sinne Spearmans zu erfassen. Wechsler erhebt dabei keinesfalls den Anspruch alles zu messen, was Intelligenz ausmacht (Zitat) Zitat Wechsler 1956, S.22: �denn kein Test w�rde dazu gegenw�rtig in der Lage sein. Wir k�nnten lediglich von einer Intelligenzskala verlangen, hinreichende Teile der Intelligenz zu messen, damit wir sie als einigerma�en zuverl�ssigen Index der globalen Leistungsf�higkeit des Pr�flings ben�tzen k�nnen.� Er stellt sich daher erst gar nicht dem Problem, die Untertests in Hinblick auf ihre Repr�sentativit�t auszuw�hlen; vielmehr wurden diejenigen Tests bzw. Aufgaben in die Testbatterien aufgenommen, welche sich in entsprechenden Voruntersuchungen als einigerma�en zuverl�ssig, g�ltig und trennscharf erwiesen haben.

8. Verbalteil besteht aus sechs Untertests: 1) Allgemeines Wissen (AW, 24 Items) 2) Zahlennachsprechen (ZN, 14 Items) 3) Wortschatz-Test (WT, 32 Items) 4) Rechnerisches Denken (RD,14 Items) 5) Allgemeines Verst�ndnis (AV, 13 Items) 6) Gemeinsamkeiten finden (GF, 16 Items)

9. Handlungsteil setzt sich aus 5 Untertests zusammen: 1) Bildererg�nzen (BE, 17 Items) 2) Bilderordnen (BO, 10 Items) 3) Mosaik-Test (MT, 9 Items) 4) Figurenlegen (FL, 4 Items) 5) Zahlen-Symbol-Test (ZS, 93 Items)

10. Einsatzbereich des HAWIE-R Auf dem Umschlag des Handbuchs hei�t es: �Der Test eignet sich zur Einsch�tzung des allgemeinen geistigen Entwicklungsstandes und der Untersuchung von alters-, milieu- oder krankheitsbedingten Leistungsbeeintr�chti-gungen in bestimmten Bereichen. Er wird mit Vorteil auch bei Sch�lern in den oberen Klassen weiterbildender Schulen eingesetzt.� Weiteres Zitat aus dem Handbuch: �Betrachtet man die umfassende Literaturdokumentation bei Matarazzo ... so wird eindrucksvoll deutlich, da� die Wechsler-Intelligenztests f�r Erwachsene in der klinischen Praxis und Forschung zu den am h�ufigs-ten eingesetzten Testverfahren geh�ren ... Der HAWIE ist ... ein zur Zeit noch sehr gebr�uchliches Verfahren ... bei psychisch und neurologisch behinderten Personen oder auch bei �lteren, testunerfahrenen Probanden, denen man keinen Multiple-Choice-Test zumuten kann. Die Verschiebung der Alterspyramide und die zunehmende Bedeutung der Gerontopsychologie machen Testverfahren erforderlich, die ... nach dem Muster eines standardisierten Dialogs konstruiert sind.� (Handbuch, S.8)Weiteres Zitat aus dem Handbuch: �Betrachtet man die umfassende Literaturdokumentation bei Matarazzo ... so wird eindrucksvoll deutlich, da� die Wechsler-Intelligenztests f�r Erwachsene in der klinischen Praxis und Forschung zu den am h�ufigs-ten eingesetzten Testverfahren geh�ren ... Der HAWIE ist ... ein zur Zeit noch sehr gebr�uchliches Verfahren ... bei psychisch und neurologisch behinderten Personen oder auch bei �lteren, testunerfahrenen Probanden, denen man keinen Multiple-Choice-Test zumuten kann. Die Verschiebung der Alterspyramide und die zunehmende Bedeutung der Gerontopsychologie machen Testverfahren erforderlich, die ... nach dem Muster eines standardisierten Dialogs konstruiert sind.� (Handbuch, S.8)

11. Gliederung Einf�hrung Ziele und Aufbau Praktische Handhabung G�tekriterien Studie von P. Steck Auswertung Kritik

12. Praktische Handhabung/1 Testmaterialien: Handbuch mit Testanweisung (121 Seiten, davon 32 Seiten Tabellen und 15 Seiten Anhang: Bewertungskriterien) Vorlageheft f�r die Untertests Bilderg�nzen und Mosaik-Test Bildkarten zum Untertest Bildordnen neun W�rfel f�r den Mosaik-Test Puzzelteile des Untertests Figurenlegen Auswertschablone f�r den Zahlen-Symbol-Test 25 Protokollb�gen Handbuch: Im Handbuch sind die Modalit�ten der Test-applikation festgelegt, die Instruktionen sind w�rtlich vorgegeben. Handbuch: Im Handbuch sind die Modalit�ten der Test-applikation festgelegt, die Instruktionen sind w�rtlich vorgegeben.

13. Praktische Handhabung/2 Mehrzahl der Tests sind reine power-Tests beim Handlungsteil flie�t in die Verrechnung zumeist auch die speed-Komponente mit ein Zahlen-Symbol-Test ist ein reiner speed-Test Abbruchkriterium beinhalten die meisten Untertests Untertest wird unterbrochen, wenn die Tpn 3 bzw. 4 Aufgaben in ununterbrochener Reihenfolge nicht l�sen k�nnen Testdauer: 60 bis 90 Minuten Auswertungsdauer: keine Angaben Die meisten Untertests sind power-Tests, im Handlungsteil k�nnen zus�tzliche Zeitbonuspunkte erreicht werden (speed-Komponente); der Zahlen-Symbol-Test ist ein reiner Geschwindigkeitstest. F�r eine Reihe an Untertests gibt es ein Abbruchkriterium: die Vorgabe des jeweiligen Untertests wird abgebrochen, wenn die Testperson eine bestimmte Anzahl (meist 3 bzw. 4) Items in Folge nicht gel�st hat. Testdauer wird mit 60 bis 90 Minuten angegeben, die Auswertung bei einem routinierten Testleiter erfordert 5 bis 10 Minuten (aber: keine Angaben im Handbuch dazu gemacht) Die meisten Untertests sind power-Tests, im Handlungsteil k�nnen zus�tzliche Zeitbonuspunkte erreicht werden (speed-Komponente); der Zahlen-Symbol-Test ist ein reiner Geschwindigkeitstest. F�r eine Reihe an Untertests gibt es ein Abbruchkriterium: die Vorgabe des jeweiligen Untertests wird abgebrochen, wenn die Testperson eine bestimmte Anzahl (meist 3 bzw. 4) Items in Folge nicht gel�st hat. Testdauer wird mit 60 bis 90 Minuten angegeben, die Auswertung bei einem routinierten Testleiter erfordert 5 bis 10 Minuten (aber: keine Angaben im Handbuch dazu gemacht)


15. G�tekriterien/1 Durchf�hrungsobjektivit�t aufgrund der meist sehr klaren Instruktionen gegeben; unterliegt lediglich den bei allen im Dialog durchge-f�hrten Individualtests typischen Einschr�nkungen (reduziert wegen Einzeltestvorgabe) Ausnahme: Bilderordnen Auswertungsobjektivit�t wurde gegen�ber dem HAWIE wahrscheinlich verbessert, da einfachere und h�ufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden Interpretationsobjektivit�t ist gegeben Objektivit�t (=Anwenderunabh�ngigkeit) Durchf�hrungsobjektivit�t - Ausnahme: Dem Testleiter wird beim Bilderordnen die �Empfehlung� gegeben, falls die Zeit noch reicht , die Testperson dazu aufzufordern, die L�sungen zu begr�nden oder beim L�sen eine Geschichte zu erz�hlen - damit wird eine Verletzung der Durchf�hrungsobjektivit�t in Kauf genommen. Auswertungsobjektivit�t wurde gegen�ber dem HAWIE wahrscheinlich verbessert, da einfachere und h�ufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden. Aber: trotzdem zeigt eine kleine Studie des Herausgebers des HAWIE-R, da� insbesondere beim Untertest Allgemeines Verst�ndnis noch Bewertungsdifferenzen auftreten k�nnen. Im Mosaik-Test mu� jetzt auch entschieden werden, ob eine Drehung um mehr als 30 Grad vorliegt; hier d�rften Auswertungsdifferenzen auftreten.Objektivit�t (=Anwenderunabh�ngigkeit) Durchf�hrungsobjektivit�t - Ausnahme: Dem Testleiter wird beim Bilderordnen die �Empfehlung� gegeben, falls die Zeit noch reicht , die Testperson dazu aufzufordern, die L�sungen zu begr�nden oder beim L�sen eine Geschichte zu erz�hlen - damit wird eine Verletzung der Durchf�hrungsobjektivit�t in Kauf genommen. Auswertungsobjektivit�t wurde gegen�ber dem HAWIE wahrscheinlich verbessert, da einfachere und h�ufiger eindeutige Bewertungsrichtlinien im Verbalteil vorgegeben werden. Aber: trotzdem zeigt eine kleine Studie des Herausgebers des HAWIE-R, da� insbesondere beim Untertest Allgemeines Verst�ndnis noch Bewertungsdifferenzen auftreten k�nnen. Im Mosaik-Test mu� jetzt auch entschieden werden, ob eine Drehung um mehr als 30 Grad vorliegt; hier d�rften Auswertungsdifferenzen auftreten.

16. G�tekriterien/2 Reliabilit�t wurde mittels Cronbachs-a bestimmt: liegt f�r die einzelnen Untertests und pro Altersgruppe zwischen .64 (FL) und .95 (ZS, mit Testhalbierung) beim Gesamt-IQ bei mindestens .95 Standardmessfehler werden getrennt nach Skalen und Altersgruppen angegeben kritische Differenzen f�r Profilinterpretationen nicht angegeben Reliabilit�t (=Zuverl�ssigkeit, d.h. wie genau mi�t der Test das, was er mi�t) FL = Figurenlegen ZS = Zahlen-Symbol-Test ein Cronbachs-a von mindestens .90 wird dar�ber hinaus nur gelegentlich f�r die Untertests Allgemeines Wissen, Wortschatz-Test, Rechnerisches Denken und Gemeinsamkeitenfinden beobachtetReliabilit�t (=Zuverl�ssigkeit, d.h. wie genau mi�t der Test das, was er mi�t) FL = Figurenlegen ZS = Zahlen-Symbol-Test ein Cronbachs-a von mindestens .90 wird dar�ber hinaus nur gelegentlich f�r die Untertests Allgemeines Wissen, Wortschatz-Test, Rechnerisches Denken und Gemeinsamkeitenfinden beobachtet

17. G�tekriterien/3 faktorielle Validit�t (= im Sinne einer Konstruktvalidierung) die Wechslersche Unterteilung in einen Verbal- und Handlungsfaktor wird best�tigt (allerdings haben ZN und RD auf beiden Faktoren substantielle Ladungen) Extremgruppenvalidierung Gruppenunterschiede zwischen Absolventen verschiedener Schultypen sowie zwischen Alkoholikern und Nicht-Alkoholikern bzw. �hnlichkeiten zwischen Verwandten (z.B. Geschwister) werden als Hinweis f�r die Validit�t aufgef�hrt. Validit�t (=G�ltigkeit, d.h. sie gibt an, ob der Test das mi�t, was er zu messen vorgibt) Faktorielle Validit�t: ZN =Zahlennachsprechen RD = Rechnerisches Denken die h�chsten Ladungen im 1. Faktor weist der Wortschatz-Test mit .86 auf, im 2. Faktor der Untertest Figurenlegen mit .78 die Ladungen mit jeweils anderen Faktoren sind durchweg klein Extremgruppenvalidierung: es ergeben sich weitgehende Unterschiede zwischen den Schulbildungen �Hauptschule�, �Realschule� und �Gymnasium� sowie zwischen Alkoholikern und Nicht-Alkoholikern.Validit�t (=G�ltigkeit, d.h. sie gibt an, ob der Test das mi�t, was er zu messen vorgibt) Faktorielle Validit�t: ZN =Zahlennachsprechen RD = Rechnerisches Denken die h�chsten Ladungen im 1. Faktor weist der Wortschatz-Test mit .86 auf, im 2. Faktor der Untertest Figurenlegen mit .78 die Ladungen mit jeweils anderen Faktoren sind durchweg klein Extremgruppenvalidierung: es ergeben sich weitgehende Unterschiede zwischen den Schulbildungen �Hauptschule�, �Realschule� und �Gymnasium� sowie zwischen Alkoholikern und Nicht-Alkoholikern.

18. G�tekriterien/4 Skalierung dazu werden nur Analysen der klassischen Test-theorie angef�hrt Trennsch�rfen sind gering, wie bei den Wechsler-Skalen �blich (vgl. z.B. Kubinger, 1983) Schwierigkeiten sind absichtlich so gew�hlt, da� der Test im unteren Leistungsbereich besser differenziert. �Er wurde in erster Linie f�r die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfaller-scheinungen geht� (nicht f�r die Untersuchung Hochbegabter, S.46) Skalierung: hierzu werden nur Analysen der klassischen Testtheorie angef�hrt - � Gegen eine Neukonstruktion auf probabilistischer Grundlage hatte sich der amerikanische Herausgeber jedoch schon bei der Neubearbeitung der Kinderform ausgesprochen.�(Handbuch S.9) Trennsch�rfen: sind gering, wie bei den Wechsler-Skalen �blich (vgl. z.B. Kubinger, 1983); Schwierigkeiten sind absichtlich so gew�hlt, da� der Test im unteren Leistungsbereich besser differenziert - �Der Test soll nicht der Untersuchung von Hochbegabten dienen. Er wurde in erster Linie f�r die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfallerscheinungen geht.�(S.46). Skalierung: hierzu werden nur Analysen der klassischen Testtheorie angef�hrt - � Gegen eine Neukonstruktion auf probabilistischer Grundlage hatte sich der amerikanische Herausgeber jedoch schon bei der Neubearbeitung der Kinderform ausgesprochen.�(Handbuch S.9) Trennsch�rfen: sind gering, wie bei den Wechsler-Skalen �blich (vgl. z.B. Kubinger, 1983); Schwierigkeiten sind absichtlich so gew�hlt, da� der Test im unteren Leistungsbereich besser differenziert - �Der Test soll nicht der Untersuchung von Hochbegabten dienen. Er wurde in erster Linie f�r die klinisch-psychologische Diagnostik entwickelt, bei der es eher um die Untersuchung von Ausfallerscheinungen geht.�(S.46).

19. G�tekriterien/5 Normierung beruht auf Gesamtstichprobe von N=2000 Testpersonen, die hinsichtlich Alter zwischen 16 und 74 Jahre sind, wobei die 20 bis 34j�hrigen �berwiegen. aber: Schulbildung und Geschlecht der Stich- probe war f�r die BRD ca. um 1986 repr�sentativ (wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen) Normierung: Die eigentlichen Normen basieren lediglich auf den 20- bis 34j�hrigen, weil laut Wechsler: �die geistige Entwicklung in dieser Altersgruppe ihr Maximum erreiche und relativ konstant bleibe� (S. 13) - die entsprechenden Untertest-Wertepunkte dienen auch der Berechnung des IQ. ! Erg�nzend k�nnen altersspezifische Normwerte bzw. Normwerte f�r Gymnasiasten bestimmt werden, jedoch nur f�r die einzelnen Untertests, nicht f�r den IQ. Aber: wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen, wahrscheinlich aber vor der Vereinigung, so da� fraglich ist, ob die Normen (insbesondere bei den Verbaltests) auch f�r die neuen Bundesl�nder gelten; dieser Einwand gilt m�glicherweise auch f�r die Schweiz und �sterreich.Normierung: Die eigentlichen Normen basieren lediglich auf den 20- bis 34j�hrigen, weil laut Wechsler: �die geistige Entwicklung in dieser Altersgruppe ihr Maximum erreiche und relativ konstant bleibe� (S. 13) - die entsprechenden Untertest-Wertepunkte dienen auch der Berechnung des IQ. ! Erg�nzend k�nnen altersspezifische Normwerte bzw. Normwerte f�r Gymnasiasten bestimmt werden, jedoch nur f�r die einzelnen Untertests, nicht f�r den IQ. Aber: wann genau die Normierung stattfand ist aus dem Handbuch nicht zu entnehmen, wahrscheinlich aber vor der Vereinigung, so da� fraglich ist, ob die Normen (insbesondere bei den Verbaltests) auch f�r die neuen Bundesl�nder gelten; dieser Einwand gilt m�glicherweise auch f�r die Schweiz und �sterreich.

20. Das Verfahren ist: �konomisch bietet gute Beobachtungsm�glichkeiten (z.B. im Handlungsteil Vorgehen nach �Versuch und Irrtum� vs. planvolles Handeln) zumutbar (insbesondere f�r klinisches Klientel) Simulationen sind wie bei allen Leistungstests m�glich; sie sind aber wegen guter Beobach-tungsm�glichkeiten eher erkennbar als bei anderen erwachsenendiagnostischen Verfahren keine systematischen Untersuchungen zur Fairne� vorhanden �konomisch: f�r einen Individualtest und entsprechend der Komplexit�t des G�ltigkeitsbereichs sehr �konomisch und N�tzlich, da Intelligenz interaktiv (mit bestimmten Materialien einerseits und mit dem Testleiter andererseits), bei gleichzeitiger Beobachtungsm�glichkeit des Arbeits- und Kontaktverhaltens, erfasst wird. F�r den Test gibt es im Erwachsenenbereich keine Alternative. Zumutbarkeit: ist im Sinne des Testkuratoriums (der F�deration deutscher Psychologenverb�nde; 1986) gegeben; vielleicht mit der Einschr�nkung, da� jede Testperson bei fast jedem Untertest solange getestet wird, bis sie versagt - und vielleicht frustriert wird. Verf�lschbarkeit/Simulationen: bei Fragestellungen wie z.B. Rentenbegehren wichtig Fairne�: (d.h. ist nicht gepr�ft!) aber der Wortschatz-Test zeigt die h�chsten Korrelationen zum Gesamt-IQ, das bedeutet, da� Bildungsfaktoren (vor allem schulisch-akademische, im Sinne westeurop�ischer und US-amerikanischer Tradition) das Gesamtergebnis stark determinieren, so da� weniger Gebildete wohl auch als weniger intelligent erscheinen.�konomisch: f�r einen Individualtest und entsprechend der Komplexit�t des G�ltigkeitsbereichs sehr �konomisch und N�tzlich, da Intelligenz interaktiv (mit bestimmten Materialien einerseits und mit dem Testleiter andererseits), bei gleichzeitiger Beobachtungsm�glichkeit des Arbeits- und Kontaktverhaltens, erfasst wird. F�r den Test gibt es im Erwachsenenbereich keine Alternative. Zumutbarkeit: ist im Sinne des Testkuratoriums (der F�deration deutscher Psychologenverb�nde; 1986) gegeben; vielleicht mit der Einschr�nkung, da� jede Testperson bei fast jedem Untertest solange getestet wird, bis sie versagt - und vielleicht frustriert wird. Verf�lschbarkeit/Simulationen: bei Fragestellungen wie z.B. Rentenbegehren wichtig Fairne�: (d.h. ist nicht gepr�ft!) aber der Wortschatz-Test zeigt die h�chsten Korrelationen zum Gesamt-IQ, das bedeutet, da� Bildungsfaktoren (vor allem schulisch-akademische, im Sinne westeurop�ischer und US-amerikanischer Tradition) das Gesamtergebnis stark determinieren, so da� weniger Gebildete wohl auch als weniger intelligent erscheinen.


22. UmfragePsychologische Testverfahren in der Praxis

23. Umfrage Im wesentlichen 3 Kategorien von Tests im dt. Raum (Kubinger; 1995)

24. Datenerhebung Fragebogen wurde an 1000 zuf�llig ausgew�hlte Mitgliedern des Berufsverbandes Deutscher Psychologen (BDP) verschickt R�cklauf von 271 Frageb�gen (27,1 %) davon konnten nur 250 ausgewertet werden

25. Fragebogen

26. Datenverarbeitung Auswertung erfolgte mittels �berf�hrung in numerischen Code bei Ja/ Nein Antworten und Zuweisung in vorher festgelegten Kategoriensystemen (wurden �berpr�ft durch 2 unabh�ngige Beurteiler ?Kappa- Koeffizient zwischen .72 und .98)

27. Ergebnisse 169 von 250 Psychologen (67,9%) setzten Tests in der Berufspraxis ein 200 Tests waren erkennbar (von 254)

28. Ergebnisse

29. Vergleich

30. Qualit�tsmerkmale

31. Abgelehnte Verfahren Gar nicht oder ungern verwendete Tests (N=121): - Rorschach- Test (24 Nennungen) - MMPI (13) - TAT (12) - IST/ IST 70 (11) - HAWIK/ HAWIK-R (8) - HAWIE/ HAWIE-R (3) Gr�nde / Nachteile: - Un�konomisch - Hauptg�tekriterien/ Konstruktion ungen�gend - Geringe /keine diagnostische Relevanz - Geringe /keine Akzeptanz - Auswertung schwer handhabbar

32. Subtest und Anwendung 53 der Befragten gaben an, sich bei den Tests auf einzelne Subtests zu beschr�nken - v.a. bei HAWIE/ HAWIE-R; IST/ IST 70; HAWIK/ HAWIK-R; LPS; PFK u.a. 58 Befragte gaben an, die Tests in abweichender Form anzuwenden - v.a. bei HAWIK/ HAWIK-R; TAT u.a. Abweichungen beziehen sich auf Instruktion, Durchf�hrung (Zweckentfremdung, Verk�rzung, Modifizierung des Testmaterials) und Auswertung

33. Fazit zur Umfrage Geh�rt mit zu den am h�ufigsten verwendeten Tests (national und international) Hat einen relativ stabilen Platz in der Rangordnung der letzten 20 Jahre


35. Auswertung/1 Allgemein: Auswertung erfolgt �ber die Anzahl richtig gel�ster Aufgaben Berechnung von Verbal- IQ, Handlungs- IQ und Gesamt- IQ daneben werden noch alters- und bildungsspezifische Wertpunkttabellen angeben Dauer der Testauswertung: 5- 10 Minuten Auswertung, allgemein: die Auswertung erfolgt �ber die Anzahl der richtig gel�sten Aufgaben es werden ein Verbal- IQ, ein Handlungs- IQ und ein Gesamt- IQ berechnet f�r diesen Zweck werden die Wertpunktsummen f�r die 6 Verbaltests, die 5 Handlungstests und f�r alle 11 Untertests berechnet und in IQ- Werte (normierter Mittelwert aller Wertpunkte) transformiert direkt aus Umrechnungstabellen daneben werden noch alters- und bildungsspezifische (Gymnasiasten und Abiturienten) Wertpunkttabellen angeben, die z.T. aber auf sehr kleinen SP beruhen Testauswertung dauert bei einem routinierten Testleiter 5- 10 Minuten Auswertung, allgemein: die Auswertung erfolgt �ber die Anzahl der richtig gel�sten Aufgaben es werden ein Verbal- IQ, ein Handlungs- IQ und ein Gesamt- IQ berechnet f�r diesen Zweck werden die Wertpunktsummen f�r die 6 Verbaltests, die 5 Handlungstests und f�r alle 11 Untertests berechnet und in IQ- Werte (normierter Mittelwert aller Wertpunkte) transformiert direkt aus Umrechnungstabellen daneben werden noch alters- und bildungsspezifische (Gymnasiasten und Abiturienten) Wertpunkttabellen angeben, die z.T. aber auf sehr kleinen SP beruhen Testauswertung dauert bei einem routinierten Testleiter 5- 10 Minuten

36. Auswertung/2 Berechnung der Wertpunkte: zun�chst Berechnung der Punktzahl jeden Untertests = Rohwert die Rohwerte k�nnen in verschiedene Wertpunkte transformiert werden Ankreuzen der Rohwerte ergibt das Testprofil des Probanden Berechnung der Wertpunkte: zun�chst Berechnung der Punktzahl jeden Untertests = Rohwert die einzelnen Untertest- Rohwerte werden in die entsprechende Ergebnisspalte des Protokollbogens eingetragen die Rohwerte k�nnen in verschiedene Wertpunkte transformiert werden Voraussetzung f�r die Bestimmung des IQ sind die �Wertpunkte A� hierbei handelt es sich um die Abweichungswerte von den Erwartungswerten der Altersgruppe 20- 34 Jahre durch Ankreuzen der Rohwerte in der Wertpunkttabelle auf dem Deckblatt erh�lt man auch das Testprofil des Pb f�r die Interpretation der Testergebnisse kann es unter Umst�nden sinnvoll sein, die Abweichung der Rohwerte von anderen Referenzgruppen (z.B. Gymnasiasten) zu bestimmen hierf�r gibt es die Spalte �Wertpunkte B� 10 Wertpunkte entsprechen dem Durchschnitt der Altersgruppe, der der Pb zuzurechnen ist (Orientierungswerte) Berechnung der Wertpunkte: zun�chst Berechnung der Punktzahl jeden Untertests = Rohwert die einzelnen Untertest- Rohwerte werden in die entsprechende Ergebnisspalte des Protokollbogens eingetragen die Rohwerte k�nnen in verschiedene Wertpunkte transformiert werden Voraussetzung f�r die Bestimmung des IQ sind die �Wertpunkte A� hierbei handelt es sich um die Abweichungswerte von den Erwartungswerten der Altersgruppe 20- 34 Jahre durch Ankreuzen der Rohwerte in der Wertpunkttabelle auf dem Deckblatt erh�lt man auch das Testprofil des Pb f�r die Interpretation der Testergebnisse kann es unter Umst�nden sinnvoll sein, die Abweichung der Rohwerte von anderen Referenzgruppen (z.B. Gymnasiasten) zu bestimmen hierf�r gibt es die Spalte �Wertpunkte B� 10 Wertpunkte entsprechen dem Durchschnitt der Altersgruppe, der der Pb zuzurechnen ist (Orientierungswerte)

37. Wertpunkte�quivalente f�r die Rohwerte

38. Auswertung/3 Berechnung der IQ- Werte: Berechnung erfolgt �ber �Wertpunkte A� Berechnung der Wertpunkte der 6 Verbaltests der 5 Handlungstests aller 11 Untertests drei Summenwerte werden im Protokollbogen eingetragen m.H. der IQ- Umrechnungstabelle wird der IQ bestimmt Berechnung der IQ- Werte: Berechnung erfolgt �ber �Wertpunkte A� Berechnung der Wertepunkte der 6 Verbaltests der 5 Handlungstests aller 11 Untertests diese drei Summenwerte werden im Protokollbogen eingetragen m.H. der IQ- Umrechnungstabelle (S.86- 103) wird der IQ bestimmt Berechnung der IQ- Werte: Berechnung erfolgt �ber �Wertpunkte A� Berechnung der Wertepunkte der 6 Verbaltests der 5 Handlungstests aller 11 Untertests diese drei Summenwerte werden im Protokollbogen eingetragen m.H. der IQ- Umrechnungstabelle (S.86- 103) wird der IQ bestimmt

39. Inhaltliche Bedeutung der Skalen/1 Gesamt- IQ: Hinweis auf das allgemeine geistige Leistungsverm�gen des Individuums ob eine Person eher praktisch oder verbal- theoretisch begabt ist Leistungsbeeintr�chtigungen vor bestimmtem Hintergrund interpretieren Inhaltliche Bedeutung der Skalen: der Gesamt- IQ gibt einen Hinweis auf das allgemeine geistige Leistungsverm�gen des Individuums gibt Auskunft dar�ber, ob eine Person eher praktisch oder verbal- theoretisch begabt ist Leistungsbeeintr�chtigungen sollten immer vor dem Hintergrund milieuspezifischer Einfl�sse und m�glicher krankheits- oder verletzungsbedingter Behinderungen interpretiert werdenInhaltliche Bedeutung der Skalen: der Gesamt- IQ gibt einen Hinweis auf das allgemeine geistige Leistungsverm�gen des Individuums gibt Auskunft dar�ber, ob eine Person eher praktisch oder verbal- theoretisch begabt ist Leistungsbeeintr�chtigungen sollten immer vor dem Hintergrund milieuspezifischer Einfl�sse und m�glicher krankheits- oder verletzungsbedingter Behinderungen interpretiert werden

41. Inhaltliche Bedeutung der Skalen/2 Allgemeines Wissen: �berpr�ft dasjenige Wissen, �das sich ein Durchschnittsmensch [...] selbst aneignen kann� (MATARAZZO, 1982) kulturabh�ngig Zahlenged�chtnis: geringer Bedeutung f�r das allgemeine intellektuelle Leistungsniveau Inhaltliche Bedeutung der Skalen: Allgemeines Wissen: �berpr�ft dasjenige Wissen, �dass sich ein Durchschnittsmensch mit durchschnittlichen Bildungsm�glichkeiten selbst aneignen kann� (MATARAZZO, 1982) kulturabh�ngig/ sprachabh�ngig Zahlenged�chtnis: scheint von geringer Bedeutung f�r das allgemeine intellektuelle Leistungsniveau zu sein trotzdem sind Leistungsausf�lle klinisch bedeutsam, da es klinische Zshg.e geben kann Inhaltliche Bedeutung der Skalen: Allgemeines Wissen: �berpr�ft dasjenige Wissen, �dass sich ein Durchschnittsmensch mit durchschnittlichen Bildungsm�glichkeiten selbst aneignen kann� (MATARAZZO, 1982) kulturabh�ngig/ sprachabh�ngig Zahlenged�chtnis: scheint von geringer Bedeutung f�r das allgemeine intellektuelle Leistungsniveau zu sein trotzdem sind Leistungsausf�lle klinisch bedeutsam, da es klinische Zshg.e geben kann

42. Inhaltliche Bedeutung der Skalen/3 Wortschatztest: �exzellentes Maߓ der allgemeinen Intelligenz weitgehend unabh�ngig vom Lebensalter Rechnerisches Denken: gutes allgemeines Intelligenzma� Leistungen sind abh�ngig von schulischer und beruflicher Erfahrung Inhaltliche Bedeutung der Skalen: Wortschatztest: gilt als �exzellentes Maߓ der allgemeinen Intelligenzeiner Person (MATARAZZO) weitgehend unabh�ngig vom Lebensalter gutes Ma� f�r Lernf�higkeit und verbale Informationsbreite des Probanden Rechnerisches Denken: gutes allgemeines Intelligenzma� (MATARAZZO) Leistungen sind abh�ngig von schulischer und beruflicher Erfahrung COHEN (1942) weist darauf hin, dass das niedrige Testwerte auch auf mangelndes Sprachverst�ndnis zur�ckzuf�hren sein k�nnen Inhaltliche Bedeutung der Skalen: Wortschatztest: gilt als �exzellentes Maߓ der allgemeinen Intelligenzeiner Person (MATARAZZO) weitgehend unabh�ngig vom Lebensalter gutes Ma� f�r Lernf�higkeit und verbale Informationsbreite des Probanden Rechnerisches Denken: gutes allgemeines Intelligenzma� (MATARAZZO) Leistungen sind abh�ngig von schulischer und beruflicher Erfahrung COHEN (1942) weist darauf hin, dass das niedrige Testwerte auch auf mangelndes Sprachverst�ndnis zur�ckzuf�hren sein k�nnen

43. Inhaltliche Bedeutung der Skalen/4 Allgemeines Verst�ndnis: pr�ft den �gesunden Menschenverstand� erfasst die F�higkeit zum logischen Denken (WECHSLER) Gemeinsamkeiten finden: erlaubt quantitativen und qualitative Aussagen logische Struktur der Denkprozesse (WECHSLER, MATARAZZO) Inhaltliche Bedeutung der Skalen: Allgemeines Verst�ndnis: pr�ft den �gesunden Menschenverstand� erfasst die F�higkeit zum logischen Denken (WECHSLER) abh�ngig von Sprachverst�ndnis Gemeinsamkeiten finden: nach WECHSLER gro�e Bedeutung sei besonders gut geeignet, um neben quantitativen Aussagen auch qualitative Aussagen zu machen gibt Auskunft �ber logische Struktur der Denkprozesse (WECHSLER, MATARAZZO) abh�ngig von sprachlichen F�higkeitenInhaltliche Bedeutung der Skalen: Allgemeines Verst�ndnis: pr�ft den �gesunden Menschenverstand� erfasst die F�higkeit zum logischen Denken (WECHSLER) abh�ngig von Sprachverst�ndnis Gemeinsamkeiten finden: nach WECHSLER gro�e Bedeutung sei besonders gut geeignet, um neben quantitativen Aussagen auch qualitative Aussagen zu machen gibt Auskunft �ber logische Struktur der Denkprozesse (WECHSLER, MATARAZZO) abh�ngig von sprachlichen F�higkeiten

44. Inhaltliche Bedeutung der Skalen/5 Bildererg�nzen: F�higkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER) Bilderordnen: F�higkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzusch�tzen (WECHSLER) Inhaltliche Bedeutung der Skalen: Bildererg�nzen: erfasst die F�higkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER) unterschiedliche Meinungen aller Forscher dar�ber, was der Test misst Bilderordnen: F�higkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzusch�tzen (WECHSLER) Inhaltliche Bedeutung der Skalen: Bildererg�nzen: erfasst die F�higkeit, zwischen wichtigen und unwichtigen Details bei visuellen Vorlagen zu unterscheiden (WECHSLER) unterschiedliche Meinungen aller Forscher dar�ber, was der Test misst Bilderordnen: F�higkeit, die Gesamtsituation zu verstehen und die Einzelaspekte hinsichtlich ihrer Bedeutung richtig einzusch�tzen (WECHSLER)

45. Inhaltliche Bedeutung der Skalen/6 Mosaik- Test: ausgezeichnete Pr�fung der allgemeinen Intelligenz (WECHSLER) f�r qualitative Aussagen geeignet besonders gut f�r klinische Diagnostik Figuren legen: Hinweise �ber die Arbeitsstil der Probanden Inhaltliche Bedeutung der Skalen: Mosaik- Test: ausgezeichnete Pr�fung der allgemeinen Intelligenz (WECHSLER) f�r qualitative Aussagen geeignet besonders gut f�r klinische Diagnostik, weil Patienten mit geistigem Abbau und Senile schlechte Leistungen erbringen und Patienten mit Hirnverletzungen andere L�sungsstrategien w�hlen als Gesunde Figuren legen: WECHSLER hatte methodische Bedenken bei diesem Untertest, da er schlecht in h�heren Intelligenzbereichen differenziert er gibt jedoch Hinweise �ber die Arbeitsstil der ProbandenInhaltliche Bedeutung der Skalen: Mosaik- Test: ausgezeichnete Pr�fung der allgemeinen Intelligenz (WECHSLER) f�r qualitative Aussagen geeignet besonders gut f�r klinische Diagnostik, weil Patienten mit geistigem Abbau und Senile schlechte Leistungen erbringen und Patienten mit Hirnverletzungen andere L�sungsstrategien w�hlen als Gesunde Figuren legen: WECHSLER hatte methodische Bedenken bei diesem Untertest, da er schlecht in h�heren Intelligenzbereichen differenziert er gibt jedoch Hinweise �ber die Arbeitsstil der Probanden

46. Inhaltliche Bedeutung der Skalen/7 Zahlen- Symbol- Test: erfasst die allgemeine psychometrische Geschwindigkeit gutes Ma� f�r das Konzentrationsverm�gen (WECHSLER) Ergebnisse sind in starkem Ma�e altersabh�ngig Inhaltliche Bedeutung der Skalen: Zahlen- Symbol- Test: erfasst die allgemeine psychometrische Geschwindigkeit gutes Ma� f�r das Konzentrationsverm�gen (WECHSLER) Ergebnisse sind in starkem Ma�e altersabh�ngigInhaltliche Bedeutung der Skalen: Zahlen- Symbol- Test: erfasst die allgemeine psychometrische Geschwindigkeit gutes Ma� f�r das Konzentrationsverm�gen (WECHSLER) Ergebnisse sind in starkem Ma�e altersabh�ngig


48. Kritik/1 M�ngel am HAWIE-R: keine Bezug auf die probabilistische Testtheorie Vorwurf: artifizielle Messung Orientierung auf Denkresultat statt Denkprozess Status statt Entwicklungspotential Vernachl�ssigung der kreativen Komponenten Konzept des IQ M�ngel am HAWIE-R: der HAWIE-R wurde ohne Bezug auf die probabilistische Testtheorie konstruiert ihm wird deshalb vorgeworfen, v�llig artifiziell zu messen Orientierung auf das Denkresultat, nicht auf den Denkprozess; nur auf den Status, nicht auf das Entwicklungspotential (Lernf�higkeit) Vernachl�ssigung der kreativen Komponenten und der f�r die Erwachsenenintelligenz besonders wichtigen Weisheit (sensu Baltes) und sozial- praktischen Intelligenz (sensu Sternberg) Untersch�tzung der Intelligenz von �Unterprivilegierten� und kulturellen Minorit�ten ein grunds�tzliches Problem aller WECHSLER- Skalen liegt im Konzept des IQ als Durchschnittsleistung definiert ist mit ihm die Annahme impliziert, dass irgendwelche Untertest- �Tiefs� einer Testperson durch beliebige Untertests- �Hochs� egalisiert werden k�nnen M�ngel am HAWIE-R: der HAWIE-R wurde ohne Bezug auf die probabilistische Testtheorie konstruiert ihm wird deshalb vorgeworfen, v�llig artifiziell zu messen Orientierung auf das Denkresultat, nicht auf den Denkprozess; nur auf den Status, nicht auf das Entwicklungspotential (Lernf�higkeit) Vernachl�ssigung der kreativen Komponenten und der f�r die Erwachsenenintelligenz besonders wichtigen Weisheit (sensu Baltes) und sozial- praktischen Intelligenz (sensu Sternberg) Untersch�tzung der Intelligenz von �Unterprivilegierten� und kulturellen Minorit�ten ein grunds�tzliches Problem aller WECHSLER- Skalen liegt im Konzept des IQ als Durchschnittsleistung definiert ist mit ihm die Annahme impliziert, dass irgendwelche Untertest- �Tiefs� einer Testperson durch beliebige Untertests- �Hochs� egalisiert werden k�nnen

49. Kritik/2 M�ngel am HAWIE-R: Validit�t zu wenig untersucht einzelne Testitems werden bem�ngelt Probanden werden mit diagnostisch wenig informativen Items konfrontiert HAWIE- und HAWIE-R- Ergebnisse lassen sich nicht direkt vergleichen Normierungsstichprobe TEWES� Replik Einzelkritikpunkte: bereits fr�he Testrezensenten (FAY, 1993; KUBINGER, 1993) kritisierten, wie wenig der HAWIE-R bisher auf seine Validit�t hin untersucht wurde besonders die Tatsache, dass zur prognostischen Validit�t (schulpsychologische Beratung) �berhaupt keine Ergebnisse im Handbuch referiert werden das noch im Handbuch dargestellte tradierte Konzept mir den beiden Hauptfaktoren ist durch weiterf�hrende Analysen erheblich differenziert worden danach sind- z.B. in der Inhaltsfacette- numerische, figurale und verbale Anforderungen unterscheidbar (s. auch J�GERs Intelligenzstrukturmodell) Vertreter der probabilistischen Testtheorie bem�ngeln, dass f�r die einzelnen Untertests nicht gepr�ft wurde, ob �berhaupt homogene F�higkeiten gepr�ft werden FAY, 1993 bem�ngelt aus gutem (hier nicht darstellbaren) Grund einzelne Testitems (z.B. Wasserkrugbild in BE) Die Testperson wird wegen des gro�en Geltungsbereiches weiterhin mit vielen diagnostisch wenig informativen Items konfrontiert i.d.R. endet der Untertest bei klinischen Patienten mit einer �Frustration� ein adaptiver Testaufbau k�nnte diesen Mangel �berwinden direkte Vergleichbarkeit der alten HAWIE- Ergebnisse mit den neuen HAWIE-R- Ergebnissen ist nicht gegeben der HAWIE bringt durchschnittlich h�here Testwerte als der HAWIE-R (allerdings nur im Bereich bis IQ= 115, danach kehrt sich das Verh�ltnis um) Normierungsstichprobe (N= 2000), die hinsichtlich Alter, Schulbildung und Geschlecht f�r die BRD 1986 repr�sentativ war wann genau die Normierung stattfand, ist nicht ersichtlich dies geschah wahrscheinlich vor der Vereinigung, so dass die Normen (insbesondere bei den Verbaltests) nicht f�r die neuen Bundesl�nder gelten (auch f�r �sterreich und Schweiz nicht gegeben) TEWES: Normenaktualisierung: Normierung vor Vereinigung keine �bertragbarkeit, weil in beiden Gebieten Unterschiede im Bildungssystem und vermutlich auch in den Sprachgewohnheiten und Alltagserfahrungen bestanden Validit�t: die Kritik am Fehlen von Informationen zur prognostischen Validit�t ist nicht verst�ndlich, da es ich um einen Erwachsenentest handelt (16- 74 J.) Einzelkritikpunkte: bereits fr�he Testrezensenten (FAY, 1993; KUBINGER, 1993) kritisierten, wie wenig der HAWIE-R bisher auf seine Validit�t hin untersucht wurde besonders die Tatsache, dass zur prognostischen Validit�t (schulpsychologische Beratung) �berhaupt keine Ergebnisse im Handbuch referiert werden das noch im Handbuch dargestellte tradierte Konzept mir den beiden Hauptfaktoren ist durch weiterf�hrende Analysen erheblich differenziert worden danach sind- z.B. in der Inhaltsfacette- numerische, figurale und verbale Anforderungen unterscheidbar (s. auch J�GERs Intelligenzstrukturmodell) Vertreter der probabilistischen Testtheorie bem�ngeln, dass f�r die einzelnen Untertests nicht gepr�ft wurde, ob �berhaupt homogene F�higkeiten gepr�ft werden FAY, 1993 bem�ngelt aus gutem (hier nicht darstellbaren) Grund einzelne Testitems (z.B. Wasserkrugbild in BE) Die Testperson wird wegen des gro�en Geltungsbereiches weiterhin mit vielen diagnostisch wenig informativen Items konfrontiert i.d.R. endet der Untertest bei klinischen Patienten mit einer �Frustration� ein adaptiver Testaufbau k�nnte diesen Mangel �berwinden direkte Vergleichbarkeit der alten HAWIE- Ergebnisse mit den neuen HAWIE-R- Ergebnissen ist nicht gegeben der HAWIE bringt durchschnittlich h�here Testwerte als der HAWIE-R (allerdings nur im Bereich bis IQ= 115, danach kehrt sich das Verh�ltnis um) Normierungsstichprobe (N= 2000), die hinsichtlich Alter, Schulbildung und Geschlecht f�r die BRD 1986 repr�sentativ war wann genau die Normierung stattfand, ist nicht ersichtlich dies geschah wahrscheinlich vor der Vereinigung, so dass die Normen (insbesondere bei den Verbaltests) nicht f�r die neuen Bundesl�nder gelten (auch f�r �sterreich und Schweiz nicht gegeben) TEWES: Normenaktualisierung: Normierung vor Vereinigung keine �bertragbarkeit, weil in beiden Gebieten Unterschiede im Bildungssystem und vermutlich auch in den Sprachgewohnheiten und Alltagserfahrungen bestanden Validit�t: die Kritik am Fehlen von Informationen zur prognostischen Validit�t ist nicht verst�ndlich, da es ich um einen Erwachsenentest handelt (16- 74 J.)

50. Kritik/3 1. Allgemeines Wissen: Normdaten medialer Darstellung 2. Bildererg�nzen: physikalische Details Distraktoreninformationen 1. Allgemeines Wissen: sehr problematisches Item: �Zahl der Bundesl�nder� und �Zahl der Einwohner Deutschlands� wann die Normdaten erhoben wurden ist nicht ersichtlich im Handbuch problematisches Item: �Wer w�hlt bei uns den Bundeskanzler?� es ist problematisch, ein Wissenselement in einen Test aufzunehmen, von dem man wei�, dass es alle vier Jahre Objekt exzessiver medialer Darstellung ist 2. Bildererg�nzen: physikalische Details werden nicht beachtet, der Pb k�nnte abgelenkt werden (Item 7, Glas- Wasser) eine volle Punktzahl zu erreichen ist in diesem Falle also nur bei Nichtbeachtung von unbeabsichtigten Distraktoreninformationen m�glich 1. Allgemeines Wissen: sehr problematisches Item: �Zahl der Bundesl�nder� und �Zahl der Einwohner Deutschlands� wann die Normdaten erhoben wurden ist nicht ersichtlich im Handbuch problematisches Item: �Wer w�hlt bei uns den Bundeskanzler?� es ist problematisch, ein Wissenselement in einen Test aufzunehmen, von dem man wei�, dass es alle vier Jahre Objekt exzessiver medialer Darstellung ist 2. Bildererg�nzen: physikalische Details werden nicht beachtet, der Pb k�nnte abgelenkt werden (Item 7, Glas- Wasser) eine volle Punktzahl zu erreichen ist in diesem Falle also nur bei Nichtbeachtung von unbeabsichtigten Distraktoreninformationen m�glich

51. Kritik/4 4. Bilderordnen: Distraktoren Unachtsamkeiten der Konstrukteure 6. Mosaik- Test: Kategorie des Drehfehlers 4. Bilderordnen: unn�tige Distraktoren st�ren den Probleml�seprozess einige Unachtsamkeiten primen den Probanden 6. Mosaik- Test: neu eingef�hrt wurde die Kategorie des Drehfehlers der Pb kann das Muster bis zu 30 Grad drehen und trotzdem die Gesamtpunktzahl erreichen warum 30 Grad, wird nicht erkl�rt 4. Bilderordnen: unn�tige Distraktoren st�ren den Probleml�seprozess einige Unachtsamkeiten primen den Probanden 6. Mosaik- Test: neu eingef�hrt wurde die Kategorie des Drehfehlers der Pb kann das Muster bis zu 30 Grad drehen und trotzdem die Gesamtpunktzahl erreichen warum 30 Grad, wird nicht erkl�rt

52. Kritik/5 9. Allgemeines Verst�ndnis: Fragestellung- Problematik �Warum muss man Steuern zahlen?� �Wozu werden Steuereinnahmen gebraucht?� �Warum gibt es ein gesetzliches Arbeitsverbot f�r Kinder?� 9. Allgemeines Verst�ndnis: Fragestellung- Problematik Item 5: �Warum muss man Steuern zahlen?� wer hier den Grund nennt, nach dem eindeutig gefragt ist, also die zweifelsohne richtige Antwort �Weil es ein Gesetz ist.� erh�lt 0 Punkte eine Antwort auf die gar nicht gestellte Frage �Wozu werden Steuereinnahmen gebraucht?� dagegen bringt die volle Punktzahl (2 Punkte) Item 7: �Warum gibt es ein gesetzliches Arbeitsverbot f�r Kinder?� (2 Antworten werden erfragt) antwortet man auf die Frage �Das Kind wird zu schlecht bezahlt und macht au�erdem den Erwachsenen Konkurrenz auf dem Arbeitsmarkt.�, erh�lt man die volle Punktzahl (!) die Aussage �Kinderarbeit kann zu k�rperlichen und seelischen Entwicklungssch�den f�hren� wird als 1-Punkt- Antwort klassifiziert also ist die Auswertungsobjektivit�t mangelhaft 9. Allgemeines Verst�ndnis: Fragestellung- Problematik Item 5: �Warum muss man Steuern zahlen?� wer hier den Grund nennt, nach dem eindeutig gefragt ist, also die zweifelsohne richtige Antwort �Weil es ein Gesetz ist.� erh�lt 0 Punkte eine Antwort auf die gar nicht gestellte Frage �Wozu werden Steuereinnahmen gebraucht?� dagegen bringt die volle Punktzahl (2 Punkte) Item 7: �Warum gibt es ein gesetzliches Arbeitsverbot f�r Kinder?� (2 Antworten werden erfragt) antwortet man auf die Frage �Das Kind wird zu schlecht bezahlt und macht au�erdem den Erwachsenen Konkurrenz auf dem Arbeitsmarkt.�, erh�lt man die volle Punktzahl (!) die Aussage �Kinderarbeit kann zu k�rperlichen und seelischen Entwicklungssch�den f�hren� wird als 1-Punkt- Antwort klassifiziert also ist die Auswertungsobjektivit�t mangelhaft

53. Kritik/6 11. Gemeinsamkeiten finden: 'darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennsch�rfe besagt, dass die ansonsten in diesem Untertest �Guten� dieser irrigen Auffassung sind?� Dilemma der theoriegeleitete Testkonstruktion 11. Gemeinsamkeiten finden: Gemeinsamkeit von Apfelsine und Banane anerkannt wird u.a. �Baumobst�, was falsch ist, denn Bananen wachsen nun mal nicht auf B�umen darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennsch�rfe besagt, dass die ansonsten in diesem Untertest �Guten� dieser irrigen Auffassung sind? man steht damit vor dem klassischen Dilemma einer theoriegeleiteten Testkonstruktion einerseits der psychologisch schl�ssigen Operationalisierung dessen, was sprachliches Abstraktionsverm�gen sei und der Konfrontation dieser �berlegungen mit empirisch erhobenen Daten, andererseits der Einsicht, dass das Verhaftetsein in einer offensichtlichen Fehlvorstellung von biologisches Gegebenheiten als Mitindiz f�r ein �berdurchschnittlich ausgepr�gtes sprachliches Abstraktionsverm�gen herangezogen werden kann es gibt also S�tze, �ber deren Richtigkeit sich unschwer Konsens herstellen l�sst sie lassen sich nicht per Mehrheitsbeschluss von �richtig� in �falsch� umdefinieren es muss allerdings immer klar definiert sein, was unter dem mittels eines Verfahrens zu messenden Konstrukts zu verstehen sei und was die im Sinne dieses Konstrukts �richtigen� Antworten sind11. Gemeinsamkeiten finden: Gemeinsamkeit von Apfelsine und Banane anerkannt wird u.a. �Baumobst�, was falsch ist, denn Bananen wachsen nun mal nicht auf B�umen darf, soll oder muss man eine falsche Antwort dann als richtig anerkennen, wenn die Trennsch�rfe besagt, dass die ansonsten in diesem Untertest �Guten� dieser irrigen Auffassung sind? man steht damit vor dem klassischen Dilemma einer theoriegeleiteten Testkonstruktion einerseits der psychologisch schl�ssigen Operationalisierung dessen, was sprachliches Abstraktionsverm�gen sei und der Konfrontation dieser �berlegungen mit empirisch erhobenen Daten, andererseits der Einsicht, dass das Verhaftetsein in einer offensichtlichen Fehlvorstellung von biologisches Gegebenheiten als Mitindiz f�r ein �berdurchschnittlich ausgepr�gtes sprachliches Abstraktionsverm�gen herangezogen werden kann es gibt also S�tze, �ber deren Richtigkeit sich unschwer Konsens herstellen l�sst sie lassen sich nicht per Mehrheitsbeschluss von �richtig� in �falsch� umdefinieren es muss allerdings immer klar definiert sein, was unter dem mittels eines Verfahrens zu messenden Konstrukts zu verstehen sei und was die im Sinne dieses Konstrukts �richtigen� Antworten sind

54. Fazit HAWIE-R: l�ngst f�llige Verbesserung des praktisch bew�hrten Tests HAWIE N�tzlichkeit des HAWIE-R steht au�er Frage globale Absch�tzung des Intelligenzstatus f�r die klinische Einzelfalluntersuchung konkurrenzlos Fazit der HAWIE-R stellt gegen�ber dem HAWIE eine bereits l�ngst f�llige Verbesserung eines praktisch bew�hrten Tests dar die N�tzlichkeit des HAWIE-R steht au�er Frage allerdings gestattet er lediglich eine globale Absch�tzung des Intelligenzstatus� durch Vorgabe m�glichst unterschiedlicher Aufgaben, die nach der Theorie von WECHSLER eine Vorhersage intelligenten Alltagsverhaltens zulassen soll der �berzeugende Beweis f�r diese Behauptung ist aber immer noch nicht erbracht davon abgesehen sollten Profilinterpretationen nur bei sehr massiven Untertestdifferenzen gegeben werden trotz der aufgezeigten M�ngel bleibt der HAWIE-R f�r die klinische Einzelfalluntersuchung Erwachsener und wegen seiner internationalen Verbreitung f�r die klinisch-psychologische Forschung gegenw�rtig konkurrenzlos Fazit der HAWIE-R stellt gegen�ber dem HAWIE eine bereits l�ngst f�llige Verbesserung eines praktisch bew�hrten Tests dar die N�tzlichkeit des HAWIE-R steht au�er Frage allerdings gestattet er lediglich eine globale Absch�tzung des Intelligenzstatus� durch Vorgabe m�glichst unterschiedlicher Aufgaben, die nach der Theorie von WECHSLER eine Vorhersage intelligenten Alltagsverhaltens zulassen soll der �berzeugende Beweis f�r diese Behauptung ist aber immer noch nicht erbracht davon abgesehen sollten Profilinterpretationen nur bei sehr massiven Untertestdifferenzen gegeben werden trotz der aufgezeigten M�ngel bleibt der HAWIE-R f�r die klinische Einzelfalluntersuchung Erwachsener und wegen seiner internationalen Verbreitung f�r die klinisch-psychologische Forschung gegenw�rtig konkurrenzlos

55. Vielen Dank f�r die Aufmerksamkeit!

HAWIE-R Hamburg-Wechsler Intelligenztest f r Erwachsene Revision 1991

HAWIE-R Hamburg-Wechsler Intelligenztest f r Erwachsene Revision 1991

Presentation Transcript

R f rences:

R v R (1991) An example of a persuasive precedent.

Unterrichtsveranstaltung f r Pharmaziepraktikanten

Hamburg- Wechsler-Intelligenztest für Erwachsene

a n r o f e r

Freie und Hansestadt Hamburg Institut f r Hygiene und Umwelt Hamburger Landesinstitut f r Lebensmittelsicherheit, Gesund

R. F. Systems

Der Hamburger Wechsler Intelligenztest f r Kinder HAWI-K

VERPACKUNGSMATERIALIEN F R LEBENSMITTEL

Beispiele f r Vorgehensmodelle

Infoabend f r Freiwillige

13 th R ussian F ashion R etail F orum

R I F E F F

1991 r. Państwowy Monitoring Środowiska (PMŚ)

HAWIE-R

R F L P

Hamburg- Wechsler-Intelligenztest für Erwachsene

R F M

F a r m

r-f+1

F L O R

F R O G