De flesta personlighetstest innehåller ett flertal skalor, och man har vinnlagt sig om att ha lika många item i varje skala. Detta kan verka rimligt, men vilka konsekvenser får det om de olika domänerna är olika väl sammanhållna? Man finner nämligen att det kan vara högst olika med den saken. En domän som emotionell stabilitet är väl sammanhållen, dvs korrelationerna mellan de olika testuppgifterna är ganska höga och det är ganska lätt att konstruera en reliabel skala med t ex 10 item. Emotionell intelligens är betydligt svårare för testuppgifterna har en tendens att inte korrelera så starkt. Vill man då ha lika hög reliabilitet som för emotionell stabilitet måste man ta med flera testuppgifter i den skalan och kravet med lika många uppgifter i varje delskala kan inte uppfyllas.
Men det finns en frestande utväg som får mig att tänka på gångna tiders Guttmanskalor för attitydmätning. Guttmans krav på en attitydskalla var extremt höga och kunde uppfyllas enbart om man använde frågor som var semantiskt överlappande, alltså mycket lika. Följden blev att skalorna var alldeles för specifika. Samma sak händer med personlighetstest om man väljer uppgifter som är semantiskt överlappande. Likhet och korrelation tenderar ju att gå hand i hand. Skalorna blir snyggt balanserade men validiteten ytterst olika och risken är stor att den blir låg för de skalor som gjorts för att mäta svagt sammanhållna domäner.
Referens
Sjöberg, L. (1980). Similarity and correlation. In E.-D. Lantermann & H. Feger (Eds.), Similarity and choice (pp. 70-87). Bern: Huber. Klicka här.