之前閱讀有關心理計量特性驗證的文章,看到的是收不同診斷類型的個案,一起分析比較。我先承認之前念的心理計量特性驗證的文章不是很多,但我所看到使用Rasch model的文章,都是同時一起分析多樣不同類型,或許讓我一直處於要收多樣化的個案。
現在雖然知道同一個評估工具需針對同一族群做心理計量特性驗證的文章,但卻仍無法說服自己。上星期六問李晏此疑惑,她的回應為,不同族群有不同特性,所驗證的結果也不一樣。例如:A族群的短期記憶力較差,但長期記憶較好,B族群的短期記憶較好,但工作記憶較差,使用一樣的評估工具測量,得出的驗證結果會不一樣(如下的簡圖)。
我現在想,同一評估工具針對不同族群,信度結果應該不會差太多,因為旨在驗證工作的穩定性,例如:inter-rater reliability,目的在看施測者間的測量是否一致,sample只是工具,不同族群應該不致於影響施測者間有太大的差異。但同一評估工具針對不同族群,在效度和反應性結果應該會有不一樣的結果。我這樣的想法對嗎??
In theory, psychometric properties are sample dependent. However, empirical evidence talks.
回覆刪除