2012年11月30日 星期五

義大研究進度 (11/29)

FDTCPDT再測研究
人數統計
11/19-11/29
累計
完成第一次評估
0
42*
完成第二次評估
1
39


*完成第一次評估後,有二位受測者因間隔時間超過二週,所以沒有進行第二次施測。

二位施測者於第二次施測之人數分配
A施測者:評估21
B施測者:評估18

2012年11月29日 星期四

Comments in the writing course (11/27)


一、寫作通則
(一)、架構
     1. 第一句為此段的主題述求 (topic sentence),中間為論述結果,最後一句話為臨床應用。(Patrice)
     2. 結論只要呈現主要目的之結果,間接的結果在討論中描述。(En-Chi)
     3. 標準要簡單清楚,論文才能表達清楚。例如:CFA指標數值已是低標,數值偏向不符合,整個trend是不符合,不須刻意再加入其它傾向正面的解釋。(En-Chi)
     4. 寫作立場不能反覆,例如:...except baseline severity of motor impairment, whether the other clinical variables... remain inconclusive. 此處先是說conclusive後來又說inconclusive,反覆不定。(Karine)

(二)、前言部分
     1.  寫作須簡單明瞭,例如:前言須說清楚是結果不確定,還是方法不確定才不確定所發現之結果。(Karine)
     2. 前言要探討的問題是不確定的。(Karine)
     3. 從結果和賣點來寫前言。(Karine)

(三)、方法部分
     1. 在步驟部分,是否已包括所有重要的資料,別人可以重覆此研究。例如:是否已包括以下內容,rater從哪裡來,如何分配,標準話情境下施測,一個是interview,一個是performance-based評分。(Jenny)
     2. 數值要精確,標準在哪裡就在哪裡。例如:>0.9,0.9就不符合標準。(Jenny)
     3. 不同分析方法,須分開段落書寫,寫作沒有段落的限制。(Jenny)

(四)、討論部分
     1. "相關"和"影響"是有距離,使用相關之結果解釋成影響,會過度解釋意義。(Patrice)
     2. 讀者在討論部分可能很難連接到方法部分的描述,所以在討論部分須再提出重點描述,以協助讀者連接。例如:讀者對perceived difficulty不是很瞭解,須在討論部分再提,以提醒讀者其意。(Patrice)

二、寫作細節
(一)、語句
     1. construct是個概念,不是項目或工具,應改用"subscale"。(Jenny)
     2. 語句不要太長,2行之內要結束。(Jenny)
     3. "The raters reviewed the literature describing the ADL...",藉由閱讀文獻以訓練使用工具之方式,此意義有限,文獻很廣泛。須思考如何提升rater間之施測品質。(Jenny)
     4. 語句不清楚,例如:the results of the CFA analysis showed... could not be summed up,此處不清楚,為何不能被加總? 須說明概念,因為不是單向度,因此不能加總。(En-Chi)

三、口頭報告建議
(一)、ppt製作
     1. 字顏色對比要明顯。(Patrice)
     2. 寫重點,字不須太多,只須寫簡單句子。字句超過3行,聽眾就不會follow。抓住主要概念和詞彙。(En-Chi, Jenny)
     3. 面對聽眾,free talking。(Patrice)

四、學習要點
(一)、要問對問題,才能找對好的答案和獲得幫助。不能問關鍵性問題,寫論文也不會抓到重點。
(二)、沒說明背景,無法討論。(Jenny)
(三)、問題沒解決,要追根究底,問問題的人不能期待別人把答案寫好。
(四)、須學習之二層面:1. 內容概念須清楚,且深刻。2. 邏輯清楚(表達能力,包括寫作和講話)。

五、研究題材
(一)、研究東西好不好,是否可有一系列之研究 (內容可否長期累積)。

2012年11月28日 星期三

生態效度之效標工具

生態效度之定義:生態效度為分析受測者之評估表現與真實環境下表現之相關性。驗證方法為欲驗證之評估工具與效標 (ADL或outcome measure評估工具)之相關性。

過去文獻,驗證生態效度使用之效標工具有二種類型:(1) 回到工作之能力 (return to work)。(2) 日常生活功能 (ADL)。

目前台灣精神科領域常用之ADL評估工具為日常生活評量表第三版 (ADLRS-III),但此工具之建構效度不好,其10個面向加總不能代表患者ADL能力。

根據范 (2009)1之精神障礙者就業者評量工具之文獻回顧,從其所提及之工作評量相關工具中,找到有三個已發展之中文版評估工具,包括:工作相關自我效能量表 (Work-related Self-efficacy Scale, WSS-37)、工作行為量表 (Work Behavior Inventory, WBI)、特定任務自我效能量表 (Task-Specific Self Efficacy Scale for people with mental illness, TSSES-PMI)。此三個評估工具介紹如Table 1。

我的博士論文欲驗證所發展之區辨型執行功能評估工具之生態效度,目前欲選擇之效標工具為WSS-37中文版或TSSES-PMI,理由為此二個工具可測量精神病患尚未進入職場時,其是否瞭解自己回到工作時所須之能力。
不選擇WBI之理由為未必能實際觀察到患者從事工作之狀況,且謝 (2007)提及雖有操作手冊,但須經過解說和討論才能讓施測者清楚瞭解。

Table 1
工具
測量內容
心理計量特性
WSS-37
WSS-37為測量精神分裂症患者工作相關自我效能感,包括四個層面:生涯規劃技巧、工作安全技巧、工作相關社交技巧、一般工作技巧。原版共37題,會談測量方式。
(2010)之碩士論文,翻譯且驗證中文版,共28題,自填方式,11點量表 (0-10),總分範圍為0-280分。中文版分成四個因素,包括:職業準備技巧的信心、實際面臨工作及保護自我權益的信心、自我了解與社交技巧的信心、求職技巧的信心。
原版之心理計量特性:有良好之內在一致性和建構效度。2
中文版之心理計量特性 (樣本為精神分裂症和情感性精神疾患):內容效度;Crobach’s alpha =0.91-0.95;再測信度,整體量表r=0.99EFA分成四個因素;收斂效度為中度相關 (r=0.49)3
WBI
WBI為情境評量工具,測量個案之工作行為表現。評量方式為於工作情境中觀察個案,且與督導會談,以給予評分。五點量表 (1-5),量表將工作能力分成五個面向:社會行為、合作性、工作習慣、工作品質、個人表現。每個面向有七題,最後一題為評量整體工作行為,共36題。
(2007)之碩士論文,翻譯且驗證中文版,共36 (同原版題數和內容)
原版之心理計量特性:Crobach’s alpha =0.85-0.95;收斂效度為中度相關。4
中文版之心理計量特性 (樣本為精神分裂症、情感性精神分裂、憂鬱症):專家效度;Crobach’s alpha =0.89-0.94;施測者間信度 r=0.71-0.87;再測信度 r=0.85-0.94;區辨效度 (支持性vs.庇護性);收斂效度低度到中度相關 (r=0.38-0.65)5
TSSES-PMI
TSSES-PMI為評量精神病患之工作相關自我效能感,共35題,6點計分 (1-6),自填量表
樣本來自台灣和香港,包括精神分裂症和情感性精神疾患。EFA結果分成四個因素:symptom management skills, work-related skills, helping-seeking skills, emotional self-regulation skills.6


參考文獻

1.     范珈維, 潘璦琬. 使用人類職能模式探討精神障礙者就業能力評量工具之評量向度--文獻回顧. 臺灣職能治療研究與實務雜誌 2009;5(1):51-64.
2.     Waghorn G, Chant D, King R. Work-related self-efficacy among community residents with psychiatric disabilities. Psychiatr Rehabil J 2005;29(2):105-13.
3.     李書棻. 工作自我效能量表之編製及信效度研究. 台北: 國立台灣師範大學; 2010.
4.     Bryson G, Bell MD, Lysaker P, Zito W. The Work Behavior Inventory: A scale for the assessment of work behavior for people with severe mental illness. Psychiatric Rehabilitation Journal 1997;20(4):47-55.
5.     謝美惠. 慢性精神病患者工作行為量表 (WBI)中文化之信效度研究. 高雄: 國立高雄師範大學; 2007.
6.     Chou CC, Cardoso Eda S, Chan F, Tsang HW, Wu M. Development and psychometric validation of the Task-Specific Self-Efficacy Scale for Chinese people with mental illness. Int J Rehabil Res 2007;30(4):261-71.

2012年11月26日 星期一

11/26~11/30 預定進度

任務
預定完成日
1. 準備11/27論文寫作課
11/27
2. 修改博士論文大綱
11/30
3.  ADLRS-III論文撰寫與修改
12/14
4. 製作博士論文海報
12/21
5. 更新義大治療師評估之結果
11/30

2012年11月25日 星期日

CPDT硬體、軟體設備

針對CPDT電腦測驗工具
問題一:電腦螢幕大小會造成什麼影響
回覆:電腦螢幕大小會影響CPDT圓圈的大小,即圓圈大小會隨著螢幕大小而改變。因為測試方法為使用手指點選電腦螢幕,假若手指較大,但圓圈較小,手指會蓋住圓圈,受測者則不易看到圓圈反白變色。
            目前所使用的觸控螢幕為20"-23" (為恭所使用之螢幕為20",台大所使用之螢幕為23"、義大所使用之螢幕為22")。為恭醫院目前使用狀況顯示,圓圈大小適當,手指不會蓋住圓圈,且可以看到圓圈反白變色。

問題二:增加聲音會造成什麼影響
回覆:增加聲音或許可以提醒受測者有確實點到圓圈 (聽覺迴饋)。在CPDT中已有視覺迴饋 (圓圈顏色反白),但受測者可能會忘記或未注意要等到圓圈反白後才點選下一個圓圈,增加聽覺迴饋後,或許可以多一個提醒,但不完全確保受測者就會記得或要注意聽到聲音後才能點選下一個圓圈。
             原本之魏式記憶測驗之空間記憶廣度測驗,並未有視覺迴饋和聽覺迴饋,受測者直接點不規則之方塊位置,施測者要注意受測者是否所點的順序是否正確。而CPDT已多增加視覺迴饋。我的想法是應改善CPDT軟體或觸控螢幕,能否明確地記錄受測者所點選的位置和順序,已增加電腦所獲得結果的正確度。
             之前台大研究及目前義大研究之CPDT使用,都沒有聽覺迴饋。

2012年11月24日 星期六

發展區辨型EF評估工具之理由

我的博士論文為發展具有區辨力之執行功能 (executive functions, EF)表現型評估工具 (performance-based assessment),目前具有指標分數代表EF能力之表現型評估工具有三個,包括EFPT、MET、EFRT。於過去研究,此三個評估工具區辨力的驗證顯示EFPT可區分急性和慢性精神分裂症患者,MET和EFRT未有區辨力之驗證,但MET題目較難,可能有會floor effect,難以區辨EF能力差之受測者此二個工具的是否具有區辨力,須進一步之驗證。Table 1 呈現評估工具於精神分裂症之整理比較。

評估工具是否合適翻譯使用於台灣精神分裂症患者須考慮之因素有三:(一)、工具項目內容是否適用於台灣文化,此三個EF表現型評估工具之部分項目具備文化或環境特性,不適於國人使用,例如:EFPT須煮燕麥粥、MET須在醫院裡購買郵票、EFRT須到學校找辦公室等。(二)、理論架構,此三個評估工具未有提及依據特定EF理論發展,未能確認評量哪些EF能力,例如:MET使用total error score表示受測者之EF能力,不確定此為測量哪個EF能力。(三)、普及性,此些工具於研究或臨床上尚未普遍應用於測量精神分裂症患者之EF能力。因此,此些工具不適當翻譯此些工具應用於台灣之精神分裂症患者。須發展適於國人使用之EF評估工具。

綜合以上結果,欲使用具有區辨力之EF評估工具測量台灣精神分裂症的EF能力,不適於直接翻譯使用國外已發展之EF評估工具。

Table 1
評估工具
依據執行理論而發展
應用於精神分裂症患者之文獻篇數
於精神分裂症患者心理計量特性
項目內容是否適合使用於台灣
Executive Function Performance Test (EFPT)
未有文獻提及此工具是依EF理論而發展
0
Schizophrenia with acute and chronic stage: Cronbach’s alpha= 0.88; discriminative validity (acute vs. chronic); convergent validity (correlation with the Behavioral Assessment of the Dysexecutive Syndome profile = 0.43-0.76)1
煮燕麥粥、從藥灌中拿藥 (須準備有病患名字的藥瓶)等不合適於台灣使用
Multiple Errands Test (MET)
未有文獻提及此工具是依EF理論而發展
0
0
醫院版本-提供醫院地圖,須於醫院裡購買郵票、生日卡、可口可樂,此不容易於台灣醫院裡都可以買到。
賣場版本-須帶病患到賣場中施測,不容易執行。
題目過於太難,患者可能不願執行 (high drop-out rate)
Executive Function Route Finding Task (EFRT)
未有文獻提及此工具是依EF理論而發展
0
0
項目為校園裡找到某一個辦公室,此不適合於台灣臨床進行。


參考文獻
1.     Katz N, Tadmor I, Felzen B, Hartman-Maeir A. Validity of the executive function performance test in individauls with schozophrenia. OTJR: Occupation, Participation and Health 2007;27(2):44-51.

2012年11月22日 星期四

發展區辨型EF評估工具之意義和方法

評估工具之區辨功能,意指在沒有外在效標下,工具在同一個面向中可以區辨不同個案或不同群體間的功能狀況。例如:執行功能(Executive function, EF)評估工具可以區辨不同精神分裂症個案或群體之EF能力。
Definition of discriminative index: A discriminitive index is used to distinguish between individuals or groups on an underlying dimension when no external criterion or gold standard is available for validating these measures (Kirshner & Guyatt, 1985).

參考Kirshner & Guyatt (1985),區辨型評估工具需要之先決條件:
1. 須具有良好之再測信度。
2. 為單向度。

我的博士論文欲發展區辨型EF評估工具,所發展之區辨型EF評估工具可以區辨不同精神分裂症群體間之EF能力,例如:評估工具可將精神分裂症群體之EF能力分成三類,輕度、中度、重度。區辨型EF評估工具可幫助臨床和研究人員解讀評估結果及掌握患者之不同EF失能程度。
驗證區辨力的方法為使用Rasch analysis之person ability index (PSI),PSI最低標準值為2.0 (Vianya-Estopa, Elliott, & Barrett, 2010),可將患者區分三個群體 (輕度、中度、重度)。
由PSI計算可分成幾個群體的公式:number of person strata= (4G +1)/3, G=PSI (Fisher Jr., 1992)

參考文獻
Fisher Jr., W. P. (1992). Reliability statistics. Rasch measurement transactions, 6, 238.
Kirshner, B., & Guyatt, G. (1985). A methodological framework for assessing health indices. Journal of Chronic Diseases, 38(1), 27-36.
Vianya-Estopa, M., Elliott, D. B., & Barrett, B. T. (2010). An evaluation of the Amblyopia and Strabismus Questionnaire using Rasch analysis. Investigative ophthalmology and visual science, 51(5), 2496-2503. doi: 10.1167/iovs.09-4381

為恭研究進度 (11/21)

聯絡余治療師,確認其安裝於20吋觸控電腦螢幕後之狀況:

問題一:在測試過程中是否有當機的問題?
回覆:沒有。

問題二:是否在點選圓圈時,手指蓋住圓圈而看不到圓圈?
回覆:不會。目前觸控電腦螢幕尺吋 (20")比之前的筆電尺吋 (12")大,使用手指點選時,可以清楚看到圓圈,也可以看到圓圈反白變色。

問題三:是否可讀取數據 (施測結果)?
回覆:11/16時回覆無法讀取數據。
            11/21已協助余治療師找出無法讀取數據的問題,目前已可以讀取數據。在施測時,必須是以"系統管理員"的身份開啟CPDT,才能讀取數據。

問題四:電腦觸控敏感度狀況?
回覆:目前電腦觸控敏感度狀況佳。但假如受測者點選圓圈速度太快時 (現在受測者都為科內治療師),即使電腦觸控敏感度狀況佳,電腦仍會遺漏讀取受測者已點選的圓圈。
            點選圓圈後必須等到圓圈反白變色,電腦才會讀取。當圓圈無變色時點選下一個圓圈,電腦沒有讀取到,即使點選圓圈的位置和順序是正確的,電腦的結果會顯示答錯此題。
            我的猜測:或許可以設定軟體讀取的速度加快,即圓圈與圓圈之間相隔時間變短,以改善受測者點選圓圈速度快但圓圈無反白變色的問題。
            思考:臨床病患的點選圓圈的速度 (反應速度)會很快嗎? 假如不會的話,應該就沒有必要改軟體。

問題五:能否在施測中途停止整個測驗?
回覆:目前版本並無設定施測中途離開測驗,必須做完全程測驗才能離開。但可以啟動工作管理員 (Ctrl+Alt+Delete)以結束軟體。必須要關閉main.iv和application二個檔案,才能完整結束CPDT運作。只有關閉main.iv檔,無法直接再次開啟CPDT,需要重新開機才能再次開啟CPDT。

2012年11月21日 星期三

統計諮詢 (11/19)

諮詢主題
1. 釐清4CFA指標意義,包括:χ2/df CFITLIRMSEA
2. 影響CFA指標分數的原因。
3. 釐清估計法,包括:ADFWLSULSML之不同及使用情況。
4. 釐清什麼是polychoric correlation
5. 確認CFA如何驗證單向度。
6. 瞭解CR信度(construct reliability)
諮詢時間
101/11/18 7:30AM-9:30AM, 10AM-10:30AM (skype)
諮詢內容彙整
對此主題的未知概念
諮詢後釐清的概念
1. 為何會有些指標符合判定標準,但其它指標卻不符合?另為何刪除因素負荷量低的項目後,RMSEA卻變差?
χ2/df 卡方值為預期正確模式的幾倍。卡方值與預期正確模式之差距越小,則比值越靠近1,即越接近預期正確模式。
CFITLI:不好的模式到好模式進步多少 (非與好模式比較,而是可進步多少才到達好模式)。例如:CFI=0.8 表示已進步80分,分數越高,則越接近好的模式。
RMSEA:目前模式與好模式的差異度,與好模式比較。項目數越少,RMSEA並不會變越好。RMSEA可計算區間估計值,區間估計值包括判定標準,表示為可接受之模式。
2. 知道此4個指標都為不受樣本數多寡的影響,有什麼原因會影響CFA指標?
影響CFA指標分數之主要原因有三:
1. 分配:項目分數非常態分配,會影響CFA指標值。非常態分配時,會高估χ2/df  RMSEA,會低估CFITLI
2. 模型複雜度:看NQ (N:人數;Q:參數)。最低的標準為51 (人數:參數),但此比例無法確定是否為卡方分配。其它標準為201501
3. 樣本數:雖然此4個指標在理論上是不會受到樣本數的影響 (其公式中計算有考慮到樣本數影響),但實際上會受到影響,因為卡方分配會受到樣本數影響。樣本數越大越趨近卡方分配。
3. 我所知ML為多元常態分配且連續變項時使用。ULS為不具分配假設,可用於ordinal score,但無法使用適配度指標。WLS為不具分配假設,可用於ordinal score,但且可使用適配度指標。Robust ML為非常態分配時使用。
不確定自己的概念是否正確。
沒有一個估計方法是針對likert type scale做的,所以並非分ordinals scoreinterval score之狀況下使用。
ML為多元常態分配時,進行卡方分配。
WLS為加權估計法。
ADF-WLSWLS之一種特定加權方法,不需於多元常態分配下,可進行卡方分配。但此方法需要大樣本(人數:參數=1001)。因此使用此方法的樣本數多為上千筆資料。
ULSWLS的一種不加權方法。在多元常態分配時,會等於ML。非多元常態分配時,永遠不會是卡方分配,不做任何檢定。
Robust ML為在非多元常態分配時使用。於AMOS中無法使用robust ML估計法。於Lisrel中可使用robust ML估計法,須要先在PRELIS上算出AC矩陣和共變矩陣,以此二個矩陣輸出至Lisrel中分析。
4. 我只知polychoric correlation是相關分析,但不知其含意
polychoric correlation為假設所分析之特質為常態分配,想瞭解特質之相關。例如:有2個項目都為2點量尺,項目數值非為常態分配,但假設每個項目所測量之特質為常態分配,則會使用polychoric correlation
5. 目前使用CFA指標與factor loading來驗證單向度。此概念是否正確?
驗證單向度主要是看CFA指標。factor loading為驗證是否為因素之indicator。當factor loading小時,表示誤差大,誤差可能為有別的因素。
依據Hair (2010)書上所提:The size of the factor loading is one important consideration. In the case of high convergent validity, high loadings on a factor would indicate that they converge on a common point, the latent construct.此處說明為使用factor loading數值驗證是否此些項目是否單向度。
6. CR信度值是否為一般所指之Cronbach’s alpha?
Cronbach’s alpha為假設因素對每個項目的影響是固定的,即每個項目之factor loading值都一樣。但CR信度為建構信度,為假設每個項目factor loading非固定。
CR=0.7表示可解釋70%的變異。但CR值高非表示model可以解釋data
信度不好,效度一定不好。信度好,效度也不一定會好。