每日每周定期文獻survey原文書 吸取精華再還書,累積起來就很有用
參考文獻理想比重 中:英:網路= 6:3:1
教育研究很多從經驗上,如迷思概念、
開發了工具後,常產生典範的移轉,如GS合作學習的工具平台
文章裡面會談到新的工具、新的理論、過去經驗
改掉其中的變項,便是一篇論文
書本往往比較經得起考驗,如杜威的理論、心理學的理論
期刊雜誌常常是新的情境變化
網路或研討會的新知吸收
是三種文獻研討來源
可以操弄改變的項目:變項
T檢定:拿兩個東西來對比,看看有沒有太大的差別
現場常常看到的例子是前後測,實驗組、對照組
T test
學生前測考70分,後測考75分,差異5分,
可能是真正的學習提升(教育、學習)或假的考試誤差兩種可能
T檢驗講到的是機率問題,可能為真的學習提升的機率比
統計把誤差: 發生錯誤的機率多大,信心水準多高
看是真正的差別,還是量測上的誤差
測驗與評量領域中提到信度與效度,
碰到三個以上的比較會以單因子變數分析,
有工具的部分:測驗,
測驗的目的在於評量
打棒球每次都打中,打界外球,信度好效度不足
投手每次都投好球,信度高,有時被打全壘打,效度不足
只有工具被評論信效度,才比較適當
有信度不見得有效度
沒有效度,一定沒有信度
準確尺,信度足,但不用心去量,是為效度不足
不準確尺,是為信度不足
自變項、依變項(因、果)
地球自己轉,所以會有白天晚上
依變項又會影響自變項的情形太複雜,不適合做為研究
論文的研究目的常常會揭示自變項與依變項的結構
作業:在加值論文系統或期刊雜誌搜尋摘要中的自變項、依變項
信度與效度
社會研究方法 關秉寅
1、 信度(reliability)與效度(validity)是所有測量的重要議題。兩者都是關心我們所設計的具體指標與這些指標所預測之構念(construct)間的關係。
構念是指將一些觀念,事實或印象有系統的組織起來後,所形成的概念。
2、 信度是指可靠性或一致性。信度好的指標在同樣或類似的條件下重複操作,可以得到一致或穩定的結果。
信度有三種:
n 穩定信度(stability reliability):這是一種長期的信度。也就是指標在不同時間做測量時,可以得到同樣的結果。通常我們是用測試與再測試方法(test-retest method)來檢視一個指標的穩定信度,也就是將同樣的指標對同一群體重新施測,如果每次都得到同樣的結果,則此指標即有穩定信度。
n 代表性信度(representative reliability):代表性信度是橫跨各個次母體或群組的信度。也就是指標用於不同次母體或群組(如年齡、性別)時,可以得到同樣的結果。例如,對年齡的測量,應該是詢問不同年齡層時,都可得到一致性的資訊,不論此指標是正確的問到年齡,還是有同樣方向的偏誤,如以多報少。做次母群體分析(subpopulation analysis)時,除了比較指標使用在不同的次母群體或群組的結果外,還涉及利用其他獨立的資訊,以判斷指標使用在不同群組時所得到的結果是否有同樣的誤差。
n 同等信度(equivalence reliability):同等信度是應用在利用多重指標測量同一構念的情況。我們感興趣的是:是否不同指標能得到一致的測量結果?
研究者常用折半法(the split-half method)來做此種信度的分析。其作法是將測量同一構念的多重指標隨機分成兩組後進行測量,然後判定是否兩組指標得到相同的結果。我們可以用如Cronbach’s α這種統計方法來做此種信度分析。如果多重指標有相當的信度,我們就可利用這些指標來建構量表。
另一種同等信度的特殊分析方法是做編碼者間信度(intercoder reliability)的分析。當我們用多位觀察者、評判者或編碼者時就可用此方法。其目的是檢視不同的觀察者或編碼者是否彼此間的意見一致。
3、如何增進信度
n 明確的概念化:當我們只測量單一構念或構念的一個面向(subdimension),並有清楚的理論定義時,信度就會增加。
n 提升測量尺度的精確性
n 使用多重指標:多重指標能使研究者測量一個構念的廣泛定義內容。這就好像是從概念領域中做抽樣(sampling from the conceptual domain),使研究者能測量到一個構念的不同層面。
n 使用預試(pretests)、前導研究(pilot studies)及重複測試(replication)
5、效度是指概念定義(conceptual definition)及操作化定義(operational definition)間是否契合。因此,當我們說一個指標有效度時,我們是在特定目的及定義的情況下做此判斷。同樣的指標在不同的研究目的下,可能有不同的效度。
測量的效度比信度難達到。因為構念是抽象的,而指標則是具體的觀察。我們對於一個測量是否有效度並無絕對的信心,但可判斷是否比另一測量更有效度。測量的效度有四種類型:
n 表面效度(face validity):這是最容易達成及最基本的效度。此類效度就是由學界來判斷指標是否真的測量到所欲測量到的構念。
n 內容效度(content validity):這是一種特殊的表面效度。此類效度關心的是:是否一個定義的內容都在測量中呈現出來?構念定義包含著想法與概念的「空間」,指標測量應該抽樣到或包含到此空間中所有的想法。內容效度的達成有三個步驟:
─ 說明構念定義的內容
─ 從此定義所包含的區域或部份中做抽樣
─ 發展指標將定義來連結定義的這些部份
n 校標效度(criterion validity):此類效度是用某些標準或校標來精確的指明一個構念。檢視測量指標的這種效度是要將它與測量同一構念且研究者有信心的指標來做比較。這種效度有兩個次類型:
─ 併行效度(concurrent validity):一個指標必須與既存且已被視為有效的指標相關連。
─ 預測效度(predictive validity):一個指標能預測在邏輯上與構念相關的事件。此指標與預測的事件是指向同一構念,但又有區別。這和假設測定不同。假設測定是一個變項預測另一不同的變項。
n 建構效度(construct validity):建構效度(或構念效度)是用於多重指標的測量情況。此類效度也有兩個次類型:
─ 聚合效度(convergent validity):當測量同一構念的多重指標彼此間聚合或有關連時,就有此種效度存在。
─ 區別效度(discriminant validity):此種效度也稱之為分歧效度(divergent validity),與聚合效度相反。此類效度是指當一個構念的多重指標相聚合或呼應時,則這個構念的多重指標也應與其相對立之構念的測量指標有負向相關。例如與「政治容忍」相關的多重指標應會與「政治不容忍」相關的多重指標間有負向相關。
