時間:2023-07-24 09:23:24
緒論:在尋找寫作靈感嗎?愛發(fā)表網(wǎng)為您精選了8篇統(tǒng)計學參數(shù)概念,愿這些內(nèi)容能夠啟迪您的思維,激發(fā)您的創(chuàng)作熱情,歡迎您的閱讀與分享!
大學數(shù)學教學大綱
課程代碼318.009.1編寫時間
課程名稱數(shù)理統(tǒng)計
英文名稱Statistics
學分數(shù)3周學時3+1
任課教師*徐先進開課院系**數(shù)學學院
預(yù)修課程
課程性質(zhì):
本課程為數(shù)學學院本科生開設(shè),是概率論基礎(chǔ)的繼續(xù),介紹數(shù)理統(tǒng)計學的基礎(chǔ)知識。
基本要求和教學目的:
課程基本內(nèi)容簡介:
數(shù)理統(tǒng)計是一門理論研究與數(shù)學實踐相結(jié)合的學科,它區(qū)別于概率論基礎(chǔ)部分,不從概率空間出發(fā),而是考慮如何給隨機現(xiàn)象裝配一個概率空間。
數(shù)理統(tǒng)計學研究數(shù)據(jù)資料的收集、整理、分析和推斷,廣泛地應(yīng)用于社會科學、工程技術(shù)和自然科學中。
教學方式:
教材和教學參考資料:
作者教材名稱出版社出版年月
教材概率論,第二冊,數(shù)理統(tǒng)計(兩分冊)人民教育出版社1979
參考資料陳希孺數(shù)理統(tǒng)計引論科學出版社1981
峁詩松,王靜龍,濮曉龍高等數(shù)理統(tǒng)計高等教育出版社,施普林格出版社1998,2003
J.O.BergerStatisticaldecisiontheoryandBayesionanalysis,2ndedition
中譯本:賈乃光譯,統(tǒng)計決策理論和貝葉斯分析Springer-Verlag,NewYork
中國統(tǒng)計出版社1985
1988
教學內(nèi)容安排:
第一章引論
本章的教學目的是闡述數(shù)理統(tǒng)計學的基本問題,介紹數(shù)理統(tǒng)計學的基本概念。指出了現(xiàn)階段的教學內(nèi)容是研究如何利用一定的資料對所關(guān)心的問題作出盡可能精確可靠的結(jié)論,而不是考慮如何設(shè)計獲得數(shù)據(jù)的試驗。
統(tǒng)計量是從數(shù)據(jù)中提取信息的工具。本章介紹了兩種常用求估計量的方法,介紹了刻畫統(tǒng)計量性能的一致最小方差的概念。
§1統(tǒng)計學的基本問題
§2數(shù)理統(tǒng)計學的基本概念
§3求估計量的兩種常用方法
§4一致最小方差無偏估計
第二章抽樣分布
本章假定待研究的母體服從最常見的正態(tài)分布,導(dǎo)出了常用統(tǒng)計量,,的分布。本章的結(jié)論是對小樣本討論的,由于正態(tài)分布的特殊性,它們也可作為大樣本情形的極限分布。
本章還介紹了與正態(tài)母體相聯(lián)系的柯赫倫定理與費歇定理。
§1正態(tài)母體子樣的線性函數(shù)的分布
§2分布
§3分布和分布
§4正態(tài)母體子樣均值和方差的分布
第三章假設(shè)檢驗(I)
本章的教學目的是讓學生認識到參數(shù)估計、假設(shè)檢驗和區(qū)間估計是針對問題的不同性質(zhì)而作的三種統(tǒng)計推斷,掌握并正確理解顯著性檢驗問題的處理步驟。在本章的執(zhí)行過程中,給出了一些典型的假設(shè)檢驗問題的分析和理解,以幫助學生掌握和運用這一統(tǒng)計思想。
本章介紹了具有一般意義的廣義似然比檢驗。
§1引言
§2正態(tài)母體參數(shù)的檢驗
§3正態(tài)母體參數(shù)的置信區(qū)間
§4多項分布的檢驗
§5廣義似然比檢驗
第四章線性統(tǒng)計推斷
本章主要討論數(shù)理統(tǒng)計學中兩類重要的問題,線性模型和回歸分析,介紹了處理另一類問題的方差分析。在數(shù)學過程中,解釋了在復(fù)雜問題中使用線性模型的合理性,也分析了統(tǒng)計假設(shè)在實際問題中的意義。
在本章的執(zhí)行過程中,比較了回歸分析與線性模型的異同點。
§1最小二乘法
§2回歸分析
§3方差分析
第五章點估計
本章從理論的角度討論了一致最小方差無偏估計的性質(zhì)。介紹了一些尋找一致最小方差無偏估計的方法。
§1最小方差無偏估計
統(tǒng)計學是一門基于試驗數(shù)據(jù)的搜集、整理,對研究目標的統(tǒng)計性質(zhì)進行分析和推斷的學科,更是一門綜合運用數(shù)學科學、計算機科學、信息學等工具學科、并與自然科學、社會科學相結(jié)合的多學科相交叉的邊緣學科。在我國,早期的統(tǒng)計學設(shè)置比較狹隘,多作為數(shù)學學科的概率統(tǒng)計和經(jīng)濟學科的經(jīng)濟統(tǒng)計等子學科。直到 1998年,國家教育部設(shè)立了統(tǒng)計學專業(yè)[1],2011年頒布的《普通高等學校本科專業(yè)目錄》更把統(tǒng)計學提升為一級學科!由此可見,統(tǒng)計學的專業(yè)地位及其重要性得到了廣泛的認可。
與之相反,關(guān)于統(tǒng)計學專業(yè)教學的研究還處于起步階段。相比于其他大類專業(yè)的教學研究,關(guān)于統(tǒng)計專業(yè)教學的教學語言設(shè)計的研究還未得到深入發(fā)展。
教學語言是一類廣義的語言,是教學者與教學對象的多種感官的交流;同時,也是一種人文文化的載體,是一種民族文化的展示。教學語言的設(shè)計,就是通過調(diào)動教學對象的聽覺、視覺、感覺等多方面來實現(xiàn)教學目標。
統(tǒng)計學專業(yè)的教學語言主要包括:口語語言、文字語言、符號語言、圖表語言和肢體語言,本文將從上述五個方面對統(tǒng)計學專業(yè)的教學語言設(shè)計展開討論與研究。
一、充分運用口語語言闡述教學內(nèi)容
口語語言,是教學內(nèi)容闡述的主要載體之一,是師生之間思想、情感交流的主要工具。由于統(tǒng)計學是與自然科學、社會科學相結(jié)合的多學科相交叉的邊緣學科,統(tǒng)計學專業(yè)教學的口語語言與一般教學的口語語言既有聯(lián)系,又有區(qū)別,主要具有以下特點:
1.對于基礎(chǔ)理論的教學,口語語言要準確、規(guī)范
由于統(tǒng)計學的基礎(chǔ)理論主要是基于各種模型,通過邏輯推導(dǎo)來進行分析和推斷,并以高等數(shù)學形式來描述,因此相關(guān)教學的口語語言應(yīng)以標準的數(shù)學口語語言來準確、規(guī)范地闡述相應(yīng)的數(shù)學理論,特別要注意相應(yīng)的模型理論的提出和邏輯關(guān)系的表述、推導(dǎo)等,依此來幫助學生準確地理解、把握統(tǒng)計學的基礎(chǔ)理論; 同時,對復(fù)雜的邏輯關(guān)系及符號含義,要做出準確的表述,幫助學生在有限的課堂教學時間內(nèi)了解、體會相應(yīng)的含義,并能進行熟練、獨立的運用。
2.對于后續(xù)課程的具體教學內(nèi)容,口語語言要親切、生動
在針對特定的知識點的教學過程中,教師要通過口語設(shè)計,把抽象的數(shù)學理論轉(zhuǎn)換為具體的形象感覺,并結(jié)合適當?shù)默F(xiàn)實案例加以說明。特別是抽象的概念,比如隨機過程中“下鞅”、“上鞅”、“鞅”以及“遍歷性”等概念,要努力避免平鋪直敘、照本宣科地進行授課,而是把該概念與日常實例相結(jié)合。
該定理是其后重要結(jié)論的基礎(chǔ),具有重要意義,但其證明太過數(shù)學化,因此在課堂教學中,并不進行證明,而采用簡明的語言來進行說明。對第一個不等式,可以強調(diào)為“在每個樣本點上,取所有隨機變量的最小值,做成一個新的隨機變量,它的均值不會大于所有隨機變量先做平均再取最小的那個值”,即“最小值的期望,小于等于期望的最小值”;從而整個定理敘述為“最小值的期望,小于等于期望的最小值,小于等于期望的最大值,小于等于最大值的期望”。
由此可見,在課堂教學過程中,通過語言設(shè)計來調(diào)動學生的積極性,再結(jié)合語音、語調(diào)、語速等變化來突出重點、強調(diào)難點、控制教學節(jié)奏,可以讓學生更好地理解具體教學內(nèi)容。
二、準確運用文字語言刻畫基本內(nèi)容
文字語言,是教學內(nèi)容可視化的主要載體之一,是學生明確認知教學內(nèi)容的主要途徑。統(tǒng)計學專業(yè)教學的文字語言的“準確性”,應(yīng)具有如下特點:
1.對于基礎(chǔ)理論的教學,注重文字語言的“數(shù)學性”
由于統(tǒng)計學是以數(shù)學理論為基礎(chǔ)的,因此,文字語言要符合數(shù)學描述的一般要求;同時,也要注重結(jié)合教學目的,進行適當?shù)恼{(diào)整來強調(diào)重點。
比如,統(tǒng)計量的定義:“設(shè)x1,x2,…,xn為取自某總體的樣本,若樣本函數(shù)T=Tx1,x2,…,xn中不含有任何未知參數(shù),則稱T為統(tǒng)計量”。在該定義中,應(yīng)當注意三個非常重要的細節(jié):“x1,x2,…,xn”、“任何”和“未知”。如果在教學過程中,不強調(diào)這幾個細節(jié),就可能忽略了小標“n”這個已知參數(shù),從而產(chǎn)生對統(tǒng)計量概念的混淆,影響對統(tǒng)計量“樣本均值”的認識。
2.對于后續(xù)課程的案例教學,強調(diào)文字語言的“概括性”
統(tǒng)計學處理的是實際的、非數(shù)學的對象,特別是一些來自社會經(jīng)濟活動的、真實物理環(huán)境的或現(xiàn)實遺傳學科的具體實例。此時的文字語言,不僅要具有抽象性,拋棄不必要、不相關(guān)的、過多的背景描述,還要樸實易懂,最大限度地概括試驗的理論背景、數(shù)據(jù)的研究意義。其意義在于,既利于學生理解研究的問題,明確研究的目標,同時也為學生的思考留出相應(yīng)的空間。
三、簡明地運用符號語言,壓縮復(fù)雜意義
符號,是一些基本概念、基本性質(zhì)、運算法則的縮寫;符號語言,就是利用基本符號,以簡單、明確和形式化的方式來簡化復(fù)雜關(guān)系及大量文字性描述。在形式上,符號語言可以簡化計算和推理過程,明確其中的邏輯過程,展現(xiàn)其抽象性;在意義上,通過結(jié)合具體試驗背景,符號語言精練了相關(guān)信息的描述,體現(xiàn)其簡潔性。由此可見,符號語言對相應(yīng)學科的發(fā)展、傳播和普及都有重要的推動作用。
對統(tǒng)計學專業(yè)而言,其基礎(chǔ)理論部分的符號語言基本與高等數(shù)學的符號語言是相似的,因此,在教學過程中,教師要有意識地訓練學生對符號的靈活運用,并提及相應(yīng)符號的意義。
對統(tǒng)計專業(yè)低年級學生,教師要通過符號語言的設(shè)計,消除學生對符號的陌生感,使學生牢固地掌握各類符號的意義,熟練地運用各類符號描述相對復(fù)雜的含義,并將復(fù)雜的文字性描述利用符號來進行簡化描述,進而培養(yǎng)學生利用符號語言來壓縮復(fù)雜意義的能力。
例如,在概率統(tǒng)計中,隨機變量的期望EX是一個重要概念,通過不同的角度可以得到不同形式的符號描述。在符號語言下,概率空間記為Ω,F(xiàn),P,隨機變量記為X,對應(yīng)的密度函數(shù)和分布函數(shù)分別記為px和Fx,從而隨機變量的數(shù)學期望EX有如下表述記為
其中,EX是數(shù)學期望(expectation)的符號,第一個等式為實空間R中的數(shù)學期望描述,這是一般概率論中的結(jié)論;第二個等式為實空間中的一般隨機變量的數(shù)學期望表達式;第三個等式則為在概率空間Ω,F(xiàn),P中的描述形式,是Riemann-Stieltjes積分,這是在隨機分析范圍下常用的描述方式。因此,在教學過程中,教師應(yīng)強調(diào)上述關(guān)系式的意義及使用范圍。
再如Lindeberg-Levy中心極限定理:設(shè){Xi}∞i=1是相互獨立、同分布的隨機變量序列,且EXi=μ,VarXi=σ2& gt;0都存在;若記Y*n = X1 + X2 + 上述定理中的符號沿襲了高等數(shù)學的符號方式,同時,將σn改寫為nσ2,其目的在于強調(diào)正態(tài)分布關(guān)于參數(shù)μ和σ2的依賴關(guān)系。強調(diào)這種依賴關(guān)系,有利于學生對正態(tài)分布的掌握,進一步明確隨機變量與其特征參數(shù)的關(guān)系,也為后續(xù)其他重要分布和統(tǒng)計量的學習奠定基礎(chǔ)。
對統(tǒng)計學專業(yè)高年級的學生,教師要注意引導(dǎo)學生基于基本符號,在特定的實際問題中,創(chuàng)造性地定義一些新符號,并賦予明確的含義,從而把特定問題進行符號化描述,簡化統(tǒng)計分析、推斷過程。這里需要注意的是,所定義的新符號首先要遵循一般的符號原理與意義,不只是符號的數(shù)學意義,還有在特定問題下的符號意義;其次,滿足問題分析的需要,充分利用特有名詞的縮寫、符號的上、下標等。
比如,在回歸分析中,基于多變量的多項式回歸模型中,因變量y關(guān)于自變量x1,x2的二元二次回歸模型為:y = β0 + β1 x1 + β2 x2 + β11 x21 + β22 x22 + β12 x1 x2 + ε。在該表達式中,β的小標1、2分別代表與變量x1,x2有關(guān),而重復(fù)出現(xiàn)的次數(shù)則表征了相應(yīng)變量的階數(shù)。因此,建議在教學過程中,對該類下表可以進行改進,比如將β12改記為β1,2,即下標中的“12”改為“1,2”,通過添加“,”進一步明晰變量的交互關(guān)系。
四、合理運用圖表語言,明晰基本關(guān)系
圖表語言,是利用圖像、表格等直觀的形象來描述復(fù)雜的概念、關(guān)系以及抽象數(shù)據(jù)所具有的含義。與符號語言的簡潔和抽象相比,圖表語言更具形象、直觀的特性,能記錄數(shù)量變化趨勢、表達變量之間的關(guān)系以及展現(xiàn)概念之間的相關(guān)關(guān)系,因此,在統(tǒng)計學專業(yè)教學中,圖表語言具有非常重要的意義與作用。
1.數(shù)據(jù)圖表,記錄數(shù)量變化趨勢
數(shù)據(jù)圖表,主要是對試驗結(jié)果所獲得的數(shù)據(jù)的形象表達,比如某地區(qū)的生產(chǎn)總值、居民消費額、空氣中污染物含量等具體數(shù)據(jù)的excel表格或柱狀圖,以及對抽象數(shù)據(jù)處理之后所形成的頻數(shù)直方圖、頻率直方圖、盒子圖等。依據(jù)不同的目的,選用不同的數(shù)據(jù)圖表來說明進行統(tǒng)計分析的依據(jù),并掌握進行統(tǒng)計推斷的方向。
2.分析圖表,表達變量之間的關(guān)系
分析圖表,主要是指基于概率論與統(tǒng)計分析所得到的分析結(jié)論的圖表,目的在于展示分析結(jié)論,進而解釋變量關(guān)系。主要包括:(1)教材所附的典型分布的分布表,如正態(tài)分布表、F分布表、t分布表等;(2)數(shù)據(jù)分析表,如回歸分析中所得到的Model Summery、ANVOA、Coefficients等;(3)結(jié)論預(yù)測表,如變量擬合圖、時間序列分析表等。
3.關(guān)系圖表,展現(xiàn)概念之間的相關(guān)關(guān)系
關(guān)系圖表,主要是指為了那些抽象描述多個概念之間的相關(guān)關(guān)系,是對各種概念、方法、思想等的總體描述。從大的角度上講,借助于關(guān)系圖表,學生對統(tǒng)計學的發(fā)展、不同統(tǒng)計思想與方法間的異同等方面,會形成整體認識,常見于導(dǎo)論一類課程。從小的角度上講,通過建立關(guān)系圖表,學生可以進一步區(qū)分具體的概念,深化知識點的理解和運用。
五、巧妙運用肢體語言,深化教學效果
肢體語言,主要是指教師在教學過程中通過動作、姿勢、表情等肢體的動作和變化來傳達教學內(nèi)容、實現(xiàn)教學目的的行為。首先,肢體語言具有形象、生動、操作性強;其次,易于學生的模仿與體會,以形成對抽象概念的形象認識;再次,可以很好地控制教學進程,如加速新課程的引入、教學內(nèi)容的轉(zhuǎn)換等。同時,可以活躍課堂氣氛,調(diào)動學生的積極性,傳遞教師對學生的關(guān)懷。
總之,教學設(shè)計是指為實現(xiàn)教學目標,教師依據(jù)學習原理和教學理論,對各個環(huán)節(jié)進行具體計劃,進而形成完整、有效的教學方案的過程。為了充分、有效地利用課堂教學,教師應(yīng)該運用多種方法和技巧來實現(xiàn)與學生的交流。因此,教學語言的設(shè)計就顯得更為重要。通過不斷地研究與實踐,教師的教學語言設(shè)計能力將會得以豐富和提高,取得事半功倍的效果。
隨著社會的發(fā)展,大數(shù)據(jù)時代的到來,統(tǒng)計思想與技術(shù)日益受到重視,統(tǒng)計人才更是供不應(yīng)求。為更好地培養(yǎng)社會所需的專業(yè)技術(shù)人才,作為統(tǒng)計學專業(yè)的教師,在日常的教學過程中,應(yīng)該深刻地考慮教學語言的設(shè)計,從而更好地實現(xiàn)教學目標,努力做到知識、技術(shù)、思想的傳播,也做到人文關(guān)懷的傳承,培養(yǎng)出一批具有社會責任感的專業(yè)人才。
對專門從事相應(yīng)的統(tǒng)計工作的人來說,有效掌握最基本的統(tǒng)計方式對其發(fā)展有著十分重要的影響意義,并且數(shù)理統(tǒng)計這門學科不同于一般統(tǒng)計形式,數(shù)理統(tǒng)計更加注重應(yīng)用隨機變化的方式。在實際環(huán)境中允許的觀察是非常有限的,因此在數(shù)理統(tǒng)計中占據(jù)的份額非常小。在數(shù)理統(tǒng)計學中僅抽取一部分對象進行觀察研究,這樣就能夠獲取推斷的總體,并且這也是數(shù)理統(tǒng)計中較為基本的方式。數(shù)理統(tǒng)計的研究形式,主要是隨著科學技術(shù)與生產(chǎn)形式發(fā)展逐步擴大的,將其有效概括起來就能夠被分為兩種:一種是研究怎么樣對隨機產(chǎn)生的現(xiàn)象進行觀察實驗,這樣就能夠獲取具有代表性的內(nèi)容,這一部分的內(nèi)容就是描述統(tǒng)計學;另一種就是統(tǒng)計推斷的內(nèi)容,這一部分主要是對已經(jīng)獲取的抽樣內(nèi)容進行整理分析,之后就能夠推測其規(guī)律性,這一部分實際上屬于推斷統(tǒng)計學。推斷統(tǒng)計學的應(yīng)用范圍十分廣泛,其中涉及的概念較為廣泛,并且研究對象是隨機抽取完成的,其應(yīng)用概念較為新穎,不僅涉及各行各業(yè)的發(fā)展問題,并且應(yīng)用的數(shù)學知識較為廣泛,大部分初學者并不能夠找到較好的學習形式以及解決方式,學習起來難度較大,所以,想要有效掌握數(shù)理統(tǒng)計學知識內(nèi)容并不容易。
二、數(shù)理統(tǒng)計學的主要內(nèi)容與研究形式數(shù)理統(tǒng)計學中推斷
統(tǒng)計學內(nèi)容被分為兩個方面內(nèi)容,其中一項就是抽樣分布,在這一部分中首先需要研究抽樣分布,弄清楚抽樣分布的基本概念,也就是總體、樣本以及統(tǒng)計量方面的內(nèi)容。并且推斷統(tǒng)計中常用的分布形態(tài)有t分布、F分布等,后面分布內(nèi)容主要是受到正態(tài)統(tǒng)計影響的,這些內(nèi)容都是隨著變量函數(shù)分布變化的。在抽樣分布狀態(tài)中一定要有效領(lǐng)會它們之間的概念,掌握各種分布曲線狀態(tài)特點,熟練概率分布表的使用;其次,就是統(tǒng)計估值以及假設(shè)檢驗,這一部分內(nèi)容主要是數(shù)理統(tǒng)計學習中重難點問題。并且統(tǒng)計估值主要包含區(qū)間估計與點估計方面的內(nèi)容。假設(shè)檢驗中包含的內(nèi)容較多,就能夠?qū)⑵鋭澐譃榉钦龖B(tài)總體與正態(tài)總體方面的內(nèi)容,就其劃分內(nèi)容包含總體參數(shù)與概率分布方面的內(nèi)容,并且這兩個總體中包含多個總體假設(shè)檢驗,概率檢驗分布也分為不同發(fā)展形勢,從這一點來看,其內(nèi)容較為繁雜,不容易進行改良。但是,在現(xiàn)實生活環(huán)境中,一些隨機現(xiàn)象對應(yīng)產(chǎn)生的隨機變量大多數(shù)都是服從正常分布狀況進行,對于一些不能夠服從正態(tài)分布的隨機變量來說,其對應(yīng)大樣本也能夠依照服從正態(tài)分布狀況進行。
三、總結(jié)
自從Paelinck提出“空間經(jīng)濟計量學”這個術(shù)語,Cliff和Ord(1973,1981)對空間自回歸模型的開拓性工作,發(fā)展出廣泛的模型、參數(shù)估計和檢驗技術(shù),使得經(jīng)濟計量學建模中綜合空間因素變得更加有效。
Anselin(1988)對空間經(jīng)濟計量學進行了系統(tǒng)的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經(jīng)濟計量學的定義是:“在區(qū)域科學模型的統(tǒng)計分析中,研究由空間引起的各種特性的一系列方法?!盇nselin所提到的區(qū)域科學模型,指明確將區(qū)域、位置及空間交互影響綜合在模型中,并且它們的估計及確定也是基于參照地理的(即:截面的或時-空的)數(shù)據(jù),數(shù)據(jù)可能來自于空間上的點,也可能是來自于某個區(qū)域,前者對應(yīng)于經(jīng)緯坐標,后者對應(yīng)于區(qū)域之間的相對位置。
國外近幾年空間經(jīng)濟計量學得以迅速發(fā)展,如Anselin和Florax(1995)指出的,主要得益于以下幾點:
(1)人們對于空間及空間交互影響的作用的重新認識。對空間的重新關(guān)注并不局限于經(jīng)濟學,在其它社會科學中也得以反映。
(2)與地理對應(yīng)的社會經(jīng)濟大型數(shù)據(jù)庫的逐步實用性。在美國以及歐洲,官方統(tǒng)計部門提供的以區(qū)域和地區(qū)為統(tǒng)計單元的大型數(shù)據(jù)庫很容易得到,并且價格低廉。這些數(shù)據(jù)可以進行空前數(shù)量的截面或時空觀測分析,這時,空間(或時空)自相關(guān)可能成為標準而非一種特殊情況。
(3)地理信息系統(tǒng)(GIS)和空間數(shù)據(jù)分析軟件,以高效和低成本的計算技術(shù)處理空間觀測的發(fā)展。GIS的使用,允許地理數(shù)據(jù)的有效存儲、快速恢復(fù)及交互可視化,為空間分析技術(shù)的藝術(shù)化提供了巨大的機會。至少目前線性模型中,缺少針對空間數(shù)據(jù)和空間經(jīng)濟計量學的軟件的情況已經(jīng)大為改觀。目前已有一些專門的空間統(tǒng)計分析軟件,并且SAS、S-PLUS等著名統(tǒng)計軟件中,都已經(jīng)包括用于空間統(tǒng)計分析的模塊。
(二)空間經(jīng)濟計量學與相關(guān)學科的關(guān)系
空間統(tǒng)計學是研究空間問題的另一門學科,它是應(yīng)用數(shù)學的一個快速發(fā)展的分支。它起源于20世紀50年代早期,用以幫助采礦業(yè)進行礦藏量的計算。最早的工作是采礦工程師D.G.Krige和統(tǒng)計學家H.S.Sichel在南非進行的。70年代隨著計算機的普及以及運算速度的大幅提高,空間統(tǒng)計分析技術(shù)逐漸擴展到地球科學的其它領(lǐng)域。目前已經(jīng)普遍存在于需要處理時間上或空間上相關(guān)的數(shù)據(jù)的科技領(lǐng)域中。
空間經(jīng)濟計量學與空間統(tǒng)計學的區(qū)分不太容易。Haining和Anselin的觀點認為空間統(tǒng)計學的研究大多由數(shù)據(jù)驅(qū)動,而空間經(jīng)濟計量學由模型驅(qū)動,即從特定的理論或模型出發(fā),重點放在問題的估計、解釋和檢驗上。空間統(tǒng)計學的主流是研究生態(tài)學和地質(zhì)學中的物質(zhì)現(xiàn)象,空間經(jīng)濟計量學主要研究與區(qū)域及城市經(jīng)濟有關(guān)的模型。有一種觀點認為二者的區(qū)分應(yīng)基于作者將其工作對應(yīng)于空間經(jīng)濟計量學還是空間統(tǒng)計學,這種區(qū)分辦法可能較為簡單。
地質(zhì)統(tǒng)計學(Geostatistics)發(fā)展于20世紀60年代,主要用于研究地質(zhì)學現(xiàn)象的空間結(jié)構(gòu)和進行空間估值。例如,在探礦過程中,通常是在空間上布點進行鉆探,然后對采樣得到的樣品進行分析,估計礦藏的分布和儲量。由于礦藏不開采的話,在時間上結(jié)構(gòu)幾乎是不變的,因此地質(zhì)統(tǒng)計學研究的問題主要是空間相關(guān)??臻g經(jīng)濟計量學所研究的問題不僅存在空間相關(guān),往往所研究的問題在時間上也存在相關(guān)。
在區(qū)域經(jīng)濟學的理論中,人們建立了各種理論以及關(guān)系式來描述人類在空間上的行為,如研究城鎮(zhèn)問題的“引力模型”等。但在利用模型進行定量研究問題的時候,需要將理論或關(guān)系式用數(shù)學模型來進行刻劃,利用統(tǒng)計方法對模型進行估計、檢驗,并進行評價,這些正好是屬于經(jīng)濟計量學研究的范疇。應(yīng)該說,空間經(jīng)濟計量學主要研究區(qū)域經(jīng)濟問題,依據(jù)的是區(qū)域經(jīng)濟學理論,但它還需要綜合數(shù)學,以及空間統(tǒng)計學等學科,因此它不等同于區(qū)域經(jīng)濟學,而是一門交叉學科。
二、研究的問題
空間經(jīng)濟計量學主要研究存在空間效應(yīng)的問題??臻g效應(yīng)主要包括空間相關(guān)和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。
(一)空間相關(guān)
空間相關(guān)指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關(guān),即
附圖
存在空間相關(guān)的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調(diào)查過程中,數(shù)據(jù)的采集與空間中的單位有關(guān),如數(shù)據(jù)是按省、市、縣等統(tǒng)計的,但設(shè)定的空間單位與研究問題不一致,存在測量誤差。
空間相關(guān)不僅意味著空間上的觀測缺乏獨立性,并且意味著潛在于這種空間相關(guān)中的空間結(jié)構(gòu),也就是說空間相關(guān)的強度及模式由絕對位置和相對位置(布局,距離)決定。
對于空間相關(guān),空間自回歸通常是其核心內(nèi)容,空間自回歸模型的一般形式為:
附圖
在這個模型中,β解釋變量X(n×k矩陣)的參數(shù)向量(k×1),ρ是空間滯后相關(guān)變量的參數(shù),λ是殘差空間自回歸(空間AR)結(jié)構(gòu)中的參數(shù)。
W[,1]和W[,2]為n×n矩陣,是標準化或未標準化的空間加權(quán)矩陣,分別對應(yīng)于因變量以及擾動項中的空間自回歸過程,這兩個矩陣可以不同,這意味著兩個過程由不同的空間結(jié)構(gòu)生成。
這個模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。
對這個模型,普通最小二乘估計不僅是有偏的,而且是不一致的,參數(shù)的估計通常采用極大似然估計,近幾年,有學者嘗試采用貝葉斯估計對參數(shù)進行估計。
(二)空間差異性
空間差異性指空間上的區(qū)域缺乏均一性,如存在中心區(qū)和郊區(qū)、先進和后進地區(qū)等。例如,我國沿海地區(qū)和中西部地區(qū)經(jīng)濟存在較大差別。
對于空間差異性,只要將空間單元的特性考慮進去,大多可以用經(jīng)典經(jīng)濟計量學方法解決。但當空間差異性與空間相關(guān)共同存在時,經(jīng)典經(jīng)濟計量學方法不再適用,而且這時問題可能變得非常復(fù)雜,因為這時要區(qū)分空間差異性與空間相關(guān)可能非常困難。
研究空間差異性的模型主要有:
E.Casetti提出的空間擴展模型(1972)和回歸參數(shù)漂移分析方法(簡稱DARP)模型(1982)。這時,空間差異性表現(xiàn)為模型參數(shù)隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴展參數(shù))。
y=Xβ+ε
附圖
模型(3)為以經(jīng)緯坐標(Z[,x],Z[,y])作為擴展參數(shù)的空間擴展模型。同樣可以以到中心區(qū)域的距離作為擴展參數(shù)設(shè)計模型。
將模型(3)的第二個式子右邊加入隨機擾動項,則為DARP模型。E.Casetti(1992)進一步提出了貝葉斯空間擴展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;Martin Charlton(1996),提出地理加權(quán)回歸模型(簡稱GWR模型)。
附圖
(三)時空數(shù)據(jù)空間模型
在模型中考慮時間維增加了描述的復(fù)雜性,但綜合時間空間的模型在實際工作中非常有用。在經(jīng)典的經(jīng)濟計量學模型中,這是綜合截面和時間序列數(shù)據(jù)的情形。如果數(shù)據(jù)不存在空間相關(guān),則可以采用Panel Data模型。Anselin(1988)將似不相關(guān)(SUR)模型擴展到空間的情形,提出空間SUR模型。
三、應(yīng)用前景及需要進一步研究的問題
(一)在中國的應(yīng)用前景
在我國,地質(zhì)統(tǒng)計學是較早應(yīng)用空間統(tǒng)計學的領(lǐng)域,在20世紀80年代中國科學院就有人研究并應(yīng)用Krige模型??臻g統(tǒng)計學除了在地質(zhì)學的研究中發(fā)揮作用,近十年來,周國法、徐汝梅等學者研究生態(tài)學中的空間相互作用,并于1998年出版了《生物地理統(tǒng)計學》。20世紀80年代以來,我國利用衛(wèi)星遙感技術(shù),對土地、森林、農(nóng)業(yè)、礦產(chǎn)、能源、作物估產(chǎn)、災(zāi)患檢測等進行應(yīng)用,開始了我國空間統(tǒng)計學在經(jīng)濟領(lǐng)域應(yīng)用中統(tǒng)計調(diào)查的工作,為了將空間遙感調(diào)查技術(shù)逐步納入到我國統(tǒng)計的常規(guī)性工作中,1998年10月,國家統(tǒng)計局成立了空間統(tǒng)計研究室,并與中國科學院地理所合作,組成了“空間信息多重采樣設(shè)計的空間統(tǒng)計學應(yīng)用研究”課題組,運用遙感技術(shù)和空間分析對我國農(nóng)業(yè)耕地、森林、草地等資源以及城鎮(zhèn)動態(tài)變化進行調(diào)查,該項目獲得國家統(tǒng)計局2000年課題研究一等獎。
在我國地質(zhì)統(tǒng)計學、生物地理統(tǒng)計學及利用遙感技術(shù)進行的各種調(diào)查,都屬于空間統(tǒng)計學的范疇。地質(zhì)統(tǒng)計學、生物地理統(tǒng)計學主要研究空間相關(guān)及空間估值,在生物地理統(tǒng)計學的研究中還包括物種的空間擴散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型。空間動態(tài)采樣的研究,與地質(zhì)礦產(chǎn)調(diào)查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計算等問題的研究,根據(jù)其研究的問題和方法,也可以將其歸入統(tǒng)計學的抽樣調(diào)查分支之中。
隨著我國按地區(qū)進行統(tǒng)計的統(tǒng)計基礎(chǔ)資料不斷積累,尤其是遙感技術(shù)應(yīng)用到統(tǒng)計調(diào)查中來,都將使得按時間和空間排列的數(shù)據(jù)資料極為豐富,對數(shù)據(jù)進行空間甚至時空分析成為可能,人們將逐漸從時間的角度轉(zhuǎn)向普遍從時空的角度來考慮問題。
從經(jīng)濟分析的角度看,空間經(jīng)濟計量學在我國以下幾個方面將有很大的應(yīng)用前景。
由于區(qū)域之間存在相關(guān)性,或者存在差異性,因此一項政策對每個區(qū)域的影響是不同的,通過運用空間經(jīng)濟計量學方法對各區(qū)域進行研究之后,找到政策在各區(qū)域上作用的關(guān)系,對于政府決策、正確制訂政策具有很大的參考價值。
由于區(qū)域之間存在先進地區(qū)和后進地區(qū),通過空間經(jīng)濟計量學方法可以對先進地區(qū)與后進地區(qū)之間的相互關(guān)系進行研究。
按區(qū)域編制投入產(chǎn)出表時,空間的概念將發(fā)揮作用。
對房地產(chǎn)的價值進行評估時,在考慮外界影響因素的基礎(chǔ)上,充分考慮地區(qū)之間的相互關(guān)系,將對正確評估房地產(chǎn)的價值有很大幫助。
對環(huán)境污染進行研究時,運用空間經(jīng)濟計量學方法對污染的傳播方式進行研究,有助于人們對環(huán)境污染進行控制。
在交通領(lǐng)域的研究,可以利用空間經(jīng)濟計量學方法對人員、貨物在空間上的流動方式進行研究,同時對通道上的不同區(qū)段進行研究。
在對某種疾病(如流感)在空間上的傳播過程進行研究之后,對于疾病的預(yù)防控制將有很大的幫助。
建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關(guān)性。而空間抽樣在空間上的布點方式也可以用作商業(yè)網(wǎng)點的布局研究。
總之,只要問題涉及到空間的概念,空間經(jīng)濟計量學就將發(fā)揮其作用。對空間經(jīng)濟計量學的深入研究及應(yīng)用,將促使人們面對問題的時候,從空間或時空的角度思考問題。
(二)需要進一步研究的問題
目前的研究中,系統(tǒng)內(nèi)的空間單元受到系統(tǒng)內(nèi)其它位置單元的影響,但邊界處的單元還受到系統(tǒng)外與之相鄰的單元的影響,如何將這個影響考慮在模型中值得研究。
在具體問題中,距離的概念需要加以認真對待,單用地理上的距離有時并不合適,例如國與國之間的經(jīng)濟聯(lián)系在今天并不是距離遠近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時,如何將貿(mào)易、人員、資金的流動充分考慮到空間加權(quán)矩陣中去,尚值得研究。
貝葉斯方法在統(tǒng)計學各個分支的應(yīng)用越來越廣,空間貝葉斯模型也是目前空間經(jīng)濟計量學研究的熱點之一。
可變單元的問題。當數(shù)據(jù)匯總的級別變化,可能整個模型的描述都發(fā)生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個統(tǒng)一的模式對系統(tǒng)進行描述尚待進一步研究。
時空數(shù)據(jù)的綜合分析,參數(shù)估計的漸近性質(zhì),模型的各種檢驗方法等,還有待進一步的研究。
經(jīng)濟問題中,許多需要研究的對象是多維的,即研究對象是一個向量,如何在空間問題中建立一系列空間VAR模型,尚需研究。
不易獲得較為詳細且價格低廉的區(qū)域統(tǒng)計數(shù)據(jù),將大大限制空間經(jīng)濟計量學模型的應(yīng)用。建立我國區(qū)域統(tǒng)計數(shù)據(jù)庫,要求價格低廉且方便實用,是擺在統(tǒng)計工作者面前的一個重要課題。
【責任編輯】彭非
【參考文獻】
1 Anselin,L.1988.Spatial Econometrics.Methods and Models,Dordrecht Kluwer Academic
Publishers.
2 Anselin,L.and R.J.G.M.Florax ed.1995.New Directions inSpatial Econometrics,Springer-Verlag.
3 Brundson,C.,A.S.Fotheringham,and M.E.Chalton.1996."Geographically Weighted
Regression:A Method for ExploringSpatial Nonstationarity,"Geographical Analysis,
Vol.28,p281-298.
4 Brunsdon,C.,A.S.Fotheringham,and M.E.Chalton.1999."SomeNotes on Parametric
Significance Tests for GeographicallyWeighted Regression,"Journal of Regional
Science,Vol.39,No.3,p497-524.
5 Casetti,E.1972."Generating Models by Expansion Method:Applications to Geographic
Research,"Geographical Analysis,Vol.4,p81-91.
6 Casetti,E.1982."Drift Analysis of Regression Parameters:An Application to the
Investigation of Fertility ofFertility Development Relations,"Modeling and Simulation
13,p961-966.
7 Casetti,E.1992."Bayesian Regression and the ExpansionMetod,"Geographical
Analysis,Vol.24,p58-74.
8 Cliff,A.D.and J.K.Ord.1981.Spatial Processes:Models andApplications,Pion.
9 Haining,R.P.Spatial Data Analysis in the Social andEnvironmental Science,Cambridge
University Press.1990.
10 Paelinck,Jean H.P.and Leo H.Klaassen.1979.SpatialEconometrics,Saxon House,
Teakfield Ltd.
11 莊大方,張穩(wěn),羅建國.土地資源遙感調(diào)查中的空間信息多重采樣框架設(shè)計與GIS實現(xiàn),統(tǒng)計研究,1999年第1期.
自從Paelinck提出“空間經(jīng)濟計量學”這個術(shù)語,Cliff和Ord(1973,1981)對空間自回歸模型的開拓性工作,發(fā)展出廣泛的模型、參數(shù)估計和檢驗技術(shù),使得經(jīng)濟計量學建模中綜合空間因素變得更加有效。
Anselin(1988)對空間經(jīng)濟計量學進行了系統(tǒng)的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經(jīng)濟計量學的定義是:“在區(qū)域科學模型的統(tǒng)計分析中,研究由空間引起的各種特性的一系列方法?!盇nselin所提到的區(qū)域科學模型,指明確將區(qū)域、位置及空間交互影響綜合在模型中,并且它們的估計及確定也是基于參照地理的(即:截面的或時-空的)數(shù)據(jù),數(shù)據(jù)可能來自于空間上的點,也可能是來自于某個區(qū)域,前者對應(yīng)于經(jīng)緯坐標,后者對應(yīng)于區(qū)域之間的相對位置。
國外近幾年空間經(jīng)濟計量學得以迅速發(fā)展,如Anselin和Florax(1995)指出的,主要得益于以下幾點:
(1)人們對于空間及空間交互影響的作用的重新認識。對空間的重新關(guān)注并不局限于經(jīng)濟學,在其它社會科學中也得以反映。
(2)與地理對應(yīng)的社會經(jīng)濟大型數(shù)據(jù)庫的逐步實用性。在美國以及歐洲,官方統(tǒng)計部門提供的以區(qū)域和地區(qū)為統(tǒng)計單元的大型數(shù)據(jù)庫很容易得到,并且價格低廉。這些數(shù)據(jù)可以進行空前數(shù)量的截面或時空觀測分析,這時,空間(或時空)自相關(guān)可能成為標準而非一種特殊情況。
(3)地理信息系統(tǒng)(GIS)和空間數(shù)據(jù)分析軟件,以高效和低成本的計算技術(shù)處理空間觀測的發(fā)展。GIS的使用,允許地理數(shù)據(jù)的有效存儲、快速恢復(fù)及交互可視化,為空間分析技術(shù)的藝術(shù)化提供了巨大的機會。至少目前線性模型中,缺少針對空間數(shù)據(jù)和空間經(jīng)濟計量學的軟件的情況已經(jīng)大為改觀。目前已有一些專門的空間統(tǒng)計分析軟件,并且SAS、S-PLUS等著名統(tǒng)計軟件中,都已經(jīng)包括用于空間統(tǒng)計分析的模塊。
(二)空間經(jīng)濟計量學與相關(guān)學科的關(guān)系
空間統(tǒng)計學是研究空間問題的另一門學科,它是應(yīng)用數(shù)學的一個快速發(fā)展的分支。它起源于20世紀50年代早期,用以幫助采礦業(yè)進行礦藏量的計算。最早的工作是采礦工程師D.G.Krige和統(tǒng)計學家H.S.Sichel在南非進行的。70年代隨著計算機的普及以及運算速度的大幅提高,空間統(tǒng)計分析技術(shù)逐漸擴展到地球科學的其它領(lǐng)域。目前已經(jīng)普遍存在于需要處理時間上或空間上相關(guān)的數(shù)據(jù)的科技領(lǐng)域中。
空間經(jīng)濟計量學與空間統(tǒng)計學的區(qū)分不太容易。Haining和Anselin的觀點認為空間統(tǒng)計學的研究大多由數(shù)據(jù)驅(qū)動,而空間經(jīng)濟計量學由模型驅(qū)動,即從特定的理論或模型出發(fā),重點放在問題的估計、解釋和檢驗上??臻g統(tǒng)計學的主流是研究生態(tài)學和地質(zhì)學中的物質(zhì)現(xiàn)象,空間經(jīng)濟計量學主要研究與區(qū)域及城市經(jīng)濟有關(guān)的模型。有一種觀點認為二者的區(qū)分應(yīng)基于作者將其工作對應(yīng)于空間經(jīng)濟計量學還是空間統(tǒng)計學,這種區(qū)分辦法可能較為簡單。
地質(zhì)統(tǒng)計學(Geostatistics)發(fā)展于20世紀60年代,主要用于研究地質(zhì)學現(xiàn)象的空間結(jié)構(gòu)和進行空間估值。例如,在探礦過程中,通常是在空間上布點進行鉆探,然后對采樣得到的樣品進行分析,估計礦藏的分布和儲量。由于礦藏不開采的話,在時間上結(jié)構(gòu)幾乎是不變的,因此地質(zhì)統(tǒng)計學研究的問題主要是空間相關(guān)??臻g經(jīng)濟計量學所研究的問題不僅存在空間相關(guān),往往所研究的問題在時間上也存在相關(guān)。
在區(qū)域經(jīng)濟學的理論中,人們建立了各種理論以及關(guān)系式來描述人類在空間上的行為,如研究城鎮(zhèn)問題的“引力模型”等。但在利用模型進行定量研究問題的時候,需要將理論或關(guān)系式用數(shù)學模型來進行刻劃,利用統(tǒng)計方法對模型進行估計、檢驗,并進行評價,這些正好是屬于經(jīng)濟計量學研究的范疇。應(yīng)該說,空間經(jīng)濟計量學主要研究區(qū)域經(jīng)濟問題,依據(jù)的是區(qū)域經(jīng)濟學理論,但它還需要綜合數(shù)學,以及空間統(tǒng)計學等學科,因此它不等同于區(qū)域經(jīng)濟學,而是一門交叉學科。
二、研究的問題
空間經(jīng)濟計量學主要研究存在空間效應(yīng)的問題??臻g效應(yīng)主要包括空間相關(guān)和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。
(一)空間相關(guān)
空間相關(guān)指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關(guān),即
存在空間相關(guān)的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調(diào)查過程中,數(shù)據(jù)的采集與空間中的單位有關(guān),如數(shù)據(jù)是按省、市、縣等統(tǒng)計的,但設(shè)定的空間單位與研究問題不一致,存在測量誤差。
空間相關(guān)不僅意味著空間上的觀測缺乏獨立性,并且意味著潛在于這種空間相關(guān)中的空間結(jié)構(gòu),也就是說空間相關(guān)的強度及模式由絕對位置和相對位置(布局,距離)決定。
對于空間相關(guān),空間自回歸通常是其核心內(nèi)容,空間自回歸模型的一般形式為:
在這個模型中,β解釋變量X(n×k矩陣)的參數(shù)向量(k×1),ρ是空間滯后相關(guān)變量的參數(shù),λ是殘差空間自回歸(空間AR)結(jié)構(gòu)中的參數(shù)。
W[,1]和W[,2]為n×n矩陣,是標準化或未標準化的空間加權(quán)矩陣,分別對應(yīng)于因變量以及擾動項中的空間自回歸過程,這兩個矩陣可以不同,這意味著兩個過程由不同的空間結(jié)構(gòu)生成。
這個模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。
對這個模型,普通最小二乘估計不僅是有偏的,而且是不一致的,參數(shù)的估計通常采用極大似然估計,近幾年,有學者嘗試采用貝葉斯估計對參數(shù)進行估計。
(二)空間差異性
空間差異性指空間上的區(qū)域缺乏均一性,如存在中心區(qū)和郊區(qū)、先進和后進地區(qū)等。例如,我國沿海地區(qū)和中西部地區(qū)經(jīng)濟存在較大差別。
對于空間差異性,只要將空間單元的特性考慮進去,大多可以用經(jīng)典經(jīng)濟計量學方法解決。但當空間差異性與空間相關(guān)共同存在時,經(jīng)典經(jīng)濟計量學方法不再適用,而且這時問題可能變得非常復(fù)雜,因為這時要區(qū)分空間差異性與空間相關(guān)可能非常困難。
研究空間差異性的模型主要有:
E.Casetti提出的空間擴展模型(1972)和回歸參數(shù)漂移分析方法(簡稱DARP)模型(1982)。這時,空間差異性表現(xiàn)為模型參數(shù)隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴展參數(shù))。
y=Xβ+ε
模型(3)為以經(jīng)緯坐標(Z[,x],Z[,y])作為擴展參數(shù)的空間擴展模型。同樣可以以到中心區(qū)域的距離作為擴展參數(shù)設(shè)計模型。
將模型(3)的第二個式子右邊加入隨機擾動項,則為DARP模型。E.Casetti(1992)進一步提出了貝葉斯空間擴展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon
,A.S.Fotheringham;MartinCharlton(1996),提出地理加權(quán)回歸模型(簡稱GWR模型)。
(三)時空數(shù)據(jù)空間模型
在模型中考慮時間維增加了描述的復(fù)雜性,但綜合時間空間的模型在實際工作中非常有用。在經(jīng)典的經(jīng)濟計量學模型中,這是綜合截面和時間序列數(shù)據(jù)的情形。如果數(shù)據(jù)不存在空間相關(guān),則可以采用PanelData模型。Anselin(1988)將似不相關(guān)(SUR)模型擴展到空間的情形,提出空間SUR模型。
三、應(yīng)用前景及需要進一步研究的問題
(一)在中國的應(yīng)用前景
在我國,地質(zhì)統(tǒng)計學是較早應(yīng)用空間統(tǒng)計學的領(lǐng)域,在20世紀80年代中國科學院就有人研究并應(yīng)用Krige模型??臻g統(tǒng)計學除了在地質(zhì)學的研究中發(fā)揮作用,近十年來,周國法、徐汝梅等學者研究生態(tài)學中的空間相互作用,并于1998年出版了《生物地理統(tǒng)計學》。20世紀80年代以來,我國利用衛(wèi)星遙感技術(shù),對土地、森林、農(nóng)業(yè)、礦產(chǎn)、能源、作物估產(chǎn)、災(zāi)患檢測等進行應(yīng)用,開始了我國空間統(tǒng)計學在經(jīng)濟領(lǐng)域應(yīng)用中統(tǒng)計調(diào)查的工作,為了將空間遙感調(diào)查技術(shù)逐步納入到我國統(tǒng)計的常規(guī)性工作中,1998年10月,國家統(tǒng)計局成立了空間統(tǒng)計研究室,并與中國科學院地理所合作,組成了“空間信息多重采樣設(shè)計的空間統(tǒng)計學應(yīng)用研究”課題組,運用遙感技術(shù)和空間分析對我國農(nóng)業(yè)耕地、森林、草地等資源以及城鎮(zhèn)動態(tài)變化進行調(diào)查,該項目獲得國家統(tǒng)計局2000年課題研究一等獎。
在我國地質(zhì)統(tǒng)計學、生物地理統(tǒng)計學及利用遙感技術(shù)進行的各種調(diào)查,都屬于空間統(tǒng)計學的范疇。地質(zhì)統(tǒng)計學、生物地理統(tǒng)計學主要研究空間相關(guān)及空間估值,在生物地理統(tǒng)計學的研究中還包括物種的空間擴散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型。空間動態(tài)采樣的研究,與地質(zhì)礦產(chǎn)調(diào)查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計算等問題的研究,根據(jù)其研究的問題和方法,也可以將其歸入統(tǒng)計學的抽樣調(diào)查分支之中。
隨著我國按地區(qū)進行統(tǒng)計的統(tǒng)計基礎(chǔ)資料不斷積累,尤其是遙感技術(shù)應(yīng)用到統(tǒng)計調(diào)查中來,都將使得按時間和空間排列的數(shù)據(jù)資料極為豐富,對數(shù)據(jù)進行空間甚至時空分析成為可能,人們將逐漸從時間的角度轉(zhuǎn)向普遍從時空的角度來考慮問題。
從經(jīng)濟分析的角度看,空間經(jīng)濟計量學在我國以下幾個方面將有很大的應(yīng)用前景。
由于區(qū)域之間存在相關(guān)性,或者存在差異性,因此一項政策對每個區(qū)域的影響是不同的,通過運用空間經(jīng)濟計量學方法對各區(qū)域進行研究之后,找到政策在各區(qū)域上作用的關(guān)系,對于政府決策、正確制訂政策具有很大的參考價值。
由于區(qū)域之間存在先進地區(qū)和后進地區(qū),通過空間經(jīng)濟計量學方法可以對先進地區(qū)與后進地區(qū)之間的相互關(guān)系進行研究。
按區(qū)域編制投入產(chǎn)出表時,空間的概念將發(fā)揮作用。
對房地產(chǎn)的價值進行評估時,在考慮外界影響因素的基礎(chǔ)上,充分考慮地區(qū)之間的相互關(guān)系,將對正確評估房地產(chǎn)的價值有很大幫助。
對環(huán)境污染進行研究時,運用空間經(jīng)濟計量學方法對污染的傳播方式進行研究,有助于人們對環(huán)境污染進行控制。
在交通領(lǐng)域的研究,可以利用空間經(jīng)濟計量學方法對人員、貨物在空間上的流動方式進行研究,同時對通道上的不同區(qū)段進行研究。
在對某種疾?。ㄈ缌鞲校┰诳臻g上的傳播過程進行研究之后,對于疾病的預(yù)防控制將有很大的幫助。
建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關(guān)性。而空間抽樣在空間上的布點方式也可以用作商業(yè)網(wǎng)點的布局研究。
總之,只要問題涉及到空間的概念,空間經(jīng)濟計量學就將發(fā)揮其作用。對空間經(jīng)濟計量學的深入研究及應(yīng)用,將促使人們面對問題的時候,從空間或時空的角度思考問題。
(二)需要進一步研究的問題
目前的研究中,系統(tǒng)內(nèi)的空間單元受到系統(tǒng)內(nèi)其它位置單元的影響,但邊界處的單元還受到系統(tǒng)外與之相鄰的單元的影響,如何將這個影響考慮在模型中值得研究。
在具體問題中,距離的概念需要加以認真對待,單用地理上的距離有時并不合適,例如國與國之間的經(jīng)濟聯(lián)系在今天并不是距離遠近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時,如何將貿(mào)易、人員、資金的流動充分考慮到空間加權(quán)矩陣中去,尚值得研究。
貝葉斯方法在統(tǒng)計學各個分支的應(yīng)用越來越廣,空間貝葉斯模型也是目前空間經(jīng)濟計量學研究的熱點之一。
可變單元的問題。當數(shù)據(jù)匯總的級別變化,可能整個模型的描述都發(fā)生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個統(tǒng)一的模式對系統(tǒng)進行描述尚待進一步研究。
時空數(shù)據(jù)的綜合分析,參數(shù)估計的漸近性質(zhì),模型的各種檢驗方法等,還有待進一步的研究。
自從Paelinck提出“空間經(jīng)濟計量學”這個術(shù)語,Cliff和Ord(1973,1981)對空間自回歸模型的開拓性工作,發(fā)展出廣泛的模型、參數(shù)估計和檢驗技術(shù),使得經(jīng)濟計量學建模中綜合空間因素變得更加有效。
Anselin(1988)對空間經(jīng)濟計量學進行了系統(tǒng)的研究,它以及Cliff和Ord(1973,1981)這三本著作至今仍被廣泛引用。Anselin對空間經(jīng)濟計量學的定義是:“在區(qū)域科學模型的統(tǒng)計分析中,研究由空間引起的各種特性的一系列方法?!盇nselin所提到的區(qū)域科學模型,指明確將區(qū)域、位置及空間交互影響綜合在模型中,并且它們的估計及確定也是基于參照地理的(即:截面的或時-空的)數(shù)據(jù),數(shù)據(jù)可能來自于空間上的點,也可能是來自于某個區(qū)域,前者對應(yīng)于經(jīng)緯坐標,后者對應(yīng)于區(qū)域之間的相對位置。
國外近幾年空間經(jīng)濟計量學得以迅速發(fā)展,如Anselin和Florax(1995)指出的,主要得益于以下幾點:
(1)人們對于空間及空間交互影響的作用的重新認識。對空間的重新關(guān)注并不局限于經(jīng)濟學,在其它社會科學中也得以反映。
(2)與地理對應(yīng)的社會經(jīng)濟大型數(shù)據(jù)庫的逐步實用性。在美國以及歐洲,官方統(tǒng)計部門提供的以區(qū)域和地區(qū)為統(tǒng)計單元的大型數(shù)據(jù)庫很容易得到,并且價格低廉。這些數(shù)據(jù)可以進行空前數(shù)量的截面或時空觀測分析,這時,空間(或時空)自相關(guān)可能成為標準而非一種特殊情況。
(3)地理信息系統(tǒng)(GIS)和空間數(shù)據(jù)分析軟件,以高效和低成本的計算技術(shù)處理空間觀測的發(fā)展。GIS的使用,允許地理數(shù)據(jù)的有效存儲、快速恢復(fù)及交互可視化,為空間分析技術(shù)的藝術(shù)化提供了巨大的機會。至少目前線性模型中,缺少針對空間數(shù)據(jù)和空間經(jīng)濟計量學的軟件的情況已經(jīng)大為改觀。目前已有一些專門的空間統(tǒng)計分析軟件,并且SAS、S-PLUS等著名統(tǒng)計軟件中,都已經(jīng)包括用于空間統(tǒng)計分析的模塊。
(二)空間經(jīng)濟計量學與相關(guān)學科的關(guān)系
空間統(tǒng)計學是研究空間問題的另一門學科,它是應(yīng)用數(shù)學的一個快速發(fā)展的分支。它起源于20世紀50年代早期,用以幫助采礦業(yè)進行礦藏量的計算。最早的工作是采礦工程師D.G.Krige和統(tǒng)計學家H.S.Sichel在南非進行的。70年代隨著計算機的普及以及運算速度的大幅提高,空間統(tǒng)計分析技術(shù)逐漸擴展到地球科學的其它領(lǐng)域。目前已經(jīng)普遍存在于需要處理時間上或空間上相關(guān)的數(shù)據(jù)的科技領(lǐng)域中。
空間經(jīng)濟計量學與空間統(tǒng)計學的區(qū)分不太容易。Haining和Anselin的觀點認為空間統(tǒng)計學的研究大多由數(shù)據(jù)驅(qū)動,而空間經(jīng)濟計量學由模型驅(qū)動,即從特定的理論或模型出發(fā),重點放在問題的估計、解釋和檢驗上。空間統(tǒng)計學的主流是研究生態(tài)學和地質(zhì)學中的物質(zhì)現(xiàn)象,空間經(jīng)濟計量學主要研究與區(qū)域及城市經(jīng)濟有關(guān)的模型。有一種觀點認為二者的區(qū)分應(yīng)基于作者將其工作對應(yīng)于空間經(jīng)濟計量學還是空間統(tǒng)計學,這種區(qū)分辦法可能較為簡單。
地質(zhì)統(tǒng)計學(Geostatistics)發(fā)展于20世紀60年代,主要用于研究地質(zhì)學現(xiàn)象的空間結(jié)構(gòu)和進行空間估值。例如,在探礦過程中,通常是在空間上布點進行鉆探,然后對采樣得到的樣品進行分析,估計礦藏的分布和儲量。由于礦藏不開采的話,在時間上結(jié)構(gòu)幾乎是不變的,因此地質(zhì)統(tǒng)計學研究的問題主要是空間相關(guān)??臻g經(jīng)濟計量學所研究的問題不僅存在空間相關(guān),往往所研究的問題在時間上也存在相關(guān)。
在區(qū)域經(jīng)濟學的理論中,人們建立了各種理論以及關(guān)系式來描述人類在空間上的行為,如研究城鎮(zhèn)問題的“引力模型”等。但在利用模型進行定量研究問題的時候,需要將理論或關(guān)系式用數(shù)學模型來進行刻劃,利用統(tǒng)計方法對模型進行估計、檢驗,并進行評價,這些正好是屬于經(jīng)濟計量學研究的范疇。應(yīng)該說,空間經(jīng)濟計量學主要研究區(qū)域經(jīng)濟問題,依據(jù)的是區(qū)域經(jīng)濟學理論,但它還需要綜合數(shù)學,以及空間統(tǒng)計學等學科,因此它不等同于區(qū)域經(jīng)濟學,而是一門交叉學科。
二、研究的問題
空間經(jīng)濟計量學主要研究存在空間效應(yīng)的問題。空間效應(yīng)主要包括空間相關(guān)和空間差異性。在研究中涉及空間相鄰、空間相鄰矩陣等概念。
(一)空間相關(guān)
空間相關(guān)指在樣本觀測中,位于位置i的觀測與其它j≠i的觀測有關(guān),即
附圖
存在空間相關(guān)的原因有兩方面:相鄰空間單元存在測量誤差,空間交互影響的存在。測量誤差是由于調(diào)查過程中,數(shù)據(jù)的采集與空間中的單位有關(guān),如數(shù)據(jù)是按省、市、縣等統(tǒng)計的,但設(shè)定的空間單位與研究問題不一致,存在測量誤差。
空間相關(guān)不僅意味著空間上的觀測缺乏獨立性,并且意味著潛在于這種空間相關(guān)中的空間結(jié)構(gòu),也就是說空間相關(guān)的強度及模式由絕對位置和相對位置(布局,距離)決定。
對于空間相關(guān),空間自回歸通常是其核心內(nèi)容,空間自回歸模型的一般形式為:
附圖
在這個模型中,β解釋變量X(n×k矩陣)的參數(shù)向量(k×1),ρ是空間滯后相關(guān)變量的參數(shù),λ是殘差空間自回歸(空間AR)結(jié)構(gòu)中的參數(shù)。
W[,1]和W[,2]為n×n矩陣,是標準化或未標準化的空間加權(quán)矩陣,分別對應(yīng)于因變量以及擾動項中的空間自回歸過程,這兩個矩陣可以不同,這意味著兩個過程由不同的空間結(jié)構(gòu)生成。
這個模型可以退化成為普通的線性回歸模型、(純)空間自回歸模型、混合回歸與空間自回歸模型、殘差空間自回歸模型等形式。
對這個模型,普通最小二乘估計不僅是有偏的,而且是不一致的,參數(shù)的估計通常采用極大似然估計,近幾年,有學者嘗試采用貝葉斯估計對參數(shù)進行估計。
(二)空間差異性
空間差異性指空間上的區(qū)域缺乏均一性,如存在中心區(qū)和郊區(qū)、先進和后進地區(qū)等。例如,我國沿海地區(qū)和中西部地區(qū)經(jīng)濟存在較大差別。
對于空間差異性,只要將空間單元的特性考慮進去,大多可以用經(jīng)典經(jīng)濟計量學方法解決。但當空間差異性與空間相關(guān)共同存在時,經(jīng)典經(jīng)濟計量學方法不再適用,而且這時問題可能變得非常復(fù)雜,因為這時要區(qū)分空間差異性與空間相關(guān)可能非常困難。
研究空間差異性的模型主要有:
E.Casetti提出的空間擴展模型(1972)和回歸參數(shù)漂移分析方法(簡稱DARP)模型(1982)。這時,空間差異性表現(xiàn)為模型參數(shù)隨空間位置變化,并以空間單元的位置信息作為輔助變量(稱為擴展參數(shù))。
y=Xβ+ε
附圖
模型(3)為以經(jīng)緯坐標(Z[,x],Z[,y])作為擴展參數(shù)的空間擴展模型。同樣可以以到中心區(qū)域的距離作為擴展參數(shù)設(shè)計模型。
將模型(3)的第二個式子右邊加入隨機擾動項,則為DARP模型。E.Casetti(1992)進一步提出了貝葉斯空間擴展模型。
D.P.McMillen和J.F.McDonald(1997),C.Brunsdon,A.S.Fotheringham;MartinCharlton(1996),提出地理加權(quán)回歸模型(簡稱GWR模型)。
附圖
(三)時空數(shù)據(jù)空間模型
在模型中考慮時間維增加了描述的復(fù)雜性,但綜合時間空間的模型在實際工作中非常有用。在經(jīng)典的經(jīng)濟計量學模型中,這是綜合截面和時間序列數(shù)據(jù)的情形。如果數(shù)據(jù)不存在空間相關(guān),則可以采用PanelData模型。Anselin(1988)將似不相關(guān)(SUR)模型擴展到空間的情形,提出空間SUR模型。
三、應(yīng)用前景及需要進一步研究的問題
(一)在中國的應(yīng)用前景
在我國,地質(zhì)統(tǒng)計學是較早應(yīng)用空間統(tǒng)計學的領(lǐng)域,在20世紀80年代中國科學院就有人研究并應(yīng)用Krige模型。空間統(tǒng)計學除了在地質(zhì)學的研究中發(fā)揮作用,近十年來,周國法、徐汝梅等學者研究生態(tài)學中的空間相互作用,并于1998年出版了《生物地理統(tǒng)計學》。20世紀80年代以來,我國利用衛(wèi)星遙感技術(shù),對土地、森林、農(nóng)業(yè)、礦產(chǎn)、能源、作物估產(chǎn)、災(zāi)患檢測等進行應(yīng)用,開始了我國空間統(tǒng)計學在經(jīng)濟領(lǐng)域應(yīng)用中統(tǒng)計調(diào)查的工作,為了將空間遙感調(diào)查技術(shù)逐步納入到我國統(tǒng)計的常規(guī)性工作中,1998年10月,國家統(tǒng)計局成立了空間統(tǒng)計研究室,并與中國科學院地理所合作,組成了“空間信息多重采樣設(shè)計的空間統(tǒng)計學應(yīng)用研究”課題組,運用遙感技術(shù)和空間分析對我國農(nóng)業(yè)耕地、森林、草地等資源以及城鎮(zhèn)動態(tài)變化進行調(diào)查,該項目獲得國家統(tǒng)計局2000年課題研究一等獎。
在我國地質(zhì)統(tǒng)計學、生物地理統(tǒng)計學及利用遙感技術(shù)進行的各種調(diào)查,都屬于空間統(tǒng)計學的范疇。地質(zhì)統(tǒng)計學、生物地理統(tǒng)計學主要研究空間相關(guān)及空間估值,在生物地理統(tǒng)計學的研究中還包括物種的空間擴散過程。所用的方法主要是各種Krige模型、方差圖模型,以及空間自回歸模型。空間動態(tài)采樣的研究,與地質(zhì)礦產(chǎn)調(diào)查類似,主要涉及樣本在空間上的布局、有效樣本量的確定、采樣誤差的計算等問題的研究,根據(jù)其研究的問題和方法,也可以將其歸入統(tǒng)計學的抽樣調(diào)查分支之中。
隨著我國按地區(qū)進行統(tǒng)計的統(tǒng)計基礎(chǔ)資料不斷積累,尤其是遙感技術(shù)應(yīng)用到統(tǒng)計調(diào)查中來,都將使得按時間和空間排列的數(shù)據(jù)資料極為豐富,對數(shù)據(jù)進行空間甚至時空分析成為可能,人們將逐漸從時間的角度轉(zhuǎn)向普遍從時空的角度來考慮問題。
從經(jīng)濟分析的角度看,空間經(jīng)濟計量學在我國以下幾個方面將有很大的應(yīng)用前景。
由于區(qū)域之間存在相關(guān)性,或者存在差異性,因此一項政策對每個區(qū)域的影響是不同的,通過運用空間經(jīng)濟計量學方法對各區(qū)域進行研究之后,找到政策在各區(qū)域上作用的關(guān)系,對于政府決策、正確制訂政策具有很大的參考價值。
由于區(qū)域之間存在先進地區(qū)和后進地區(qū),通過空間經(jīng)濟計量學方法可以對先進地區(qū)與后進地區(qū)之間的相互關(guān)系進行研究。
按區(qū)域編制投入產(chǎn)出表時,空間的概念將發(fā)揮作用。
對房地產(chǎn)的價值進行評估時,在考慮外界影響因素的基礎(chǔ)上,充分考慮地區(qū)之間的相互關(guān)系,將對正確評估房地產(chǎn)的價值有很大幫助。
對環(huán)境污染進行研究時,運用空間經(jīng)濟計量學方法對污染的傳播方式進行研究,有助于人們對環(huán)境污染進行控制。
在交通領(lǐng)域的研究,可以利用空間經(jīng)濟計量學方法對人員、貨物在空間上的流動方式進行研究,同時對通道上的不同區(qū)段進行研究。
在對某種疾?。ㄈ缌鞲校┰诳臻g上的傳播過程進行研究之后,對于疾病的預(yù)防控制將有很大的幫助。
建立了空間的概念之后,人們對于在空間上的抽樣將綜合考慮空間單元之間的相關(guān)性。而空間抽樣在空間上的布點方式也可以用作商業(yè)網(wǎng)點的布局研究。
總之,只要問題涉及到空間的概念,空間經(jīng)濟計量學就將發(fā)揮其作用。對空間經(jīng)濟計量學的深入研究及應(yīng)用,將促使人們面對問題的時候,從空間或時空的角度思考問題。
(二)需要進一步研究的問題
目前的研究中,系統(tǒng)內(nèi)的空間單元受到系統(tǒng)內(nèi)其它位置單元的影響,但邊界處的單元還受到系統(tǒng)外與之相鄰的單元的影響,如何將這個影響考慮在模型中值得研究。
在具體問題中,距離的概念需要加以認真對待,單用地理上的距離有時并不合適,例如國與國之間的經(jīng)濟聯(lián)系在今天并不是距離遠近決定的,電子化交易使得資金的流動非常迅速方便,因此,在研究這類問題時,如何將貿(mào)易、人員、資金的流動充分考慮到空間加權(quán)矩陣中去,尚值得研究。
貝葉斯方法在統(tǒng)計學各個分支的應(yīng)用越來越廣,空間貝葉斯模型也是目前空間經(jīng)濟計量學研究的熱點之一。
可變單元的問題。當數(shù)據(jù)匯總的級別變化,可能整個模型的描述都發(fā)生變化,對于不同的問題,可能影響模型變化的匯總的級別也不同,能否有一個統(tǒng)一的模式對系統(tǒng)進行描述尚待進一步研究。
時空數(shù)據(jù)的綜合分析,參數(shù)估計的漸近性質(zhì),模型的各種檢驗方法等,還有待進一步的研究。
1.醫(yī)學統(tǒng)計學標準化試題庫建立的必要性
近年來選修醫(yī)學統(tǒng)計學的學生逐漸增多,考試的客觀性、公正性顯得尤為重要。當前,不同的學校采取的考試方式不盡相同:有的學校建立了“整卷庫”,以整套試卷為單位進行存儲,考試時隨機抽取一套試卷對考生施測,這種方式固化了試卷結(jié)構(gòu),不能根據(jù)實際需求靈活調(diào)整;有的學校簡單地將試題按章節(jié)存放在一起,試題未經(jīng)測試與合理的分析,未按能力層次及學科要求進行劃分,考試時按章節(jié)選出一部分試題組卷,費時又費力;還有的學校指定每位代課老師出一定數(shù)量的題目,最后把所有老師提交的題目匯總、組合成卷,由于代課老師往往根據(jù)課堂上強調(diào)的授課重點出題,因此不能全面考察學生的真實水平??梢姡t(yī)學統(tǒng)計學考試制度存在諸多問題,要想通過考試客觀、準確地評價每個考生的真實能力,充分發(fā)揮考試對教學的反饋作用,實現(xiàn)科學化、標準化、規(guī)范化、公正化的考試,建立高質(zhì)量的醫(yī)學統(tǒng)計學標準化試題庫〔1〕勢在必行。所謂試題庫〔2〕(itembank),并不是試題的簡單堆集,而是以一定的教育測量理論為基礎(chǔ),通過相應(yīng)的數(shù)學模型對試題進行多項性能指標分析后,選出符合要求的優(yōu)秀題目,按次序集中儲存的一種形式,并能按要求調(diào)出所需試題,最終按規(guī)定的條件組合成卷〔3-5〕。醫(yī)學統(tǒng)計學標準化試題庫以合格、優(yōu)秀的試題為基本單位,能克服現(xiàn)有考試制度的弊端。因此,建議建立醫(yī)學統(tǒng)計學標準化試題庫。
2.理論依據(jù)———項目反應(yīng)理論(itemresponsetheory,IRT)
建設(shè)醫(yī)學統(tǒng)計學標準化試題庫的中心環(huán)節(jié)就是命題、選題。選題時必須根據(jù)一定的評價指標對試題進行評估,優(yōu)秀的、符合要求的試題方可進入試題庫。教育測量是以一定的理論為基礎(chǔ),目前用于試題評價的理論主要有經(jīng)典測量理論(classicaltesttheory,CTT)和項目反應(yīng)理論(itemresponsetheory,IRT)〔6,7〕。CTT存在很多無法克服的技術(shù)問題,如具有試題依賴性和樣本依賴性、被試的能力分數(shù)與試題難度未建立在同一量尺上、忽略了每位被試的反應(yīng)組型等等〔8-11〕。于是,近代在CTT基礎(chǔ)上發(fā)展起來了一種新的測量理論,即IRT,又稱潛在特質(zhì)理論(latenttraittheory)或項目特征曲線理論〔12〕(itemcharacteristiccurvetheory)。IRT以幾項基本假設(shè)(如單維性假設(shè)、局部獨立性假設(shè)〔13,14〕等)為前提,試圖通過建立恰當?shù)臄?shù)理統(tǒng)計模型來反映被試特質(zhì)水平、試題參數(shù)與該被試在試題上的反應(yīng)表現(xiàn)之間的關(guān)系。相對于CTT,IRT的優(yōu)勢主要有:(1)具有試題獨立性和樣本獨立性,即扣除測量誤差的影響后,被試能力參數(shù)的估計值不會隨試題的不同而不同,試題參數(shù)的估計值也不會隨被試的不同而不同。(2)每位被試具有相應(yīng)的測量誤差。(3)考慮了每位被試的反應(yīng)組型。(4)引入了信息函數(shù)的概念,其可代替CTT中信度的概念〔15〕。IRT克服了CTT的不足,已逐漸成為試題評價的主流理論。許多大型的考試如美國的研究生入學考試GRE及著名考試TOFEL等試題評價均采用了IRT〔16〕。本文也將應(yīng)用IRT,闡述醫(yī)學統(tǒng)計學標準化試題庫建設(shè)的基本思路。
資料與方法
1.資料
從中山大學公共衛(wèi)生學院資料庫中搜集2008年至2011年期間的醫(yī)學統(tǒng)計學考試試卷,共5116份。試題題型主要是單項選擇題、簡答題和計算分析題。這些試題面向7個不同專業(yè)的考生,包括臨床專業(yè)、預(yù)防專業(yè)、藥學專業(yè)、法醫(yī)專業(yè)、口腔專業(yè)、康復(fù)專業(yè)以及護理專業(yè)。此外,這些考生來自于不同層次,包括本科生、碩士生。
2.方法
IRT強調(diào)的核心是數(shù)學模型的建立和對模型中各個參數(shù)的估計〔13〕,通過對模型中各個參數(shù)適當估計和選取,解決在現(xiàn)實中CTT遇到的大部分問題。IRT假定學生對測試項目的反應(yīng)不僅受到特定“能力”的影響,還受到許多隨機因素的影響,其將被試的能力看作是一個潛在的不可觀測的變量,同時將難度、區(qū)分度、猜測度等參數(shù)看作是項目的固有屬性,獨立于被試樣本,并將被試在某項目上的反映情況與該被試的特質(zhì)水平聯(lián)結(jié)起來,與表示試題特性的參數(shù)一起,共同建立起數(shù)理統(tǒng)計學概率模型〔17,18〕。不同形式的數(shù)據(jù)應(yīng)采用不同的模型進行擬合。本研究擬應(yīng)用IRT,從以下幾個方面進行分析。
(1)考生反應(yīng)組型的整理
采用EpiData3.1軟件包,根據(jù)搜集到的試題輸入每位受試者的反應(yīng)組型(responsepattern),即:考生在一組測驗試題上的作答情形。數(shù)據(jù)處理如下:對于單項選擇題,假定某考生對試題i的反應(yīng)為ui,其中答對用ui=1來表示,答錯用ui=0來表示(屬于二元化計分);對于簡答題,每一道簡答題滿分為h=6分,我們將其分為以下四個等級:h=0分、0<h≤2分、2<h≤4分、4<h≤6分,分別用0,1,2,3來表示(屬多元計分);對于計算分析題,每一道計算分析題滿分為k=12分,我們將其分為以下四個等級:k=0分、0<k≤4分、4<k≤8分、8<k≤12分,分別用0,1,2,3來表示(屬多元計分)。
(2)模型選擇
①單維三參數(shù)logistic模型(3parameterlogisticmodel,3PLM)對于單項選擇題,其反應(yīng)數(shù)據(jù)為二元化計分形式,項目反應(yīng)理論中可采用的數(shù)學模型有l(wèi)ogistic模型和正態(tài)卵形模型,其中應(yīng)用最廣的是前者〔9〕。logistic模型根據(jù)參數(shù)數(shù)目的不同,可分為單參數(shù)模型、雙參數(shù)模型和三參數(shù)模型〔19〕。在理論和實踐中,三參數(shù)模型得到了充分的驗證,相對成熟、可靠,并且可以提供更多的試題信息,能更好地對參數(shù)進行估計〔20〕。因此,本文對單項選擇題的數(shù)據(jù)采用單維三參數(shù)logistic模型〔21-22〕進行處理,其表達式如下:Pi(θ)=ci+(1-ci)eDai(θ-bi)1+eDai(θ-bi)(1)其中θ表示考生能力估計值;ai表示第i題的區(qū)分度系數(shù);bi表示第i題的難度系數(shù);ci表示第i題的猜測度系數(shù);D表示標化因子,一般取D=1.702〔19〕;Pi(θ)表示能力為θ的人答對此題目的概率。②等級反應(yīng)模型對于簡答題和計算分析題,將原始分數(shù)進行轉(zhuǎn)化后,反應(yīng)數(shù)據(jù)變換為多元計分形式,此時,可采用項目反應(yīng)理論中的等級反應(yīng)模型〔23-25〕(gradedresponsemodel,GRM)。GRM假設(shè)每一個反應(yīng)類別各自對應(yīng)一條特征曲線,如果對某試題i而言,被試的反應(yīng)可以劃分為g+1類,其得分可以表示如下:Xi=0,1,……,g,那么被試在該試題上恰好得某一等級g分的概率可表示如下:Pi,k(θ)=P*i,k(θ)-P*i,k+1(θ)(2)公式(2)中,Pi,k(θ)表示對于試題i而言,能力值為θ的被試恰好得k分的概率;P*i,k(θ)表示對于試題i而言,能力值為θ的被試得k分以及k分以上的概率,P*i,k+1(θ)表示對于試題i而言,能力值為θ的被試得k+1分以及k+1分以上的概率。其中P*i,k(θ)按雙參數(shù)logistic模型可以寫為:P*i,k=11+e-Dai(θ-bi,k)(3)公式(3)中,θ、ai、D的含義與公式(1)相同,bi,k表示第i題第k個等級的難度系數(shù)。
(3)試題參數(shù)估計
應(yīng)用MULTILOG軟件,采用最大邊緣似然估計〔26,27〕(marginalmaximumlikelihoodestimate,MMLE)法來估計IRT模型中的參數(shù)。以L(ui|θ)表示能力為θ的某考生對題目i的反應(yīng)ui(答對:ui=1;答錯:ui=0)的概率,用對數(shù)似然函數(shù)表示為:L(u1,u1,…,un|θ)=∏ni=1PuiiQ1-uii(4)其中n為題目數(shù),Puii表示考生答對第i題的概率,Q1-uii表示考生答錯第i題的概率。當各參數(shù)的偏導(dǎo)數(shù)為0時函數(shù)取得最大值,分別求得每一個試題相應(yīng)參數(shù)值,即:試題區(qū)分度系數(shù)ai,難度系數(shù)bi,猜測度系數(shù)ci。
(4)試題篩選入庫
在篩選試題以決定哪些試題可以入庫時,不能僅以試題參數(shù)作為能否進入試題庫的唯一標準,需同時考慮估計出的各試題參數(shù)以及任課教師的專業(yè)意見,篩選符合一定標準的試題進入試題庫。試題難度過大或過小,會使分數(shù)呈偏態(tài)分布,從而使考試的信度系數(shù)值降低,因此,選取難度系數(shù)位于[-4.0,4.0]范圍內(nèi)的試題進入試題庫。區(qū)分度越大的題目,表明對學業(yè)水平不同的考生的鑒別力或區(qū)分能力越強。通常,教學過程完畢后進行的考試,是以考察考生對知識掌握情況為目的的,因此,區(qū)分度不應(yīng)過大。我們選取區(qū)分度位于[0,3]范圍內(nèi)的試題進入試題庫。此外,試題的猜測度也不應(yīng)太大,猜測度系數(shù)過大的試題對于考察學生對知識的掌握意義不大〔28〕,我們將猜測度小于0.25的試題選入試題庫。根據(jù)試題參數(shù)篩選出試題后,再由5~7位任課教師,獨立地逐一對初步篩選的試題進行審核,以判斷試題文字表述是否恰當、是否會引起歧義、是否符合醫(yī)學統(tǒng)計學邏輯、是否具有考試價值、是否具有內(nèi)容典型性、是否具有編寫格式統(tǒng)一性,是否重復(fù)等,經(jīng)全部任課教師認可的試題方能最終進入試題庫。除了將試題及試題參數(shù)錄入數(shù)據(jù)庫外,各個試題庫還應(yīng)包括試題編號、試題類型、所考知識點、認知層次、參考答案、選中標識等。醫(yī)學統(tǒng)計學標準化試題庫建立的流程圖見圖1。結(jié)果該研究的預(yù)期結(jié)果是成功建立醫(yī)學統(tǒng)計學標準化試題庫,該試題庫以單個試題為基本單位,每道試題都有編號、題型、難度、區(qū)分度、猜測度、知識點、認知層次、參考答案以及選中標識這9個屬性,且試題庫中的試題參數(shù)都建立在同一量尺上。試題庫中的所有試題均符合大綱要求,且試題知識覆蓋面廣,每一章節(jié)均有一定數(shù)目的試題。該試題庫可用于期末考試,也可用于階段性小測驗,可供臨床、口腔、康復(fù)、護理、預(yù)防醫(yī)學等專業(yè)使用,可根據(jù)不同專業(yè)的不同要求(如預(yù)防專業(yè)的學生應(yīng)該掌握醫(yī)學統(tǒng)計學知識,考試時理應(yīng)選取難度較大的試題進行測驗;而康復(fù)專業(yè)的學生理解醫(yī)學統(tǒng)計學知識即可,那么考試時應(yīng)選取中等難度或低難度的試題進行測驗)選取試題,進而實現(xiàn)自動化組卷或者計算機自適應(yīng)考試,從而使各種考試得以方便、快速、順利地進行。結(jié)論與討論采用項目反應(yīng)理論建立的醫(yī)學統(tǒng)計學標準化試題庫可以滿足各種目的的考試要求。不僅大大節(jié)省了時間、節(jié)約了人力,還使考試更加客觀、公正,具有重大的實際意義。
在建設(shè)醫(yī)學統(tǒng)計學標準化試題庫的過程中,以下幾個問題值得引起我們的注意:
1.必須明確醫(yī)學統(tǒng)計學的教學大綱,并結(jié)合本校的實際情況列出考核知識點,然后將搜集到的試題歸類于相應(yīng)的知識點。以知識點而非章節(jié)作為試題的屬性,更便于我們有針對性的命題、將試題進行分類以及對試題進行搜索。
2.在考生人數(shù)和試題庫試題題量方面,當然是考生人數(shù)越多,試題參數(shù)估計的穩(wěn)健性越好;選入試題庫的題量越大、試題知識覆蓋面越廣越好。但是在實際中,由于考生人數(shù)以及符合大綱要求的試題題量有限,可以先根據(jù)現(xiàn)有的資源創(chuàng)建試題庫,然后不斷地修正試題參數(shù),不斷地為試題庫注入新的“血液”,使試題庫不斷的發(fā)展完善。為了增加試題庫題量,我們還可以借鑒兄弟院校的試題,或者組織經(jīng)驗豐富的專家或教師命制新的試題。
3.每一道試題須包括以下9個屬性:編號、題型、難度、區(qū)分度、猜測度、知識點、認知層次、參考答案以及選中標識,以便于對試題進行分類、存儲、檢索、維護與管理。
4.醫(yī)學統(tǒng)計學試題往往帶有各種數(shù)學符號、表格甚至圖形,這就提醒我們在錄入試題前,應(yīng)選擇合適的軟件平臺,以保證所有的試題均能完整無誤地輸入或輸出試題庫,以確保各種工作的順利進行。
關(guān)鍵詞: 醫(yī)學碩士;學位論文;數(shù)理統(tǒng)計;調(diào)查
摘 要:目的 分析醫(yī)學碩士研究生學位論文中數(shù)理統(tǒng)計應(yīng)用情況. 方法 隨機抽取2000/2001年100位河南醫(yī)科大學應(yīng)屆醫(yī)學碩士學位論文初稿,對其中數(shù)理統(tǒng)計應(yīng)用情況進行統(tǒng)計分析. 結(jié)果 論文中采用單因素設(shè)計者占94.0%,多因素設(shè)計占6.0%,應(yīng)用正確率為96.6%;論文中使用經(jīng)典基本數(shù)理統(tǒng)計方法為97.9%,統(tǒng)計學方法的正確應(yīng)用率為75.7%;應(yīng)用參數(shù)統(tǒng)計時出現(xiàn)的主要問題是未進行適用條件判斷,而應(yīng)用非參數(shù)統(tǒng)計時出現(xiàn)的主要問題則是推斷結(jié)論有誤. 結(jié)論 應(yīng)加強碩士學位論文的數(shù)理統(tǒng)計設(shè)計和審查工作.
Keywords:medical master graduates;thesis;statistics;in-vestigation
Abstract:AIM Analysis case of using statistical theory in the thesis of2000~2001master graduates.METHODS 100thesis of this year’s medical master graduates in Henan Medi-cal University were taken out randomly.Their theoretical scores and practical application of health statistics in their thesis were analyzed.RESULTS Master graduate has grasped the theory of health statistics preferably.The abso-lute majority,namely97.9%of the total students,have used the basic statistic method in their thesis,75.7percent could use statistic method correctly.The main problem arising in using parametric test is that they hadn’t judged the applying condition,while in non-parametric test is that the conclusion is wrong.CONCLUSION Ought to strengthen checkup health statistical in the thesis of master graduates.
0 引言
數(shù)理統(tǒng)計的應(yīng)用正確與否是論文科學性的重要標志.近年在醫(yī)學學術(shù)期刊(包括國內(nèi)著名的核心期刊)上發(fā)表的論著,數(shù)理統(tǒng)計方面還存在問題,甚至導(dǎo)出錯誤的結(jié)論[1-4] .數(shù)理統(tǒng)計作為一門應(yīng)用學科已成為醫(yī)學碩士研究生學位課程的主要內(nèi)容之一,越來越受到碩士研究生的重視.為了解醫(yī)學碩士生學位論文中數(shù)理統(tǒng)計的應(yīng)用情況,為課題的統(tǒng)計設(shè)計和論文審查提供科學依據(jù),為教學改革提供參考,作者隨機抽取河南醫(yī)科大學應(yīng)屆碩士學位論文100篇,對其數(shù)理統(tǒng)計應(yīng)用情況進行分析.
1 材料和方法
2000/2001年河南醫(yī)科大學共有醫(yī)學碩士研究畢業(yè)生222人,應(yīng)用隨機數(shù)表隨機抽取100名碩士研究生學位論文的初稿作為研究對象,對實驗設(shè)計類型、使用的統(tǒng)計學分析方法及使用的統(tǒng)計學工具,存在的問題等進行調(diào)查.結(jié)果推斷利用SAS(6.12)統(tǒng)計分析系統(tǒng)進行分析.
2 結(jié)果
2.1 實驗設(shè)計類型 碩士學位論文中采用單因素設(shè)計的比重較大,占94.0%,統(tǒng)計學設(shè)計正確率較高(Tab1).
2.2 統(tǒng)計學方法 論文中使用經(jīng)典的基本統(tǒng)計學方法的占絕對多數(shù),為97.9%(856/874),統(tǒng)計學方法的正確應(yīng)用率為75.7%,且不同的統(tǒng)計學方法之間的正確應(yīng)用率存在著差別.應(yīng)用參數(shù)統(tǒng)計方法者518次,應(yīng)用正確者357次,正確應(yīng)用率為68.9%;應(yīng)用非參數(shù)統(tǒng)計方法者346次,應(yīng)用正確者305次,正確應(yīng)用率為88.1%.對參數(shù)統(tǒng)計方法的正確應(yīng)用率低于非參數(shù)統(tǒng)計方法(χ2 =35.8,P
表1 碩士論文的實驗設(shè)計類型及正確應(yīng)用情況 略
表2 論文中應(yīng)用的統(tǒng)計學方法分布及正確應(yīng)用情況 略
表3 獲取結(jié)果時使用的計算工具 略
2.3 數(shù)理統(tǒng)計問題 論文中存在的問題在參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計中的構(gòu)成不同,應(yīng)用參數(shù)統(tǒng)計時出現(xiàn)的問題是未進行使用條件判斷者159次,未正確應(yīng)用統(tǒng)計方法者9次,推斷結(jié)論有誤者19次;而應(yīng)用非參數(shù)統(tǒng)計時出現(xiàn)問題是未進行使用條件判斷者8次,未正確應(yīng)用統(tǒng)計方法者14次,推斷結(jié)論有誤者21次(兩者相比χ2 =48.31,P
3 討論
在碩士研究生的基礎(chǔ)理論教學中,開設(shè)數(shù)理統(tǒng)計學的主要目的是為了指導(dǎo)研究生正確地應(yīng)用統(tǒng)計學的原理與方法,解決醫(yī)學研究中如何科學地進行科研資料的搜集、整理和分析推斷問題.傳統(tǒng)的經(jīng)典的和基本的統(tǒng)計學理論與方法仍然是當前碩士研究生進 行科研工作的統(tǒng)計學方面的主要工具.論文中采用的完全隨機、配對及配伍等單因素設(shè)計的比重較大占94.0%,多因素設(shè)計占的比重較少為6.0%,總的來說,其統(tǒng)計學設(shè)計的正確率是比較高的.說明學生對統(tǒng)計學設(shè)計理論比較重視并能正確應(yīng)用.論文中使用經(jīng)典的基本統(tǒng)計學方法占絕對多數(shù)為97.9%(856/874),主要為t檢驗、F檢驗、χ2 檢驗及秩和檢驗等,這與這些方法成熟、簡單明了且實用性極強有很大關(guān)系,而近些年來新發(fā)展的比較前沿的統(tǒng)計學分析方法[5-12] ,由于對設(shè)計要求嚴格,使用過程復(fù)雜,非專業(yè)人員在短時間內(nèi)難以掌握而實際應(yīng)用較少.這提示在今后的研究生教學過程中,除應(yīng)繼續(xù)進行基礎(chǔ)部分內(nèi)容的學習外,還應(yīng)加強新的統(tǒng)計學方法和使用條件的教學力度.
論文中以基本的經(jīng)典的統(tǒng)計學方法為主,但實際應(yīng)用時的正確應(yīng)用率僅為75.7%,且不同的統(tǒng)計學方法之間的正確應(yīng)用率存在著差別,對參數(shù)統(tǒng)計方法的正確應(yīng)用率低于非參數(shù)統(tǒng)計方法.經(jīng)進一步分析,應(yīng)用參數(shù)統(tǒng)計時出現(xiàn)的主要問題是未進行適用條件判斷,而應(yīng)用非參數(shù)統(tǒng)計時出現(xiàn)的主要問題則是推斷結(jié)論有誤.作為一門應(yīng)用學科,數(shù)理統(tǒng)計學有著其獨特的邏輯性,概念多、公式多且連貫性強,眾多的公式和分析方法既有聯(lián)系又有區(qū)別,同時有著嚴格的適用條件.傳統(tǒng)的教材編寫和教學重點是統(tǒng)計學方法的計算技巧,其結(jié)果容易將學生引導(dǎo)到僅注重學習統(tǒng)計計算方法上,忽略了各種方法的適用條件和對資料的綜合分析.所以t檢驗、F檢驗等經(jīng)典的統(tǒng)計方法雖看似簡單,但要正確應(yīng)用到實際工作中,對學生來說仍有相當難度.秩和檢驗等非參數(shù)統(tǒng)計由于其適用條件較參數(shù)統(tǒng)計寬松,使得其正確應(yīng)用率高于參數(shù)檢驗,而并非學生對非參數(shù)檢驗掌握的比參數(shù)檢驗更好.
隨著計算機技術(shù)和統(tǒng)計軟件的完善與普及,各種復(fù)雜的統(tǒng)計計算不必再用手工計算.本次研究表明大部分人(91.0%)通過應(yīng)用著名的統(tǒng)計分析軟件SPSS及SAS獲取結(jié)果,這些結(jié)果比手工計算的更準確、更規(guī)范,所以各種統(tǒng)計方法的計算過程大可不必細致介紹,而要重點介紹各種數(shù)理統(tǒng)計方法的使用條件,加強資料分析實踐,提高碩士生解決實際問題的能力.
參考文獻
[1]Wang GS,Qian GS,Yang XJ,Huang CJ,Wei H.The statis-tics of application of laboratory animals in clinical research pa-pers in China [J].Di-san Junyi Daxue Xuebao(Acta Acad Med Militaris Tertiae),1997;19(2):163-165.
[2]Chen P,Zu SX.The analysis of statistical techniques used in the Chinese journal of clinical medicine [J].Anhui Yike Daxue Xue-bao(Acta Univ Med Anhui),1998;33(2):108-110.
[3]Fang JQ,Ling L,Zhang MR.Frequently appearing statistical mistakes in recent medical articles and relevant suggestions [J].Zhongshan Yike Daxue Xuebao(Acad J Sun Yat-sen Univ Med Sci),1999;20(4):314-318.
[4]Wang Q,Zhang BH.Current use of statistical methods in five core Chinese medical journals [J].Zhonghua Yixue Zazhi(Natl Med J China),1998;78(3):230-233.
[5]Zhang GK,Yao C,Xu YY.Contrast between two schools of thought on hypothesis test [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(2):85-87.
[6]Shang L,Xu YY,Hou RL,Zhang SP,Zhou YR,Chen CS.Comparison of different approaches of fitting centile curves for growth standard [J].Di-si Junyi Daxue Xuebao(J Fourth Mil Med Univ),2000;21(6):676-678.
[7]Li XS,Ni ZZ.On the problems of fitting linear regression mo-dels for hierachically structured data in medical research [J].Huaxi YikeDaxueXuebao(J WestChina Univ Med Sci),1999;30(1):59-62.
[8]Li XS,Zhang WT,Ni ZZ.Multilevel models in analysis of crossover design [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(5):273-275.
[9]Li XS,Liu QY,Ni ZZ.Meta analysis using multilevel models [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999:16(3):133-135.
[10]Sun XW,F(xiàn)ang JQ,Yang XF.Number-theoretic method for pa-rameters estimation in multivariate nonlinear regression with ap-plication [J].Zhongguo Weisheng Tongji(Chin J Health Statist),1999;16(1):6-7.