《再生權(quán)最小二乘法穩(wěn)健估計》根據(jù)作者多年從事測量數(shù)據(jù)處理的教學(xué)與研究工作成果撰寫而成。首先,介紹了再生權(quán)最小二乘法的基本原理和計算方法,討論了再生權(quán)最小二乘法穩(wěn)健估計在測量控制網(wǎng)平差、多元線性回歸和坐標(biāo)系統(tǒng)轉(zhuǎn)換中的具體應(yīng)用。然后,介紹了一種確定穩(wěn)健估計方法的穩(wěn)健特性的仿真實驗方法,并通過仿真實驗,討論了再生權(quán)最小二乘法和13種常用穩(wěn)健估計方法的穩(wěn)健特性以及它們中相對更為有效的穩(wěn)健估計方法。最后,對測量控制網(wǎng)平差、一元線性和非線性回歸的有關(guān)問題進行了討論。
更多科學(xué)出版社服務(wù),請掃碼獲取。
第1章 穩(wěn)健估計
1.1 穩(wěn)健估計概述
測量都具有觀測誤差,觀測誤差分為三類:一類是具有隨機性的偶然誤差;一類是帶有規(guī)律性的系統(tǒng)誤差;此外還有粗差(outlier或grosserror),泛指離群的誤差。統(tǒng)計學(xué)家根據(jù)大量觀測數(shù)據(jù)分析指出,在生產(chǎn)實踐和科學(xué)實驗中,粗差出現(xiàn)的概率約占觀測總數(shù)的。這些少量的粗差會對參數(shù)估計結(jié)果造成嚴重的干擾。隨著科學(xué)技術(shù)的進步,人們對測量結(jié)果的精度要求越來越高。因此,尋求有效的方法消除或減弱粗差顯得越來越重要。
目前,對含粗差觀測值的處理主要采用兩種方法:其一是將含粗差觀測值視為期望異常,用統(tǒng)計檢驗方法剔除含粗差的觀測值后再用最小二乘法進行處理;其二是將含粗差觀測值視為方差異常,采用穩(wěn)健估計方法處理。最早引起重視的是統(tǒng)計檢驗法,歸納起來是一個辨別、定位和調(diào)節(jié)改正的過程。其實質(zhì)是假設(shè)觀測誤差服從均值漂移模型,將粗差歸于函數(shù)模型處理。當(dāng)存在多個粗差,且系統(tǒng)結(jié)構(gòu)不佳時,僅僅依靠最小二乘法的殘差檢測來定位粗差的辦法具有很大的局限性。有鑒于此,穩(wěn)健估計的理論和方法應(yīng)運而生。
穩(wěn)健估計(robustestimation)也稱抗差估計,是指在粗差不可避免的情況下,選擇適當(dāng)?shù)墓烙嫹椒,使參?shù)估值盡可能地減免其影響,得出正常模式下的最優(yōu)或接近最優(yōu)的參數(shù)估值。
早在19世紀初,已有學(xué)者提出了減免粗差干擾的估計方法。但直到20世紀五六十年代,隨著電子計算機的發(fā)展,穩(wěn)健估計理論和方法的研究才得以深入。Box于1953年首次提出“穩(wěn)健性”(robustness)的概念。隨后,Tukey于1960年提出了污染分布模式。Hub [5]于1964年發(fā)表“定位參數(shù)的穩(wěn)健估計”一文,提出了M估計理論。Hampel于196)年提出了影響函數(shù)和崩潰點的概念。Holland和界613:11[6]于1977年提出了選權(quán)迭代法。Stigerra于同年提出了中位數(shù)估計法。之后,Stiger與Bloomfield又提出了估計法(本書中記為法)。HuberHam-pet Rousseeuw和Ler等均對穩(wěn)健估計進行了卓有成效的研究,并先后發(fā)表了有影響力的論著,為穩(wěn)健估計奠定了理論基礎(chǔ)。經(jīng)過眾多數(shù)理統(tǒng)計學(xué)家不斷地開拓和研究,穩(wěn)健估計理論深入發(fā)展,成為應(yīng)用到眾多學(xué)科的分支科學(xué)。
丹麥的Kramp和Kubik等于1980年將穩(wěn)健估計理論引入測量界,提出了著名的“丹麥法”由于穩(wěn)健估計方法能夠較好地處理測量數(shù)據(jù)中含有粗差的問題,大地測量界掀起了穩(wěn)健估計的研究熱潮,產(chǎn)生了大量有價值的研究成果。
1983年,Rousseeuw等提出了最小剪切二乘法(LTS法)。LTS法對杠桿點具有很好的抵抗性,但是計算效率比較低。隨后,Rousseeuw[11]等又提出了最小中位數(shù)二乘法(LMS法)、S估計法和"估計法。Yohai于1987年提出MM估計法,在保證M估計穩(wěn)健性的前提下,提高了M估計的計算效率。1989年,周江文[12,13]提出等價權(quán)的概念,將M估計最小二乘化,使傳統(tǒng)最小二乘法具備了抗差能力,并提出兩種有效的估計方案——IGGI方案和IGGII方案。楊元喜[14,15]對等價權(quán)原理進行了擴充,提出了IGGIII方案,并且針對相關(guān)等價權(quán)不對稱的問題,構(gòu)造了雙因子方差膨脹模型和雙因子等價權(quán)模型,導(dǎo)出了各種平差模型的參數(shù)抗差估計公式。徐培亮[16]也給出了相關(guān)觀測的穩(wěn)健估計方法。劉經(jīng)南和姚宜斌等[17]提出了基于等價方差-協(xié)方差陣的穩(wěn)健最小二乘估計理論,這種方法不僅可以控制觀測異常的影響,而且保持了原有觀測的相關(guān)性不變。歐吉坤[18]提出了一種三步抗差方案,用分步變常數(shù)法提高了參數(shù)估值的計算效率。為了控制設(shè)計空間誤差的影響,提出了杠桿點評估和設(shè)計空間抗差的IGGIV方案。徐培亮[19]提出了符號約束的抗差估計。王志忠和朱建軍[2e]等研究了適合污染誤差模型估計的最優(yōu)性準則,提出了均方差極小原則下的參數(shù)抗差估計。楊元喜[21,22]提出了依據(jù)誤差分布實際情形的自適應(yīng)抗差估計和抗差方差分量估計,導(dǎo)出了抗差擬合推估解法。針對病態(tài)性與粗差同時存在的問題,Nyquist和Slvapulle提出了基于M估計的抗差嶺估計。隋立芬[23,24]對其原理和性質(zhì)進行了研究,提出了抗差組合主成分估計和抗差單參數(shù)主成分估計。歸慶明等[25]運用有偏估計的壓縮變換方法,提出了壓縮型抗差估計。彭軍還[26]證明了基于誤差方差膨脹模型與基于誤差均值漂移模型所得到的無偏估計公式的等價性。估計作為一類重要的抗差估計,也得到了廣泛而深入的研究。孫海燕[27]和周世健[28,29]等研究了?m范分布的密度函數(shù),估計的抗差性和效率,誤差分布和估計方法之間的關(guān)系。周秋生[30]提出了利用線性規(guī)劃求解估計問題的方法,并且依據(jù)線性規(guī)劃的對偶原理給出了求解問題的實用方法。在動態(tài)數(shù)據(jù)處理方面,楊元喜[31~33]提出了抗差Kalman濾波,分析了多種抗差濾波的理論基礎(chǔ),討論了抗差自適應(yīng)濾波解的性質(zhì),構(gòu)建了抗差自系。
1.2最小N乘法原理
1.最小二乘法
最小二乘法,又稱最小平方法,是一種數(shù)學(xué)優(yōu)化技術(shù)。它是通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配。自Gauss于1809年提出以來,最小二乘法廣泛應(yīng)用于測量及其他科學(xué)工程領(lǐng)域。
在測量數(shù)據(jù)處理中,Gauss-Markov模型是最常見的模型之一。其基本模型是模型(1-1)還可表示為
測量平差中一般將式(1-2)表示為
式(1-3)稱為誤差方程。上式中,L表示nX1階觀測值矩陣;P(XW)表示觀測值L的權(quán)陣;Dl表示觀測值L的協(xié)方差陣表示單位權(quán)方差表示觀測值L的真誤差;V表示觀測值L的改正數(shù),是真誤的估值表示階系數(shù)矩陣;表示以1階未知數(shù)真值矩陣階未知數(shù)估值矩陣。
按最小二乘法求解Gauss-Markov模型中的參數(shù)估值V,即是要求準則函數(shù)將對X求導(dǎo)并令其為零,得
將式(1-3)代入得令
則式(1-7)寫成
式稱為法方程(normalequations),其解為
由式(1-9)求得的參數(shù)估值確保了VTPV=min。
將式(1-9)代入式(1-3)得觀測值的改正數(shù)V和觀測值的估值L:
單位權(quán)中誤差的估值
未知數(shù)的協(xié)因數(shù)陣:
應(yīng)用最小二乘準則時,并不需要知道觀測向量服從何種概率分布,而只需知道它的先驗權(quán)陣即可!
當(dāng)P為非對角陣時,表示觀測值相關(guān),按VTPV=min進行的平差稱為相關(guān)觀測平差。
當(dāng)P為對角陣時,表示觀測值不相關(guān),此時最小二乘準則可表示為純量形式,即
特別地,當(dāng)觀測值不相關(guān)且等精度時,權(quán)陣P為單位陣,此時最小二乘準則可表為
2.最小N乘法
當(dāng)觀測值不相關(guān)且等精度時,最/J、?s準則函數(shù)為
當(dāng)N=1時,即為最小一乘法的準則函數(shù):
當(dāng)N=2時,即為最小二乘法的準則函數(shù):
當(dāng)N=3時,即為最小三乘法的準則函數(shù):
當(dāng)N=4時,即為最小四乘法的準則函數(shù):
當(dāng)尺時,即為最小無窮乘法的準則函數(shù):
3.算例
設(shè)有線性方程組
式(1-21)中,方程的數(shù)量r=3,未知數(shù)的數(shù)量n=6。未知數(shù)的數(shù)量大于方程的數(shù)量,所以未知數(shù)具有無窮多組解。表1.1列出了N為1、2、3、4和無窮大時式(1-21)未知數(shù)(精確到0.1)的部分解。由表1.1可知,當(dāng)未知數(shù)的解精確到0.1時,最小一乘法有31組解(第1-31行),約束條件式(1-16)的值為14.0;最小二乘法有1組解(第32行),約束條件式(1-17)的值為59.0;最小三乘法有1組解(第33行),約束條件式(1-1))的值為214.3;最小四乘法有1組解(第34行),約束條件式(1-19)的值為765.7;最小無窮乘法有25組解(第35!59行),約束條件式(1-20)的值為3.7。
。1)不同的約束條件下未知數(shù)的解是不盡相同的。
……