《信息技術(shù)和電氣工程學(xué)科國(guó)際知名教材中譯本系列:凸優(yōu)化》從理論、應(yīng)用和算法三個(gè)方面系統(tǒng)地介紹凸優(yōu)化內(nèi)容。
凸優(yōu)化在數(shù)學(xué)規(guī)劃領(lǐng)域具有非常重要的地位。從應(yīng)用角度看,現(xiàn)有算法和常規(guī)計(jì)算能力已足以可靠地求解大規(guī)模凸優(yōu)化問(wèn)題,一旦將一個(gè)實(shí)際問(wèn)題表述為凸優(yōu)化問(wèn)題,大體上意味著相應(yīng)問(wèn)題已經(jīng)得到徹底解決,這是非凸的優(yōu)化問(wèn)題所不具有的性質(zhì)。從理論角度看,用凸優(yōu)化模型對(duì)一般性非線性優(yōu)化模型進(jìn)行局部逼近,始終是研究非線性規(guī)劃問(wèn)題的主要途徑,因此,通過(guò)學(xué)習(xí)凸優(yōu)化理論,可以直接或間接地掌握數(shù)學(xué)規(guī)劃領(lǐng)域幾乎所有重要的理論結(jié)果。由于上述原因,對(duì)于涉足優(yōu)化領(lǐng)域的人員,無(wú)論是理論研究還是實(shí)際應(yīng)用,都應(yīng)該對(duì)凸優(yōu)化理論和方法有一定程度的了解。
本書(shū)內(nèi)容非常豐富。理論部分由4章構(gòu)成,不僅涵蓋了凸優(yōu)化的所有基本概念和主要結(jié)果,還詳細(xì)介紹了幾類基本的凸優(yōu)化問(wèn)題以及將特殊的優(yōu)化問(wèn)題表述為凸優(yōu)化問(wèn)題的變換方法,這些內(nèi)容對(duì)靈活運(yùn)用凸優(yōu)化知識(shí)解決實(shí)際問(wèn)題非常有用。應(yīng)用部分由3章構(gòu)成,分別介紹凸優(yōu)化在解決逼近與擬合、統(tǒng)計(jì)估計(jì)和幾何關(guān)系分析這三類實(shí)際問(wèn)題中的應(yīng)用。算法部分也由3章構(gòu)成,依次介紹求解無(wú)約束凸優(yōu)化模型、等式約束凸優(yōu)化模型以及包含不等式約束的凸優(yōu)化模型的經(jīng)典數(shù)值方法,以及如何利用凸優(yōu)化理論分析這些方法的收斂性質(zhì)。通過(guò)閱讀本書(shū),能夠?qū)ν箖?yōu)化理論和方法建立完整的認(rèn)識(shí)。
本書(shū)對(duì)每章內(nèi)容都配備了大量習(xí)題,因此也非常適合用作教科書(shū)。實(shí)際上,該書(shū)多年來(lái)已在美國(guó)多所大學(xué)用于課堂教學(xué),近兩年也在清華大學(xué)自動(dòng)化系用作相關(guān)研究生課程的主要教材。
本書(shū)由美國(guó)斯坦福大學(xué)StephenBoyd教授和加州大學(xué)洛杉磯分校LievenVanden-berghe教授合著,從理論、應(yīng)用和算法三個(gè)方面系統(tǒng)地介紹凸優(yōu)化內(nèi)容。
凸優(yōu)化在數(shù)學(xué)規(guī)劃領(lǐng)域具有非常重要的地位。從應(yīng)用角度看,現(xiàn)有算法和常規(guī)計(jì)算能力已足以可靠地求解大規(guī)模凸優(yōu)化問(wèn)題,一旦將一個(gè)實(shí)際問(wèn)題表述為凸優(yōu)化問(wèn)題,大體上意味著相應(yīng)問(wèn)題已經(jīng)得到徹底解決,這是非凸的優(yōu)化問(wèn)題所不具有的性質(zhì)。從理論角度看,用凸優(yōu)化模型對(duì)一般性非線性優(yōu)化模型進(jìn)行局部逼近,始終是研究非線性規(guī)劃問(wèn)題的主要途徑,因此,通過(guò)學(xué)習(xí)凸優(yōu)化理論,可以直接或間接地掌握數(shù)學(xué)規(guī)劃領(lǐng)域幾乎所有重要的理論結(jié)果。由于上述原因,對(duì)于涉足優(yōu)化領(lǐng)域的人員,無(wú)論是理論研究還是實(shí)際應(yīng)用,都應(yīng)該對(duì)凸優(yōu)化理論和方法有一定程度的了解。
本書(shū)內(nèi)容非常豐富。理論部分由4章構(gòu)成,不僅涵蓋了凸優(yōu)化的所有基本概念和主要結(jié)果,還詳細(xì)介紹了幾類基本的凸優(yōu)化問(wèn)題以及將特殊的優(yōu)化問(wèn)題表述為凸優(yōu)化問(wèn)題的變換方法,這些內(nèi)容對(duì)靈活運(yùn)用凸優(yōu)化知識(shí)解決實(shí)際問(wèn)題非常有用。應(yīng)用部分由3章構(gòu)成,分別介紹凸優(yōu)化在解決逼近與擬合、統(tǒng)計(jì)估計(jì)和幾何關(guān)系分析這三類實(shí)際問(wèn)題中的應(yīng)用。算法部分也由3章構(gòu)成,依次介紹求解無(wú)約束凸優(yōu)化模型、等式約束凸優(yōu)化模型以及包含不等式約束的凸優(yōu)化模型的經(jīng)典數(shù)值方法,以及如何利用凸優(yōu)化理論分析這些方法的收斂性質(zhì)。通過(guò)閱讀本書(shū),能夠?qū)ν箖?yōu)化理論和方法建立完整的認(rèn)識(shí)。
本書(shū)對(duì)每章內(nèi)容都配備了大量習(xí)題,因此也非常適合用作教科書(shū)。實(shí)際上,該書(shū)多年來(lái)已在美國(guó)多所大學(xué)用于課堂教學(xué),近兩年也在清華大學(xué)自動(dòng)化系用作相關(guān)研究生課程的主要教材。
本書(shū)前言及第1,3,5,7章由許鋆翻譯;第2,4,6,8章由黃曉霖翻譯;第9~11章及附錄部分由王書(shū)寧翻譯。全書(shū)由王書(shū)寧定稿。
感謝StephenBoyd教授提供本書(shū)英文版本的電子文件,為翻譯本書(shū)提供了極大的便利。
譯者
2012年10月
前言
本書(shū)研究?jī)?yōu)化問(wèn)題的一個(gè)重要分支凸優(yōu)化。事實(shí)上,最小二乘以及線性規(guī)劃問(wèn)題都屬于凸優(yōu)化問(wèn)題。眾所周知,關(guān)于最小二乘和線性規(guī)劃問(wèn)題的理論相當(dāng)成熟,這兩個(gè)問(wèn)題出現(xiàn)在很多應(yīng)用領(lǐng)域,均能很快地進(jìn)行數(shù)值求解。本書(shū)的基本觀點(diǎn)是,除了這兩個(gè)問(wèn)題以外,還有很多凸優(yōu)化問(wèn)題亦是如此。
盡管凸優(yōu)化的研究已經(jīng)持續(xù)了一個(gè)世紀(jì)左右,然而,最近一些相關(guān)的研究成果使得這一問(wèn)題重新引起人們的關(guān)注。這當(dāng)中首推對(duì)內(nèi)點(diǎn)法的重新認(rèn)識(shí)。內(nèi)點(diǎn)法于20世紀(jì)80年代提出,本是用以求解線性規(guī)劃問(wèn)題,但是最近人們認(rèn)識(shí)到,它亦可以被應(yīng)用于求解凸優(yōu)化問(wèn)題。這些新的方法使得我們可以如求解線性規(guī)劃一樣有效求解一些特殊的凸優(yōu)化問(wèn)題,如半定規(guī)劃以及二階錐規(guī)劃問(wèn)題。
第二個(gè)相關(guān)的研究成果是人們發(fā)現(xiàn)凸優(yōu)化問(wèn)題(不僅僅是最小二乘和線性規(guī)劃)在實(shí)踐中的應(yīng)用遠(yuǎn)遠(yuǎn)超乎人們的想象。從20世紀(jì)90年代開(kāi)始,凸優(yōu)化即被用在自動(dòng)控制系統(tǒng)、估計(jì)和信號(hào)處理、通信網(wǎng)絡(luò)、電路設(shè)計(jì)、數(shù)據(jù)分析及建模、統(tǒng)計(jì)和金融方面。此外,在組合優(yōu)化以及全局優(yōu)化方面,凸優(yōu)化經(jīng)常被用來(lái)估計(jì)最優(yōu)值的界以及給出近似解。我們相信,還有很多其他凸優(yōu)化的應(yīng)用領(lǐng)域正在等待著人們?nèi)グl(fā)現(xiàn)。
發(fā)現(xiàn)某個(gè)問(wèn)題是凸優(yōu)化問(wèn)題或能將其描述為凸優(yōu)化問(wèn)題將會(huì)大有裨益。最本質(zhì)的好處就是對(duì)此問(wèn)題可以用內(nèi)點(diǎn)法或者其他凸優(yōu)化方法進(jìn)行可靠且迅速的求解。這些求解方法可靠,足以嵌入于電腦輔助設(shè)計(jì)或分析工具,甚至用于實(shí)時(shí)響應(yīng)系統(tǒng)或者自動(dòng)控制系統(tǒng)。此外,將某個(gè)問(wèn)題描述為凸優(yōu)化問(wèn)題還具有理論或概念上的優(yōu)越性。例如,相應(yīng)的對(duì)偶問(wèn)題經(jīng)常可以基于原問(wèn)題給出有意義的解釋,有時(shí)可導(dǎo)向有效的或分布式的求解原問(wèn)題的方法。
我們認(rèn)為,凸優(yōu)化非常重要,任何從事計(jì)算數(shù)學(xué)的人至少需要對(duì)其有一定的了解。在我們看來(lái),凸優(yōu)化理所當(dāng)然地是繼近代線性代數(shù)(如最小二乘,奇異值)和線性規(guī)劃之后的又一重要領(lǐng)域。
本書(shū)目的
對(duì)于很多一般性的優(yōu)化方法,通常人們用它直截了當(dāng)?shù)卦嚱獯獾膯?wèn)題。凸優(yōu)化就與此不同,只有我們知道待解的問(wèn)題是凸的,它的優(yōu)越性才可能完整地體現(xiàn)出來(lái)。當(dāng)然,很多優(yōu)化問(wèn)題是非凸的,判斷某個(gè)問(wèn)題是否凸或者將某個(gè)問(wèn)題表述為凸優(yōu)化的形式是比較困難的。
本書(shū)的主要目的是幫助讀者掌握應(yīng)用凸優(yōu)化方法的相關(guān)知識(shí),即判斷、描述以及求解凸優(yōu)化問(wèn)題的技能和背景知識(shí)。
獲取凸優(yōu)化的相關(guān)應(yīng)用知識(shí)對(duì)數(shù)學(xué)要求較高,對(duì)于主要關(guān)注應(yīng)用的讀者更是如此。根據(jù)我們的經(jīng)驗(yàn),對(duì)于電氣工程以及計(jì)算科學(xué)的研究生來(lái)說(shuō),在這方面的投入會(huì)獲得良好的、有時(shí)是豐厚的回報(bào)。
在此之前,有不少關(guān)于線性規(guī)劃以及一般的非線性規(guī)劃的書(shū)籍,這些書(shū)籍的側(cè)重點(diǎn)在于問(wèn)題的描述,建模以及應(yīng)用。另有一些書(shū)籍主要討論凸優(yōu)化的理論,內(nèi)點(diǎn)法以及復(fù)雜度分析。本書(shū)介于二者之間,介紹一般的凸優(yōu)化理論,側(cè)重于問(wèn)題描述以及建模。
我們也要指出本書(shū)并不追求什么。它不是一本側(cè)重于凸分析或者凸優(yōu)化的數(shù)學(xué)知識(shí)的教材,已經(jīng)有一些別的書(shū)籍涵蓋了這些內(nèi)容。此外,本書(shū)也不是凸優(yōu)化算法的一個(gè)綜述。我們只是挑選了一些較好的算法,介紹其簡(jiǎn)化了的或者是典型的形式(但是它們?cè)趯?shí)踐中確實(shí)能發(fā)揮作用)。本書(shū)也不試圖涵蓋求解凸問(wèn)題的內(nèi)點(diǎn)法(或其他方法)的最新發(fā)展動(dòng)態(tài)。雖然本書(shū)所提供的一些數(shù)值仿真實(shí)例經(jīng)過(guò)了高度簡(jiǎn)化,但是我們認(rèn)為,它們能夠適應(yīng)一些潛在用戶的應(yīng)用要求。并且,對(duì)于一些凸優(yōu)化算法,本書(shū)詳細(xì)地探討了如何利用問(wèn)題的結(jié)構(gòu)使得求解更為迅速。對(duì)于所描述算法的復(fù)雜性理論,我們也只是以一種簡(jiǎn)單方式進(jìn)行了介紹。然而,對(duì)于內(nèi)點(diǎn)法的自和諧和復(fù)雜度分析的重要思想我們都有一定的介紹。
讀者范圍
對(duì)于在工作中需要用到數(shù)學(xué)優(yōu)化,或者更一般地說(shuō),用到計(jì)算數(shù)學(xué)的科研人員、科學(xué)家以及工程師,本書(shū)較為適合。這些人群包括直接從事優(yōu)化或者運(yùn)籌學(xué)的科技工作者,亦包括一些工作在其他科學(xué)和工程領(lǐng)域但是需要借助數(shù)學(xué)優(yōu)化工具的科技工作者,這些領(lǐng)域包括計(jì)算科學(xué)、經(jīng)濟(jì)學(xué)、金融、統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘等。本書(shū)主要針對(duì)后者,即可能使用凸優(yōu)化的科技工作者,而不是針對(duì)人數(shù)相對(duì)少很多的凸優(yōu)化領(lǐng)域的專家。
在閱讀本書(shū)之前,讀者只需要掌握現(xiàn)代微積分和線性代數(shù)的相關(guān)知識(shí)。如果讀者對(duì)一些基本的數(shù)學(xué)分析知識(shí)(如范數(shù)、收斂性、初等拓?fù)鋵W(xué))和基本的概率論有一定的了解,應(yīng)能較好地理解本書(shū)的所有論證和討論。當(dāng)然,我們希望即使沒(méi)有學(xué)過(guò)數(shù)學(xué)分析和概率論的讀者也能夠理解本書(shū)所有的基本思想和要點(diǎn)。此外,本書(shū)的正文以及附錄部分包含了數(shù)值計(jì)算和優(yōu)化方法需要的所有輔助資料,因此,讀者并不需要事先具備這些知識(shí)。
使用本書(shū)作為教材
我們希望本書(shū)能夠在不同的課程中作為基本教材或者是參考教材發(fā)揮它的作用。從1995年開(kāi)始,我們即在Stanford和UCLA的一些研究生課程中使用本書(shū)的初稿,這些課程包括線性優(yōu)化、非線性優(yōu)化和凸優(yōu)化(偏工程應(yīng)用)。我們的經(jīng)驗(yàn)表明,用一個(gè)研究生課程的四分之一時(shí)間即可以粗略講授完本書(shū)的大部分內(nèi)容,如果用一個(gè)滿學(xué)期的課程時(shí)間,講課進(jìn)度就可以比較從容,也可以增加更多的例子,并且可以更加詳盡地討論有關(guān)理論。若能用兩個(gè)四分之一的研究生課程時(shí)間,就可以對(duì)線性規(guī)劃和二次規(guī)劃(對(duì)于以應(yīng)用為目的的學(xué)生極為重要)這些基本內(nèi)容進(jìn)行較廣泛的討論,或者對(duì)學(xué)生布置更多的大練習(xí)。
本書(shū)可以作為線性優(yōu)化、非線性優(yōu)化等基礎(chǔ)課的參考讀物。對(duì)于涉及凸優(yōu)化的應(yīng)用領(lǐng)域如控制系統(tǒng)等課程,本書(shū)亦可以作為替換教材。此外,對(duì)于凸優(yōu)化方面更關(guān)注理論的課程,本書(shū)可以作為輔助教材,它提供了一些簡(jiǎn)單的實(shí)際例子。
致謝
本書(shū)的完成歷時(shí)將近十年。這十年中,我們收到了不少關(guān)于本書(shū)的反饋以及建議,這些建議來(lái)自我們的研究生、我們課程上的學(xué)生以及我們?cè)赟tanford和UCLA的同事等。篇幅有限,我們無(wú)法一一表達(dá)我們的感謝,僅列出下述名單,表達(dá)我們誠(chéng)摯的謝意。A.Aggarwal,V.Balakrishnan,A.Bernard,B.Bray,R.Cottle,A.d’Aspremont,
J.Dahl,J.Dattorro,D.Donoho,J.Doyle,L.ElGhaoui,P.Glynn,M.Grant,A.Hansson,T.Hastie,A.Lewis,M.Lobo,Z.-Q.Luo,M.Mesbahi,W.Naylor,P.Parrilo,
I.Pressman,R.Tibshirani,B.VanRoy,L.Xiao和Y.Ye.我們要感謝J.Jalden以及A. d’Aspremont 在時(shí)間序列分析§6.5.4 中所提供的例子,§6.5.5中的界定顧客喜好的例子也由他們提供。此外,感謝P.Parrilo對(duì)習(xí)題4.4和習(xí)題4.56所提供的建議。
我們還要特別感謝兩個(gè)人。ArkadiNemirovski引發(fā)了我們對(duì)凸優(yōu)化的興趣并且鼓勵(lì)我們撰寫(xiě)本書(shū)。而KishanBaheti對(duì)本書(shū)的完成也發(fā)揮了極大的作用。早在1994年的時(shí)候,他就鼓勵(lì)我們以凸優(yōu)化在實(shí)際工程中的應(yīng)用為題申請(qǐng)美國(guó)科學(xué)基金會(huì)的科研課程基金,本書(shū)可以認(rèn)為是當(dāng)年的基金成果,雖然在時(shí)間上可能有所滯后。
StephenBoydStanford,CaliforniaLievenVandenbergheLosAngeles,California
2003 年7 月
1 引言
1.1 數(shù)學(xué)優(yōu)化
1.2 最小二乘和線性規(guī)劃
1.3 凸優(yōu)化
1.4 非線性優(yōu)化
1.5 本書(shū)主要內(nèi)容
1.6 符號(hào)
參考文獻(xiàn)
I 理論
2 凸集
2.1 仿射集合和凸集
2.2 重要的例子
2.3 保凸運(yùn)算
2.4 廣義不等式
2.5 分離與支撐超平面
2.6 對(duì)偶錐與廣義不等式
參考文獻(xiàn)
習(xí)題
3 凸函數(shù)
3.1 基本性質(zhì)和例子
3.2 保凸運(yùn)算
3.3 共軛函數(shù)
3.4 擬凸函數(shù)
3.5 對(duì)數(shù)-凹函數(shù)和對(duì)數(shù)-凸函數(shù)
3.6 關(guān)于廣義不等式的凸性
參考文獻(xiàn)
習(xí)題
4 凸優(yōu)化問(wèn)題
4.1 優(yōu)化問(wèn)題
4.2 凸優(yōu)化
4.3 線性規(guī)劃問(wèn)題
4.4 二次優(yōu)化問(wèn)題
4.5 幾何規(guī)劃
4.6 廣義不等式約束
4.7 向量?jī)?yōu)化
參考文獻(xiàn)
習(xí)題
5 對(duì)偶
5.1 Lagrange對(duì)偶函數(shù)
5.2 Lagrange對(duì)偶問(wèn)題
5.3 幾何解釋
5.4 鞍點(diǎn)解釋
5.5 最優(yōu)性條件
5.6 擾動(dòng)及靈敏度分析
5.7 例子
5.8 擇一定理
5.9 廣義不等式
參考文獻(xiàn)
習(xí)題
Ⅱ 應(yīng)用
應(yīng)用
6 逼近與擬合
6.1 范數(shù)逼近
6.2 最小范數(shù)問(wèn)題
6.3 正則化逼近
6.4 魯棒逼近
6.5 函數(shù)擬合與插值
參考文獻(xiàn)
習(xí)題
7 統(tǒng)計(jì)估計(jì)
7.1 參數(shù)分布估計(jì)
7.2 非參數(shù)分布估計(jì)
7.3 最優(yōu)檢測(cè)器設(shè)計(jì)及假設(shè)檢驗(yàn)
7.4 Chebyshev界和Cherno.界
7.5 實(shí)驗(yàn)設(shè)計(jì)
參考文獻(xiàn)
習(xí)題
8 幾何問(wèn)題
8.1 向集合投影
8.2 集合間的距離
8.3 Euclid距離和角度問(wèn)題
8.4 極值體積橢球
8.5 中心
8.6 分類
8.7 布局與定位
8.8 平面布置
參考文獻(xiàn)
習(xí)題
Ⅲ 算法
9 無(wú)約束優(yōu)化
9.1 無(wú)約束優(yōu)化問(wèn)題
9.2 下降方法
9.3 梯度下降方法
9.4 最速下降方法
9.5 Newton方法
9.6 自和諧
9.7 實(shí)現(xiàn)
參考文獻(xiàn)
習(xí)題
10 等式約束優(yōu)化
10.1 等式約束優(yōu)化問(wèn)題
10.2 等式約束的Newton方法
10.3 不可行初始點(diǎn)的Newton方法
10.4 實(shí)現(xiàn)
參考文獻(xiàn)
習(xí)題
11 內(nèi)點(diǎn)法
11.1 不等式約束的極小化問(wèn)題
11.2 對(duì)數(shù)障礙函數(shù)和中心路徑
11.3 障礙方法
11.4 可行性和階段1方法
11.5 自和諧條件下的復(fù)雜性分析
11.6 廣義不等式問(wèn)題
11.7 原對(duì)偶內(nèi)點(diǎn)法
11.8 實(shí)現(xiàn)
參考文獻(xiàn)
習(xí)題
附錄
A 有關(guān)的數(shù)學(xué)知識(shí)
A.1 范數(shù)
A.2 分析
A.3 函數(shù)
A.4 導(dǎo)數(shù)
A.5 線性代數(shù)
參考文獻(xiàn)
B 雙二次函數(shù)的問(wèn)題
B.1 單約束二次優(yōu)化
B.2 S-程序
B.3 雙對(duì)稱矩陣的數(shù)值場(chǎng)
B.4 強(qiáng)對(duì)偶結(jié)果的證明
參考文獻(xiàn)
C 有關(guān)的數(shù)值線性代數(shù)知識(shí)
C.1 矩陣結(jié)構(gòu)與算法復(fù)雜性
C.2 求解已經(jīng)因式分解的矩陣的線性方程組
C.3 LU,Cholesky和LDLT 因式分解
C.4 分塊消元和Schur補(bǔ)
C.5 求解不確定線性方程組
650參考文獻(xiàn)
參考文獻(xiàn)
符號(hào)
索引