當前位置：首頁 > 编程资源 > 编程问答 >内容正文

编程问答

最优化方法（无约束）转载

發布時間：2024/4/17 编程问答 35 豆豆

生活随笔收集整理的這篇文章主要介紹了最优化方法（无约束）转载小編覺得挺不錯的,現在分享給大家,幫大家做個參考.

并沒有完全看懂，先收藏。在沒有約束條件的情況下，求函數的最優解。

梯度的方向與等值面垂直，并且指向函數值提升的方向。

二次收斂是指一個算法用于具有正定二次型函數時，在有限步可達到它的極小點。二次收斂與二階收斂沒有盡然聯系，更不是一回事，二次收斂往往具有超線性以上的收斂性。一階收斂不一定是線性收斂。

解釋一下什么叫正定二次型函數：

n階實對稱矩陣Q，對于任意的非0向量X，如果有X^TQX>0，則稱Q是正定矩陣。

對稱矩陣Q為正定的充要條件是：Q的特征值全為正。

二次函數，若Q是正定的，則稱f(X)為正定二次函數。

黃金分割法

黃金分割法適用于任何單峰函數求極小值問題。

求函數在[a,b]上的極小點，我們在[a,b]內取兩點c,d，使得a<c<d<b。并且有

1）如果f(c)<f(d)，則最小點出現在[a,d]上，因此[a,d]成為下一次的搜索區間。

2）如果f(c)>f(d)，則[c,b]成為下一次的搜索區間。

假如確定了[a,d]是新的搜索區間，我們并不希望在[a,d]上重新找兩個新的點使之滿足(1)式，而是利用已經抗找到有c點，再找一個e點，使滿足：

可以解得r=0.382，而黃金分割點是0.618。

練習：求函數f(x)=x*x-10*x+36在[1,10]上的極小值。

+ View Code

最速下降法

泰勒級數告訴我們：

其中Δx可正可負，但必須充分接近于0。

X沿D方向移動步長a后，變為X+aD。由泰勒展開式：

目標函數：

a確定的情況下即最小化：

向量的內積何時最小？當然是兩向量方向相反時。所以X移動的方向應該和梯度的方向相反。

接下來的問題是步長a應該怎么定才能使迭代的次數最少？

若f(X)具有二階連續偏導，由泰勒展開式可得：

H是f(X)的Hesse矩陣。?

可得最優步長：

g是f(X)的梯度矩陣。

此時：

可見最速下降法中最優步長不僅與梯度有關，而且與Hesse矩陣有關。

練習：求函數f(x1,x2)=x1*x1+4*x2*x2在極小點，以初始點X0=(1,1)T。

+ View Code

梯度下降法開始的幾步搜索，目標函數下降較快，但接近極值點時，收斂速度就比較慢了，特別是當橢圓比較扁平時，收斂速度就更慢了。

另外最速下降法是以函數的一次近似提出的，如果要考慮二次近似，就有牛頓迭代法。

牛頓迭代法

在點X^k處對目標函數按Taylar展開：

?令

得

即

可見X的搜索方向是，函數值要在此方向上下降，就需要它與梯度的方向相反，即。所以要求在每一個迭代點上Hesse矩陣必須是正定的。

練習：求的極小點，初始點取X=(0,3)。

+ View Code

?牛頓法是二次收斂的，并且收斂階數是2。一般目標函數在最優點附近呈現為二次函數，于是可以想像最優點附近用牛頓迭代法收斂是比較快的。而在開始搜索的幾步，我們用梯度下降法收斂是比較快的。將兩個方法融合起來可以達到滿意的效果。

收斂快是牛頓迭代法最大的優點，但也有致命的缺點：Hesse矩陣及其逆的求解計算量大，更何況在某個迭代點X^k處Hesse矩陣的逆可能根本就不存在（即Hesse矩陣奇異），這樣無法求得X^k+1。

擬牛頓法

Hesse矩陣在擬牛頓法中是不計算的，擬牛頓法是構造與Hesse矩陣相似的正定矩陣，這個構造方法，使用了目標函數的梯度（一階導數）信息和兩個點的“位移”（X_k-X_k-1）來實現。有人會說，是不是用Hesse矩陣的近似矩陣來代替Hesse矩陣，會導致求解效果變差呢？事實上，效果反而通常會變好。

擬牛頓法與牛頓法的迭代過程一樣，僅僅是各個Hesse矩陣的求解方法不一樣。

在遠離極小值點處，Hesse矩陣一般不能保證正定，使得目標函數值不降反升。而擬牛頓法可以使目標函數值沿下降方向走下去，并且到了最后，在極小值點附近，可使構造出來的矩陣與Hesse矩陣“很像”了，這樣，擬牛頓法也會具有牛頓法的二階收斂性。

對目標函數f(X)做二階泰勒展開：

兩邊對X求導

當X=X_i時，有

這里我們用H_i來代表在點X_i處的Hesse矩陣的逆，則

(5)式就是擬牛頓方程。

下面給出擬牛頓法中的一種--DFP法。

令

我們希望H_i+1在H_i的基礎上加一個修正來得到：

給定E_i的一種形式：

m和n均為實數，v和w均為N維向量。

(6)(7)聯合起來代入(5)可得：

下面再給一種擬牛頓法--BFGS算法。

(8)式中黑色的部分就是DFP算法，紅色部分是BFGS比DFP多出來的部分。

BFGS算法不僅具有二次收斂性，而且只有初始矩陣對稱正定，則BFGS修正公式所產生的矩陣H_k也是對稱正定的，且H_k不易變為奇異，因此BFGS比DFP具有更好的數值穩定性。

共軛方向法

最速下降法有鋸齒現像，收斂速度慢；而牛頓法需要計算Hesse矩陣而計算量大。共軛方向法收斂速度界于兩者之間，具有二次收斂性。共軛方向法屬于效果好而又實用的方法。

由于一般目標函數在最優點附近呈現為二次函數，因此可以設想一個算法對于二次函數比較有效，就可能對一般函數也有較好效果。共軛方向法是在研究對稱正定二次函數的基礎上提出來的。

則稱兩個向量P₀和P₁為Q的共軛向量。當Q為單位向量時，有，所以“共軛”是“正交”的推廣。

對于二次正定函數，從任意點X⁰出發，沿任意下降方向P⁰作直線搜索得到X¹，再從X¹出發，沿與P⁰共軛的方向P¹作直線搜索，即可得到f(X)的極小點。

當一組向量Pⁱ（i=1,2,...,n-1）為Q共軛時，從任意點出發，依次沿P⁰,P¹,P²,...,P^n-1方向作下述算法的直線搜索，經過n次迭代必定收斂于正定二次函數的極小點。

為確定最優步長t_k,令

現在問題是如何產生一組關于Q共軛的向量？這里一種叫作Gram-Schmidt的方法。

取線性無關的向量組V⁰,V¹,...,V^n-1，例如取n個坐標軸的單位向量。

取P⁰=V⁰.

上面的方法都是針對目標函數為正定二次函數的，對于一般非二次函數，可以通過二次近似。

這就是f(X)在極小點X*處的近似，是Hesse矩陣，相當于Q，由于X*未知，但當X⁰充分接近于X*時，可用近似代替，從而構造共軛向量。

理論與實踐證明，將二次收斂算法用于非二次的目標函數，亦有很好的效果，但迭代次數不一定保證有限次，即對非二次n維目標函數經n步共軛方向一維搜索不一定就能達到極小點。在這種情況下，為了找到極小點，可用泰勒級數將該函數在極小點附近展開，略去高于二次的項之后即可得該函數的二次近似。實際上很多的函數都可以用二次函數很好地近似，甚至在離極小點不是很近的點也是這樣。故用二次函數近似代替非二次函數來處理的方法不僅在理論分析上是重要的，而且在工程實際應用中也是可取的。

共軛梯度法

共軛梯度法是共軛方向法的一種延伸，初始共軛向量P⁰由初始迭代點X⁰處的負梯度-g⁰來給出。以后的P^k由當前迭代點的負梯度與上一個共軛向量的線性組合來確定：

對于非二次函數的優化問題，迭代次數不止n次，但共軛方向只有n個。當迭代n次后，可以把Pⁿ重新置為最開始的P⁰，其他的變量按原方法更新。

原文來自:博客園（華夏35度）http://www.cnblogs.com/zhangchaoyang 作者:Orisun

轉載于:https://www.cnblogs.com/litian0605/p/5253345.html

總結

以上是生活随笔為你收集整理的最优化方法（无约束）转载的全部內容，希望文章能夠幫你解決所遇到的問題。

如果覺得生活随笔網站內容還不錯，歡迎將生活随笔推薦給好友。

上一篇： C、Shell、Perl基于Tomcat
下一篇：怎样用jquery添加HTML代码

国产亚洲精品久久久久动-影视先锋中文字幕-av网站在线观看一区-亚洲视频 在线观看-久久亚洲不卡-欧美精品一区在线观看-欧美乱淫视频-欧美熟妇另类久久久久久不卡-粉嫩av一区二区三区四区五区-日韩欧美操

编程问答

最优化方法（无约束）转载

黃金分割法

最速下降法

牛頓迭代法

擬牛頓法

共軛方向法

共軛梯度法

總結

国产亚洲精品久久久久动-影视先锋中文字幕-av网站在线观看一区-亚洲视频在线观看-久久亚洲不卡-欧美精品一区在线观看-欧美乱淫视频-欧美熟妇另类久久久久久不卡-粉嫩av一区二区三区四区五区-日韩欧美操