當(dāng)前位置：首頁(yè) > 编程资源 > 编程问答 >内容正文

编程问答

UA MATH566 统计理论 Bayes统计基础

發(fā)布時(shí)間：2025/4/14 编程问答 16 豆豆

生活随笔收集整理的這篇文章主要介紹了 UA MATH566 统计理论 Bayes统计基础小編覺(jué)得挺不錯(cuò)的,現(xiàn)在分享給大家,幫大家做個(gè)參考.

UA MATH566 統(tǒng)計(jì)理論 Bayes統(tǒng)計(jì)基礎(chǔ)

共軛分布
- 基于后驗(yàn)概率預(yù)測(cè)新的觀測(cè)值

Bayes統(tǒng)計(jì)思想的基礎(chǔ)是Bayes公式
$P(Ci∣A)=P(A,Ci)P(A)=P(A∣Ci)P(Ci)∑i=1nP(A∣Ci)P(Ci)P(C_i|A) = \frac{P(A,C_i)}{P(A)}= \frac{P(A|C_i)P(C_i)}{\sum_{i=1}^n P(A|C_i)P(C_i)}$

其中 $P(C_i)$ 是先驗(yàn)概率， $P(A|C_i)$ 是似然， $P(C_i|A)$ 是后驗(yàn)概率。頻率派統(tǒng)計(jì)關(guān)注的焦點(diǎn)是似然函數(shù)（樣本信息），貝葉斯學(xué)派則使用似然函數(shù)（樣本信息）與先驗(yàn)概率（先驗(yàn)信息）。

假設(shè)隨機(jī)變量為 $X$ ，定義在概率空間 $(Ω,F,Pθ)(\Omega,\mathcal{F},P_{\theta})$ 上， $f(x,θ)f(x,\theta)$ 是概率 $PθP_{\theta}$ 的密度函數(shù)。貝葉斯統(tǒng)計(jì)認(rèn)為 $θ\theta$ 也是一個(gè)隨機(jī)變量，定義在參數(shù)空間 $Θ\Theta$ 上，概率密度為 $π(θ)\pi(\theta)$ ，即先驗(yàn)密度。根據(jù)貝葉斯公式，給定一組樣本 $X\textbf{X}$ ，參數(shù)的后驗(yàn)密度為
$π(θ∣X)=f(X,θ)f(X)=∏i=1nf(xi∣θ)π(θ)∫Θ∏i=1nf(xi∣θ)π(θ)dθ\pi(\theta|\textbf{X}) = \frac{f(\textbf{X},\theta)}{f(\textbf{X})} = \frac{\prod_{i=1}^nf(x_i|\theta)\pi(\theta)}{\int_{\Theta} \prod_{i=1}^nf(x_i|\theta)\pi(\theta)d\theta}$

基于后驗(yàn)密度可以計(jì)算后驗(yàn)風(fēng)險(xiǎn)（參考UA MATH574M 統(tǒng)計(jì)學(xué)習(xí)I 監(jiān)督學(xué)習(xí)理論），然后做一些統(tǒng)計(jì)決策。比如使用平方損失，后驗(yàn)均值就是參數(shù)的Bayes估計(jì)；使用絕對(duì)值損失，后驗(yàn)中位數(shù)就是參數(shù)的Bayes估計(jì)。后驗(yàn)密度的含義就是給定樣本時(shí)參數(shù)的密度函數(shù)，因此用后驗(yàn)密度的分位點(diǎn)就可以構(gòu)成參數(shù)的置信區(qū)間，何種置信區(qū)間叫做可信區(qū)間（Credible Intervals）。后驗(yàn)密度中與參數(shù)有關(guān)的部分被稱為后驗(yàn)核（kernel），大部分分布憑核就可以識(shí)別出來(lái)，比如

分布核

$N(μ,σ2)N(\mu,\sigma^2)$	$exp(?12σ2(x?μ)2)exp(-\frac{1}{2\sigma^2}(x-\mu)^2)$
$Γ(α,λ)\Gamma(\alpha,\lambda)$	$xα?1e?λxx^{\alpha-1}e^{-\lambda x}$
$Beta(α,β)Beta(\alpha,\beta)$	$xα?1(1?x)β?1x^{\alpha-1}(1-x)^{\beta-1}$

例1 假設(shè) $B e r (p)$ 中 $\sim Beta(\alpha,\beta)$ ，則
$π(p∣X)∝p∑i=1nXi(1?p)n?∑i=1nXipα?1(1?p)β?1=p∑i=1nXi+α?1(1?p)n?∑i=1nXi+β?1\pi(p|\textbf{X}) \propto p^{\sum_{i=1}^nX_i}(1-p)^{n-\sum_{i=1}^nX_i}p^{\alpha-1}(1-p)^{\beta-1} = p^{\sum_{i=1}^nX_i+\alpha-1}(1-p)^{n-\sum_{i=1}^nX_i+\beta-1}$

這說(shuō)明 $p∣X～Beta(∑i=1nXi+α,n?∑i=1nXi+β)p|\textbf{X}\sim Beta(\sum_{i=1}^nX_i+\alpha,n-\sum_{i=1}^nX_i+\beta)$

例2 假設(shè)多元分布 $(1;p1,?,pr)(1;p_1,\cdots,p_r)$ 中 $(p1,?,pr)～Dir(α1,?,αr)(p_1,\cdots,p_r) \sim Dir(\alpha_1,\cdots,\alpha_r)$ ，則
$π(p1,?,pr∣X)∝∏i=1rpi∑i=1nXi∏i=1rpiαi?1=∏i=1rpi∑i=1nXi+α?1\pi(p_1,\cdots,p_r|\textbf{X}) \propto \prod_{i=1}^r p_i^{\sum_{i=1}^n X_i} \prod_{i=1}^r p_i^{\alpha_i-1} = \prod_{i=1}^rp_i^{\sum_{i=1}^n X_i+\alpha-1}$

這說(shuō)明 $(p1,?,pr)∣X～Dir(∑i=1nX1+α1,?,∑i=1nXr+αr)(p_1,\cdots,p_r)|\textbf{X}\sim Dir(\sum_{i=1}^n X_1+\alpha_1,\cdots,\sum_{i=1}^n X_r+\alpha_r)$ ，其中 $X1,?,XrX_1,\cdots,X_r$ 都是Bernoulli變量。

共軛分布

上面的兩個(gè)例子有一個(gè)很重要的性質(zhì)，先驗(yàn)分布與后驗(yàn)分布都是beta分布，我們稱這種先驗(yàn)分布與后驗(yàn)分布相同時(shí)的分布為共軛分布族，更準(zhǔn)確一點(diǎn)，稱Beta分布是 $B e r (p)$ 的共軛分布族，從先驗(yàn)到后驗(yàn)的參數(shù)變換規(guī)則是
$Beta(α,β)→Beta(∑i=1nXi+α,n?∑i=1nXi+β)Beta(\alpha,\beta) \to Beta(\sum_{i=1}^nX_i+\alpha,n-\sum_{i=1}^nX_i+\beta)$

下面列出了一些典型的共軛分布族的表：

統(tǒng)計(jì)模型共軛分布族的參數(shù)變換

$B e r (p)$	$Beta(α,β)→Beta(∑i=1nXi+α,n?∑i=1nXi+β)Beta(\alpha,\beta) \to Beta(\sum_{i=1}^nX_i+\alpha,n-\sum_{i=1}^nX_i+\beta)$
$N(θ,σ02)N(\theta,\sigma_0^2)$ ， $σ02\sigma^2_0$ 已知	$N(θ1,1λ0)→N(λ0θ1+(n/σ02)Xˉλ0+n/σ02,σ02n+λ0σ02)N(\theta_1,\frac{1}{\lambda_0}) \to N(\frac{\lambda_0\theta_1 + (n/\sigma_0^2)\bar{X}}{\lambda_0+n/\sigma^2_0},\frac{\sigma_0^2}{n+\lambda_0\sigma^2_0})$
$Pois(λ)Pois(\lambda)$	$Γ(α,β)→Γ(α+∑i=1nXi,β+n)\Gamma(\alpha,\beta) \to \Gamma(\alpha+\sum_{i=1}^n X_i,\beta+n)$

基于后驗(yàn)概率預(yù)測(cè)新的觀測(cè)值

基于樣本 $X={X1,?,Xn}\textbf{X} = \{X_1,\cdots,X_n\}$ 預(yù)測(cè)新的觀測(cè)值 $X_*$ ，只需要根據(jù)下面的公式就可以計(jì)算出新觀測(cè)值的分布：
$fX?∣X(x?)=∫Θf(x?∣θ)π(θ∣X)dθf(wàn)_{X_*|\textbf{X}}(x_*) = \int_{\Theta} f(x_*|\theta)\pi(\theta|\textbf{X})d\theta$

下面列出了上表共軛分布族的新觀測(cè)值分布：

統(tǒng)計(jì)模型共軛分布族新觀測(cè)值的分布

$B e r (p)$	$Ber(β+n?∑i=1nXiα+β+n)Ber(\frac{\beta + n - \sum_{i=1}^n X_i}{\alpha+\beta+n})$
$N(θ,σ02)N(\theta,\sigma_0^2)$ ， $σ02\sigma^2_0$ 已知	$N(λ0θ1+(n/σ02)Xˉλ0+n/σ02,σ02n+λ0σ02+1λ0)N(\frac{\lambda_0\theta_1 + (n/\sigma_0^2)\bar{X}}{\lambda_0+n/\sigma^2_0},\frac{\sigma_0^2}{n+\lambda_0\sigma^2_0}+\frac{1}{\lambda_0})$
$Pois(λ)Pois(\lambda)$	$Negbin(∑i=1nXi+α,1n+β+1)Negbin(\sum_{i=1}^n X_i +\alpha,\frac{1}{n+\beta+1})$

第三個(gè)結(jié)果是比較意外的，在共軛分布下，新觀測(cè)服從負(fù)二項(xiàng)分布而不是原來(lái)的Poisson分布，這里給一個(gè)簡(jiǎn)單的推導(dǎo)：
$fX?∣X(x?)=∫Θf(x?∣θ)π(θ∣X)dθ=∫0∞λX?X?!e?λλα+∑i=1nXi?1(β+n)α+∑i=1nXiΓ(α+∑i=1nXi)e?(α+∑i=1nXi)λdλ=(β+n)α+∑i=1nXiΓ(α+∑i=1nXi)X?!∫0∞λ∑i=1nXi+α+X??1e?(n+β+1)λdλ=(β+n)α+∑i=1nXiΓ(α+∑i=1nXi)X?!Γ(α+∑i=1nXi+X?)(n+β+1)∑i=1nXi+α+X?=C∑i=1nXi+α+X??1∑i=1nXi+α(n+βn+β+1)n+∑i=1nXi(1n+β+1)X?f_{X_*|\textbf{X}}(x_*) = \int_{\Theta} f(x_*|\theta)\pi(\theta|\textbf{X})d\theta \\ = \int_0^{\infty} \frac{\lambda^{X_*}}{X_*!}e^{-\lambda}\frac{\lambda^{\alpha+\sum_{i=1}^n X_i-1}(\beta+n)^{\alpha+\sum_{i=1}^nX_i}}{\Gamma(\alpha+\sum_{i=1}^nX_i)}e^{-(\alpha+\sum_{i=1}^nX_i)\lambda}d\lambda \\ = \frac{(\beta+n)^{\alpha+\sum_{i=1}^nX_i}}{\Gamma(\alpha+\sum_{i=1}^nX_i)X_{*}!}\int_0^{\infty} \lambda^{\sum_{i=1}^n X_i+\alpha+X_{*}-1}e^{-(n+\beta+1)\lambda}d\lambda \\ = \frac{(\beta+n)^{\alpha+\sum_{i=1}^nX_i}}{\Gamma(\alpha+\sum_{i=1}^nX_i)X_{*}!}\frac{\Gamma(\alpha+\sum_{i=1}^nX_i+X_{*})}{(n+\beta+1)^{\sum_{i=1}^n X_i + \alpha + X_{*}}} \\ = C_{\sum_{i=1}^n X_i + \alpha + X_{*}-1}^{\sum_{i=1}^n X_i + \alpha} \left( \frac{n+\beta}{n+\beta+1} \right)^{n+\sum_{i=1}^n X_i}\left( \frac{1}{n+\beta+1} \right)^{X_*}$

總結(jié)

以上是生活随笔為你收集整理的UA MATH566 统计理论 Bayes统计基础的全部?jī)?nèi)容，希望文章能夠幫你解決所遇到的問(wèn)題。

如果覺(jué)得生活随笔網(wǎng)站內(nèi)容還不錯(cuò)，歡迎將生活随笔推薦給好友。

上一篇： UA MATH564 概率论 Diric
下一篇： UA MATH571A 回归分析概念与