决策理论的基本概念
1.2 決策理論的基本概念
客觀未知
概率模型適合于描述報酬依賴于有客觀明顯概率的事件(比如拋硬幣,轉輪盤等)
主觀未知
概率模型適合于描述報酬依賴于不明顯明顯概率的事件(比如股市,賽馬等)
基本符號
對于有限集合,我們用 Z 表示用  Δ ( Z ) \Delta(Z) Δ(Z) 表示集合 Z 的概率分布集合 即
  Δ Z = { q : Z → R ∣ ∑ y ∈ Z q ( y ) = 1 且 q ( z ) ? 0 , ? z ∈ Z } \Delta Z = \{q:Z\to R \mid \sum_{y\in Z}q(y) = 1 且 q(z) \geqslant 0, \forall z\isin Z\} ΔZ={q:Z→R∣y∈Z∑?q(y)=1且q(z)?0,?z∈Z}
 (按照常規的集合記號,上述大括號中的 “ ∣ \mid ∣” 表示“滿足···的條件”)
以買彩票為例子
f 都給出一個非負實數
f ( x ∣ t ) f(x\mid t) f(x∣t)
使得對 Ω \varOmega Ω中的每一個t都有
∑ x ∈ X f ( x ∣ t ) = 1 \sum_{x\in X}f(x\mid t)=1 x∈X∑?f(x∣t)=1
L = { f : Ω → Δ ( X ) } L = \{f:\varOmega \to \Delta(X)\} L={f:Ω→Δ(X)}
Δ ( X ) 表示集合 X 的概率分布 \Delta(X) 表示集合X的概率分布 Δ(X)表示集合X的概率分布
f ( ? ∣ t ) f(·\mid t) f(?∣t)
表示在狀態 t 下由 f 確定的 X 的概率分布,即 表示在狀態t下由f確定的X的概率分布,即 表示在狀態t下由f確定的X的概率分布,即
f ( ? ∣ t ) = ( f ( x ∣ t ) ) x ∈ X ∈ Δ ( X ) f(·\mid t) = (f(x\mid t))_{x\in X}\isin \Delta(X) f(?∣t)=(f(x∣t))x∈X?∈Δ(X)
這里的每個數  f ( x ∣ t ) f(x\mid t) f(x∣t)都可以被理解為若t是世界的真實狀態,
 則彩票 f 得到彩金 x 的客觀條件概率是 f ( x ∣ t ) f(x\mid t) f(x∣t)
 為了使這種解釋合乎情理,狀態必須被定義的足夠廣泛,以至于包括所有可能影響到所獲得的彩金的 主觀未知事件
我們假定,根據彩金集合X的定義,不同彩金之間相互排斥,且窮盡了決策者各種決策的可能結果。
事件
決策者關于世界真實狀態可能擁有的信息可以用一個 事件(event) 來描述,每個事件都是 Ω \varOmega Ω 的一個非空子集。
 我們用  Ξ \varXi Ξ 來表示所有事件組成的集合,則
Ξ = { S ∣ S ? Ω 且 S =? ? } \varXi = \{S\mid S\sube \varOmega 且 S\not= \emptyset\} Ξ={S∣S?Ω且S=?}
對于L(前面定義的彩票的集合)中的任意兩個彩票f和g,以及 Ξ \varXi Ξ中的任意事件S,當且僅當決策者知道了世界真實狀態在S中,
 則對于他來說f至少和g一樣的理想選擇的時候,我們才得到
  f ? s g f\gtrsim \small s \large g f?sg
  KaTeX \KaTeX KATE?X : 這表示,當且僅當決策者在只知道事件S已經發生而且又必須在f和g中選擇其中一個時,
 他自愿選擇了彩票f才有$ f\gtrsim \small s \large g $
給定的關系($ f\gtrsim \small s ) 我們可以定義關系 ( ) 我們可以定義關系( )我們可以定義關系(\succ ) 和 ( )和( )和(\sim$) 因此
 f ~ s g 當且僅當 f ? s g 且 g ? s f f ? s g 當且僅當 f ? s g 且 g ? s f f \sim \small s \large g \tiny \qquad 當且僅當 \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\gtrsim \small s \normalsize f \\ f \succ \small s \large g \tiny \qquad 當且僅當 \normalsize f\gtrsim \small s \large g \normalsize \quad 且 g\nsim \small s \normalsize f f~sg當且僅當f?sg且g?sff?sg當且僅當f?sg且g?sf
 這就是說,$f \sim \small s \large g $ 意味著,如果決策者在知道S之后只能在f和g之間選擇,他認為二者之間毫無差異;
 而  f ? s g f \succ \small s \large g f?sg則意味著在同樣的情況下,他嚴格偏向于f.
- 第二個公式解讀
 
當決策者知道S之后只能在f和g之間選擇,他認為二者之間有差異,且偏向于f,則他嚴格偏向于f
對于滿足 0 ≤ α ≤ 1 0\le \alpha \le 1 0≤α≤1中的任意一個數 α \alpha α和L中任意兩個彩票f與g,  α f + ( 1 ? α ) g \alpha f+(1-\alpha )g αf+(1?α)g表示L中這樣的彩票,使得
  [ α f + ( 1 ? α ) g ] ( x ∣ t ) = α f ( x ∣ t ) + ( 1 ? α ) g ( x ∣ t ) , ? x ∈ X , ? t ∈ Ω \lbrack \alpha f+(1-\alpha )g\rbrack (x\mid t) = \alpha f(x\mid t)+(1-\alpha)g(x\mid t),\\ \forall x \isin X, \forall t\in \varOmega [αf+(1?α)g](x∣t)=αf(x∣t)+(1?α)g(x∣t),?x∈X,?t∈Ω
- 公式解讀
 
我們假設從一個裝有白色球和黑色球的袋子里面抽取一個球,袋中黑色球的比例是 α \alpha α,那么白球的比例是 ( 1 ? α ) (1-\alpha) (1?α)。
 設想若取出的是黑球, 則決策者抽取的彩票為f,若取出的是白球,則決策者抽取的彩票為g。
 于是,如果t是真實的狀態,該決策者最終得到彩票的概率是 α f ( x ∣ t ) + ( 1 ? α ) g ( x ∣ t ) \alpha f(x\mid t)+(1-\alpha)g(x\mid t) αf(x∣t)+(1?α)g(x∣t)
- 因而, α f + ( 1 ? α ) g \alpha f+(1-\alpha )g αf+(1?α)g表示基于f和g并按照隨機的彩票選擇過程而產生的復合彩票。
 
對任意彩金x,我們令 [ x ] \lbrack x\rbrack [x]表示一個總是一定能給出彩金x的彩票。即,對每個狀態t都有
  [ x ] ( y ∣ t ) = 1 若 y = x , [ x ] ( y ∣ t ) = 0 若 y ≠ x \lbrack x\rbrack (y\mid t)=1 \quad 若y=x, \qquad \lbrack x\rbrack (y\mid t)=0 \quad 若y\neq x [x](y∣t)=1若y=x,[x](y∣t)=0若y=x
- 因而, α [ x ] + ( 1 ? α ) [ y ] \alpha \lbrack x\rbrack + (1-\alpha)\lbrack y\rbrack α[x]+(1?α)[y] 表示概率 α \alpha α和 ( 1 ? α ) (1-\alpha) (1?α)給出彩金x和彩金y的彩票
 
總結
                            
                        - 上一篇: CSP 201609-3 炉石传说
 - 下一篇: 网络编程之什么是计算机网络