数理統計学８　統計的決定理論（２） - 数学、ときどき統計、ところによりＩＴ

今回は決定関数の優劣について説明します。

はじめに決定関数の優劣に関する言葉を定義します。

定義　 $\delta_1,\ \delta_2\in \Delta$ とする。

任意の $\theta\in \Theta$ に対して $r(\theta,\delta_1)\le r(\theta,\delta_2)$ を満たすとき $\delta_1$ は $\delta_2$ より少なくても同程度に優れているという。
$\delta_1$ が $\delta_2$ より少なくても同程度に優れていて、かつ $r(\theta,\delta_1) \lt r(\theta,\delta_2)$ を満たす $\theta \in \Theta$ が存在するとき $\delta_1$ は $\delta_2$ より優れているという。
任意の $\theta \in \Theta$ に対して $r(\theta,\delta_1)= r(\theta,\delta_2)$ を満たすとき $\delta_1$ と $\delta_2$ は同等という。
任意の $\delta \in \Delta$ より $\delta _0\in \Delta$ が少なくても同程度に優れているとき、 $\delta _0$ は $\Delta$ の中で最良であるという。
$\delta _0 \in \Delta$ より優れた $\delta \in \Delta$ が存在しないとき、 $\delta _0$ は許容的であるという。

上記の言葉を用いれば統計的決定問題とは想定する確率分布の下、出来る限り優れた決定関数を見つける問題であるということが出来ます。この問題の解の探索範囲について一般には確率的決定関数全体 $\Delta$ ですが、決定空間 $\mathcal{D}$ と損失関数 $w$ に凸性がある場合は非確率的決定関数全体 $\Delta _0$ で考えれば十分であることが示せます。つまり

定理　統計的決定問題 $(\mathcal{X}, \mathcal{B},\mathcal{P},\Theta, \mathcal{D},\mathcal{A},\mathcal{w},\Delta)$ において次の２条件

$\mathcal{D}\subset \mathbf{R}^k$ で $\mathcal{D}$ は凸集合かつ $\mathcal{A}$ は $\mathcal{D}$ のボレル集合族全体、
各 $\theta \in \Theta$ で $w(\theta,\cdot)$ は $\mathcal{D}$ 上で定義された $\mathcal{A}$ -可測な凸関数であって $\| a\|_{\mathbf{R^k}}\to \infty$ のとき $w(\theta,\delta)\to \infty$

を満たすとする。このとき任意の $\delta \in\Delta \setminus \Delta _0$ に対して $\delta$ より少なくても同程度に優れている $\delta_0 \in \Delta _0$ が存在する。

証明　任意の $\delta \in\Delta \setminus \Delta _0$ を取り固定する。また\begin{equation} \Theta_0 :=\left\{ \theta \in \Theta \ | \ r(\theta,\delta) < \infty \notag \right\}\end{equation}

とする。 $\theta \in \Theta \setminus \Theta_0$ のときは任意の $\delta_0 \in\Delta_0$ に対して\begin{equation} r(\theta, \delta_0) \le r(\theta, \delta) = \infty \notag \end{equation}が成り立つから定理の主張は自明。

$\theta \in \Theta_0$ の場合に定理を証明する。\begin{equation}\mathcal{X}_{\infty} :=\left\{x\in \mathcal{X} \ \Bigg| \int _{\mathcal{D}} w(\theta,a)\delta(da, x) = \infty \right\} \notag \end{equation}とすると $P_{\theta}(\mathcal{X} _{\infty})=0$ が成り立つ。実際、 $P_{\theta}(\mathcal{X}_{\infty})\gt 0$ ならば任意の $n \gt 0$ に対して\begin{align*} r(\theta, \delta) & = \int _{\mathcal{X}} P_{\theta}(dx) \int _{\mathcal{D}} w(\theta,a)\delta (da, x) \\ & = \int _{\mathcal{X_{\infty}}} + \int _{\mathcal{X} \setminus \mathcal{X_{\infty}}} \ge \int _{\mathcal{X}_{\infty}} n \ P_{\theta}(dx) + \int _{\mathcal{X} \setminus \mathcal{X_{\infty}}} \ge n \ P_{\theta}(\mathcal{X}_{\infty})\end{align*}であるから $r(\theta, \delta) \lt \infty$ に反する。

一方、仮定２より適当な $\alpha _{P_{\theta}} \gt 0$ 、 $\beta _{P_{\theta}} \in \mathbf{R}$ を取って\begin{equation*} \alpha _{P_{\theta}} \| a\| _{\mathbf{R}^k}+ \beta _{P_{\theta}} \le w(\theta,a),\quad a\in \mathcal{D}\end{equation*}と出来る*1から $x \in \mathcal{X} \setminus \mathcal{X}_{\infty}$ に対して\begin{equation*} \int _{\mathcal{D}} \| a \| _{\mathbf{R}^k} \delta (da, x)\le \int _{\mathcal{D}} \frac{w(\theta, a)-\beta _{P_{\theta}}}{\alpha _{P_{\theta}}} \delta(da, x) \lt \infty .\end{equation*}

よって\begin{equation*} \varphi (x) := \begin{cases} \displaystyle \int _{\mathcal{D}} a \delta (da, x), & x \in \mathcal{X} \setminus \mathcal{X}_{\infty} \\ a_0 , & x \in \mathcal{X}_{\infty} \end{cases} \end{equation*} （ただし $a_0$ は $\mathcal{D}$ の任意の元）が定義できて、 $\varphi$ は $\mathcal{B}/\mathcal{A}$ -可測になる*2。さらに\begin{equation*}\delta _0(A, x):= \chi _{A} (\varphi(x)) ,\quad A \in \mathcal{A},\ x \in \mathcal{X} \end{equation*}

とすれば $\delta_0(A,\cdot)$ は $\mathcal{B}$ -可測、つまり $\delta_0\in\Delta _0$ となる。任意の $x\in \mathcal{X} \setminus \mathcal{X}_{\infty}$ に対し\begin{equation*} \delta _0(A,x)=0,\quad A\subset \mathcal{D}\setminus \{ \varphi (x)\}\notag\end{equation*}であるから\begin{equation*} \int _{\mathcal{D}} w(\theta,a)\delta _0(da,x)= \int _{\{\varphi (x)\}}+ \int _{\mathcal{D}\setminus \{ \varphi (x)\}} =w(\theta,\varphi (x)). \end{equation*}

よってイェンセンの不等式より\begin{align*} r(\theta, \delta_0) & = \int _{\mathcal{X}} P_{\theta}(dx)\int _{\mathcal{D}} w(\theta,a)\delta_0(da,x) \\ & = \int _{\mathcal{X} \setminus \mathcal{X}_{\infty}} P_{\theta}(dx) w(\theta,\varphi (x)) \\&= \int _{\mathcal{X} \setminus \mathcal{X}_{\infty}} P_{\theta}(dx) \ w\! \left(\theta,\int _{\mathcal{D}} a\delta (da,x)\right) \\ & \le \int _{\mathcal{X} \setminus \mathcal{X}_{\infty}} P_{\theta}(dx) \int _{\mathcal{D}} w(\theta,a)\delta (da,x)\\ & = r(\theta, \delta) \end{align*}

が成り立つ。（証明終）

次回はラオ・ブラックウェルの定理について説明します。

*1:鍋谷清治「数理統計学」の定理1.5.6 参照

*2: $\varphi$ を近似する関数列を $\varphi _n(x) = \sum _ia_{n,i}\delta (A_{n,i},x)$ とすると各 $\varphi _n$ は $\mathcal{B}/\mathcal{A}$ -可測なので $\varphi = \lim _{n}\varphi _{n}$ も $\mathcal{B}/\mathcal{A}$ -可測となります。