数理統計学４　測度論的確率論 - 数学、ときどき統計、ところによりＩＴ

今回はこれまでに定義した測度空間・可測関数・可測写像が統計学の文脈でどのように使われるのかを見ていきたいと思います。

確率変数と確率分布

偶然性を伴う現象を観測してデータを取り統計学を使って分析するとします。この場合、まず観測対象を確率空間 $(\Omega, \mathcal{F}, P)$ によりモデル化し、 $\omega\in \Omega$ に対する観測値を $X(\omega) \in \mathcal{X}$ と置きます。そして可測写像 $\Omega\to \mathcal{X}$ , $\omega\mapsto X(\omega)$ によって観測行為そのものを表します。

このことを理解するために、市民の年齢について統計調査をする、という具体的な状況を考えてみましょう。まずサンプルとなる市民を無作為に選びＩＤを割り振り、ＩＤ全体を $\Omega$ と置きます。 $\mathcal{F}$ を $\Omega$ の部分集合全体、 $P:\mathcal{F}\to [0,1]$ を $P(A):=\#A/\#\Omega$ とすれば、 $(\Omega, \mathcal{F},P)$ は確率空間になっています。

そして個人 $\omega\in \Omega$ の年齢を $X(\omega)$ とすれば、 $X:\Omega \to \mathbf{R}$ は市民の年齢を観測する行為と考えることが出来ます。通常、こうした調査では標本抽出は１回しか行いませんが、仮にもう１度標本抽出を行ったとしたとしましょう。一般的には１回目と２回目で $\omega \in \Omega$ に対応する個人が異なるため、１回目の $X(\omega)$ と２回目の $X(\omega)$ は異なる値を取ることになります。つまり $X(\omega)$ は偶然によって決まる値であり、後述する様にこれを確率測度で評価する必要があるため $X$ には可測性を仮定します。

以上を踏まえ確率変数を次のように定義します。

定義１（確率変数）　 $(\Omega, \mathcal{F}, P)$ を確率空間、 $(\mathcal{X}, \mathcal{A})$ を測度空間とする。このとき $\mathcal{F}/\mathcal{A}$ -可測写像 $X:\Omega\to \mathcal{X}$ を確率変数と呼ぶ。

先程見たように確率変数の取る値は偶然性を伴い変化しますが、このことに関して何らかの傾向（例えば $X(\omega)$ が $a$ から $b$ までの範囲に入る $\omega \in \Omega$ は全体の何パーセントか等）を知ることが統計学における基本的な関心事になります。そこで次の概念を導入します。

定義２（確率分布）　 $(\Omega, \mathcal{F}, P)$ を確率空間、 $(\mathcal{X}, \mathcal{A})$ を可測空間、 $X:\Omega \to \mathcal{X}$ を確率変数とする。このとき\begin{equation} P^{X}(A) := P(X^{-1}(A)), \ A \in \mathcal{A} \notag \end{equation}で導入される $(\mathcal{X},\mathcal{A})$ 上の確率測度 $P^{X}$ を $X$ の確率分布と呼ぶ。

なお、現実の問題を統計学を使って分析する場合、 $(\Omega, \mathcal{F}, P)$ を直接モデル化することはあまり無く、議論の出発点において現象の背後にある存在として抽象的に与え、具体的な分析は得られたデータを表現する $(\mathcal{X},\mathcal{A},P^{X})$ で行われることが殆どでです。

さて統計学では、観測から得られた生データ $x\in \mathcal{X}$ を標本平均や標本分散などの、いわゆる統計量 $T(x)$ に加工して利用することが一般的です。一般にデータの属する可測空間 $(\mathcal{X}, \mathcal{A})$ から別の可測空間 $(\mathcal{T}, \mathcal{B})$ への $\mathcal{A}/\mathcal{B}$ -可測写像 $T$ を統計量と呼んでいます。

確率変数の積分

$X$ を $\mathbf{R}$ -値の確率変数とします。 $X$ の積分値が有限の場合、これを期待値と呼び、統計学ではしばしば以下の記号を使って書かれます。\begin{equation} E_{P}[X]:=\int _{\Omega} X(\omega )P(d\omega ) = \int _{\mathbf{R}} x P^{X}(dx).\notag \end{equation}

また\begin{equation} E_{P}[(X-E_{P}[X])^2] =\int _{\Omega} (X(\omega)-E_{P}[X])^2P(d\omega) = \int _{\mathbf{R}} (x-E_{P}[X])^2P^{X}(dx) \notag \end{equation}は $X$ の分散と呼ばれ、統計学において重要な役割を演じます。

確率論における $\sigma$ -加法族の役割

最後に確率論において $\sigma$ -加法族が担う重要な役割について指摘しておきます。

$(\Omega, \mathcal{F}, P)$ を確率空間とし、 $\mathcal{X}$ を $\mathbf{R}$ 値の確率変数とします。

例えば $\sigma$ -加法族 $\mathcal{F}$ が $\mathcal{F} = \{\phi , \Omega\}$ であったとすると $X$ は定数関数\begin{equation}X(\omega ) = c, \ \omega \in \Omega \notag\end{equation}のみが許されます。

次に $\mathcal{F}=\{ \phi, A, A^{c}, \Omega\}$ であった場合は単関数\begin{equation}X(\omega ) = c_{A}1 _{A}(\omega) + c_{A^{c}} 1 _{A^{c}}(\omega), \ \omega \in \Omega \notag\end{equation}まで取ることが許されます。

このことから複雑な観測を行いたければ、それに応じた複雑な $\sigma$ -加法族を考えなければならないことが分かります。つまり $\sigma$ -加法族は観測によって得られる（現象の発生頻度や傾向といった確率論的な）情報そのものであること分かります。

次回は条件付期待値について説明します。

確率変数と確率分布

確率変数の積分

確率論における -加法族の役割

確率論における $\sigma$ -加法族の役割