条件付確率 について、それが確率測度になるか否かは自明ではありません。実際、 を満たす集合, に対して適当な零集合 が存在し \begin{equation}P(A_{1}|\mathcal{G})(\omega)+P(A_{2}|\mathcal{G})(\omega)=P(A_{1}\cup A_{2}|\mathcal{G})(\omega),\quad\…
今回は前回の続きで木の成長と剪定について論じます。
データの分類に使われる代表的なアルゴリズムの1つである決定木を取り上げます。
今回は母分散が未知の場合の母平均の検定におけるサンプルサイズについて考えます。
今回は検定を適切に実施するために必要となるサンプルサイズについて考えます。
今回は 2 値判別問題に代理損失を用いることの正当性について考えることにします。
入力値に対してラベルを割り当てて複数のグループに振り分ける問題を判別問題と言います。特に 2 つのグループに振り分ける問題を 2 値判別問題と言います。例えば迷惑メールの振り分けは 2 値判別問題の典型例です。 今回は 2 値判別問題を機械学習の枠組み…
自然言語処理における前処理について個人的な経験を踏まえて思いつくまま書き出した備忘録です。
今回は相対エントロピーの非負性、いわゆるギブスの不等式について見ていきます。
今回は一般の可測空間上の 2 つの確率測度に対する相対エントロピーおよびそれに関する基本定理について紹介します。
形態素解析 MeCab(1)の続きです。
与えられた任意の文に対して、意味を持つ最小単位の音素(これを形態素と言います)に分解して、音素の品詞を判別する処理を形態素解析と言います。今回は形態素解析を行うツールである MaCab の使い方についての個人的なメモです。
今回はシャノンエントロピーとその特徴付けであるファデエフの公理系について紹介します。
今回は経験損失を最小化する学習アルゴリズムとその評価について議論します。
学習アルゴリズムの評価において必要となる不等式を証明します。
前回、学習アルゴリズムの評価方法として期待予測損失を用いる方法を紹介しましたが、この方法は統計的決定理論*1の枠組みで書き表すことが出来ます。 *1:統計的決定理論については「数理統計学 7 統計的決定理論 (1)」をご参照下さい。
今回から数回に亘って統計的機械学習について取り上げたいと思います。
物体に働く力は大きく分けて2種類あります。一つは物質に直接働く重力や電磁気力などの体積力、もう一つは物質の境界を通じて働く力である面積力です。今回は面積力である応力テンソルを取り上げたいと思います。
テンソル積は同型を除いて唯1つに決まりますが、この「同型を除いて」というのが曲者で、一見すると別物なのに同じものを表している、ということが起こります。これがテンソルの実態を掴みにくくしている理由の1つになっています。今回はその点について詳…
今回は物体の変形を表現するひずみテンソルについて見ていきたいと思います。
今回は「テンソルとは何か、なぜテンソルという概念が必要となるのか」について考えたいと思います。
大学の理学部(数物系)、工学部などの出身者であれば、テンソルという言葉を少なくても1度は耳にしたことがあると思います。重要な概念にも関わらず、どうしてテンソルは理解されないのか、その原因について考えてみたいと思います。
grep は言わずと知れた文字列検索コマンドです。
今回は非確率化検定における仮説の採否と有意水準の関係、いわゆるp値について考えます。
仮説の採否を観測値に照らして判断する手法である統計的仮説検定(または単に検定)について、統計的決定理論の枠組みの中で定式化していきます。
今回はラオ・ブラックウェルの定理について説明します。 ※本記事は2021/2/1に加筆修正を行いました。
今回は決定関数の優劣について説明します。
ここ最近、統計的機械学習という分野が流行っています。 自分は流行とは全く無関係に数理統計学を勉強している訳ですが、流行っているのを横目で見ているとやはり気にはなるもので、遅ればせながら本格的な書籍を読んでみたくなりました。ネットで調べてみる…
今回から統計的決定理論について取り上げます。
今回は十分統計量について説明します。 ※本記事は2021/2/1に全面的に加筆修正を行いました。