数学、ときどき統計、ところによりIT

理論と実践の狭間で漂流する数学趣味人の記録

正則条件付確率

条件付確率 について、それが確率測度になるか否かは自明ではありません。実際、 を満たす集合, に対して適当な零集合 が存在し \begin{equation}P(A_{1}|\mathcal{G})(\omega)+P(A_{2}|\mathcal{G})(\omega)=P(A_{1}\cup A_{2}|\mathcal{G})(\omega),\quad\…

決定木(2)

今回は前回の続きで木の成長と剪定について論じます。

決定木(1)

データの分類に使われる代表的なアルゴリズムの1つである決定木を取り上げます。

仮説検定におけるサンプルサイズの決め方(2)

今回は母分散が未知の場合の母平均の検定におけるサンプルサイズについて考えます。

仮説検定におけるサンプルサイズの決め方

今回は検定を適切に実施するために必要となるサンプルサイズについて考えます。

2 値判別問題における代理損失と判別適合性

今回は 2 値判別問題に代理損失を用いることの正当性について考えることにします。

2 値判別問題

入力値に対してラベルを割り当てて複数のグループに振り分ける問題を判別問題と言います。特に 2 つのグループに振り分ける問題を 2 値判別問題と言います。例えば迷惑メールの振り分けは 2 値判別問題の典型例です。 今回は 2 値判別問題を機械学習の枠組み…

自然言語処理で文書を美味しく頂くための下拵え

自然言語処理における前処理について個人的な経験を踏まえて思いつくまま書き出した備忘録です。

ギブスの不等式

今回は相対エントロピーの非負性、いわゆるギブスの不等式について見ていきます。

測度論的相対エントロピー

今回は一般の可測空間上の 2 つの確率測度に対する相対エントロピーおよびそれに関する基本定理について紹介します。

形態素解析 MeCab(2)

形態素解析 MeCab(1)の続きです。

形態素解析 MeCab(1)

与えられた任意の文に対して、意味を持つ最小単位の音素(これを形態素と言います)に分解して、音素の品詞を判別する処理を形態素解析と言います。今回は形態素解析を行うツールである MaCab の使い方についての個人的なメモです。

シャノンエントロピーとファデエフの公理系

今回はシャノンエントロピーとその特徴付けであるファデエフの公理系について紹介します。

経験損失を最小化する仮説を導く学習アルゴリズムとその評価

今回は経験損失を最小化する学習アルゴリズムとその評価について議論します。

確率不等式

学習アルゴリズムの評価において必要となる不等式を証明します。

統計的機械学習と統計的決定理論の関係

前回、学習アルゴリズムの評価方法として期待予測損失を用いる方法を紹介しましたが、この方法は統計的決定理論*1の枠組みで書き表すことが出来ます。 *1:統計的決定理論については「数理統計学 7 統計的決定理論 (1)」をご参照下さい。

統計的機械学習

今回から数回に亘って統計的機械学習について取り上げたいと思います。

応力テンソル

物体に働く力は大きく分けて2種類あります。一つは物質に直接働く重力や電磁気力などの体積力、もう一つは物質の境界を通じて働く力である面積力です。今回は面積力である応力テンソルを取り上げたいと思います。

テンソルの具体的表現

テンソル積は同型を除いて唯1つに決まりますが、この「同型を除いて」というのが曲者で、一見すると別物なのに同じものを表している、ということが起こります。これがテンソルの実態を掴みにくくしている理由の1つになっています。今回はその点について詳…

ひずみテンソル

今回は物体の変形を表現するひずみテンソルについて見ていきたいと思います。

テンソルとは何か、なぜテンソルという概念が必要となるのか

今回は「テンソルとは何か、なぜテンソルという概念が必要となるのか」について考えたいと思います。

テンソルがなかなか理解されない3つの理由

大学の理学部(数物系)、工学部などの出身者であれば、テンソルという言葉を少なくても1度は耳にしたことがあると思います。重要な概念にも関わらず、どうしてテンソルは理解されないのか、その原因について考えてみたいと思います。

Windows 版 grep

grep は言わずと知れた文字列検索コマンドです。

数理統計学 11 p値

今回は非確率化検定における仮説の採否と有意水準の関係、いわゆるp値について考えます。

数理統計学 10 統計的仮説検定

仮説の採否を観測値に照らして判断する手法である統計的仮説検定(または単に検定)について、統計的決定理論の枠組みの中で定式化していきます。

数理統計学 9 ラオ・ブラックウェルの定理

今回はラオ・ブラックウェルの定理について説明します。 ※本記事は2021/2/1に加筆修正を行いました。

数理統計学 8 統計的決定理論 (2)

今回は決定関数の優劣について説明します。

はじめて機械学習の書籍を購入してみた

ここ最近、統計的機械学習という分野が流行っています。 自分は流行とは全く無関係に数理統計学を勉強している訳ですが、流行っているのを横目で見ているとやはり気にはなるもので、遅ればせながら本格的な書籍を読んでみたくなりました。ネットで調べてみる…

数理統計学 7 統計的決定理論 (1)

今回から統計的決定理論について取り上げます。

数理統計学 6 十分統計量

今回は十分統計量について説明します。 ※本記事は2021/2/1に全面的に加筆修正を行いました。