next up previous
次へ: 数値例 上へ: NMF で遊ぶ 戻る: 出典

Poisson 分布との関連

オリジナルの最大化すべき目的関数は

$\displaystyle F=\sum_{i=1}^n\sum_{\mu=1}^m\left[V_{i\mu}\log\left(WH\right)_{i\mu}-\left(WH\right)_{i\mu}\right],$ (2)

で与えられる。

一方、Poisson 分布の密度関数は以下の通り

$\displaystyle \frac{\lambda^{x}}{x!}\exp^{-\lambda}.$ (3)

周知の通りポアソン分布は生起確率が非常に小さい場合の 理論分布である。 2 項分布との関連では言うと $ \lambda=np$ ここで p は生起確率、への近似と捉えることもできる。 密度関数を対数変換すれば

$\displaystyle \log\eqref{2}=x\log\lambda - \lambda + \log x!$ (4)

となる。この式を (2) 式と比べれば $ x\leftrightarrow V$, $ \lambda\leftrightarrow WH$ という対応が成り立つ。 (4) の第 3 項は観 測データのみによって決まる項なので無視すればよい。 すなわち (2) 式の意味はポアソン分布の最大対数尤度を 計算していることに相当する。すなわち $ V$ を観測データとして ポアソン分布に従う確率変数と考え、このような分布を与えるような 潜在クラスとその重みベクトルを求めていることになる。



Shinichi ASAKAWA 平成13年3月13日