次へ: この文書について... 上へ: NMF で遊ぶ 戻る: Poisson 分布との関連

数値例

小学 1--6 年までの学習漢字 1006 を使って遊んでみた。

データは MSWindows に付属する MS ゴチックフォントを $32\times32$ ピクセルにラスタライズしたものを何の前処理もせずに用いた。論文のアルゴリズムをすなおに C でインプリメントしただけである。

恐ろしいことに、ゴンベン、ニンベン、テヘン、シンニョウなどが現れる。このようなセグメンテーションは、従来の工学的な文字認識の分野では自動的に切り分けることが難かしい問題である。少し驚いたので文章にしてみた。

Shinichi ASAKAWA 平成13年3月13日