データは MSWindows に付属する MS ゴチックフォントを ピクセル にラスタライズしたものを何の前処理もせずに用いた。論文のアルゴリズムをすな おに C でインプリメントしただけである。
恐ろしいことに、ゴンベン、ニンベン、テヘン、シンニョウなどが現れる。このよ うなセグメンテーションは、従来の工学的な文字認識の分野では自動的に切り分け ることが難かしい問題である。少し驚いたので文章にしてみた。