ニューラルネットワークによる文字認識


 

7章 結論

7.1 文字認識について

 この二つの文字認識方法の特徴を考えてみると、以下の様になる。

 T.パターンマッチング

 一つ一つ学習データとして与えられた文字と比較していき、一番学習データと似ている文字を認識文字とする。つまり自分の持っている知識を一つずつ調べていくという、いわば人間でいえば左脳の働き(論理的思考)にあたいすると考えられる。

 U.ニューラルネットワーク

 与えられた学習データを学習する際に、ネットワーク自身がその特徴を見つけだし、記憶する。認識の際も文字の構成全体をみて認識するという、いわば人間の右脳の働き(直感的思考)にあたいすると考えられる。

 つまり、二つとも全く違った情報処理の方法であり、利点、欠点も相反するものである為、この二つの処理法をうまく組み合わせることにより、実際に人間が行っている様に正確に素早く文字の認識ができる様になると思われる。

 今後の課題としては、以下の3つのことがあげられる。

(1)データの入力をする際に、文字の拡大、縮小、回転などの加工を行えば、より認識率が上がると思われる。

(2)今回は学習データを学習者の字しか用意しなかったため、学習者以外の人の字では認識率がかなり悪かった。したがってこれらに対応するためには、学習者以外の人の字を学習データとするか、統計的手法によって複数の人の文字にも良く合うパターンを作り、それを学習データとして使用しなければならないと考えられる。

(3)ニューラルネットワークの扱うデータは本来アナログ量であるので、今回はデータ入力時に2値化を行ってしまったが、これを行わずにドットごとの濃度値をデータとして採用すれば、より認識率が上がると思われる。


 

7.2 ニューラルネットワークのその他の利用法

 ニューラルネットワークの行っている情報処理を行う機械としてニューロコンピューター、パターンマッチングの行っている情報処理を行う機械としてノイマン型コンピューターと考え、この二つを比較してみると表7.1のような特徴がある。

表7.1 ニューロコンピュータノイマンコンピュータとの比較
ニューロコンピューター ノイマン型コンピューター
・ノンアルゴリズミック ・アルゴリズミック
・訓練(学習)    ・命令群を用いたプログラミング
・記憶要素と処理要素は同一 ・記憶要素と処理要素は分離している
・多数過程を同時に追求  ・一時に一つの過程を追求
・非論理操作(直感) ・論理操作

 それぞれの得意とする処理分野は次のようになる。

T.ノイマン型コンピューター

 数値計算処理、記号処理、文字処理、論理演算処理、そして一般的には、少量データの逐次直列処理に用いられる。

U.ニューロコンピューター

 文字や図形などのパターン処理、そして一般的には、多量データの並列処理に用いられる。

 したがってニューロコンピューターは多量のデータを短時間で処理しなければならない場合に利用できると思われる。


 さらに、本来ニューロコンピューターの扱うデータはアナログ量である為、A/D変換をする必要がなく、あいまいなデータもそのまま利用できる。

 しかし、あいまいなデータを扱える分、出力される結果もあいまいな為、これをノイマン型コンピューターを使って、論理的に処理し、その正確さを増やすことによって、その処理の精度、反応速度共に一番良い処理ができると考えられる。

 また、人間の行う処理を模倣する場合もニューロコンピューターを利用した方がよいと思われる。

 具体的に言うと、例えばコンピューターに将棋をさせる場合、ノイマン型コンピューターだけで行おうとすると、次のような処理法になり、いくつかの欠点が出てくる。

T.次に打てるすべての手について考え、その中で一番有効な手を打つ。
U.局面が進むにつれて、次に打てる手が多くなりすべての手について考えることができなくなる。
V.したがって考える手をいくつか減らす。
W.その減らし方によって(アルゴリズムによって)その将棋の強さが決まる。さらに相手の打ち方によっても、かなり強さが変わってしまう。

 しかし人間が将棋を行う場合、いくつかの手を直感的に思いついて、そのいくつかの手の中から最善の手を論理的に選び出すという方法で処理を行っている。

 したがって直感的に思いつく部分をニューロコンピューターが処理し、論理的に選び出す部分をノイマン型コンピューターが処理すれば、人間の行っている処理を模倣できると思われる。

 つまりニューロコンピューターの利用法としては、人間がほとんど直感的思考で処理していると思われるパターン認識や音声認識などはニューロコンピューター単体での処理でも十分利用価値はあると思われるが、人間が直感的思考と論理的思考とを組み合わせて処理していると思われる文章の理解、翻訳などはニューロコンピューターを直感的思考の処理を行うものとして、利用していけば良いと考えられる。

以上。


参考文献へ進む 目次に戻る 展示室に戻る