PROJECT STORY 04

ペーパーレス化を促進する
AIを使った手書き文字認識器の開発

ビジネス開拓事業部
プロダクト開発部

プロジェクトの経緯・課題

プロジェクトの経緯・課題

ペーパーレス化の流れを汲み、手書き文字認識器の開発に取り組む。文字認識をRPAなどと組み合わせた自動処理も見込む。

プロダクト開発部は、TSOL独自の「新しいプロダクト」を開発している部門です。昨今ペーパーレス化(紙書類の電子化)が進み、手書き書類を作成する機会は以前より少なくなっています。しかし、まだ手書き書類が残っている職場環境もあります。
そこで、私たちはAIを使った手書き文字認識器の開発に取り組んでいます。
ただの画像データではなく文字データとして扱えるようにすることで可能になることは多岐に渡ります。その中でも私たちは、メモ書きを文字データとして扱うことでRPAなどと組み合わせて自動処理が行えるようにしています。社内の申請フォーマットに合わせて自動入力し、その他の項目を埋めて申請可能な形にすることで、社内業務負担の大幅削減を目標にしています。
※RPA(ロボティック・プロセス・オートメーション)

解決方法

日本語は、ひらがな、カタカナ、漢字など、多種多様な文字を扱うため文字認識の難易度は高い。ディープラーニングによる画像認識AIなどにより、解消を目指す。

メモ書きは以下の流れで文字データ化します。まずはメモを画像化して、その画像をAIに送ります。そこでAIが画像認識した結果を元に文字データ化する流れです。
画像を文字データにするために、多くの文字データをAIに学習させているディープラーニングを採用しました。日本語で扱う文字には多くの種類が存在します。その中でJIS第一水準と呼ばれる漢字区分とひらがな、カタカナ、英数字と簡単な記号に対応することを目指しています。

開発における課題

まずは電車移動による交通費の申請手続きに活用できるように開発。駅名を対象に、予測文字を増やしていけるように進める。

現在の画像認識の主流であるディープラーニングは、多くのデータから法則を見つけ出す手法です。本プロジェクトでは大量の日本語手書き文字を集める必要がありますが、漢字を扱う言語のため文字の種類だけで膨大な数になってしまうことが課題になります。
現在は交通費の申請手続きをターゲットとしているので、駅名を対象文字として少しずつ増やしていくような開発・運用を行っています。
また、AIを使えば100%正解するというものではなく、AIで予測したあとで文字を補完する運用が必要になります。本プロジェクトは電車移動を想定していますので、予測された文字列と近い駅の名前を候補として提案する機能を持たせています。

開発における課題

お客さまの反応や将来の展望

検証段階で好評価。協力者も増え、着実な歩みを進めている。今後のプロダクト提供に向けて開発に努める。

まだプロダクトとして提供できていないためユーザーはいませんが、検証段階で山手線のみの文字認識機能をデモンストレーションした際に、いい反応がもらうことができました。また、協力してくださる方も徐々に増えていきました。
課題は多いですが、この体験を糧にプロダクト開発に努めていきます。