好みではない、でもやるときはやる
私は全体的にはデータ入力が好きだが、名簿や名刺の入力は好きではない。
私が好きなのは、データ入力の中でもアンケート回答の入力やネットでの情報収集などだ。名簿入力系は、好きでないからこそ、きちんとした単価でクライアントに見積りを出す。金額が通らなければ、受注しなければいいだけのこと。
とはいえ、受注すればあれこれ工夫してみる。
名刺に関してはOCR(原稿を画像としてパソコンに取り込み、その画像から文字として認識させる)が役に立つ。私は富士通のScanSnapというスキャナで名刺を読み取り、「名刺OCR」というソフトで文字認識させている。
ScanSnapが、名刺を連続してシュパッ、シュパッと取り込む様子はかわいらしい。「名刺OCR」も、思ったよりは正確に文字を認識する(ただし、凝ったデザインやカッコ良すぎる書体は全くムリ。ありふれたレイアウトにそっけない明朝体の名刺が、認識成績は一番いい)。
日本語は似た漢字が多いから文字認識は大変だろう、英字や数字は問題ないだろう…と、やる前は思っていた。ところが、OCRは単純な文字が苦手だ。Iとlと1(大文字アイと小文字エルと数字の1)などは、しょっちゅう間違って読み取られる。
そこで、名刺OCRでデータ化したあと秀丸エディタ上で確認する。文字に強調表示をかけて、大文字と小文字と数字をそれぞれ別の色で表示させたりすると、見落とした認識ミスを発見できる。
『月刊在宅入力者』を作っていた頃、はるばる新幹線でアーキーさんのお宅へ取材に行き、そのとき秀丸での色分け表示方法を実際に見せてもらったのが、役に立っている。
| 固定リンク


















