« 文字数を増やす | トップページ | このリズムに慣れる »

25%も落ちがある仕事

 違うクライアントから来た難聴音声の話。
 とにかく録音が遠い。音量を最大近くに上げても大して聞き取れない。ちょっと起こして不明だらけのサンプルを送ったら、これでOKと言われたので作業スタート。
 「不明マークを500個入力し、マークの間にたまたま聞き取れた文字を入力」という難聴音声用の方法。音声は1時間半、粗起こしが終わった段階で、不明マーク800個以上(他に、聞こえたとおりにカタカナで入力したところがある)。文字数1万6000字。

 聞き直しをして、不明マーク645個。文字数は不明マークを含めて1万8000字。
 この話者は、しゃべるスピードが遅いというより間を取るタイプで、たぶん1時間に1万6000字ぐらいのペースだろうと思う。ということは、本当は1時間半なら2万4000字程度あるはずで、6000字が聞き取れていないことになる。
 (こういう音声だと、文字化した部分も正しく聞き取れているという確信は全然ないけど)

 驚いたのは、文字化率わずか75%のデータでも、全体を読んでみるとなんとなく話の大まかな流れは理解できることだ。あとはライターさんにお任せすべく、淡々と納品。
 最近こんな仕事が多いので、普通の録音状態の音声とどう違うか、自分のスタンスはどうあればいいか、だんだんわかってきた。その話はまた次回。

|

« 文字数を増やす | トップページ | このリズムに慣れる »

テープ起こし4」カテゴリの記事