テープ起こし4

あのね、驚いたのは、

(hiroさん記事連載の途中だけど、ちょっと割り込み。)

 メンバーさんから届いたばかりの起こし原稿を読んでいた。まずは音と照らし合わせずに、文字だけを読んでいたのだけど、「あのね、驚いたのは、」という一節があってこちらも驚いた。

 普通のテープ起こしでは、「あのー」「えーと」などはケバとして削除する。だから、この「あのね」も削除されて不思議ではない。
 今回の音声は、たぶんその世界が好きな人にとってはよだれが出るような役者さんが語っている。「あのね」が削除されなかったことで、インタビュアーの問いかけに対して、おそらくちょっと身を乗り出して答える雰囲気が伝わっている。
 「あのね、驚いたのは、」

 テープ起こしを(1)情報内容の伝達を重視してしゃべりの雰囲気は消すべきものと、(2)しゃべりの雰囲気再現を狙うもの…の2種類に分けると、これは後者として絶妙に起こしていると思う。
 かといって、もちろんケバというケバみんな残しては読みにくい。ほとんど整理して、数カ所残してある。うまいなあ。

|

白熱した議論に石焼き芋

 納品してもらった起こしを聞き直し中。音声の中で時刻は夕方。バックに「いーしやーきいもー♪」が通っていく。
 自分の家の外かと思ったけど、やっぱり音声の中だ。教授たちが議論している建物のそばに道路があるらしい。秋だなあ。

 バックの音はいろいろある。
 音声の中で電話が鳴る。自分のところかと錯覚して慌てる。
 音声の中で、エレベーターがその階に着いたときのチャイムが鳴る(会議室がエレベーターホールに近いらしい)。うちのインターホンが鳴ったのかと誤解することがある。

 セミナー用に音声教材を録音するときは、余計な音が入ったらどうしようと結構緊張する。でもたとえ石焼き芋が通ったとしても、「これは実際の音声でもよくあることです」と平然と説明すればいいんだなあ、本当は。

|

夜中のテープ起こしは脳みそが弱くて

 「初歩的」な技術分野と起こしてしまうところだった。正しくは「総合的」な技術分野。単純な聞き間違いだけど、気づいてよかった。初歩的じゃないだろ、この分野は!と自分で突っ込みを入れて、入りそうな言葉を頭で考え直してから聞いたら聞き取れた。
 数日前は、何回聞いても「シー検査」としか聞こえない個所を、深呼吸して意味から考え直したら「立ち入り検査」だった。

 夜中になるともう脳みそが疲れていて、聞こえた言葉を頭で考え直す力が弱くなる。やっぱり午前中は絶好調。

|

このリズムに慣れる

 テープ起こしをする者にとって「聞き取りたい」という欲求、あるいは「聞き取れなければ失格」という呪縛は強い。

 だから、起こしにくい音声を頼むのは怖い。普通の何倍も作業時間をかけたりして、無理をしているんじゃないだろうか。それでも仕上がりはこれなのかと、自分を責めているかもしれない。
 もう廿の仕事はしたくないと思うかもしれない。特にこれから冬になると繁忙期で、私のところ以外だっていくらでも仕事はあるのだから。

 それで、この話題をわざわざオープンなブログで書くことにした。起こしにくい音声の対処法を考えるのは後ろめたいことではないと、自分にも言い聞かせたかったし。並行して、個別のメールでも状況をできるだけ説明した。
 最近、いつもお願いしている方々の納品メールが、以前より楽な感じになってきたように思う。

 録音がよくて、話者が明晰にしゃべっていて、資料も十分に添付されている、そんな音声だったら、聞き取れて当然かもしれない。聞き取れなければ、自分が語彙不足とか、ネット検索が下手とか、資料の読み取りがなってないとか、かもしれない。

 そうでない音声もある。
 ある程度の不明を出さないと起こせない音声というものが、現実に存在する。そう割り切ること、不明の多い起こしの作業リズムに慣れること。私は最近、難聴音声だからといって格別時間をかけていない(だって急ぎなんだもの、この仕事)。

|

25%も落ちがある仕事

 違うクライアントから来た難聴音声の話。
 とにかく録音が遠い。音量を最大近くに上げても大して聞き取れない。ちょっと起こして不明だらけのサンプルを送ったら、これでOKと言われたので作業スタート。
 「不明マークを500個入力し、マークの間にたまたま聞き取れた文字を入力」という難聴音声用の方法。音声は1時間半、粗起こしが終わった段階で、不明マーク800個以上(他に、聞こえたとおりにカタカナで入力したところがある)。文字数1万6000字。

 聞き直しをして、不明マーク645個。文字数は不明マークを含めて1万8000字。
 この話者は、しゃべるスピードが遅いというより間を取るタイプで、たぶん1時間に1万6000字ぐらいのペースだろうと思う。ということは、本当は1時間半なら2万4000字程度あるはずで、6000字が聞き取れていないことになる。
 (こういう音声だと、文字化した部分も正しく聞き取れているという確信は全然ないけど)

 驚いたのは、文字化率わずか75%のデータでも、全体を読んでみるとなんとなく話の大まかな流れは理解できることだ。あとはライターさんにお任せすべく、淡々と納品。
 最近こんな仕事が多いので、普通の録音状態の音声とどう違うか、自分のスタンスはどうあればいいか、だんだんわかってきた。その話はまた次回。

|

文字数を増やす

 音声1時間50分の審議会。粗起こしを終えた段階で不明マーク307個。最初に不明マークを500個も入力してスタートしたが、幸い200個近く余って消した。
 聞き直しで227個に減った。「聞こえたとおりにカタカナ」にしたものを含めても250個程度、このシリーズとしては悪くない。

 「録音状態がよくなく、内容が難しい仕事」をやっていると、不明マークを出すのが怖くなくなる。減らすぞ!と思って聞き直してはいない。増えてもかまわないというつもりで聞き直している。

 なぜなら、私の仕様では「不明マークは文字数に関わらず1カ所に1個」だから。不明マークに●を使うとすると、例えば粗起こしでは「しかし●、●。」というような状態が珍しくない。
 でも一度最後まで起こして、また最初から聞き直す段階では「しかしこれが問題とは●、難しい●が●になったと●ます。」ぐらいまで聞き取れたりする。
 不明2個は4個に倍増だけど、聞き取れた文字は倍増以上だから、当然これは退歩ではなく進歩だ。
 ここまで文字化してあれば、クライアントが聞き取れるかもしれない。違う耳で聞くと分かるときがあるし、クライアントは会議を生で傍聴しているわけだから。

 このシリーズはもう慣れたのでストレスではなくなったが、先週は違うところから来たすごい仕事をやっていた。音声1時間半で、不明600個超。この話はまた次回。

|