Amazon Transcribeで青空文庫を文字起こししてみる

Amazon Transcribeは、音声データを文字起こししてくれるサービスです。
最近日本語に対応し、Amazon Alexaで培った音声認識のテクノロジーが使われていると思いますが、その精度はどのくらいなのでしょう。

青空朗読という青空文庫の作品の朗読データを公開しているサービスがあるので、そこから芥川龍之介の「蜘蛛の糸」を文字起こししてみます。


音声ファイルを取り込むジョブを作成します。
名前と言語を選んで、音声ファイルを置いたS3のパスとファイル形式を選択するだけです。


ちょっとハマったのは「Audio sampling rate (Hz) 」の設定で、ここを間違えるとエラーになります。
設定しなければいい感じに調整してくれるっぽいので、ここは入力しないのが無難です。

11分のファイルでしたが、大体3分で文字起こしが完了しました。

 そこで犍陀多は大きな声を出して、「こら、罪人ども。この蜘蛛の糸は己のものだぞ。お前たちは一体誰に尋いて、のぼって来た。下りろ。下りろ。」と喚きました。
 その途端でございます。今まで何ともなかった蜘蛛の糸が、急に 犍陀多のぶら下っている所から、ぷつりと音を立てて断れました。ですから 犍 陀多もたまりません。あっと云う間もなく風を切って、独楽のようにくるくるまわりながら、見る見る中に暗の底へ、まっさかさまに落ちてしまいました。
 後にはただ極楽の蜘蛛の糸が、きらきらと細く光りながら、月も星もない空の中途に、短く垂れているばかりでございます。

蜘蛛の糸 芥川龍之介
そこで カンダタ は 大きな 声 を 出し て こら 再任 とも 孤独 も の 人 は 俺 の もの だ と お前 たち は 一体 誰 に 聞い て 登っ て き た 降りろ 降りろ ん と わめき まし た その 途端 で ござい ます 今 まで 何 と も なかっ た クモ の 糸 が 急 に カンダタ の ぶら下がっ て いる ところ から 靴 り と 音 を 立て て 切れ まし た ですから カンダタ も たまり ませ あっ という ま も なく 風 を 切っ て コマ の よう に くるくる 回り ながら 見る 見る うち に 闇 の 底 へ 真っ逆さま に 落ち て しまい まし た 後 に は ただ 極楽 の クモ の 糸 が キラキラ と 補足 光り ながら スキー も 子 も ない 空 の 中東 に 短く 垂れ て いる ばかり で ござい ます


丁寧で聞き取りやすい朗読だからというのもあるでしょうが、なかなかの精度です。

近い将来、打ち合わせの議事録を自動で起こしてくれるようなサービスが登場してくれるといいなー。