
この記事は6分で読むことができます。
2017-06-22更新 この記事は5分で読めます。
音声入力になると簡単?頭の中で考えたことがどんどん入力されていく感じ?実際にやってみると本当にそうです。しゃべったことがご入力されず、どんどん変換されていく様子は見ているだけでも楽しくなります。逆に、考えるのが追い付かない感じ。試してみませんか?
音声入力が普通になる時代到来?
勝間和代氏も始めた音声入力
勝間和代氏が、音声入力をするためにセットアップした机の様子を、誌面で見ました。本格的すぎて、こんなにシステム化しないといけないの?と逆にひきましたが、こういう時代なんだなあ頭の中に強烈に残ったのは事実です。
そして、最近タッチミスによる入力ミスが多いなあという自分の反省からも音声入力に興味を持つようになりました。
もともと入力の速度というのは仕事でかなり使っていたということもあって、自分なりに自信はあったのです。
けれども入力ミスというのはどうにもなりません。これは年齢によるものかもしれませんが、タッチミスの回数がなんとなく増えているような気がして・・・。
まず調べたスマホのアプリ
最近いろいろなところで音声入力の精度が上がったと言う話を聞きました。 iphone のsiriで指示を出すとしっかりと聞き取ってくれるようになりました。
そんな現実を考え、どのくらい精度が上がったのか自分で確かめてみたくて、音声入力のアプリを調べてみました。
もっとも音声入力への期待が湧き上がったのは、今回が初めてではありません。1年ほど前、たまたま自動車の中で聞いたラジオ番組の内容を記録に残しておきたいと思い、いわゆる「テープ起こし」をしてみました。
ストリーミングで配信されている間に 記録を残しておきたいので、早くやる必要があります。
その時に、アプリで音声を文字にしてくれるものはないか調べました。
1年前、アプリでの「テープ起こし」
実際便利なアプリはありました。有料版は考えてなかったので無料のものを選んだのですが、ラジオからの音声だったにもかかわらず、聞き取り自体は、思った以上に正確に聞き取ってくれました。
この時とった方法は、ラジオの音声をipadから出して、iphoneで拾ったという感じです。そんなことができるのか?という実験的な意味合いもあったので、期待度もそんなに高くなく、できたこと自体にとても嬉しくなりました。
できないこともありました。言葉が難しくなるとほとんど変換できませんでした。
無料ということもあるのでしょうが、一度に聞き取ってくれる文の量が限られていて、しかもそれをアプリ内でそのまま記録に残すということができませんでした。データがたまるたびに(それほど多い量ではありません)メールでパソコンへ送りました。
それでも「テープ起こし」は順調に進み、思った以上に簡単に文章にすることができました。
1年後の技術進歩。でも高額なアプリ
1年たち、きっと音声入力についての技術も進んで楽にできるようになったはず、という期待で、もう一度アプリを調べました。
でも、評判の良いものは有料になってしまいます。
音声認識を上手にしてくれるアプリというのはそれほど多くはないのですが、その中でも評判の良いものはごく限られてきます。
有料といってもパソコンのソフトを買うように何千円から何万円というような価格帯ではないのですが、ちょっと迷う・・・。アプリの場合、1000円を超えると考えてしまいます。
本を購入する時に、1000円という価格で購入をためらうかと言ったらそうでもないのに不思議です。
アプリに1,000円?
試用もしないでアプリに1,000円払いますか?
評判通りの使い勝手ならいいのですが(実際今まで有料版をいきなり購入という経験はありますけど)、試用期間がなくいきなりお金を払うというのは、もし気に入らなかったらただ捨てるだけ。 心配になってしまいます。
捨ててもいいか、という価格帯は、200円とか300円(私的に)。でも1000円を超える値段というのはどうでしょう・・・
音声入力、1年で進歩していた!
目に入った「google ドキュメント」
調べている間に、 「google ドキュメント」という言葉を見つけました。
なんだこれは・・・。音声入力ができる?しかも随分と評判が良いことも分かりました。お金もかからない・・・すぐ導入できそう・・・
これはトライしてみる価値はあります。
こうして「google ドキュメント」にトライ!
google chrome を開いてから 「google ドキュメント」をさらに開きます。
音声入力にするには「無題のドキュメント」を開いてから「ツール」の「音声入力」をクリックするだけ。
レッツ トライ!何だか緊張して声がかすれてしまいました。
それでもしっかりと聞き取ってくれます。
正確!「google ドキュメント」の音声入力
正確に入力が進んでいく様子は画面を見ていて驚くほどです。誤入力というのがもう少しあるのかと思っていましたがほとんどありません。
自分で入力していてもミスタッチとかしていて誤入力というのはある程度あるわけですけれどもそれがほとんどない!
ただ句読点とか改行とかはもしかしたら私のやり方が悪いのかもしれませんが、今のところできないような気がします。
入力の様子を見ていると、例えば「私は」の「は」ですが、「わ」と入力された後、文脈から判断されるのか後で「は」に変換し直されていきます。
賢い!音声認識がこんなに正確だとこれからの主流はコンピュータに音声で指示を出すことの方がメジャーになるのかもしれません。タッチが上手にできない人も、仕事が速くできるようになります。
ただオフィスで皆がブツブツブツブツ言う様子ってどうなんでしょうね。みんながやれば怖くない?
そういえばオフィスというのは以前は課ごとに何台かの電話があって、電話の音がひっきりなしに鳴り賑やかでした。今は個人持ちの携帯の時代になって、随分と オフィスが静かに。(私が知っている会社だけ?)
そういう中でぶつぶつ言いながらの入力はなかなかできないかな・・・
ちなみにこの文章も、「google ドキュメント」の音声入力で。修正は手入力です。