好奇心

直感・閃き・気になる事探究を楽しむ

Googleドキュメントが音声入力に対応したのでAmivoiceSPと比べてみた

Googleドキュメントが音声入力対応になったと話題になったので、どのくらいの変換精度なのかを動画を撮って、AmivoiceSPと比べてみた。そしてそこで気づく検閲の事実とこれからのアドオンの進化に期待
Googleドキュメントで音声入力精度の実験をしてみた

Googleドキュメントが音声入力に対応

よほどかつぜつが悪いカミカミマンじゃない限りは
Googleの音声認識精度の高さは音声検索で体感していると思う
その音声認識精度で文章が書けるのであれば
発言がそのまま文章となるほうが楽だよね
そこで、実際にテストしてみた

Googleドキュメント音声入力精度 VS AmivoiceSP入力操作

動画を見てAmivoiceSPに興味を持った方はこちら
Googleの音声認識は最初はよさげかな・・と思ったのですが
「、」「。」など、文章で多用する句読点の記号を変換できないのは痛いですね
※Googleドキュメントヘルプから引用

「Period」(ピリオド)
「Comma」(カンマ)
「Exclamation point」(感嘆符)
「Question mark」(疑問符)
「New line」(改行)
「New paragraph」(改段落)
注: 現在のところ、上記の句読点がサポートされているのは
ドイツ語、英語、スペイン語、フランス語、イタリア語、ロシア語のみです。

つまり、まだ日本語は入力に対応してないというだけで
今後は日本語を含めアジア圏の言語にも対応していくでしょう
おまけとして音声入力ソフトのAmivoiceSPと比べてみましたが
音声認識精度はどっこいとしても、やはり改行や記号変換の強みを感じました
でも、ある意味、ショックだったのは・・
AmivoiceSPには音声認識レベルという自分の声を聞かせれば聞かせるほど
学習して聞き取り能力を成長させて、誤変換を減らすという仕組みがあります
amivoicwsp 音響学習
・・今まで学習させた声、494万4884ボイスで、実はレベルが88
Googleの音声認識はデフォルトでそれと同クラスだった!Σ(゚Д゚;)オソルベシ
また、windws7 と windowsセブン という変換の違いなどから
音声入力ソフトは覚えさせた言葉しか変換できないのに対し
Googleドキュメントの音声認識は
その言葉が何を意味するのか?を理解している感じです
それを実感させる機能があったんですよ

Googleドキュメント発言注意!検閲機能がついている!?

ピーな放送禁止用語は入力不能
Googleドキュメント 入力文章検閲
恥ずかしくなければ実際に画像の言葉を試してみるといいですよ
どんなに丁寧にかつぜつ良く伝えても、綺麗に伏字にされます(`・ω・́)ダメダネ Σ(゚Д゚;)
何を言ってるんだね君は?ご乱心かね?・・と思われるでしょうね
だって、アカウントログインした状態で入力してますから(笑)
音声では伏字になる言葉も、手入力だと書き込める不思議
自分の発言がアカウントに紐づいて消えない黒歴史確定Σ(゚Д゚;)シマッタァァ
どうりで音声入力から書き始めるまでに若干のタイムラグがあるわけだ
最初は書き始めるまで処理遅ぇな~と思っていたけれど
バッググラウンドでGoogleの膨大なデータベースから
該当するNGワードを判断してたと考えると超高性能Σ(゚Д゚;)
何を書いてるんだ?というのが全部お見通しになるから
仕事の機密文書とか絶対書けないね(情報漏えいの危機)
公的機関の人は仕事用アカウントでGogoleドキュメント禁止です
色んなサイトからコピーしてきた情報をまとめるとしたら
いつ、どこから、どういう経路で、コピーしてきたのかが丸わかり・・
便利なんだけどー・・便利なんだけどー・・
何この、使ったら後悔(公開)するぜ的な感じ(/ω\*)モジモジ…

アンドロイドOS(lollipop5.1.1)だと、何も規制が入らない!?

アンドロイドタブレットを持つ友人にGoogleドキュメントアプリをテストしてもらった所
音声入力をしても、検閲機能が働かず、こんな事に(笑)
デバイスの音声入力機能には検閲機能はない
Googleはスルーで・・windowsOSのみ情報収集か?
と思ったら、単純にデバイスについてる文字の音声入力支援機能だった(笑)
アプリには音声入力はないので、勘違いしてる人もいるようだ
とはいえ、音声入力対応にはこんな未来を期待したい

Googleドキュメントアドオンに音声入力サポートがほしい!

これは現時点ではまだない、アドオンへの要望ですので
そんなのがあればいいのにねぇ!と一緒になってやきもきしてください

特定ワード置き換え・単語の変換辞書登録(任意で追加)

これはAmivoiceSPの入力コマンドを聞いたらわかるとおり
改行、まる、てん、などの音声入力を特定の操作として変換する機能のほか
例えば「見出し」と言ったら、hタグの見出し挿入ができる・・といった
単語辞書登録もできると非常に色んな面で使いやすくなるんだけどね

検閲機能を生かす・アドワーズ商標登録キーワードチェックアドオン

今ネットで話題の某デザイナーのロゴパクリ問題について、テレビのコメンターが
「オリンピック委員会は3ヶ月かけて商標登録されたロゴのチェックをしました」
と言っていたので、オリンピック委員会は
ちゃんとやることやったんだな!・・と思いながら
デザイナーにとっては商標登録されていないのであれば
バレなければパクリオッケー素材って考えなんだろうな とか察しつつ
それは今は関係ないとして(`・ω・́)ゝ Σ(゚Д゚;)なぜふった
PPC広告を出稿する際にも、入札キーワードの中にNGワードもあったりする
つまり、商標登録されているキーワード等を選んでしまうことがある
結果的に言えば、何の問題もなく
そのキーワードは入札できませんと入札NGを返されるだけなんだけど
これをGoogleドキュメントやスプレッドシート上で事前に
このキーワードはアウト!入札できませんってのがわかればいいなぁ

検閲機能を生かすアドセンスNGワードチェックアドオン

ブロガー、アフィリエイター、サイト運営者はブログやホームページを作ります
Googleにとってそれは、広告依頼を受けた企業の宣伝をする場所となる訳で

  • Googleアドセンス収入を得たいサイトオーナー
  • 広告掲載をしたいGoogleアドワーズ

双方が求めるのは品質の良い場所、品質の良い広告
このふたつがうまい事かみ合わないといけない
しかし・・大抵がサイトオーナー側で知らず知らずのうちに
アドセンスにとってのNGワードを書き込むようになり
気がつけば、広告を掲載できない場所になっている
それを、Googleデータベースを参照できる検閲機能が有効なのであれば
アドセンスNGワードチェッカーという形で確認できるアドオンがあるといいなぁ
現時点では、確実にアドセンスでもアウトであろうピーな放送禁止用語も
音声入力では伏字だけど手入力では書き込めるので
最終的に文章構成チェックのような形でNGワードをハイライトするとか
そういう公式アドオンを出せばアドセンスの広告表示を意識して
変な記事を書く人も減ると思うんだけどね
サイトオーナーとGoogleにとってwin-winになるアドオンを期待(`・ω・́)ゝ

外で音声入力は使う?・・だったら AmivoiceSPの理由

Googleドキュメントの強みはなんといってもアカウントの連携によるクラウドデータの共有
どこでもドア!ならぬ、どこでもGoogle!
スマホでもタブレットでもノートPCでもブラウザからアカウントログインするだけで
ブックマークやアクセス履歴、作成したドキュメントを共有して
どこでも作業が可能になるのが最大の強み(`・ω・́)ゝ
そういう意味では、場所を選ばず仕事ができるのですが
場所を選ばず、パソコンに話しかけることができるだろうか?
例えば、スタバやカフェでノートパソコンやタブレットに向かって
話しかけるように入力する作業はスマート!
でも他人からみるとかっこいい!・・という印象は受けないですね
[PC]( ̄。 ̄;)ブツブツ  ( ゚o゚)ヤダァ(゚o゚ )オボウサンヨー Σ(゚Д゚;)チガウシ
むしろ、その音声入力の内容が日記とかなら
プライバシーのオープンリーチですよ
どこで不審者がきき耳を立てているかわかりません
Bluetoothでハンズフリーのイヤホンマイクで電話してても
あの人・・一人でぶつぶつ言ってる・・という目で見られるわけで
よほど鋼のメンタルを持ってて、周りの目や迷惑を気にしない人でなければ
人が大勢いる場所でパソコンに向かって音声入力はしないでしょう
結果、せっかく文章の音声入力機能も使う場所を選ぶ事になります

  • 周りに迷惑をかけない
  • 個人プライバシーや仕事内容の情報漏えいを気にする

すると、自動的に自宅や個室での音声入力作業に限られてきます
そもそも音声入力はうるさい場所ではできません(事実)
そうなると自宅PCか静かな職場に限られてしまうんだけど
上記で伝えているとおり、音声入力による発言はチェックされます
それだったら・・AmivoiceSPエディタ上で音声入力して
文字転送したほうが使い勝手がいい(検閲なし)と思います
Googleドキュメントに限らず全ての文字入力可能なソフト上で使えるので
文字転送先をGoogleドキュメントにして保存すればどこでも共有できますしねw
自分の声を聞かせるほどに成長するので認識精度を上げておけば
いずれ、体が不自由になった時、声でお仕事ができます

AmivoiceSPの特徴

amivoice

  • 話せば話すほど認識力が高まる音響学習
  • 確実に変換したいキーワードを登録できる単語登録
  • 句読点や改行など、記号を変換支援
  • 文字入力可能なソフトに文字転送を行える音声コマンド操作
  • 小声でも聞き取れる音声入力の感度調整
  • 速度か精度かの優先バランスをきめる認識効率
  • 入力時の音声データの保存、音声再生での書き込み

AmivoiceSPは専門ジャンル別に強い!

音声の認識がどうしてもうまく行かない時に追加できる
ユーザー辞書、任意で単語の読み・書きを設定できる機能があります
例えば、Apple や WordPress といった大文字と小文字
これを安定させて表示させたい時は、単語に以下のように追加
読み:あっぷる・わーどぷれす
書き:Apple・WordPress
すると、よほど変な発声をしない限りは
次回からその変換形式が優先的に表示されるようになります
・・これをひとつひとつ覚えさせていく必要はありません
特定のジャンルの専門用語に強いAmivoiceSPが用意されています

※その他、介護、医療従事者向けのAmiVoice EX7などもあるので、上記リンク先をチェック

ただ、音声入力環境が悪いと、その雑音がある状態で声を学習してしまうので
高度なノイズキャンセリングマイクを使う事をおすすめします
おすすめ:ロジクールG35R 7.1chヘッドセットを「買いなおした理由」とは・・
最初は認識はうまく行かないかもしれませんが
レベルが上がって精度が上がると凄く嬉しくなりますよ
あなたの声の癖を、声の特徴にあわせてチューニングしていくので
力を抜いて、普段の自分の声で根気良く育てていくと
あなたのいう事をちゃんと理解する仕事のパートナーになります
AmivoiceSP実践解説サイト

Googleドキュメントの音声入力は会議録音にはむかない

どっかで会議の記録を録音して文章を作成するとかあったけど
マイクが聞き取れないと、そこでエラーで音声入力を続けてできなくなる仕様
会社の会議録とか大学の講義とかを録音するならちゃんとしたボイスレコーダー
ICレコーダーを準備して、後で文字起こしをしたほうがいいですね

LEAVE A REPLY

*
*
* (公開されません)

Return Top