この記事を書いた時点では無料でも試せたのですが、現在「WhisperTyping」は100分の使用を超過すると、有料プランを選ばないと利用できなくなっています。料金は月5ドル前後(プランや為替で変動)なので、試す方はそこだけ先に注意してください。そのうえで、現時点でも「文字入力のストレス」を減らすツールとしてはかなり優秀だと思っています。

普段はあまり書かないけれど、今日は自分の仕事場の環境について少し。基本は自宅で仕事をしており、業務はマルチタスク。デザイン、ウェブ制作、文章作成、写真撮影と現像、会計や法律関連、マーケティングや広告の出稿まで、とにかく器用貧乏で範囲が広い。

作業がここまで多岐にわたるので、パソコンはモニターを6台つないで使っている。文字入力の量もかなり多く、手だけで打ち続けるのは正直しんどい。そこで約3年前から音声入力を導入した。本格的に使い始めたきっかけは、Chromeの拡張機能「Voice In」。当時は本当に助かった。しかし最初は無料版でも使用時間無制限だったのに、人気が出るにつれて1日の使用時間に制限がかかるようになり、だんだん不便に感じる場面が増えた。それ以外でも、基本的にブラウザでの動作になるからメモ帳やそれ以外の場所に使えないのは結構不便だった。

ちなみに「Voice In」はいったん有料版にも切り替えたが、毎月の料金が気になって、今はもう使っていない。途中からWindows 11の音声入力へ移行した。ところが、このWindows標準搭載の音声認識がとにかくひどい。句点や「。」の扱いは崩れるし、文章全体の変換ミスもかなり多い。しかも音声の単語登録ができないので、誤変換はいつまでたっても誤変換のまま。直しようがない。
何か他に良い方法はないかと考えて、AIを使った音声認識の文字入力なら、これまでの問題はすべて解決できるのではないかと思った。音声認識といえば有名なのはWhisper。これを使っているツールを探してみたところ、「WhisperTyping」というソフトに行き着き、試しにインストール。結果はとても良好で、使い勝手が抜群にいい。以前使っていた「Voice In」の有料版と比べても、こちらのほうが断然いい。
このソフトは起動するとタスクバーに常駐し、音声入力のときにしっかり動作しているのが分かる。入力の開始・停止は好みのキーに割り当てられるので、作業の流れを崩さない。さらに、通常の辞書では拾いにくい単語でも、ひらがな読みと対応する漢字を登録しておけば、正確に認識してくれる。

実際にWhisperを音声認識として使ったことがある人ならわかると思うが、精度は本当に高い。これまで文字入力ツールはいろいろ試してきたものの、AIを使っていても別の音声エンジンだったり、そもそもWhisperとはまったく違うモデルを使っていることが多い。変換がうまくいく場面もあるにはあるが、総合的な変換精度ではこのソフトに並ぶものは正直見当たらない。だから自信を持っておすすめできる。
この記事を読んで試してみたい人もいると思うので、ダウンロード先を載せておく。
※ちなみに自分はブラインドタッチができるくらいタイピングは速いんですが、それでも入力スピードは音声入力にはかなわないですね。