この記事で得られること
- 音声入力で仕事をする仕組みを作るまでに11ヶ月かかった理由——なぜすぐにできなかったのか
- 試行錯誤の具体的なプロセス——何を試して、何が失敗して、何が残ったのか
- この仕組みはヘルニア以外の制約にも応用できる——介護・育児・メンタル疾患、あらゆる「制約下の働き方」への示唆
導入:椅子に座れなくなった日から、11ヶ月
プライム上場企業で10年、人事部や新規事業担当部署で働いてきた私の仕事は、すべて「椅子に座る」ことが前提でした。パソコンの前に座り、メールを書き、資料を作り、会議に出る。座ることが、仕事そのものでした。
2025年3月にヘルニアを発症し、その前提が崩れました。
「座れないなら、音声入力で仕事をすればいい」——このアドバイスは早い段階でもらっていました。2025年6月〜7月の時点で、Googleドキュメントの音声入力が良いという情報も得ていました。
その間、スマホでほぼ1年間ヘルニアの治療法を調べ続けていました。触りすぎてスマホタコができるほどに。パソコンに向かうのは痛くて無理。スマホで修正作業をしようとしても限界がある。
転換点は2つありました。1つは「音声入力のまま補正なしでnoteにアップすると割り切った」こと。もう1つは「SuperWhisperでOpenAIの最上位モデルを使うと誤変換がほぼなくなる」と2026年2月に知ったこと。発症から約11ヶ月。
なぜこれほど時間がかかったのか。何が壁だったのか。そして最終的に何がうまくいったのか。この記事は、その試行錯誤の記録です。
なぜ「音声入力すればいい」では済まなかったのか
このセクションのポイント: 音声入力は「話すだけ」ではない。入力後の編集・整形がボトルネックになる。
音声入力の「入口」は簡単。「出口」が地獄
音声入力で文字を起こすこと自体は、技術的にはそこまで難しくありません。スマートフォンに向かって話せば、テキストが生成される。
問題はその先にありました。
音声入力で生成されたテキストには、誤変換が大量に含まれます。句読点の位置がおかしい。改行がない。同音異義語が間違っている。話し言葉のまま文字になっているから、文章としての体裁をなしていない。
これを「記事として読める状態」に整えるには、結局スマートフォンの画面を操作しないといけないのです。
バックスペースで文字を消す。テキストを選択する。コピー&ペーストする。段落を入れ替える。ヘルニアで痛くてパソコンに向かえない。仰向けの状態でスマホでこれをやると、手が痛くなる。実際、スマホを触りすぎてスマホタコができました。画面を長時間見続けると首にも負担がかかる。音声入力で「入力」はできても、「編集」が身体的に困難だった。
最初の試み:Googleドキュメント(失敗)
2025年6月〜7月、Googleドキュメントの音声入力を試しました。当時、音声入力の精度としては最も評価が高いとされていました。
結果は期待以下でした。認識精度が自分の発話パターンに合わず、誤変換が多すぎる。修正しようとすると結局スマートフォンの画面操作が必要になる。入力できても、アウトプットに仕上げられない状態が続きました。
この段階で、「音声入力は自分には向いていない」と判断してしまい、痛みを我慢して椅子に座ってパソコンを操作する方向に戻ってしまったのが、最大の判断ミスでした。
1日頑張って座ると、2〜3日は痛みが響いて動けなくなる。それでも「まともなアウトプットを出すには座るしかない」と思い込んでいた。
転換点:「工夫の仕方」を変えた
このセクションのポイント: ツールを変えるのではなく、プロセス全体を再設計する必要があった。
割り切りとツールの発見
約半年間の空白を経て、改めて音声入力に取り組みました。大きかったのは2つの発見です。
1つ目は「割り切り」。 音声入力のまま補正なしでnoteにアップすると決めたこと。完璧な文章を目指すから苦しくなる。「多少おかしくてもそのまま出す」と割り切ったら、一気にハードルが下がりました。
2つ目は「OpenAIの最上位モデル」。 2026年2月、SuperWhisperで一番いいモデルに変えたら、誤変換がほぼなくなりました。それまで誤変換の修正に苦しんでいたのが嘘のように。ツールの精度がここまで影響するとは思っていなかった。
今度は、Googleドキュメント単体ではなく、複数のツールとプロセスを組み合わせるアプローチに変えました。
具体的な変更点は以下の通りです。
| 要素 | 最初の試み(失敗) | 再挑戦(成功) |
|---|---|---|
| 音声入力ツール | Googleドキュメントのみ | 課金アプリを含む複数ツールを比較・選定 |
| 編集プロセス | 手動でスマホ画面を操作 | AIによる構成・推敲を活用 |
| デバイス | 手持ちのスマホのみ | iPhone+Macの組み合わせ |
| 品質基準 | 100%を目指す | 2〜3割でも出す |
| ワークフロー | 入力→手動編集→完成 | 音声入力→AI整理→最終確認 |
デバイスのスペックが意外と影響する
試行錯誤の過程でわかったのは、音声入力の精度がデバイスのスペックに大きく依存するということです。
iPhoneのモデルによって認識精度が変わる。パソコンの処理速度によってAIツールの応答速度が変わる。音声入力という「ローテク」に見える作業が、実はデバイスの性能に左右される。
結果として、MacとiPhoneを購入するという投資判断をしました。療養中の出費としては痛いですが、「座れなくても仕事ができる環境」への投資と位置づけました。
確立したワークフロー
最終的に確立した仕組みは、おおよそこのような流れです。
Step 1:音声入力でメモを取る
仰向けの状態で、スマートフォンに向かって話す。文章として整っている必要はない。思考の断片、キーワード、エピソード、言いたいことをとにかく声に出す。
Step 2:AIで構成を整理する
音声入力で生成された生テキストを、AIに渡して構成を整理してもらう。見出しの設計、論理構成、情報の過不足チェック。
Step 3:記事として出力する
構成に沿って記事を生成し、最終確認を行う。完璧でなくてもいい。2〜3割の品質でもアウトプットとして出す。
この記事自体が、このワークフローで作られています。
人事の視点で見る:この仕組みの応用可能性
このセクションのポイント: 「仰向けで仕事をする仕組み」は、ヘルニア以外の制約にも応用できる。
BPO・業務最適化の知見が活きた
プライム上場企業の人事部や新規事業担当部署で、間接部門のBPO(ビジネス・プロセス・アウトソーシング)やシステム導入、業務効率化に取り組んできました。間接部門は「同じアウトプットを、より少ないリソースで出す」ことが求められる世界です。
この考え方が、そのまま自分の療養生活に応用できました。
身体という「リソース」が制限された中で、どうやってアウトプットの量と質を維持するか。これは、企業の間接部門が直面する課題と構造的にまったく同じです。
ヘルニア以外の「制約」にも使える
この音声入力ベースのワークフローは、ヘルニア以外の身体的・環境的制約を持つ方にも応用できると考えています。
| 制約の種類 | 状況 | 音声入力ワークフローの適用 |
|---|---|---|
| ヘルニア・腰痛 | 椅子に座れない、長時間のPC操作ができない | 仰向けで音声入力→AI整理→アウトプット |
| 育児中 | まとまった時間が取れない、両手が塞がっている | 子どもが寝ている間に音声メモ→後でAI整理 |
| 介護中 | 在宅で離れられない、細切れの時間しかない | 介護の合間に音声入力→蓄積→まとめて出力 |
| メンタル不調 | 集中力が続かない、画面を長時間見られない | 短時間の音声入力を複数回→AIが統合 |
| 通勤中 | 移動時間を活用したい | 歩きながら・電車内で音声メモ |
特に、今まで知識や経験を持っていたのに、制約によってアウトプットできなくなった人にとって、この仕組みは大きな可能性があります。
もともと優秀な方がヘルニアで離職せざるを得なくなったり、育児や介護でフルタイム勤務ができなくなったりしても、頭の中にある知識と経験は失われていない。音声入力+AIの仕組みがあれば、その知識と経験をアウトプットに変えることができます。
「どう治すか」と「どう生きるか」は同じ問い
最後に、少し個人的な話をさせてください。
大学時代、哲学を学んでいました。「人間はなぜ生きるのか」「なぜ働くのか」「どう生きたら最適なのか」ということを、真剣に考えていた時期があります。
結局、答えは出ないまま「働く上で収入がないと持続できない」という現実的な判断でプライム上場企業に入り、10年以上勤めました。
そして今、ヘルニアで療養する中で「この痛みをどう治すか」「この制約の中でどう生きるか」と自問自答している。あの頃と驚くほど似た問いを、まったく違う状況で抱えています。
ただ、一つわかったことがあります。
答えを出してから動くのではなく、動きながら答えが見えてくる。
ヘルニアの治療に「正解」はなかった。仰向けで仕事をする方法も、最初から見えていたわけではなかった。11ヶ月間の試行錯誤を経て、ようやく「こうすればできる」が見えた。哲学的に「どう生きるか」を考え続けるより、とにかくアウトプットしていく方が、結果的に道が開ける。
20代の頃は体力という資源が豊富にあったから、何でもできた。30代でヘルニアになり、その資源が突然制限された。人間は、日々少しずつ変化するなら適応できるが、一気に変化すると適応できない。だからこそ、変化に適応するための仕組みを、意識的に作る必要がある。
この記事と、このブログ自体が、その仕組みの一つです。
まとめ:11ヶ月かかった仕組みを、この記事で短縮してほしい
① 音声入力は「話すだけ」では仕事にならない。 入力後の編集・整形がボトルネック。AIとの組み合わせで初めてワークフローとして成立する。
② デバイスへの投資は「仕事環境への投資」。 音声入力の精度はデバイスのスペックに依存する。療養中の出費としては痛いが、「座れなくても稼げる環境」への投資と捉える。
③ この仕組みはヘルニアに限らない。 育児・介護・メンタル不調・通勤時間——あらゆる「制約下の働き方」に応用できる。知識と経験がある人ほど、効果が大きい。
今日からできる3つのアクション
- スマートフォンの音声入力を5分間試す: まず今日の考えや気づきを、声に出してメモする。品質は問わない
- AIツールに音声メモを渡してみる: 生テキストを構成してもらう体験を一度する。「こんなに整理されるのか」と驚くはず
- 「座れなくてもできること」リストを1つ作る: 自分の知識・経験の中で、音声だけで伝えられるものは何か。一つ見つける
アイキャッチ画像案: ベッドに仰向けの人がスマートフォンに向かって話しかけ、そこからテキストが浮かび上がって記事の形になっていくイラスト。「11ヶ月かけて見つけた、ベッドからの働き方」のコピー。
後日作成(Adobe Firefly or Gemini Image)
本文中の図解案:
1. 【ワークフロー図】音声入力→AI整理→記事出力の3ステップフロー
2. 【制約別の応用マップ】ヘルニア・育児・介護・メンタル不調それぞれの活用イメージ