音声合成

今日は節分ですね。

すごく寒いので家にこもって、音声合成で遊んでいます。

もともとはクローズドな議事録起こしツールを作りたいだけだったんだけど、方向は逆だけどテキストから音声を合成できるのであれば、つぎのフローも試したくなってくる。

  • 音声からテキスト起こし
  • 起こしたテキストでLLM
  • LLMの回答を音声合成

これを自分の好みの声や好みの性格を持ったLMMとかを学習させてしまえば、すごく好みなキャラクターができたりして…

議事録も登場するキーワードまでを要約できるようにすることもできそうな感じだなぁ…