Qwen-TTSというテキストto音声モデルが出ていて、どうせ日本語はしゃべれんのだろう?って思ってたけど案外しゃべれるし、自分の音声のクローンもできるようなので、試してみました。 Qwen3-TTS Family is Now Open Sourced: Voice Design, Clone, and Generation! 手順などはGitHubに。 https://github.com/QwenLM/Qwen3-TTS 基本的にはpip installするだけ pip install -U qwen-tts flash-attnを入れたほうがいいということだけど、Windowsなのであきらめます。 pip install -U flash-attn --no-build-isolation デモがあるので起動。デフォルトではflash-attnを使うようになってるので、使わないよう