エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
中国の人工知能(AI)スタートアップ「趣丸網絡科技(Quwan Network Technology)」(以下、趣丸科技)... 中国の人工知能(AI)スタートアップ「趣丸網絡科技(Quwan Network Technology)」(以下、趣丸科技)は2024年10月24日、香港中文大学・深圳校と共同で開発した音声合成モデル「MaskGCT」をオープンソースの音声生成ツールキット「Amphion」で公開したと発表した。MaskGCTは、既存のテキスト音声合成(TTS)モデルと異なり、マスク言語モデルと音声コーデック技術を採用し、音声クローン生成や多言語合成、音声制御などを迅速にこなす。 MaskGCTのテスト結果(画像は企業提供) MaskGCTは、既存のTTSモデルよりも音声の類似性やクオリティー、安定性に優れ、音声合成モデルとしては最先端の性能を有しているという。主な特長は下記の3つ。 ・超リアルな音声クローンを数秒で生成できる。3秒間の音声サンプルを入力すれば、人やアニメ、ささやき声といったあらゆる声色を生成