指定した音声ファイルを、楽器ごとのパートに分解してくれるソフトです。 音声ファイルをドラッグ&ドロップで放り込むと、該当のファイルを ボーカル ベース ドラム その他(キーボード、ギター 等) ボーカル以外のインストゥルメンタル といった 5 つのファイルに分解してくれます。 処理を GPU(CUDA)で実行することもできます。
日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば
オープンソースVOICEVOX は OSS(オープンソース・ソフトウェア)版 VOICEVOX をもとに構築されています。 製品版と OSS 版の違いやモジュール構成は VOICEVOX の全体構成 をご参照ください。 ソフトウェア部分は Electron + Vue 、音声合成エンジン部分は Python + FastAPI です。 追加したい・改善したい機能があれば、ぜひ開発にご参加ください。
前置き はじめまして, コンポーザー, DJなどをやっているArakurです. 昔は打ち込みジャズを専門で作っていたのですが, ここ最近は殆ど作る機会がなく, 知識やTipsを持て余すくらいなら同志や後進に託そうと思ったので少しずつ記事にしてみることにしました. 第1回は, 古典和声またはポピュラー和声についてある程度知っている方向けにジャズのコード進行の理論の原理的な部分について解説します(第2回が今後書かれるかはまだ分かりません). とりあえずこれを読み切ればそこいらのスタンダードの進行は最低限アナライズできるようになる, という感じの内容を目指しています. 本記事は他ジャンルの制作にあたってジャズの知識を取り入れたいというような層を主に想定しています. 僕自身体系的なジャズ・音楽理論の教育を受けたわけではなく, 知識の大半はネットや古い教則本, およびセッションなどによる実践的経験を
あゝボクたちは楽器ができないリア充たちが楽器を振り回し歌い上げるその姿を観続けて幾星霜。 奴らがスポットライトを浴びキラキラ輝けば輝くほどオーディエンスの瞳孔は開きボクたちは暗闇へ包まれて誰の目にも映らなくなる。 あゝボクたちは楽器ができない。もしもピアノが弾けたならボクたちも少しは輝けるのだろうか。 頭の中のメロディを出力することは諦めろボクたちが楽器をやろう音楽を作ろうとするときに、陥りがちなのは頭の中のメロディや音を再現しようとすること。 それは諦めるべきことでボクたちにそんな才能がないことはボクたち自身が一番知っていることじゃないか。 こんなポエムのようなエントリに興味を持っている時点でキミはボクと同じ側であり才能のないクリエイターだ。 なぜ頭の中のメロディを再現できないのか、なぜ再現する方法を教えてくれないのか、なぜ再現してはいけないのか。 それはキミに才能がないからで、そしてボ
私の大好きな数学者の名言で、「音楽は感性の数学であり、数学は理性の音楽である」という言葉があります。 数を原理とするピタゴラス教団がピタゴラス音律を作り出し、そこから純正律という整数比率によるハーモニーを重視した音律が作られたことからも、音楽と数学の関係性は深いと言えるでしょう。 しかし、 実際に数学を多少わかって、音楽を多少嗜んでいる方であれば、音楽で使われる様々な単位への違和感を感じたことがあるのではないでしょうか。 とにかく既存の音楽理論や音楽文化が、「12音種」「7幹音」「5線譜」「1から数える」すべてが噛み合っていない感じがすごい。この噛み合ってない上で究極の覚えゲーを重ねがけして理論作り上げてんのヤバい。 — じーくどらむす/岩本翔 (@geekdrums) July 12, 2020 音楽を取り巻く数への違和感まずこの「12音階」(ド~シまで、#、♭も含めた1オクターブ以内の
プログラミングアプリ「Springin'」(スプリンギン)などを提供するしくみデザインは6月23日、商用利用OKの無償音楽素材サイト「Springin’ Sound Stock」を公開した。戦闘ゲームの攻撃音や、8bitサウンドの効果音、システム音、乗り物の音など、600点以上をそろえた。 過去のプログラミングコンテスト使用音源など、同社のサウンドデザイナーが手掛けた音源を中心に提供。「つくる楽しさを知り、誰でもクリエイターになってほしいという願い」から公開したという。 誰でも無料で使うことができ、スプリンギンでの利用だけでなく、動画制作やイベントなどの商用利用も可能だ。 関連記事 タップやフリックなどのシステム操作音のフリー素材、電通が公開 商用利用も可能 電通は、タップやフリック、文字入力などの操作を想定したオリジナルのシステム操作音をフリー素材として公開した。「SND」と名付けられた
※この記事は、音を再生できる環境で読むとより楽しめます。イヤフォン等がある方はぜひお手元にご用意ください。(もちろん音無しでも楽しめます!) 突然ですが、これらの音を聞いたことはあるでしょうか? 『和太鼓でドドン』 『男衆「オウ!」』 『ドンドンパフパフ』 YouTubeを見ていれば、必ず一度は耳にする音ばかりですね。実はこれらの効果音、すべて「効果音ラボ」というフリー音源素材サイトが提供している音なんです。 「効果音ラボ」は国内のフリー効果音サイトでは最大手と言っても過言ではありません。YouTubeに限らず、ゲームやコマーシャルでも様々な音が使われています。 効果音ラボ トップページ ただ皆さんご存知でしたか? このサイト、創設から9年の間ずっと、たった1人の方が運営しているんです。 さらに、銃声を録音するために海外に行ったり、録音のためだけにヘリコプターをチャーターしたりと、音源を作
自宅で友達と通話をしているとき、歌を歌っているとき、Zoomでミーティングをしているとき、「周りに迷惑をかけていないかな」と思ったことはありませんか? 今回はDIY未経験でも簡単かつ、安価でできる防音室作りに挑戦します! 初めまして! 近畿大学広報室でインターンをしている、理工学部 理学科物理学コース 2年生の中井七海です。 私は軽音サークルに所属しており、ボーカルとしてよくライブに出演しています。そのため、自宅でも歌の練習をしたいのですが、今住んでいる実家ではなかなか練習ができません。というのも、自分の部屋で歌うとよく音が響いてしまい、親に怒られる上に、近所迷惑にもなってしまうからです。 また、私はゲームが好きなため、よく友人と通話しながらオンラインゲームをします。ついはしゃぎすぎて、親に「うるさいで〜あんた電話控えてよ!」と怒られてしまいます。 そこで防音室があれば、自由に自分の趣味が
弊社主催のオンラインイベント、Developers.IO 2020 CONNECT! みなさんはもう参加されましたでしょうか。 今回ぼくもこちらに参加し、2本の動画をあげました。 その動画編集につかったのが、標題にも書きました Blackmagic Design 社製の「DaVinci Resolve 16」です。 こちらはプロユースの本格的な機能が備わっている一方で無償でも使え1、今回のようなセッション動画向けの編集程度であれば、3年落ちのMacBook Pro 13inch2でもそこそこの速度で動きます。 むしろZoomやQuickTime Playerで撮ったままの720p・1080pサイズのMP4ビデオ・AACオーディオ、つまり不可逆圧縮された素材をそのままタイムラインに配置してストレスなく動いてくれるので、サブスクリプションなし・登録のみで使えることを考えれば、今回の用途において
ゆうべ、そろそろ寝ようかなと思っていたらものすごいものが投下され、興奮して結局3時半まで起きてしまいました。 ということで、昨晩公開された「AIきりたん」こと歌声合成エンジンNEUTRINO1について(今の興奮をあとで思い返すためにも)書いておきます。 AIきりたんとは とりあえずこれを聴いてみてください。 これが合成音声か!?と思ってしまうような仕上がりですが、これがAIきりたん……歌声合成エンジンNEUTRINOによって生成されたきりたんの歌声です。 NEUTRINOはSHACHIさん(@SHACHI_KRTN)によって製作されたフリーウェアで、昨晩公開されました。その標準の同梱ライブラリの1つが東北きりたんのものなので、そちらのことが「AIきりたん」または「AIシンガーきりたん」と呼ばれているというわけです。 ニューラルネットワークを用いた歌声シンセサイザー【NEUTRINO】を公開
一般社団法人フリーBGM協会は、同協会が展開する「フリーBGMデータベース」について、11月26日(水)より業務利用に限らず全てのクリエイターに対しても同データベースの無償提供を開始することを発表した。 これまで教育機関及び業務においてフリーBGMの利用が予想される放送業界関係者、映像制作会社、ゲーム等の制作者に対してのみ提供されていたフリーBGMデータベース。しかし本発表により、業務利用以外でコンテンツ制作を行う全てのクリエイターも利用することが可能となる。 【プレスリリース】 本日より、全てのクリエイターのみなさまに向け「フリーBGMデータベース」の提供を開始いたします! 当協会ご賛同作家さまの約1.9万曲の中から、簡単に楽曲を検索することが可能です。ぜひご活用くださいませ! (ご利用にはユーザー登録が必要です)https://t.co/cl2GImLICl — 一般社団法人フリーBG
40. The Doors - Riders On The Storm 39. The Cure - The Lovecats 38. Rush - Digital Man 37. Graham Central Station - Hair 36. Red Hot Chili Peppers - Give It Away 35. The Jam - Town Called Malice 34. Charles Wright And The Watts 103rd Street Rhythm Band - Express Yourself 33. Bill Withers - Lovely Day 32. Grandmaster Flash & Melle Mel - White Lines (Don’t Don’t Do It) 31. Cream - Crossroads 30. Que
80年代半ば、レゲエ音楽にデジタル革命をもたらし、“モンスター・リディム”と称される「スレンテン」。その誕生の裏側には、カシオ計算機(本社:東京都渋谷区)の電子キーボードと新卒の女性開発者の存在があった。スレンテンのルーツ・奥田広子さんが、初めてベールを脱ぐ。 スレンテンのルーツはカシオトーンの音源 ジャマイカのシンガー、ウェイン・スミスの『Under Mi Sleng Teng(アンダ・ミ・スレンテン)』は、レゲエの世界に革命をもたらしたと言われる。友人のノエル・デイヴィーと2人で、カシオの電子キーボードを使って作曲したダンスホール・レゲエだ。1985年に大ヒットすると、デジタル音の心地よく、常習性のあるリズムは、またたく間に世界中に広がっていく。 レゲエでは、ドラムとベースのリズム体を「リディム」や「バージョン」、「オケ」などと呼び、これを繰り返すことで曲に鼓動を生む。同じリディムで複
UTUTUYA@ ウツロマユ 12月7日 発売予定 @SbbUtutuya すごい。 軽い気持ちで見始めて気づいたら引き込まれてた。 ゲームに音入れる時、「その場にあった音」くらいしか考えてなかったけど、先人達が築いてきた音の技術をちゃんと使いこなせるようになれば、作品が数段階はレベルアップするんだろうなぁ。 twitter.com/_kk1_/status/1… 2021-11-27 00:12:01 まだ僕には帰れる所があるんだ。こんなにうれしい事はない。 @iteeyot @_kk1_ おもしろい! 説明されてるだけなのに、ちゃんとハッとするし、不安になるし、夢から覚めた感じになる。 そしてコーヒーの音の怖さと絵の間抜けさが素晴らしい。 2021-11-27 00:02:56
MS OfficeがどうのこうのAdobeがどうのこうのいやわかる、MS OfficeとかAdobeは業界標準だしファイル互換でインポートとかも楽だ。 ただまぁその万人へ必須か?と言われたら圧倒的にそれが必須じゃない仕事をしている人のほうが多い。 何なら仕事じゃなくて趣味レベルであるならばなおさらMS OfficeとかAdobeとか業界標準ソフトウェアじゃなくても良くなっちゃう。 ということで、ありきたりなシェアウェア代替オープンソースソフトウェアのリストを作ってみた。 Libreofficeド定番中のド定番、オープンソースのオフィススイートだ。 MS Officeじゃなくて良い人はLibreofficeかGoogleのクラウドのヤツを使ってる。 やはり主に使われるのはワープロソフトのWriterと表計算ソフトのCalcとプレゼンテーションソフトのImpressだが、MS Accessの代
ASHIDAVOX® アシダ音響㈱ 🔊🎧🎙️ @ashidavox 【お詫び】本日のみで約三ヶ月分のご注文を頂き、「ST-90-05」が再欠品してご迷惑をお掛けしてしまい、大変申し訳ございません。 次回入荷予定は今月中旬頃でございます。入荷の際には再度こちらからご連絡させて頂きますので、今暫くお待ち頂ければ幸いです🙇💦💦 2022-02-01 17:57:43 詳しい解説 超高域がうたい文句のハイレゾ時代であります。 最初からワイドレンジで作るのが現代流ですが 最初に「中域を完成させて」そこに高品位の高音と低音をくっつけるのが古典派の考えるワイドレンジ なぜかわかりませんが、古典派のやり方は音に厚みが出る。 つまり完成度の高い中域に高音と低音を足してワイドレンジを作る、アシダ音響は昔かたぎであります。 ただ条件があって中域の再現性がハイレベルでない場合、上下を足してもよくならな
Ryoto Railway @Sakurai227_1000 大学の鉄研仲間に全盲者がいて、彼が(山間部で行われる)撮影会に同行したいという。当時の私は不躾にも「ついて来てどうするのか」と尋ねてしまったが、彼は涼しい顔して「見えるものだけが全てだと思っちゃ困る、山独特の風のそよぎや鳥の声の中を駆けてくる列車の響きだけで飯三杯はいけるぜ」と。 twitter.com/cyborgyukky/st… 斎藤ゆきえ@サイボーグYuki @cyborgyukky 美術館学芸員資格持ちとして一言。 白杖は全盲だけでなく弱視者も持っており、彫刻の輪郭程度は認識できる方もいる。また仮に全盲だったとして場の空気やエネルギーは体感出来るし行く意味は大いにあります。 この呟きを見た方は外出先に視覚障害のある方がいらしても心無い言葉を掛けないでほしい。 twitter.com/imatanwhale/st… Ry
著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換
はじめまして。リノベーションデザイナーをしているフジイです。 妻の「狭くてもいいので防音室が欲しい」という一言がきっかけで、約1週間かけて自宅の賃貸マンションに防音室をDIYしました。仕組みさえ分かれば、DIY初心者の方でも比較的簡単に、既製品の約5分の1の予算で製作できるので、時間と根性さえあればとてもコスパのいいDIYです。 「防音室」と言ってしまえばニッチですが、「お隣との防音壁」や「お篭もり用の小さなブース」としても汎用的に使えるアイデアです。 自宅に録音ブースが欲しい人はもちろん、自宅で仕事や作業をする人やビデオミーティングが多い人、お篭もりスペースが欲しい人の一助になればうれしいです。 防音ブースをDIYするキッカケ 2017年に結婚した妻と都内のマンションで生活をしていました。僕はフリーのリノベーション・住宅デザイナー、妻はソロのシンガーでナレーションなどの声を使った仕事を生
ある日、自宅で仕事をしていたら、同僚から「便座が会社に届きました」とDMが飛んできた。 恥ずかしい。プライベートなものをECサイトで買って、配送先を誤って会社にしてしまい、それを見られてしまった(しかも安いモデル)。 そんな私の気持ちを知ってか知らずか、同僚から「風間さん、ついに便座もレビューするんすか?」と追い打ちのDMが来た。 冗談と思ってスルーすべきところだろうが、のせられやすい性格ということもあり、温水洗浄便座を記事にするにはどうすれば良いか、真剣に考え始めた。 弊社の媒体が伝統的に得意としている、同一条件での一斉レビューを行うのは難しい。たくさん便器を用意し、それに便座を取り付け、一つ一つ座って検証していけば良いのだろうが、そんなに便器や便座が用意できない。 ■電源で何か変わるのでは? 蘇る炊飯器の記憶 思いついたのが「電源」だ。オーディオについて詳しくない方のためにかんたんに説
皆さんは「好きな惣菜発表ドラゴン」をご存知でしょうか? ボカロPのンバヂが2023年8月に動画サイトに投稿したこの曲は、シンプルな線で描かれたゆるい絵柄のドラゴンが、歌に合わせて淡々と好きな惣菜を発表していくという内容。ボーカロイド文化の祭典「ボカコレ2023夏」の「ネタ曲投稿祭」カテゴリで4位を獲得したのち、「ただただ好きなものの話をするだけ」というポジティブさからじわじわと人気が拡大し、ネットミームとなってたくさんの二次創作が作られるようになりました。 そんな二次創作動画の中には「惣菜の代わりに“好きな音楽用語”を発表する」というものがいくつも存在します。そしてそれらの多くは、実際にその音楽用語に合わせたアレンジが加えられ、曲を聴くだけでなんとなく意味がわかるようになっています。この記事では音楽用語にまつわるさまざまな「発表ドラゴン」を紹介。これらの動画を観れば、今まで知らなかった音楽
Windows、Macはもちろん、iPhone/iPad、Androidでも、インストール不要ですぐに楽しめるユニークな楽器アプリ、KANTAN Playというものが無料で公開されています。これは楽器が苦手な人でも、楽譜がまったく読めない人でも指一本ですぐに弾けてしまうという画期的なアプリです。KANTAN Musicという音楽システムにのっとったアプリであり、これまでDTMステーションでも何度か紹介してきた電子楽器、InstaChordの姉妹ソフト的なものでもあります。 KANTAN Musicは、InstaChrodの開発者である、ゆーいち(永田雄一:@u1_nagata)さんが考案したものですが、KANTAN Playというアプリは、ゆーいちさんとコラボする形で、日本におけるVRの先駆者であるGOROman(近藤義仁:@GOROman)さん、それにオーディオプログラマである、よしたか
1月末から全社員を対象に原則テレワークを開始 皆さんこんにちはー! 現在クラスメソッドでは、世界5カ国(日本、カナダ、ドイツ、韓国、インド)、国内18フロアに勤務する約500名の社員の99%が毎日テレワークをしています。そうです、いきなり非日常が来てしまい、そしてそれが日常として定着してしまいました。これは、クラウドの世界の均衡を保つ為に暗躍する超人秘密結社「クラメソ」の知られざる活動の記録である。(ここでUNION SQUARE GARDENの曲が流れる) 社長業とはすなわち意志(WILL)の発信である 私はしがない零細企業の工場長として16年目の社長をしておりますが、創業時から大事にしていることは、「お前は何を考えて何をして何を成すんだ」という意志を言葉にして周囲に伝えることでした。もともとシャイなエンジニアでしたので、カフェとか居酒屋とか休憩室とかでの対面のコミュニケーションや、3ヶ
音楽制作ツールには、Cubase、Studio One、FL Studio…のように汎用性の高いDAWソフトのほかにも、マスタリングに特化したソフトや波形編集に特化したもの、最近ではAI作曲機能が強力なものなどがあります。そうした中、それらとはまたちょっと異なるアプローチで、、作曲という部分に特化した音楽制作ツールもあります。その一つが、ハンガリーのソフトウェアメーカーであるMusicDevelopmentsのRapidComposerというWindowsでもMacでも使えるソフトです。 もともと2010年に誕生したこのソフトは、コード進行の作成やフレーズの生成にフォーカスしており、作曲における作業を効率よくこなせて、アイディア出しにも使えるツールとして進化してきた歴史があります。最新バージョンは4.7となっていますが、RapidComposerは国内に代理店がないこともあり、日本のDTM
オープンソースでMac/Winのクロスプラットフォームに対応した音楽練習/耳コピのための音楽プレイヤー「Melissa v2.5」がリリースされています。詳細は以下から。 MelissaはMasaki Onoさんが2020年から開発している音楽プレイヤーで、曲の区間ループや再生速度の変更、曲と同期するメトロノーム、セットリストの作成など楽器の練習や耳コピのための機能が備わっていますが、このMelissaの最新バージョンとなる「Melissa v2.5」が新たにリリースされています。 Version 2.5.0 new features キーボードやMIDIメッセージへ、ショートカットを割り当てられるようになりました。 音程を細かく調整できるようにしました。 リリースノートより抜粋 約1年ぶりのアップデートとなるMelissa v2.5では新たに左上のナビゲーションメニュー(三本線)の[ショ
これまでのイヤホンの常識を抜本的に覆す画期的なイヤホンが開発されました。AIP=Acoustic Innocent Pureというこのイヤホンは、従来の頭の中に閉じた空間の音ではなく、外に広がる非常に自然な音を実現するという、これまでにないbluetooth接続のイヤホンになっています。まさにスタジオモニタースピーカーの響きを再現するイヤホンで、演奏の細かいニュアンスを忠実に再現できる性能を持っています。 見た目もこれまでにない、耳から角が突き出すような不思議なデザインのこのAIP、開発したのは元ヤマハのエンジニアである旭サウンドエンタープライズ株式会社の旭保彦さん。音を聴いた瞬間に「何だこれは!」と感じる、従来のイヤホンともヘッドホンとも異なる自然なサウンドを実現してくれます。またしばらく聴いていても装着感があまりなく、イヤホン特有の疲れをまったく感じないのもAIPの大きな特徴となってい
日本マクドナルドは1月17日、ポテトが揚がったときに店内で流すタイマー音「公式ティロリサウンド」の配布を始めた。使い方について「作業用BGMとして流すもよし、アラーム音にして目覚めるもよし、ご自身でリミックスして楽しむもよし。ぜひご活用ください」(同社)としている。 同音源を利用した楽曲「ティロリミックス」の公開に合わせた施策。これまでも音源を加工した楽曲などは公開していたが、オリジナル音源を公式に配布するのは初めてという。 関連記事 チキンを温めるゲーミングPC、KFCが正式発表 「ネタじゃなかったの?」ネットざわつく KFCのゲーム部門KFC Gamingが、プレイ中にフライドチキンを温めるゲーミングPC「KFConsole」を正式に発表した。 「星のカービィ」オーケストラ楽譜を無料配布 結婚式での演奏などに利用可能 オーケストラコンサートなどで使用された「星のカービィ」の楽譜が無料配
killrain @aloward ドルゴ通気弁。 何回も取り付けたし、使用中のものを見たこともあるけど、こんなに音が出てるのは初めて見ましたw ドラム音だけじゃなくて空気が通る時の反響音がいい味出してるwww twitter.com/10chf/status/8… 2017-06-02 01:02:16 SAKUMAMATATA(サクママタタ)|作曲家 @skmmtt 「駅のトイレ通気孔ビート」がめっちゃカッコよかったのでサンプリングして曲にしてみました。喧騒に溢れる駅構内でトイレへ立ち寄りただ用を足すだけのはずが不運にも凶悪な犯罪者たちに遭遇してしまい、いつの間にかとんでもない事件に巻き込まれてしまう...!的なイメージ。 pic.twitter.com/UCcvTusr9w 2017-05-31 22:02:35
理論面 ・楽器は複数の音を同時に鳴らして和音を作るのが基本だと知った(これまでは一音ずつ順番に鳴らしてると思ってた。ドレミの歌的な) ・何拍子とか基本的なこと含めて楽譜読める(ただし雰囲気で弾けたりはしない) ・コードとかリバーブとかそういう話になんとなくついていける 実践面 ・なってる楽器が何かなんとなくわかる ・音楽聴くときに色んな音が聞こえる ・↑とほぼ同じだけど歌の動画とか聴くと歌ってる人の息遣いに気が散るようになった(スゥッ…、ハッとか。言ってたんだねw) これ中学ぐらいの時にたった1ヶ月学んでたら人生変わってたなー 学生時代に目瞑って音楽聴くだけの時間を毎日1時間とか作ってたぐらいなのにあまりに多くの音から耳を塞いでいたらしい… 追記 勉強方法はDAWで初心者が作曲する方法動画、ブログをいくつか見た後、わからない単語の意味を調べて、関連する記事とか見てただけ 企業がやってる、無
今年に入り、AI歌声合成の動きが激しく、その進化のすごさ、クオリティーの高さには驚くばかりです。中でも注目すべきは今年2月に彗星のように登場し、フリーウェアとして公開されたNEUTRINO(ニュートリノ)です。これはSHACHI(@SHACHI_NEUTRINO)さんが開発するフリーのソフトであり、これまで東北きりたん、謡子、そしてJSUT(いずれも学術的に公開されている歌声データベースを利用して開発している)の3つの歌声ライブラリが同梱されてました。そこに9月18日、新たに東北イタコが追加されたのです(9月18日現在、公開されている0.400には東北きりたん、東北イタコのみが同梱。それ以外については後日公開される模様です)。 先日、「AIきりたんに次ぐ第2のAIシンガー、東北イタコの歌唱データベース制作プロジェクトのクラウドファンディングスタート」という記事でも紹介し、無事にクラウドファ
本日8月1日、音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。 これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く