並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 765件

新着順 人気順

generatorの検索結果1 - 40 件 / 765件

generatorに関するエントリは765件あります。 AI画像イラスト などが関連タグです。 人気エントリには 『やばすぎるAI画像生成サービス「Stable Diffusion」始まる。 【簡単解説 & 応用 & Prompt付生成事例集】|やまかず』などがあります。
  • やばすぎるAI画像生成サービス「Stable Diffusion」始まる。 【簡単解説 & 応用 & Prompt付生成事例集】|やまかず

    一応、StableDiffusionとははっきりまず言います…とにかくやばいです。 分かりやすく、他のDALL・E2、Midjourney、Disco Diffusion、他有象無象Text to image machine learning系サービスと比較しますと… クオリティがかなり高い。 制限がなくなり、かなり細かい調整ができるようになったDALL・E2のような感じです。 生成が早い。 設定なしで使えば正直体感DALLE2より早いです。6秒..くらい? 安い。 3円くらいだと思います。 DALL・E2は1生成17円。Midjourneyは月4000円。 オープンソース これからいろんなサービスにこのAIが搭載されます。 他AIではかけられている学習データのフィルターがない。 各国の代表者や、有名人、ポルノがデータに含まれています。 PC上で使用できる。( = その場合無料) いや、こ

      やばすぎるAI画像生成サービス「Stable Diffusion」始まる。 【簡単解説 & 応用 & Prompt付生成事例集】|やまかず
    • 世界変革の前夜は思ったより静か|深津 貴之 (fladdict)

      世界のルールが根本的に変わってしまう… そういう展開は、マンガや映画ではよく起こる。それが現実でも起きそうだ。 あと数日(から数週間)で「トップレベルの画像生成AI」が、世界中にフリーで配布される。 イラスト、マンガはおろか3D CGや建築、動画、映像…果てはフェイクニュースからポルノまで…あらゆる創作に携わる全ての人を巻き込む、歴史的な転換点が訪れようとしている。 凄さ的には、悪魔の実がメルカリで買えるようになる。念能力トレーニング動画がYoutubeにアップされる。それぐらいヤバい。 メルカリで悪魔の実が買える世界では、誰もが能力者(一流とは限らない)になれる。そんな、漫画やゲームのラスボスが語るようなユートピアが、あと数日で現実になってしまうかもしれない。 Stable Diffusionで出力したドワーフの王様Stable Diffusionで出力したホビットのスタディ Stabl

        世界変革の前夜は思ったより静か|深津 貴之 (fladdict)
      • Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】

        ホーム ブログ 人工知能(AI)、ビッグデータ法務 Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知… はじめに Midjourney、Stable Diffusion、mimicなど、コンテンツ(画像)自動生成AIに関する話題で持ちきりですね。それぞれのサービスの内容については今更言うまでもないのですがMidjourney、Stable Diffusionは「文章(呪文)を入力するとAIが自動で画像を生成してくれる画像自動生成AI」、mimicは「特定の描き手のイラストを学習させることで、描き手の個性が反映されたイラストを自動生成できるAIを作成できるサービス」です(サービスリリース後すぐ盛大に炎上してサービス停止しちゃいましたが)。 で、この手の画像自動生成AIのようなコンテンツ自動生成AIですが、著作権法的に問題になる論点は大体決ま

          Midjourney、Stable Diffusion、mimicなどの画像自動生成AIと著作権|知的財産・IT・人工知能・ベンチャービジネスの法律相談なら【STORIA法律事務所】
        • Prompt Engineering Guide – Nextra

          Prompt Engineering Guide プロンプトエンジニアリングは、言語モデル(LMs)を効率的に使用するためのプロンプトを開発および最適化する比較的新しい学問分野です。プロンプトエンジニアリングのスキルを身につけることで、大規模言語モデル(LLMs)の能力と限界をより理解することができます。 研究者は、プロンプトエンジニアリングを使用して、質問応答や算術推論などの一般的なおよび複雑なタスクのLLMsの能力を向上させます。開発者は、LLMsやその他のツールとのインタフェースとなる強固で効果的なプロンプテクニックを設計するためにプロンプトエンジニアリングを使用します。 プロンプトエンジニアリングは、プロンプトの設計と開発に限らず、LLMsとのインタラクションおよび開発に役立つ幅広いスキルと技術を含みます。これは、LLMsとインタフェースすること、ビルドすること、能力を理解すること

          • 魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)

            やればやるほど呪術化する、AI画像錬成について。 以下は、その道の専門家にはメッチャ怒られるかもしれない、雑なロジックと制御講座。 いちおうメジャーなサービスでは、共通して動作するノウハウ(DALL-E2, MidJourney, StableEiffusion, DiscoDiffusion, crayon, dall-e mini 他)。 雑に理解する画像AIのしくみ対話型のAIにとって、呪文プロンプトとは画像錬成の方向性ベクトルを定めるものにすぎない。 たとえば、以下は「I love apple」で錬成された画像の例である。どうにも、ふわっとしたものが出てくる I Love Apple「Apple」という方向性ベクトルは、「リンゴ」「青リンゴ」と「アップルコンピューター(旧レインボーロゴ」「アップルコンピュータ(新ロゴ)」など、複数の可能性を同時に持つからだ。 つまり、「Apple」

              魔術として理解するお絵描きAI講座|深津 貴之 (fladdict)
            • 【全体公開】今から追いつく!AIイラスト超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX

              こちらの記事は2023年3月9日に投稿された旧バージョンです。特段の理由がなければ、最新事情を盛り込んだ「AIイラストが理解る!StableDiffusion超入門」をご覧ください。 こんばんは、スタジオ真榊です。このところ、ツイッター経由で公式サイトやこちらのFANBOXへのアクセスが急増しており、これからAIイラストを始め...

                【全体公開】今から追いつく!AIイラスト超入門|スタジオ真榊【AIイラスト術解説】|pixivFANBOX
              • 「いらすとや」は要らなくなっちゃう?テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい

                小猫遊りょう(たかにゃし・りょう) @jaguring1 毎日、数学をやっています。抽象度の高い数学が好きで、公理的集合論や数理論理学、圏論に興味があるけど、もっと具体的で実用的な数学も好きです。AI技術と、それがもたらす社会的影響についてよく考えていますが、基本的にテクノロジー全般の最新動向に興味があります。良さげな講義動画を見つけたら、ツイートするようにしてます。 小猫遊りょう(たかにゃし・りょう) @jaguring1 うおぉ、、新年早々、超激ヤバなニューラルネットをOpenAIが2つ発表してきた(DALL-EとCLIP)。視覚データとテキストの両方を用いたAIシステムで、DALL-Eは、テキストで説明すると、それっぽい画像を生成。こんなの創造性以外の何者でもない。テキスト+画像版GPT-3っぽい openai.com/blog/tags/mult… pic.twitter.com/

                  「いらすとや」は要らなくなっちゃう?テキストで説明するとそれに沿った何パターンもの画像を生成するOpenAIが凄まじい
                • チームで仕事をするなら、リアクションし続けよ|森 一貴(Mori Kazuki)

                  チームで仕事するとき、みんなもう少し自分の存在、自分のリアクションがチームに与える影響を自覚した方がいい。 例えばミーティングでブレストしているとき、議論が前に進むのは、あるときふと場に出されたアイデアに対して、誰かが"それいいですね"って言った瞬間である。アイデアを出したとき、その人にはふつう、確信なんてほとんどない。僕なんか自分の意見に自信なんかなくて(大体みんなそうなのだ)、言ってみて、まわりの反応を見て、あ、なんか良さそうだ…と思ったときにやっと前に進むことができる。みんな、自信なんてないのだ。だからアイデアは、場に出されたときはまだ、波際の砂のお城のようにやわらかである。 しかし、あるアイデアに対して、それいいね、と声をもらったとき。いい顔が見えたとき。姿勢が前のめりになってくるとき。そのときとあるアイデアは、はじめて光るのだ、形になる可能性を見せるのだ。 * 逆に言えば、議論に

                    チームで仕事をするなら、リアクションし続けよ|森 一貴(Mori Kazuki)
                  • JavaScript入門: 基礎知識をGIFアニメで分かりやすく解説 -総まとめ

                    JavaScript QuestionsのLydia Hallie氏の「JavaScript Visualized」シリーズすべての翻訳を完了したので、まとめて紹介します。 JavaScriptエンジンの仕組みをはじめ、イベントループ、スコープチェーン、プロトタイプ継承、非同期処理、ジェネレータ関数、Hoisting(巻き上げ)など、GIFアニメを使用して詳しく解説しています。 シリーズ7本すべてと、プラス1として楽しく学べるクイズもあります。 JavaScript イベントループの仕組み JavaScriptでエラーの原因となるHoisting(巻き上げ)の仕組み JavaScriptのスコープチェーン・変数参照の仕組み JavaScriptエンジンの仕組み JavaScript プロトタイプ継承の仕組み JavaScriptのジェネレータ関数とイテレータの仕組み JavaScriptの

                      JavaScript入門: 基礎知識をGIFアニメで分かりやすく解説 -総まとめ
                    • Web制作の常識が変わる、便利な最新オンラインツール48個まとめ

                      この記事では、Webデザインやグラフィックデザインの制作スピードを短縮し、生産性をアップする、便利な最新オンラインツールをまとめてご紹介します。 「もっと早く知りたかった」と思わせる、面倒な作業をサクサクこなす時短ツールが勢揃いです。カテゴリごとに整理しているので、目的にあったお気に入りツールを探してみましょう。 コンテンツ目次 1. Web制作便利ツール 2. デザインコレクション 3. イラスト系ライブラリ 4. 配色ツール 5. プロトタイプツール 6. コラボ、リモートワークツール 7. 面白、クリエイティブツール Web制作の常識が変わる、便利な最新オンラインツールまとめ Web制作便利ツール The Hero Generator ウェブサイトの魅力的なヒーローイメージを作成できるオンラインツール。グラデーションオーバーレイやボタンスタイル、見出しタイトルの余白など細かい部分も手

                        Web制作の常識が変わる、便利な最新オンラインツール48個まとめ
                      • AIいらすとや

                        無制限AIいらすとや 「いらすとや」風の画像を生成できる「AIいらすとや」が無制限で利用ができます。 無制限ダウンロード 「AIいらすとや」含む「AI素材」内にある多種多様な素材を追加費用を払うことなく、すべてのサイズで無制限でダウンロードができます。

                          AIいらすとや
                        • Midjourneyの呪文のまとめ

                          リンク 3D人-3dnchu- Midjourney Beta - キーワードを元にAIの力でアーティスティックな画像を生成してくれるサービス!無料のオープンベータ版を利用可能! キーワードを元にAIの力でアーティスティックな画像を生成してくれるサービス「Midjourney(ミッドジャーニー)」のベータ版が一般公開され、今話題を集めています。 3 users 13

                            Midjourneyの呪文のまとめ
                          • 個人情報テストデータジェネレーター

                            アプリケーションのテストなどで利用できる、リアルな架空の個人情報データ(疑似データ)を生成するツールです。

                              個人情報テストデータジェネレーター
                            • Stable Diffusion呪文集(プロンプト)完全ガイド。これで美少女AI画像が生成できる! - 画像生成ドットコム

                              呪文(プロンプト)とは? 呪文(プロンプト)とはStable Diffusionをはじめとする画像生成AIに入力する文章のことです。呪文(プロンプト)は画像の特徴を表すようなキーワードや文章を,区切りで入力するのが一般的な呪文(プロンプト)です。呪文(プロンプト)は呪文と呼ばれることも多いです。 呪文(プロンプト)には次のようなキーワードが指定されることが多いです。 画像の品質、クオリティ(例: masterpiece, best quality) カメラフォーカス(例: sharp focus, depth of field, blur background, bokeh) ライト・ting) 構図(例: front view, full body) 人物(例: 20 years old woman, 15 years old actress) ポーズ(例: looking at vie

                                Stable Diffusion呪文集(プロンプト)完全ガイド。これで美少女AI画像が生成できる! - 画像生成ドットコム
                              • 背景合成アプリ「Shoost」レビュー 映画のワンシーンのような「いい感じ」の絵を手軽に作れる | PANORA

                                ビジュアルクリエイティブディレクターのMuRo氏が発表した「Shoost」はユニークなツールだ。「いい感じの雰囲気の絵を簡単に作りたい! キャラクターをきれいに魅せたい!」という思いから生まれた本ツールは、3つのレイヤーを重ね合わせ、その上から撮影効果を付与することで、画面・映像を作るという今までにない立ち位置のツールと言える。しかしながら、独特なツールゆえに、どのようなものかイメージがわかない人も多いかもしれない。 本記事では、「Shoost」を実際に動かし、簡単な作品を作りながら、機能や優れている点を紹介していく。 人物画像+背景画像 まず、公式にも紹介されている、人物画像と背景画像を組み合わせた使い方を試す。 「Layer 2」 に人物画像を配置 まずは、主役となる人物画像から配置する。「Layer 2」を「Import Item」に設定し、画像アイコンをクリック。今回は「いらすとや

                                  背景合成アプリ「Shoost」レビュー 映画のワンシーンのような「いい感じ」の絵を手軽に作れる | PANORA
                                • Web制作の時短に!2020年の便利オンラインツール・ベスト100選

                                  この記事では、2020年に公開された便利なWebオンラインツール・ベスト100個をまとめてご紹介します。 定期的にリストアップしている最新オンラインツールまとめ記事では、2020年にかけて合計306個の新しいツールやサービスが登場しました。 その中でも、特にWebデザイン制作に便利なツールを選りすぐったコレクションで、「無料で利用できるツール」を揃えています。 これらのツールやサービスを活用すれば、Webデザイン制作をより快適に進めることができるでしょう。 カテゴリごとに整理しているので、目的にあったお気に入りツールを探してみましょう。 コンテンツ目次 1. CSSツール(14個) 2. パターンツール(7個) 3. イラスト系ツール(3個) 4. デザインツール(10個) 5. 配色カラーツール(6個) 6. グラデーションツール(3個) 7. SVGツール(8個) 8. スクリーンショ

                                    Web制作の時短に!2020年の便利オンラインツール・ベスト100選
                                  • 画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ

                                    2022年8月23日に無料公開された画像生成AI「Stable Diffusion」は、「ボールで遊ぶ猫」「森の中を走る犬」といった指示を与えると指示通りの画像を出力してくれます。Stable Diffusionはデモページで画像生成を試せる他、NVIDIA製GPUを搭載したマシンを用いてローカル環境で実行することも可能です。しかし、デモページは待ち時間が長く、NVIDIA製GPUは所持していない人も多いはず。Googleが提供しているPython実行環境「Colaboratory」を利用すれば、NVIDIA製GPUを所持していなくともStable Diffusionを待ち時間なしで実行する環境を無料で整えられるので、実際に環境を構築する手順や画像を生成する手順を詳しくまとめてみました。 Stable Diffusion with 🧨 Diffusers https://huggingf

                                      画像生成AI「Stable Diffusion」を低スペックPCでも無料かつ待ち時間なしで使う方法まとめ
                                    • This Anime Does Not Exist

                                      For significantly better and customizable anime image generation, check out Holara AI Creativity Slider        0.5 Higher creativity values tell the AI to be more creative and detailed, but also messy and weird Speed Slider    1.5 Space: pause grid, Drag: pan grid, Click: open image in new tab F: fullscreen mode, Z: toggle zoom on hover, V: video mode You can find updates about anime and AI on Twi

                                        This Anime Does Not Exist
                                      • HなStable Diffusion

                                        前提として、Stable Diffusionでエロ画像を出そうとしてもsafety checkerという機能が入っており、センシティブな画像を出そうとすると黒塗りになる。 (Stable DiffusionのSaaSであるDream Studioはぼかしだが、多分別の技術) https://github.com/huggingface/diffusers/releases/tag/v0.2.3 そこでGoogle Colabでちゃちゃっと環境を作り、なおかつNSFWを回避する。 1. 下記のリンクでノートを開く https://colab.research.google.com/github/huggingface/notebooks/blob/main/diffusers/stable_diffusion.ipynb 2. 下記の箇所を書き換える vvvvvvvvvvvvvvvvvv f

                                          HなStable Diffusion
                                        • AIひらめきメーカー

                                          AIひらめきメーカーは、AIを使って無限にアイデアを生成できるサービスです。 入力ワードから連想できるアイデアを、たった1クリックで生成します。ワンタップで生成します。 今すぐアイデアが欲しい方へ、新しいひらめきを得てみませんか?

                                            AIひらめきメーカー
                                          • ZOOMもUberもNetflixも、たった3万円で全てのシステム/アプリを作れるノーコードの衝撃

                                            ZOOMもUberもNetflixも、たった3万円で全てのシステム/アプリを作れるノーコードの衝撃 2021.06.09 Updated by Ryo Shimizu on June 9, 2021, 14:40 pm JST プログラマーというのは長じるとプログラムを書かなくなるものである。 特に最近はWebサイトくらいの簡単なものでも、決まり事が多くて書くのが億劫になってしまった。 大学生が適当に書いたHTMLをネットにバラ撒き散らしていた時代と異なり、今はSSL対応が必須になり、そのための証明書の管理もしなければならないし、スマートフォンでもPCでもタブレットでも綺麗にコンテンツが見えなければならない。 そうなると、もはやそれが専業の人以外は、お手上げだ。というか、できるだけ触りたくない、というのが本音である。 ところで筆者が創設に関わった「全国小中学生プログラミング大会」も今年で第

                                              ZOOMもUberもNetflixも、たった3万円で全てのシステム/アプリを作れるノーコードの衝撃
                                            • AI、ついに「二次元のKAWAII」を理解?

                                              852話(hakoniwa) @8co28 深夜に一般公開されたstable Difusionでの画面映えを意識したキャラクターのイラストの出力が、プロンプトの練度を上げたところ中々にえぐい。の画像まとめ。 AIartが今後どうなっていくのか楽しみすぎてワクワクする。すげーなあ。 pic.twitter.com/TQGhtBOQvA 2022-08-23 13:26:05

                                                AI、ついに「二次元のKAWAII」を理解?
                                              • 画像生成AI「Midjourney」の描いた絵が美術品評会で1位を取ってしまい人間のアーティストが激怒

                                                by Sincarnate 高精度な画像を生成できるAI「Stable Diffusion」などが登場し、人間と遜色ない絵が多数生み出される一方で、絵という芸術作品の著作権の概念が薄れつつあることも問題視されています。このほど、Stable Diffusionより一足先に登場していた画像生成AI「Midjourney」により生成された絵が、とある品評会で1位を獲得してしまったことが話題となっています。 An AI-Generated Artwork Won First Place at a State Fair Fine Arts Competition, and Artists Are Pissed https://www.vice.com/en/article/bvmvqm/an-ai-generated-artwork-won-first-place-at-a-state-fair-

                                                  画像生成AI「Midjourney」の描いた絵が美術品評会で1位を取ってしまい人間のアーティストが激怒
                                                • Midjourney/Memeplex(StableDiffusion)などの画像生成AIで思い通りの画像を出すヒント|shi3z

                                                  このnoteの収益を使ってStable Diffusionを使ったWebサービス https://memeplex.appを公開しました。誰でも無料で何枚でもAI作画をすることができます(そのかわり、混み合ってる時は時間がかかると思います)。 このnoteで学んだことをぜひ活用して、AIによる新しい時代の風を感じてください。 また、本文中にMidjourney、StableDiffusion、DreamStudio、Memeplexなどの言葉が頻出するため、全面的な修正を行うことにしました。StableDiffusionに統一しておきたいと思います。 現状(2022/8/28)は、StableDiffusion=DreamStudio/Memeplexと考えて構いません。Memeplexは将来的にStableDiffusion以外のアルゴリズムもサポートする予定だからです。

                                                    Midjourney/Memeplex(StableDiffusion)などの画像生成AIで思い通りの画像を出すヒント|shi3z
                                                  • メトロポリタン美術館が #あつまれどうぶつの森 に参戦。40万点の作品画像が使い放題

                                                    メトロポリタン美術館が #あつまれどうぶつの森 に参戦。40万点の作品画像が使い放題いま、世界の美術館のあいだで新たなプラットフォームとして注目を集めている、任天堂のゲーム「あつまれ どうぶつの森」。ここに、世界最大級の美術館であるメトロポリタン美術館が参戦した。 新型コロナウイルスによる外出自粛が世界的に続くなか、バーチャルワールドとして人気を博しているNintendo Switchの「あつまれ どうぶつの森」に、美術館も熱い視線を投げかけている。 中国・北京の私設美術館「木木美術館」(M WOODS)がバーチャル美術館を開館させ、アメリカ・ロサンゼルスのゲティ美術館がゲーム内に作品を飾れるアートジェネレーターを公開するなど、にわかに活気づいている「あつ森」。ここに、世界最大級の美術館として知られるメトロポリタン美術館が参戦した。 メトロポリタン美術館は、同館が所蔵している作品のうち、約

                                                      メトロポリタン美術館が #あつまれどうぶつの森 に参戦。40万点の作品画像が使い放題
                                                    • 【日本語訳】元素法典 第1巻 #NovelAI #元素法典|saip(さいぴ)

                                                      【10/18 翻訳完了】 ※StableDiffusion記法で書かれたプロンプトについて、()は{}に(5%強調)、{}は[]に(-5%強調)置換しています(NovelAI用)。また、NovelAIのプロンプトのプリセット機能はオフにしてお試しください。 Twitter (@31pi_) もフォローして頂けるとうれしいです。(間違い等あればこっそり教えてください) 元素法典 The Code of Quintessence ―― Novel AI 魔術全集 ―― 序文『元素法典』は、全ての高品質な術式と〈元素魔術〉を含めることを目的とする魔導書である。〈元素魔術〉とは、特に「商業イラストレベルの表現力を追求した」美しい絵を指す。 本書は、すべての人に開かれた書物である。したがって、聡明な読者諸君らの編み出した魔術の寄稿を歓迎する。 本書には、膨大な術式と豊富な挿絵が含まれている。その中か

                                                        【日本語訳】元素法典 第1巻 #NovelAI #元素法典|saip(さいぴ)
                                                      • 「亡き妻の写真」をAIで生成していることへのご意見について回答します(CloseBox) | テクノエッジ TechnoEdge

                                                        ご意見:この写真はAIの成果物で、そこを忘れないようにしないと ご意見:筆者の精神がおかしくなっていそう 忘れていないので、こうして記事にしているわけです。ただ、これをブラックボックスとして出してしまうと、信じてしまう人が出てくるかもしれません。そういう意味でもこういうことが技術的に可能であることを知ってもらう意義はあると思っています。 熱愛していた人を取り戻そうという人物は、そのために人類を補完しようとか、怪獣の細胞と合体させたり、ミトコンドリアがどうのこうのとかやりがちなのはフィクションのことで、彼らにも筆者のような技術があれば悪の道に走らなかったのではないかと、個人的には思います。残されたものの精神の安定には役立つと思います。現に、妻の歌声をコンピュータで再現する取り組みについては、死別し残された人の心のケアをするグリーフケアの観点から何度か取材を受けています。 ご意見:捏造した写真

                                                          「亡き妻の写真」をAIで生成していることへのご意見について回答します(CloseBox) | テクノエッジ TechnoEdge
                                                        • 上原亜衣、AI化 画像生成AIに元セクシー女優を学習させたデータを無料配布

                                                          元セクシー女優の上原亜衣さんが、AIを活用したプロジェクト「AI uehara project」を3月19日に発表しました。 「AI uehara project」は、上原亜衣さんの名前(=亜衣)とAIを掛け、「上原亜衣、AI化」を掲げて始動したプロジェクト。 上原亜衣さんの写真を画像生成AI「Stable Diffusion」に追加学習させるLoRAファイルが公開され、「上原亜衣AI画像コンテスト」と題したTwitter上でのコンテスト企画が行われています。 誰でも上原亜衣の顔を生成できるように 今回無料配布されているのは、NFT「Ai Uehara GM Collection」(外部リンク)として販売されている写真群を「Stable Diffusion」に追加学習させるLoRAファイル(外部リンク)。 このLoRaファイルを手元の「Stable Diffusion」に導入することで、誰

                                                            上原亜衣、AI化 画像生成AIに元セクシー女優を学習させたデータを無料配布
                                                          • 誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)

                                                            著者の声を録画・録音して声を変換し元の映像と組み合わせてみた映像です。 このときの変換元の音声は撮影用のスマートフォンで録音しており、部屋の残響が含まれるなど声が少し不鮮明になる収録環境ですが、それでもしっかり声変換できていることがわかると思います。 概要 Dwango Media Villageの廣芝です。 誰の声でも狙った複数の人の声に変えることができる声変換システムを開発し、実際に声を変えることができるデモページを公開しました。 (2022年5月 SeirenVoiceシリーズの製品化に伴いデモページは終了しました。) この記事では、声変換技術を研究開発する際に取り組んだ課題について紹介します。 声の変換技術には、リアルタイム性と品質のトレードオフがあります。 既存の声変換システムはリアルタイム性を重視する傾向がある一方、品質を重視したものはあまり見かけません。 品質を優先した声変換

                                                              誰の声でも100人の声に変えられる声変換システム - Dwango Media Village(ドワンゴメディアヴィレッジ,dmv)
                                                            • 画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)

                                                              画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。 StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i(image2image)」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。 その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言って

                                                                画像生成AIに2度目の革命を起こした「ControlNet」 (1/4)
                                                              • CSS Stock|Web制作を楽にするCSSコピペサイト

                                                                HTML・CSSの知識は不要。全222種類のパーツから お好みのものをご自身のサイトに取り入れることができます。 CSS Stockは「Web制作を楽にする」をテーマに、HTML・CSSのデザインやパーツをご紹介するサイトです。 お好きなパーツを選び、デザインや色を調整するだけ。あとはHTMLやCSSをコピペすれば、コーディング要らずでサイトに取り入れることができます。新しいスニペットも順次追加しており、色々なパーツを網羅できるよう日々尽力しています。 掲載しているコードについて 当サイトに掲載しているソースコードは全て自由にご自身のWebサイトやブログで使用いただいて構いません。もちろんオリジナルにカスタマイズしてご使用いただいても大丈夫です。 ただし別媒体でソースコード自体を掲載される場合は該当ページへのリンクを記載の上、参照元が当サイトであることを明記してください。 また掲載している

                                                                • Sora: Creating video from text

                                                                  Sora Creating video from text Sora is an AI model that can create realistic and imaginative scenes from text instructions. Read technical report We’re teaching AI to understand and simulate the physical world in motion, with the goal of training models that help people solve problems that require real-world interaction. Introducing Sora, our text-to-video model. Sora can generate videos up to a mi

                                                                    Sora: Creating video from text
                                                                  • midjourneyより高性能だけど入口の敷居が高すぎるStable Diffusionについて、かわなえさんによる導入方法解説まとめ+他の人の補足など

                                                                    リンク ITmedia NEWS 画像生成AI「Stable Diffusion」がオープンソース化 商用利用もOK AIスタートアップ企業の英Stability AIは、画像生成AI「Stable Diffusion」をオープンソース化した。AI技術者向けコミュニティサイト「HuggingFace」でコードやドキュメントを公開した他、同AIを試せるデモサイトなども公開している。 154 users 134 リンク はてな匿名ダイアリー HなStable Diffusion 前提として、StableDiffusionでエロ画像を出そうとしてもsafetycheckerという機能が入っており、センシティブな画像を出そうとすると黒塗りになる。(Stable… 180 users

                                                                      midjourneyより高性能だけど入口の敷居が高すぎるStable Diffusionについて、かわなえさんによる導入方法解説まとめ+他の人の補足など
                                                                    • 大規模言語モデルの驚異と脅威

                                                                      2022年11月にOpen AIが公開したChatGPTが世界で注目を集めている。一般ドメインかつ多言語で、従来のチャットボットとはレベルの異なる高品質の対話をリアルタイムに実現するサービスを(Research Preview版ではあるが)無料で提供し、検索、金融、広告、教育、法務などの広範囲な分野の転…

                                                                        大規模言語モデルの驚異と脅威
                                                                      • Midjourneyに$40課金して見つけたコツ|shi3z

                                                                        最近流行ってるAIといえばMidjourney。 吾輩は自宅の電気代が5万円を超えてしまったのでgakyoをお休み中。 というか最近はgakyoでなくてもrepica.comとかいろいろあるのでそっちでいいのではないかと思っている。 そこでMidjourneyですよ。 開発リーダーはLeapMotionの人。 何より安い。だって今まで月に5万かかってた電気代が$30でいいわけですからね。 でもチキンな吾輩はとりあえずお試し→終了→$10プラン→終了と繰り返して、$30/月プランに入りました。だから$40課金勢。 Discordで簡単に使えるのでGakyoよりワンクッションくらいは面倒なんだけど無いよりマシ。 Midjourneyは人間とかの描写に「あまり」制限がない。DALL-Eとかの公開版だと人間の描写に制限があったりするので使うのが難しいが、Midjourneyはハリウッド俳優の名前と

                                                                          Midjourneyに$40課金して見つけたコツ|shi3z
                                                                        • グラデーションの中央がグレーに濁ってしまう仕組みをくわしく解説、美しいグラデーションをCSSで実装する方法

                                                                          グラデーションを作成した時に、中央がグレーに濁ってしまうこと(グレーデッドゾーン)があります。なぜこの現象が起こるのか、どうすれば回避できるのか、鮮やかで美しいグラデーションをCSSで実装する方法を紹介します。 Make Beautiful Gradients in CSS by Josh W Comeau 下記は各ポイントを意訳したものです。 ※当ブログでの翻訳記事は、元サイト様にライセンスを得て翻訳しています。 はじめに CSSグラデーションが算出される仕組み おすすめのカラーモード これらの知識を活用する 美しいグラデーションを生成できるツール 終わりに はじめに さっそくですが、CSSで実装したイエローからブルーの線形グラデーションをご覧ください。

                                                                            グラデーションの中央がグレーに濁ってしまう仕組みをくわしく解説、美しいグラデーションをCSSで実装する方法
                                                                          • KIYAC | わずか数分でプライバシーポリシーや利用規約を簡単作成

                                                                            KIYACは、弁護士が監修する法律文書ジェネレータです。いくつかの質問に答えるだけで、プライバシーポリシーや利用規約など、ウェブサイト運営に必須の法律文書を生成できます。さらに、KIYACで生成された文書のリーガルチェックを弁護士に依頼することもできます。

                                                                              KIYAC | わずか数分でプライバシーポリシーや利用規約を簡単作成
                                                                            • Google、ORMが生成するSQLが遅いときの調査を容易にする「sqlcommenter」をオープンソースで公開。Rails、Spring、Djangoなど主要なフレームワークに対応

                                                                              Google、ORMが生成するSQLが遅いときの調査を容易にする「sqlcommenter」をオープンソースで公開。Rails、Spring、Djangoなど主要なフレームワークに対応 SQL文を直接書かなくとも、自動的にSQL文を生成、実行してくれるORM(Object-Relational Mapper)は、プログラミングを容易にしてくれる技術としてRailsやHibernate、Springなどさまざまなフレームワークなどで活用されています。 一方で、ORMが生成するSQL文はときに複雑に、あるいは非効率なものとなり、データベース処理の遅さにつながることもあります。 このとき、SQL文の生成と実行を明示的にコードとして記述する必要がないというORMの特徴が、なぜデータベース処理が遅くなったのか、どのようなSQL文が生成され、そのどこに原因があるのか、といった調査を難しくている面があり

                                                                                Google、ORMが生成するSQLが遅いときの調査を容易にする「sqlcommenter」をオープンソースで公開。Rails、Spring、Djangoなど主要なフレームワークに対応
                                                                              • 687億以上のメロディーをアルゴリズムで作り、著作権登録した弁護士

                                                                                音楽は単に数学的な組み合わせであり、椅子取りゲームである。 未使用のメロディーはいつか誰かが作曲してしまい、他のミュージシャンたちが自由に作曲する機会が日に日に奪われてしまう。という危機を回避するべく、多才な弁護士が将来の音楽家達が盗用で訴えられないよう、作曲されていない全メロディーをアルゴリズムで作曲し、それらを公開してパブリックドメインにしました。 それらを参照すれば、今後は「俺の曲パクっただろ!」と訴えられることが(もしかすると)激減するようになります。 訴訟が起これば莫大な額がフっ飛ぶ毎日のように新しい音楽が生まれていますが、作曲家が美しいと感じるメロディーには限りがあるようで、リズムや歌詞が違うだけで実は過去のミュージシャンが書いた曲とソックリだった! と訴訟で法外な金額を請求される現代社会。聴いたこともない曲なのに、似ているからという理由で著作権を請求され、共同作曲者として記載

                                                                                  687億以上のメロディーをアルゴリズムで作り、著作権登録した弁護士
                                                                                • 行政の統計資料のような非構造化データをGPTで構造化データに変換する|mah_lab / 西見 公宏

                                                                                  今朝方GPT-4が発表されて、みなさん死ぬほど盛り上がってますねー。 GPT-4を使えば一発でできそうなネタではありますが、GPT-4 APIのお値段は3.5よりもお高めの設定なので、これからはどのように上手くGPTのバージョンを使い分けていくかが問われていくと思います。 というわけで今日は非構造化データを構造化データに変換する話です。 問題の背景行政が定期的に公開している統計資料をご覧になったことはありますでしょうか。ディスる訳ではないですが、以下に示すのは私が住んでいる富士吉田市の統計資料です。 統計ふじよしだ令和元年度版 - 商業 このように分かりやすい表で情報を提供してくれるのはありがたいのですが、数値データにはなっていないので分析に活用することができません。 GPTのパワーを使って、このような非構造化データを構造化データに変換できないか?というのが本日のお題になります。 コードP

                                                                                    行政の統計資料のような非構造化データをGPTで構造化データに変換する|mah_lab / 西見 公宏

                                                                                  新着記事