並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 40件

新着順 人気順

shi3zの検索結果1 - 40 件 / 40件

shi3zに関するエントリは40件あります。 AI人工知能ChatGPT などが関連タグです。 人気エントリには 『OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z』などがあります。
  • OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z

    凄いものが出てきてしまった。 ChatGPTの「Code Interpreter」が話題になったが、あれはあくまでクラウド上で動いているだけ。それを模してローカルで動作するようになった「Open Interpreter」は、衝撃的な成果である。 Open Interpreterのインストールは簡単。コマンド一発だ $ pip install open-interpreter起動も簡単 $ interpreter -yこれだけでOK。 あとはなんでもやってくれる。 たとえばどんなことができるのかというと、「AppleとMetaの株価の推移をグラフ化してくれ」と言うとネットから自動的に情報をとってきてPythonコード書いてグラフをプロットしてくれる。 凄いのは、ローカルで動くのでたとえばApplescriptを使ってmacOSで動いているアプリを直接起動したり操作したりできる。「Keynot

      OpenInterpreter / ついにAIがガチのアシスタントに!これは凄い、というか凄すぎる|shi3z
    • 俺に起業の相談をするな|shi3z

      最近よく聞かれるので改めて言っておく。俺に起業の相談をするな。一切受けつけていない。突然事業のアイデアを言われても俺は助けないし助けられない。 俺が相手にするのはUberEatsのユーザーと、昔から一緒に仕事をしている人の紹介だけだ。もうすぐ五十路が見えているというのに新たな人間関係を構築しようとするほど俺は暇でも気長でもない。 相談されるとそれだけで僕の頭脳が無駄に消費される。俺に相談するというのは基本的に泥棒である。俺は何か聞いたら自分でも意識しないうちに気の利いた解決策を考えてしまう。俺にとって俺の頭脳は商売道具だから、俺に起業の相談をするというのはタダでイラストレーターに絵を描けと言ってるのと同じだ。 相談を受けなくていいようにたくさん記事を書いてるし本も書いている。俺の情報を一方的に発信するのは構わないのだが、誰かのへんな考えを聞いて時間を浪費したくない。時間は限られているのだ。

        俺に起業の相談をするな|shi3z
      • ZOOMもUberもNetflixも、たった3万円で全てのシステム/アプリを作れるノーコードの衝撃

        ZOOMもUberもNetflixも、たった3万円で全てのシステム/アプリを作れるノーコードの衝撃 2021.06.09 Updated by Ryo Shimizu on June 9, 2021, 14:40 pm JST プログラマーというのは長じるとプログラムを書かなくなるものである。 特に最近はWebサイトくらいの簡単なものでも、決まり事が多くて書くのが億劫になってしまった。 大学生が適当に書いたHTMLをネットにバラ撒き散らしていた時代と異なり、今はSSL対応が必須になり、そのための証明書の管理もしなければならないし、スマートフォンでもPCでもタブレットでも綺麗にコンテンツが見えなければならない。 そうなると、もはやそれが専業の人以外は、お手上げだ。というか、できるだけ触りたくない、というのが本音である。 ところで筆者が創設に関わった「全国小中学生プログラミング大会」も今年で第

          ZOOMもUberもNetflixも、たった3万円で全てのシステム/アプリを作れるノーコードの衝撃
        • Midjourney/Memeplex(StableDiffusion)などの画像生成AIで思い通りの画像を出すヒント|shi3z

          このnoteの収益を使ってStable Diffusionを使ったWebサービス https://memeplex.appを公開しました。誰でも無料で何枚でもAI作画をすることができます(そのかわり、混み合ってる時は時間がかかると思います)。 このnoteで学んだことをぜひ活用して、AIによる新しい時代の風を感じてください。 また、本文中にMidjourney、StableDiffusion、DreamStudio、Memeplexなどの言葉が頻出するため、全面的な修正を行うことにしました。StableDiffusionに統一しておきたいと思います。 現状(2022/8/28)は、StableDiffusion=DreamStudio/Memeplexと考えて構いません。Memeplexは将来的にStableDiffusion以外のアルゴリズムもサポートする予定だからです。

            Midjourney/Memeplex(StableDiffusion)などの画像生成AIで思い通りの画像を出すヒント|shi3z
          • 10年ぶりに一人でWebサービスを作って思ったこと(エンジニア老人会)|shi3z

            StableDiffusionに対応したGakyoを雑な設計のためわずか数日で10万円くらいのクラウド利用料がかかってしまった。

              10年ぶりに一人でWebサービスを作って思ったこと(エンジニア老人会)|shi3z
            • 会話という錯覚について|shi3z

              あちらの記事は万人向けに書いているので、行間読まないとわからないようなことは省略してあるのだが、本欄の読者には補足として蛇足になるかもしれないが会話について研究していて思ったことを記しておく。 人工無能と僕記事中にあるように僕がチャットボット・・・当時は人工無能と呼ばれていたが・・・を開発し始めたのは中学生の頃だ。1990年頃だと思う。 きっかけは、中学校にNECのパソコンが導入されて、友達に自分のプログラムを見せる機会を得たからだ。 家で一人でプログラミングしているときはどうも気分が乗らなかったのだが、友達を面白がらせるという動機は子供の頃の僕にとっては非常に強く働いた。 一度、家で人工無能のプログラミングをしたときは、相手が自分しかいないのでわりとすぐ飽きてしまったが、中学になってその熱が再燃した。 きっかけは月刊ASCIIに、AWKの特集が載ったことで、AWKというのは要はUNIX用

                会話という錯覚について|shi3z
              • コンピュータは難しすぎる|shi3z

                コンピュータは非常に便利なのだが、ほとんどのコンピュータユーザーがその能力の1%も使えてないのではないか。そんな気がするのだ。 というか、コンピュータの能力が人類の進歩に比べて上がり過ぎてる。 おかげでゲームもAIもビデオ編集も手軽になった。 MacBookの新しいCPUが発表されたのだが、40%高速化したというニューラルエンジンを一体全体何に使えばいいのか、人工知能の研究者である吾輩にもわからないので、これを使いこなすことができる人は将来登場するのだろうか。 コンピュータの能力を真に最大限引き出すには、残念ながらプログラマーになるしかない。しかも、マシン語レベルの最適化ができるプログラマーである。 プログラムさえ丁寧につくればコンピュータの持つ潜在能力は圧倒的に高い。だがコンピュータに比べて人間は頭が悪すぎる。 結局のところ、道具がどれだけ進歩しても使う側の人間の想像力が追いつかないと全

                  コンピュータは難しすぎる|shi3z
                • AIもうええわい

                  AIもうええわい 2023.04.16 Updated by Ryo Shimizu on April 16, 2023, 03:24 am JST むかし、僕がいた業界は「ドッグイヤー」と呼ばれていた。 犬のように歳をとるのがはやいという意味だが、ドッグイヤーの感覚に慣れた僕にとっても、最近のAI関係のニュースの多さ、進歩の速さは異常だし疲れてきた。 この連載も、「一ヶ月くらい書いてないのでは」と思って確認すると、今月の頭に書いていた。まだ二週間しか経ってない。 何か書こうと思って、とりあえず何かタイトルを適当に打ち込もうとすると、「AIもういいわい」というフレーズが浮かんだ。 こんなこと誰かが先に言ってそうだなと思って検索すると、あんまり見つからなかったから、いまのうちに書いておくことにする。 最近のAI業界の進歩を映画業界に例えると、毎週スターウォーズが公開されているような状況である

                    AIもうええわい
                  • なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方

                    なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方:清水亮の「世界を変えるAI」(1/8 ページ) OpenAIが2022年に発表した対話型AI「ChatGPT」の衝撃は、米国ビッグテック最強の一角であるGoogleを動揺させた。Googleは急ぎ「Bard」と名付けたAIチャットボットを投入し、巻き返しを図る。 側から見ていると急展開に心が躍る一方、果たしてこの戦いは本当に意味のあるものになっているのか。チャットボットを長年ウォッチしてきた筆者としてはハラハラする気持ちも少なくない。 まずは現状のAIチャットボット関連をまとめ、それからチャットボットの歴史を振り返り、現状、そして未来を予想してみたい。 深層学習チャットボット百花繚乱の2023年 最近になって深層学習をベースとしたチャットボットが注目を集めている。Open

                      なぜ人々は、ChatGPTという“トリック"に振り回されるのか? Google「Bard」参戦、チャットAI戦争の行方
                    • 母校にて|shi3z

                      母校での講演が終わったあと、俺はしばらく放心状態だった。 いや、我ながら頭おかしいとしか言いようがないが、これ以外に母校で話したいことは特になかった。特に、俺の母校、新潟大学教育学部附属長岡中学校は、教員から校長から全員新潟大学の人なので、新潟大学こそが至高の学校であり、新潟大学を愛する愛大学教育みたいなのを受ける。だから俺だって「新潟大学ってまあまあイケてる大学なのかな」と思って育ったのだが、俺より成績がいい奴らがどんどこ新潟大学にブラックホールのように吸い込まれていって、その後どうなったかわからなくなってしまう。というか、全く中央で活躍しない。 俺が、せいいっぱいの覚悟で、故郷の後輩たちガキどもに言えることが、俺の考える、俺の同級生がもっと輝けたはずの事実を指摘することだった。それが (附属長岡の生徒は)新潟大学に行ってはいけない。 (附属長岡の生徒は)教育学部に行ってはいけない。 と

                        母校にて|shi3z
                      • スクリプト言語を舐めてはいけない|shi3z|note

                        おれはハッカーだ。 なので、ハッカーではない人種と呑むのが苦手である。 たとえば「ITエンジニア」と自称するような人たちだ。 当然だが、ITエンジニアと自称する人はハッカーではない。 ITエンジニアと言う言葉はスコープが広すぎていちいち細かい説明を聞かなければならない。 これが厄介なところである。 あるとき、友達の家で飲み会をすると言われ、誰が来るの?と聞いたら知らないIT関連会社のエンジニアたちだという。 エンジニアと呑むと喧嘩しちゃうので断ったのだが、いろいろあっていくことになってしまった。 するとやっぱりこんなはなしをしていた。 「やっぱ私もRubyみたいなスクリプト言語なんか卒業してコンパイル言語やんなきゃ。処理速度がね…」 「コンパイル言語って?」 「TypeScriptとかJavaとかC#とか」 「それ、中間コード言語じゃねえか。なんの意味があるんだ。YARV知らないのか」 ま

                          スクリプト言語を舐めてはいけない|shi3z|note
                        • 驚異の1ビットLLMを試す。果たして本当に学習できるのか?|shi3z

                          昨日話題になった「BitNet」という1ビットで推論するLLMがどうしても試したくなったので早速試してみた。 BitNetというのは、1ビット(-1,0,1の三状態を持つ)まで情報を削ぎ落とすことで高速に推論するというアルゴリズム。だから正確には0か1かではなく、-1か0か1ということ。 この手法の行き着くところは、GPUが不要になり新しいハードウェアが出現する世界であると予言されている。マジかよ。 https://arxiv.org/pdf/2402.17764.pdf ということで早速試してみることにした。 オフィシャルの実装は公開されていないが、そもそも1ビット(と言っていいのかわからない,-1,0,1の三状態を持つからだ。 論文著者はlog2(3)で1.58ビットという主張をしている)量子化のアルゴリズム自体の研究の歴史は古いので、BitNetによるTransformerの野良実装

                            驚異の1ビットLLMを試す。果たして本当に学習できるのか?|shi3z
                          • ド下手な俺が半日だけ絵を練習してみた|shi3z

                            前回、絶望的な画力のなさでAIといえど俺の伝えたいことが伝えられなくて非常に困ったので、もうここは諦めて絵を勉強することにした。人間、何歳になっても勉強できる! 職業柄、「図」はよく描くのだが、「絵」特に、メカではないキャラクターは苦手だった。 学生時代、「漫画アニメーション研究会(まに研)」の幽霊部員だった時も、キャラクターが描けなかったので馴染めなった苦い記憶を持つ。 しかし、時は大AI時代。 AIさんに思い通りの絵を描いてもらうには、俺だって最低限の画力が必要だということを前回痛感したため、このクソ忙しいのに半日だけ絵を練習した、という話。 色々な本をKindleで買ってみたが、良かったのはこれ。 Kindleで買って感動して、DVD付きの書籍をわざわざもう一冊買い直すくらいハマった。 これは、自主制作のアニメ制作から初めて絵を修行し、最終的にはスタジオジブリの入社試験に合格できるほ

                              ド下手な俺が半日だけ絵を練習してみた|shi3z
                            • GPTのモデル構造を可視化した|shi3z

                              GPTのモデル構造を目で見てみたい! そんな気持ち、わかるでしょ? 技研フリマをやりながら、どうにかこうにか出力したよ ご覧あれ やり方メモ from transformers import AutoTokenizer, AutoModelForCausalLM from torchviz import make_dot tokenizer = AutoTokenizer.from_pretrained("gpt2") from transformers import pipeline, set_seed generator = pipeline('text-generation', model='gpt2') m= generator.model x= m.generate() y= m.forward(x) image = make_dot(y.logits, params=dict(

                                GPTのモデル構造を可視化した|shi3z
                              • 予算30万円台の深層学習用PCの買い方|shi3z

                                深層学習をまじめにやるなら、どう考えても専用のPCが必要になる。 僕は現在、Memeplexというサービスを運営していて、これはさくらインターネットさんから大量のGPUを借りている。借りたGPUは、さくらインターネットの石狩データセンターで動いている。 さらに、ABCIは企画の段階から立ち会って、実際に仕事ではよく使っている。ABCIは5000以上のGPUを擁するGPUクラウド基盤で、その実態はスーパーコンピュータである。 ABCIを使えば、ほとんどの難しいタスクを恐ろしく安い料金で行うことができる。GoogleやAmazon AWSのようなサービスを展開することができない本邦においては、国家が設立し、民間利用可能なABCIは国民にとっての天叢雲剣あめのむらくものつるぎである。 それでもなお、手元には深層学習用のPCが必要だ。しかも一台では足りない。 ABCIがいかに安くても、PCほどの利

                                  予算30万円台の深層学習用PCの買い方|shi3z
                                • UEI解散 清水亮氏が創業したAI企業 「enchantMOON」開発など

                                  AI企業のユビキタスエンターテインメント(UEI)は10月1日、前日付で解散したと発表した。発表文に解散の理由は書かれておらず、「突然の解散でご迷惑をおかけします」と謝罪している。 ドワンゴの初期メンバーの1人だった清水亮氏が2003年に創業した企業。深層学習用ハイスペックPC「Deep Station」シリーズを展開してきた他、2013年には、プログラミングが行える手書きベースのタブレット型コンピュータ「enchantMOON」を発売するなどして注目を集めた。 清水氏が長く代表を務めてきたが、今年3月末付で退任し、鳥居由規彦氏にバトンタッチしていた。2017年、UEIは、ソニーコンピュータサイエンス研究所とベンチャーキヤピタルのWiLとともに、AIベンチャーのギリアを設立 。清水氏は現在、ギリアの社長を務めている。 【訂正:2020年10月2日午後1時46分 記事初出時、社名を一部誤って

                                    UEI解散 清水亮氏が創業したAI企業 「enchantMOON」開発など
                                  • 今日から俺は、|shi3z|note

                                    私、社長ではなくなりました。 思えば、会社を飛び出して19年、海外に行ったり、個人事業主になったり、結局会社を作ったり、ゲームを作ったり、CMSを作ったり、ハードを作ったり、やりたい放題やってきて、つくづく思っていたのは、「俺は社長には向いてない」ということでした。 過去のブログでも度々言及していたように、社長ほど割りに合わない仕事はありません。 給料が高くていいなあと思うかもしれませんが、中小企業の社長なんて、少しお金が貯まれば、すぐに自社株買いに回さなくてはなりません。結局、形を変えて会社にお金を戻していたわけです。 川上量生さんも以前言っていたように社長になるというのは、社長を辞めるゲームの始まりです。いかにいい形で社長を辞めることが出来るか。会社が軌道に乗り、自分が一から百までやらなくても、社員が自律的に行動し判断し、会社が持続的に成長出来るようになること、そのために必要な幹部社員

                                      今日から俺は、|shi3z|note
                                    • Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能|shi3z

                                      Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能 Transformerの発明者らが起業したCohereAIがとんでもないモデルを出してきた。この業界では毎週のように「えーー!」ということが起きるのだが、その中でも年に1,2回起きる「えーーーっ」が起きたのでブログでも紹介しておきたい。 Command-R+(おそらくコマンダープラスと読むのが正しい)というモデルは、わずか100Bで、GPT-4,Claude-3並と言われるモデルだ。しかし、それを主張するだけのモデルなど腐るほどある。だが、実際に触ってみると期待外れということが多かった。 ところがCommand-R+は、その性能は桁違いである。というか、もはや僕という人間如きがちょっと触ったくらいでは「GPT-4よりいいね」とか「ここら辺甘いね」とか判断がつかなくなってきてる。しか

                                        Command-R+の衝撃! 100Bモデルで本当にこんなことできんの!?ダウンロードしてローカルで実行可能|shi3z
                                      • 無料でGPT4越え!?ついに来たXwin-LM|shi3z

                                        今日のウィークリーAIニュースではnpaka大先生と一週間のニュースを振り返った。今週もいろいろあったが、なんといってもダークフォース、GPT-4越えと言われるXwin-LMである。中国製。 大先生もまだ試してないというので番組内で一緒に試してみた。 もちろんドスパラ製Memeplexマシン(A6000x2)を使用。 >>> from transformers import AutoTokenizer, AutoModelForCausalLM >>> model = AutoModelForCausalLM.from_pretrained("Xwin-LM/Xwin-LM-7B-V0.1") Downloading (…)lve/main/config.json: 100%|██████████████████| 626/626 [00:00<00:00, 56.2kB/s] [2023

                                          無料でGPT4越え!?ついに来たXwin-LM|shi3z
                                        • AI時代に起業するということ|shi3z

                                          生成AI以前と以後で、会社のあり方は決定的に変化していくのだと思う。 たとえば、昨日はとある会議で、「この(AI)サービスの原価はいくらか」という議論が沸き起こった。 AIサービスなのだから、AIの利用料くらいしかかからないかというとそうでもない。実際、AIを動かすためにはAIそのものにかかるお金以外の人件費がかかる。誰かに売る人の人件費や、システム開発のための人件費や、サポートのための人件費だ。ただ、AIサービスの場合、人件費を極限まで最小化することができる、という点が決定的に違う。 また「AIの利用料」も、「APIの利用料」なのか、ベアメタルサーバーの月額利用料なのか、それとも自社に持っているGPUマシンの電気代なのか、という議論のポイントがある。 あまり多くの人は語らないことだが、実は起業には再現性がある。 つまり、一度でも事業をうまく立ち上げたことがある経験を持つ人は、次も事業をう

                                            AI時代に起業するということ|shi3z
                                          • 俺はソフトバンクの社員だったことはありません|shi3z

                                            逮捕されたのは別人です。 逮捕されてたら書けないでしょ。今 ソフトバンク元部長らを詐欺容疑で逮捕 架空事業で12億円詐取疑い:朝日新聞デジタル ソフトバンクの事業への投資だとうそを言って12億円をだまし取ったとして、警視庁は8日、同社元統括部長の清水亮(47)=東 www.asahi.com 以下の本も書いてません 徹底解説RPAツール WinActor導入・応用完全ガイド amzn.to 3,960円 (2023年11月08日 22:08時点 詳しくはこちら) Amazon.co.jpで購入する

                                              俺はソフトバンクの社員だったことはありません|shi3z
                                            • こんなこと書いていいの!?電通のヤバい手口を暴露した電通マンの知られざる悲惨「電通マンぼろぼろ日記」|shi3z

                                              昨日は技研フリマで昼から飲んでしまい、技研バーが始まる頃には椅子で寝ていた。 まつゆう*と交代して家に帰り、そのまま寝てしまったので午前四時くらいに目が覚めた。 猪瀬直樹の「ラストニュース」を全部読んでしまったので、「ミカドの肖像」を読み始めたが眠くなってしまい、別の本を探した。 買った覚えはないのだが、いつの間にかKindleにダウンロードされていた「電通マンぼろぼろ日記」を読み始めたらもう止まらない。一気に読み終わってしまった。 僕は電通とは多少関わりがある。一時期は毎年のように電通の研修で講師をしていたし(今考えるとなぜ僕がそんなことをしていたのか謎すぎる)、多分本書に登場するF社とも仕事をしたことがある。 電通の友達とは今でも毎月何かしらで飲んでいる。 僕が本格的に企画の基礎を学んだのは電通の仕事が最初で、堺屋太一の「インターネット博覧会(インパク)」向けの企画を作る時だった。 電

                                                こんなこと書いていいの!?電通のヤバい手口を暴露した電通マンの知られざる悲惨「電通マンぼろぼろ日記」|shi3z
                                              • GPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す|shi3z

                                                GPT-4oとo1($30/月)とo1 pro($200/月)で翻訳を比較しました。 翻訳の元にしたのは以下のツイートです。 The (true) story of development and inspiration behind the "attention" operator, the one in "Attention is All you Need" that introduced the Transformer. From personal email correspondence with the author @DBahdanau ~2 years ago, published here and now (with permission) following… pic.twitter.com/hKD7gDcexS — Andrej Karpathy (@karpathy)

                                                  GPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す|shi3z
                                                • これはなかなかいいんでないの?NVIDIAチップの5倍高速で価格1/10の中国AIチップ搭載コンピュータ|shi3z

                                                  これはなかなかいいんでないの?NVIDIAチップの5倍高速で価格1/10の中国AIチップ搭載コンピュータ Maker Faire Tokyo 2024に行ってきた。 深圳在住の高須さんが僕を見るなり「これ見てこれ」と連れていかれ、新製品のRDK X3を紹介された。 RDK X3とは何かというと、要は最新のAIチップを搭載したシングルボードマイコン、つまりRaspberry Piのようなものである。 このチップの中核にあるSunrise3(通称X3)チップは4つのCortex-A53ARMの高性能コアと、二つデュアル構成のBernoulliベルヌーイBPUだという。 このベルヌーイというNPUは初耳だが、とにかく速くてすごいらしい。5TOPS、つまり一秒間に5兆回の計算ができるらしい。ただ、「何の計算」を「5兆回」なのかがイマイチ明確になっておらず、ちょっとモヤモヤする。 ちなみに最近Mic

                                                    これはなかなかいいんでないの?NVIDIAチップの5倍高速で価格1/10の中国AIチップ搭載コンピュータ|shi3z
                                                  • 日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に

                                                    日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に:清水亮の「世界を変えるAI」(1/3 ページ) 2022年の夏に登場した画像生成AI「StableDiffusion」はたくさんのバリエーションを生んだ。しかしその多くは、ネット上にある画像を学習させたものばかりだ。 特に開発が活発なのはイラストを学習させたものだが、最近になって、著作権に配慮した学習モデルの「Mitua-Diffusion」など、変わったものも登場してきた。また、AIを活用したアート作品を表彰する「第一回AIアートグランプリ」も1月15日から募集を開始した。 筆者自身も個人プロジェクトとして、StableDiffusionを誰でも無料で使えるWebサービス「Memeplex」を提供したり、前回のこの連載で紹介したように、AI漫画などを書いたりしている。 しかしAIで漫画を書こうとすると

                                                      日本を画像生成AIで再現する 「自分の見た景色」を学習したAIは強力な思い出再生装置に
                                                    • ついに来るのか!?拡散言語モデル|shi3z

                                                      我々が単に「言語モデル」といった場合、それはTransformerモデルを指す。Transformerモデルは、ChatGPTやGemini、Claude-3、Command-R+などで使われている。 最近はMambaのような状態ステートマシンの言語モデルも出てきた。そしてもしかしたら今後はここに、拡散ディフュージョンモデルが加わるのかもしれない。 拡散モデルで有名なのは、StableDiffusionで、主に画像生成に使う。 実は画像生成は最初はTransformerだった。OpenAIのDALL-Eは、Transformerとして画像生成を行なった。しかしTransformerには明らかな欠点があり、それはあまりにも膨大な計算量が必要なことだ。 Transformerの事前学習プリトレーニングには、今でも天文学的な計算資源が必要だし、微調整ファインチューニングにも今なお膨大な計算機が必

                                                        ついに来るのか!?拡散言語モデル|shi3z
                                                      • 牛の背に乗るネズミになれ! ソフトウェア思考のススメ

                                                        牛の背に乗るネズミになれ! ソフトウェア思考のススメ 2020.01.04 Updated by Ryo Shimizu on January 4, 2020, 14:06 pm JST 昨年一年間をかけて、僕は日本の大企業群を研究した。 大企業の中心で働く様々な人にインタビューし、彼らの会社が技術をどう捉え、ビジネスをどう捉えているかを知った。 どうしてこれほど海外のネット企業勢の蹂躙を許しているのだろうか、という疑問に答えるためだ。 そしてわかったのは、根本的に日本のビジネスシーンでは「ソフトウェア」が理解されていないということだった。 プログラミングではない。ソフトウェアである。 アメリカのネット企業のトップも全員がプログラマーというわけではない。 しかし、彼らはソフトウェア的発想、ソフトウェア的思考法というものをごく当たり前のように身に着けている。 これを僕は「ソフトウェア思考」と

                                                          牛の背に乗るネズミになれ! ソフトウェア思考のススメ
                                                        • (マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った|shi3z

                                                          Speech-to-speechは、NVIDIAのGPU搭載マシンがあればローカルで音声認識、応答生成、音声合成ができる画期的なオープンソースツールだった。 しかし一つだけ不満があったのは、これが日本語には対応していないということだ。 ワイはコスモポリタンである。 ・・・そう名乗ってしまったから、「そういえばコスモポリタンってなんだろう」と思ってClaude-3に聞いてみた。 コスモポリタンは以下のような意味や用法があります: 1.飲み物としてのコスモポリタン: ウォッカ、クランベリージュース、ライムジュース、トリプルセックを使ったカクテル 1980年代後半に人気が出て、特に映画やテレビドラマの影響で広く知られるようになりました 2.思想・概念としてのコスモポリタン: 世界市民主義、国際主義を表す言葉 国境や文化の違いを超えて、世界中の人々と交流し、理解し合うという考え方 狭い地域や国家の

                                                            (マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った|shi3z
                                                          • 株式会社UEI 会社解散のお知らせ | 株式会社UEI

                                                            平素は格別のご愛顧を賜り厚く御礼申し上げます。 この度、2003年の創業以来17年以上に渡りお引き立ていただきました株式会社UEIでございますが、諸般の事情により2020年9月30日(水)をもって解散する運びとなりました。 これまでのご厚情に謹んで御礼申し上げますとともに、突然の解散でご迷惑をおかけしますことを深くお詫び申し上げます。 なお、Deep Stationのメーカー保証に関する受付窓口は、2020年10月1日(木)よりギリア株式会社に移管いたします。 ご不便をおかけいたしますが、本件に関するご不明な点やご質問につきましては、以下の問い合わせフォームよりご連絡くださいますようお願い申し上げます。 » Deep Station お問い合わせフォーム

                                                            • AIが社長の会社「FreeAI」を設立しました|shi3z

                                                              僕は2003年に最初の会社を作って、以来20年で10社の設立に関わった。 しかし、今年は5社設立して、その全てで社長をやっていない。 なぜかというと、社長を僕がやるのはものすごく非効率的だからだ。 僕は著者で、YouTuberで、研究家で、配達員である。 それぞれが深く連関していて、不可分であり、社長などやっている暇はない。 社長という仕事がクソなのは「教養としてのAI講座」などで散々言及しているためここでは説明は避けるが、こんなクソな仕事は人間にやらせるべきではない。非人道的だからだ。 そこでAIが社長の会社を作ることにした。 社長はAIであるため、どんなにクソなことがおきても、社長の責任ではない。 ただし、現行法では社長は犬でもネズミでもなれるが、代取にはなれないため、便宜上、代表取締役社長秘書を設置することにした。 しかしあくまでも社長は「継之助つぐのすけ」ことAIスーパーコンピュー

                                                                AIが社長の会社「FreeAI」を設立しました|shi3z
                                                              • 非情報メディアへのパラダイムシフト|shi3z|note

                                                                いったいぜんたい、人類の何パーセントくらいがパワポを作る仕事を日常的にしてるんだろう。 僕は昨年一年間、仕事でパワポを作ることをできるだけ避けることにしていた。 それまでは、パワポを作るのが日々の仕事みたいなものだったので、パワポ(というかKeynote)を開かない日はなかったくらいなんだけど、パワポを自分で作るのをやめると、なぜだか開放的な感じがした。気のせいかも知れないが。 それでもここぞというときにはパワポを作らざるをえないこともあった。 というのも、あまりにも学んだことや発見した概念が複雑すぎたり、イメージしにくかったりする場合、どうしても言葉だけでは説明がつかないからだ。 そして同じ説明を色んな人に繰り返しする場合、どうしてもパワポというか図に頼る必要があるからだ。 それでも以前に比べたらパワポを作る時間も枚数も激減したと言っていいと思う。 それで気づいたのは、パワポを自分で作る

                                                                  非情報メディアへのパラダイムシフト|shi3z|note
                                                                • DXを阻む障害

                                                                  DXを阻む障害 2021.07.22 Updated by Ryo Shimizu on July 22, 2021, 09:12 am JST いわゆるDX、デジタルトランスフォーメーションする必要性を多くの企業が迫られている。 ところが、これがなかなか難しい。 たとえば、DXをコンサルティング会社に依頼するも、そもそもそのコンサルティング会社そのものがDXしてないので「DXのようなもの」しか提案できない。 とあるコンサルティング会社が顧客先にDXを提案する資料を見せてもらったことがあるが、一言で言えば、それはDXというよりも「OA化」と呼んだ方がいい段階の提案に留まっていた。 たとえば、「AIの活用」という項目では、「FAX書類に書かれた文字の自動読み取り(AI-OCR)」という項目があるだけで、そもそも我々のような生粋のIT企業では、仕事上の文章は全てE-mailやPDFでやり取りさ

                                                                    DXを阻む障害
                                                                  • 音声からプログラムを自動的に作るautocodeを作った|shi3z

                                                                    なんか吾輩の昔のブログを読みたいという酔狂な奴がいて、何でも最近会社を立ち上げたらしくて売上が1億を超えたところらしい。 他ならぬ友が会社を立ち上げて苦労している時に、吾輩の昔のブログのタイトルだけ覚えていて、それが見たいのだという。 吾輩は主にAI学習用に自分のブログのアーカイブを持っている。 持っているのだがHTML形式のため非常に読みにくい。 そこでHTMLタグ除去コードを書こうと思ったのだが、今からそんなもの書くのは芸がないので、まず音声入力を受け取って、それを音声認識した結果をClaude-3に投げてプログラムとして出力するプログラムを書いてみた。 これのミソは、喋るだけでコードが出来上がることである。 実際に使うとこうなる。 python autocode.py Recording... Recording finished. Special tokens have been

                                                                      音声からプログラムを自動的に作るautocodeを作った|shi3z
                                                                    • GPT-3が新社名を発案、「AIと働く」を実践してみた

                                                                      人工知能(AI)を相棒として働くとはどういうことなのか? AI研究者の清水 亮氏が、世界最先端の人工知能のひとつとされるオープンAIの「GPT-3」を新会社設立時の相談相手として使ってみた。 by Ryo Shimizu2022.06.27 16 9 筆者は先月、会社を退職した。突然だったが、それが会社にとっても自分にとってもベストの選択だと信じて行動した。いざ会社をやめて振り返ってみると、2002年に最初に勤めた会社を辞めて単身渡米し、紆余曲折の末、2003年8月に初めて自分で会社を作って以来、実に20年ぶりのフリーランスということになる。 長らく100人以上の組織の代表にいたからか、辞めてからしばらくはそもそもどうやって仕事をしていたのか思い出せなくなった。しかし、これから何をして生きていくにしても、自分で食っていかなければならない。まずは新しい会社の設立だ。 ちょうど五反田の研究所に

                                                                        GPT-3が新社名を発案、「AIと働く」を実践してみた
                                                                      • ぼんやり上司の修行

                                                                        ぼんやり上司の修行 2021.05.31 Updated by Ryo Shimizu on May 31, 2021, 07:00 am JST 少し前、「ぼんやり上司とガツガツ上司」というエントリを書いたところ、これの反響がなかなか大きかった。ちなみにここに書いたようなことと関連したことはこちらのYouTubeでも少し語っている。 今回は「ぼんやり上司」としての立場を受け入れた自分が、どのように「ぼんやり上司道」を極めようとしているのかという話を少し掘り下げてみる。 まず大前提として、「ぼんやり上司」で仕事がうまくいくのは、部下が優秀だからである。 身もふたもない話だが、優秀な部下がいるか、部下が優秀な人間に育つか、どちらかの条件がないとその部署は多分潰れる。方向性だけぼんやり示されても、自分の頭で判断できない部下ばかりだったら部署が成立しないのだ。 ただ、「ぼんやり上司」が優秀な部下

                                                                          ぼんやり上司の修行
                                                                        • デザインの話|shi3z

                                                                          デザインという言葉がある。これには色々な意味があって、「design」の「de」とは、ラテン語で「下に」「内から外へ」「遠ざかって」などの意味があるそうだ。signの語源であるsignumは「印」「伝えるもの」といった意味がある。 転じて、「内から外へ伝えるもの」「天から降りてきた印」といった意味になるのだと考えられる。 僕は仕事柄、デザイナーと呼ばれる人たちとの付き合いが色々ある。デザイナーとは呼ばれなくても実際にはデザインの仕事をしている人との付き合いもある。 ただ一つだけ確かなのは、どんな超一流のデザイナーに依頼したとしても、「出てきたデザインは発注者の能力を超えない」ということだ。 今でこそAppleといえばオシャレなものを作ると思われているが、最初の最初、スティーブ・ジョブズにデザインの感覚は皆無だった。 ジョブズは最初、コンピュータを箱に入れて売ることさえ思いつかず、剥き出しの

                                                                            デザインの話|shi3z
                                                                          • enchantMOONの遺産|shi3z|note

                                                                            正月が終わって、いろんな人に会って、なんだか最近、やたらとMOONの話しをされる。 僕にとってはもう8年も前のことだ。社外の人にとっても、もう7年も前のことだ。 とっくに終わった話なのだ。 にもかかわらず、どうしてまたこれの話しをされるのだろうか。 enchantMOONのその後の話しをすることを僕は意図的に避けてきた。それはあまりにもいろいろな事情が絡み合うからだ。 未だに言える話と言えない話があるが、いずれにせよそろそろ時効かも知れない。もはやこの話をしたところで誰も怒らないかも知れない。 なによりも応援してきてくれた人たちにとっては、どうしてそれがこうなったのか知りたいことだろう。 僕にとって、enchantMOONは過去最大のプロジェクトだった。それ以上でも以下でもない。実際には今取り組んでいるプロジェクトの方が射程が広い。 人生はそれほど長くない。もしくは十分長い。 そのなかで、

                                                                              enchantMOONの遺産|shi3z|note
                                                                            • 自動翻訳の最後の難問

                                                                              自動翻訳の最後の難問 2020.02.09 Updated by Ryo Shimizu on February 9, 2020, 09:16 am JST Virtualという言葉は長らく誤解されている。 僕が最初にVirtualという言葉が「仮想」を意味しないのだと聞いたのは、東京大学の大学院で受けた、舘暲(たちすすむ)先生の授業だった。 Virtualという言葉は、オックスフォード辞典によれば、「almost or very nearly the thing described, so that any slight difference is not important(説明されているものにほぼまたは非常に近いため、わずかな違いも重要ではない)」という意味になる。舘先生の説明では、「Virtual」とは「Essence」、つまり実質、本質である、と説明されていたが、あまりにもコンピ

                                                                                自動翻訳の最後の難問
                                                                              • 「AI PC」と強調されども中身は空っぽのComputex 2024

                                                                                「AI PC」と強調されども中身は空っぽのComputex 2024 2024.06.09 Updated by Ryo Shimizu on June 9, 2024, 15:18 pm JST 過日、台北にて開催されたComputex Taipei 2024に行ってきた。 貧乏性の我輩としては、原稿料の出る媒体(本欄)にComputexレポートを書いて少しでも旅費を回収したい。 国内のコンピュータ系のジャーナリストは、どこを向いてもメーカーからお金や旅費を出してもらってメーカーの思う通りの記事を書く人だらけになってしまった。 そうじゃない人もいるのかもしれないけど、これは昨今の媒体の原稿料が信じられないくらい安くなっていることを考えると仕方のないことではないかと思う。 筆者は収入のうちで原稿料が占める割合は5%くらいだが、それでも「原稿料が高い方」と言われている(自分で原稿料を決めたこ

                                                                                  「AI PC」と強調されども中身は空っぽのComputex 2024
                                                                                • さすらいのUberEats配達員|shi3z

                                                                                  Uberドライバーとして、東京のあちこちを走るのが楽しい。 だいたい3〜4時間くらい活動して、疲れたら休む。 コツは、坂道が多くてタワーマンションのない場所に行くこと。 釣りの穴場と同じで「ここが穴場」とはネットではなかなか書けないが、都内に何箇所か穴場となる場所と、逆に「ここは近づいたらまずい」という場所が出来てきた。 UberEatsアプリのすごいところは、仕事依頼が来ても、「あーこっちの方いきたくないから嫌だな」と思ったらいかなくていいところ。 浅草橋の技研ベースに行くまでにUberEatsで仕事を拾いながら移動すると、さながらエクストリーム出社である。出社に通常の数倍の時間がかかるけど、そもそも出社しなくたって別にいいんだから気楽である。 坂道はご褒美だ。 距離は短いのに金額は一緒かむしろ高め。 そしてだいたい、坂の下にあるファーストフードで商品をピックアップして坂の上にある家に運

                                                                                    さすらいのUberEats配達員|shi3z
                                                                                  1

                                                                                  新着記事