サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
今年の「かわいい」
www.techno-edge.net
OpenAIは、ChatGPTの新しい有料プラン「ChatGPT Pro」を発表しました。価格は月額200ドルで、最高レベルの「OpenAI o1」を含むすべてのモデルを無制限で使用することができます。
1080p、20秒という、業界最高スペックの動画生成AIとあって、さすがのクォリティとの声がありますが、謳い文句とは異なる部分もあり、触ってみた感想を、実例を示しながら述べていきます。 なお、筆者は月額200ドル(約3万円)のChatGPT Proプランに加入したので、Relax modeと呼ばれるモードで、Sora動画を無制限に生成できます。 人物のi2vは利用者制限中。うまくいくと素晴らしいSoraは、基本的に2つのモードで動画を生成します。まず、画面に映るものと動きをテキスト(プロンプト)で記述し生成するText to Video。 例えば、「Gigantic robot is fighting against monsters attacking people in Tokyo downtown」というプロンプトを記述して生成すると、次のような動画が出来上がります。 こんなシンプル
発表から10カ月。OpenAIの動画生成AI「Sora」がついに一般ユーザーにも利用できます。 アドベントカレンダーのように、日めくりで新しい発表を行うOpenAIの「12 Days of OpenAI」。Day 1は(月額200ドル、約3万円)のChatGPT ProとGPT o1 pro modeが大きな話題となりました。 Day 2ではReinforcement Fine-Tuning(強化ファインチューニング)という技術についての説明。一般ユーザーには縁遠い技術で、o1-miniという下位モデルで、さらにすぐに提供されるわけではないというので、ちょっと肩透かし感はありました。 そして週末を挟んでのDay 3は、ついにSoraです。 最大1080p、20秒の動画生成が、Text to Video、Image to Videoの両方で可能という、現時点の動画生成AIでは最高レベルのもの
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、中国の南京大学やドイツのMax Planck Institute for the Science of Lightに所属する研究者らが、AIシステムを用いて量子もつれの新しい生成方法を発見した論文「Entangling Independent Particles by Path Identity」に注目します。 量子もつれとは、2つ以上の粒子が互いに関係し合って1つの量子状態を形成し、それらの粒子がどんなに離れていても一方の状態を測定すると瞬時に他方の状態が定まると
HUAWEIは12月6日、血圧を測定できるスマートウォッチの第2世代モデル「HUAWEI Watch D2」の国内先行販売をGRENN FUNDINGで開始しました。執筆時点での価格は超超早割の4万8224円から。製品は、2025年2月17日以降に発送の予定です。 血圧測定は、日本では許認可が必要です。Watch Dシリーズは、血圧計としては一般的な空気で膨らませるカフを利用します。Watch D2も前モデルと同様、日本で血圧計としての管理医療機器認定を受けています。 これまで、上腕式の血圧計で朝晩血圧を測定していた人なら、常に身に着けていられるウェアラブル製品で血圧測定できる利便性がよくわかるのではなないでしょうか。 血圧が測れるスマートウォッチHUAWEI Watch Dレビュー。バンドが膨らむ認可済ウェアラブル血圧計、オムロンの手首式と計測値比較 | テクノエッジ TechnoEdg
慶應義塾大学卒業後、新卒で出版社の宝島社に入社。独立後はケータイジャーナリスト/ライターとして幅広い媒体で執筆、コメントなどを行う。ケータイ業界が主な取材テーマ。 iPhoneに物理キーボードがあったら? そんな夢をかなえるスマホケースの「Clicks」が、日本に上陸しました。 現在、同製品を開発・販売するClicks TechnologyのAmazonストアができており、「iPhone 16 Pro」および「iPhone 16 Pro Max」用のケースを購入が可能。 また、同社自身のストアからは、海外からの輸入という形になりますが、iPhone 15シリーズや14シリーズ向けのケースを購入することができます。 ▲日本では、iPhone 16 ProとPro Max用のケースから発売になった。カラーはこの3色 Clicksは、24年1月に米国ラスベガスで開催されたCESで発表、その後、ア
テクノエッジ編集長。Wikiの「スマートフォン」ページに略称“スマホ”考案者として記述あり。週一以上ライブへ通う音楽好き。ヨボヨボのハタチ オープンイヤー式イヤホンは前からありましたが、2024年は、ちょっとどうしちゃったの? というくらいたくさんの製品が発売されました。キホン沼体質なので、半数くらいは買って試したような気がします。 特にオープンイヤーから選んだというわけではなく、個人的に今年のベストバイガジェットに選びたいと思っているのが、HUAWEI FreeClipです。この製品は2023年末にクラウドファンディングが実施され、私は乗り遅れたのですが支援した知人に自慢され、一般販売の初日(今年の2月20日)に飛び付きました。 ノイズキャンセル全盛の中、音漏れ防止のため外へ向かってノイズキャンセルするいうまさに逆転の発想もシビれましたが、何より素晴らしいのは装着感。Cの形をしたイヤホン
OpenAIが12日間にわたってライブストリーミングで新技術の発表を行うという「12 Days of OpenAI」、その初日であるDay 1では、GPTの最新モデルとしてo1(フルバージョン)を披露し、月額200ドルの新しいサブスクリプションプラン「Pro」追加を発表しました。 YouTubeのライブストリーミングにはOpenAIの共同創業者であるサム・アルトマン氏がo1の開発担当者たちとともに登場。フルバージョンのo1が、これまでの最新モデルであったo1-previewからどの程度改善されたかを説明しました。 ■o1(完全版)数学コンペティション、コーディングコンペティションではo1 previewから大幅に正確性が高まっています。修士レベルの科学問題ではわずかに上がっているだけのようですが、o1フルバージョンではマルチモーダルになった点は大きな改善です。 宇宙空間におけるデータセンタ
毎年この時期に大きな発表をするのが慣例となっているOpenAIですが、今年は1回では収まらず、12月5日から12日分(ただしウィークデーのみ)のライブストリーミングで行うことをXへのポストで予告しています。 OpenAI共同創業者のサム・アルトマン氏はもう少し詳しい情報をXに投稿しています。 投稿によれば、ライブストリーミングは米太平洋時間の午前10時にスタート。日本時間では12月6日の午前3時に最初の発表が行われることになります。 発表内容は現時点では未定ですが、複数の大きな発表と、クリスマスプレゼントの靴下に入るくらいの小さなものがあるとアルトマン氏は説明。 Sora開発リーダーによるポジティブなポストなどから、その中にはSoraが含まれるのではないかという観測もあります。 現在のGPT o1-previewの次世代推論モデルやAGIについての発表も期待したいところ。さらに、動画を認識
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 Anthropicは、AIシステムを色々なデータやツール、アプリと安全に繋ぐことができる「Model Context Protocol」(MCP)を発表しました。社内データベースやGoogle Driveのファイル、GitHubのコードやSlackの会話内容などにチャットAIがアクセスできてやり取りできるようになります。 動画生成AIを提供する「Runway」は、画像生成モデル「Frames」を発表しました。このモデルでは、独特なスタイル出力を特徴としており、1980年代映画の特殊メイク効果、1970年代のレコードジャケット、日本のZINE風など、様々なスタイルの世界観を作り出すことができます。 Luma AIが、動画生成AI「Dream Mach
テクノエッジ編集長。Wikiの「スマートフォン」ページに略称“スマホ”考案者として記述あり。週一以上ライブへ通う音楽好き。ヨボヨボのハタチ いつもテクノエッジをご愛読いただき、ありがとうございます。 2024年12月3日17時過ぎに、テクノエッジのRSSフィードに以下の5本の記事が誤って配信されました。 中学生におすすめプログラミング教室11選!選び方や学習するメリットを紹介 こども向け(小学生)プログラミング教室おすすめ11選!気になるスクールの料金や無料体験の有無も解説 プログラミングが学べる小学生向け教材を5つ紹介!そもそもプログラミング教育ってなに? LITALICO(リタリコ)ワンダーの口コミは最悪?高いと噂の料金やリアルな評判を紹介! 侍エンジニア(SAMURAI ENGINEER)の【評判】徹底紹介!リアルな口コミや料金コース 上記5本の記事は実験的な試みとして作成したもので
井上陽水の歌ではありませんが、夢の中へ行ってみたいとはいつも考えています。 今朝、妻と夢の中で会話をしました。 夢の中でも妻との会話は、メンバー2人だけのマストドンサーバに会話形式で記録するようにしています。今朝の会話はこんなふうに残しています。 今回の夢は、珍しくその前後の様子もある程度覚えています。 AIを使えばその辺りも再現できるかもしれません。そう考えて、試してみることにしました。 記憶にある最初の場面は、二人が住んでいるマンション。3つの入り口があり、その左端に蕎麦屋がテナントとして入っています。 これをAIに生成してもらいましょう。 Claudeに、イメージに近い画像をMidjourneyで生成するためのプロンプトを考えてもらいます。 「マンションに3つの入り口があって、その左端には蕎麦屋がある。そのイメージをMidjourneyで作って」 Claudeには画像生成機能はありま
※当ページはアフィリエイトリンクを一部含んでおり、得られた収益によって運営されています。 「侍エンジニアの悪い評判は本当?」 「実際に侍エンジニアってどうなの?」 など、疑問や不安を抱えている方もいるでしょう。 侍エンジニアは、日本初のマンツーマンプログラミングスクール。 良い評判が多いですが、本当なのか気になるところです。 そこで本記事では侍エンジニアの評判や実態を徹底調査。 料金や受講するポイントも解説しています。 受講すべきか迷っている方はぜひ、最後までお読みください。 評判・口コミを知る前に!侍エンジニアは実績ある大手プログラミングスクール引用:侍エンジニア公式サイト 侍エンジニアとは、日本初のマンツーマンに特化したプログラミングスクールです。 受講生1人に対して、1人の現役エンジニアがサポートを行う学習形式を採用しています。 侍エンジニアの概要
猫も杓子も128GB M4 Max MacBook Proなのはどういうことでしょうか。 128GB M3 Max構成のMacBook Proを使っているのにサーマルスロットリングでポッドキャスト収録もままならない散財王ドリキンは気にならなかったのに、最新機種であるM4 Max MacBook Proを128GBメモリ構成にした清水亮さん、西川和久さんの話を聞いていると、これは買わないといけない気にさせられます。 QWQが凄すぎて俺のMacがシンギュラリ始めている|shi3z 【西川和久の不定期コラム】M4 Max/メモリ128GB/1TB SSDを搭載した「MacBook Pro 14インチ」を購入! - PC Watch 【西川和久の不定期コラム】M4 Max搭載「MacBook Pro 14」のメモリ128GBをLLMでほぼ使い切ってみた! - PC Watch コンシューマー向けG
2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。 今回は、大規模言語モデル(LLM)の数十億のパラメータの中でたった1つのパラメータを削除するだけで、モデルのテキスト生成能力が完全に崩壊することを発見した論文「The Super Weight in Large Language Models」に注目します。 研究チームは、このパラメータを「スーパーウェイト」と名付けました。70億のパラメータを持つMetaのLlama-7Bモデルでは、このスーパーウェイトをゼロにするだけで、モデルのテキスト生成能力が完全に失われ、ゼロショッ
「AIオリジナル曲のリップシンクミュージックビデオを爆速で作る方法」について解説します。AIでなければ自分で弾き語りして自撮りするのが一番簡単なんですが、それは置いといて(笑) まず、完成形から。 歌手が一人で歌っているだけのシンプルなミュージックビデオです。作曲・演奏・歌唱はSuno v4ですが、映像はHeyGenだけという構成。 今時はこれだけで完成してしまうのです。そのプロセスも非常にスムーズで簡単なものになっているので、作り方を紹介します。 まず、曲を作りましょう。 テーマ(タイトル)を考えるSuno v4では歌詞を考えるのがすごく簡単になりました。ReMiという作詞エンジンを使うと、短いフレーズ(タイトルになりそうなもの)を入れるだけで、日本語の歌詞を作ってくれるのです。 それで出来上がったのは、こんな歌詞。 [Verse] あなたの寝顔を見ているよ 寝てるふりしてね ふとんの中
Valveが『Half-Life 2』を発売したのは2004年11月16日。
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 イスラエルのネゲヴ・ベン=グリオン大学(BGU)と富士通の研究チームは、一部の自動運転 / 先進運転支援システム搭載車が停止中の緊急車両に衝突する事故は、システムが「デジタルてんかん発作」を起こすのが原因かもしれないとする研究結果を報告しました。 研究者らは、自動運転 / 先進運転支援システム(ADAS)搭載車の一部が、救急車や消防車のフラッシュ警告灯が視界に入った際に、その方向にある物体をはっきりと認識できなくなる現象が起こると述べ、テレビ画面の明滅で引き起こされる光感受性てんかんになぞらえて「デジタルてんかん発作」と呼んでいます。 自動運転システムやADASの多くは周囲や前方にある障害物を検出するために電
生成AIグラビアをグラビアカメラマンが作るとどうなる? 連載記事一覧 Detail Daemonとは?またその効果は?前回Stable Diffusion 3.5 Large TurboとMediumの話をしたが、扉とグラビアにDetail Daemonを使用、詳細は次回と予告したので、今回はDetail Daemonの話にしたい。 Detail Daemon、詳しい内容までは筆者も把握していないのだが、簡単に説明すると「元画像に追加書き込みする」機能だ。 類似する機能で一番分かりやすい例だとUpscale時のDenoise。リアル系の時は0.2~0.4程度にするが(そうしないと顔が大きく変わる)、もしDenoiseがないUpscaleだと、指定倍率に拡大しただけのスカスカ画像になってしまう。これを防ぐのにDenoiseを使いPromptや周囲の情報から追加書き込みをし、擬似的に情報量を盛
その後は一般層にも広がり、筆者の事例がテレビに取り上げられたりもしました。番組にはLuma AIの開発担当者も登場してコメントしています。 ・「亡き妻と交流するための窓」思い出が動き出す…生成AI最新技術 写真→動画が簡単に(テレビ朝日 羽鳥慎一モーニングショー) Luma Dream Machineは2枚の画像をフレーム補完する機能をつけたりループ機能を付けたりと先進的な部分はありましたが、アジア系の顔が崩れがちだったりといった基本部分の遅れが目立ち、現在ではRunway、KLING、Viduなどに後れをとっている状況です。 そんな状況を挽回しようと、ほぼ5カ月が経過した11月26日、Luma AIはDream Machineに大きな改変を施しました。 まず、静止画生成機能の追加。 Luma Photonという新しいイメージ生成モデルにより、Text to Imageだけでなく、画像を読
上記メンバーとほとんど同じメンバーが発表した今回紹介する研究は、1000人以上の実在する人の思考パターンと行動を分析してコピーした自律AIを1000体以上創り上げた内容になります。以前の研究では架空の性格を創り上げていましたが、今回は実在する人の考えを複製(クローン)した自律AIになります。 そのため、参照した各個人に対して2時間のインタビューを実施し、そのデータを基に一人一人の行動や思考をシミュレートできるように創り込みました。 (▲1000人以上の参加者に対して2時間のインタビューを実施し、性格を抽出し、これらの個人の態度や行動を再現する自律AIを作成した) 研究チームはまず、アメリカ社会の縮図となるように、年齢、性別、人種、居住地域、教育レベル、政治的立場などを考慮して1052人の参加者を慎重に選びました。各参加者は、AIによるインタビュアー(GPT-4o)と2時間の音声対話を行い、
AIによる音声合成は、Diff-SVC、RVC、Vocoflex、Seed-VCなどのボイチェン方面で追いかけてきましたが、最近では商用サービスがTTS(Text To Speech)によるボイスクローニングを充実させてきたことに注目しています。 その一方で、オープンソース、フリーソフト側でもずいぶん進化しているのを見落としていました。そこに気づくきっかけとなったのは、「AivisSpeech」というソフトの登場です。 (▲AivisSpeech) ■AivisSpeechの登場AivisSpeechとは、日本で開発されたAI音声合成ソフトで、いくつかのプリセットボイスが使える推論用アプリがMac、Windows向けに提供されており、すぐに試すことができます。 既存のアプリに似た使いやすいユーザーインタフェースで、感情表現やアクセントの修正などが直感的にできる他、音声をトレーニングしてその
ITジャーナリスト/Publickeyブロガー。IT系の雑誌編集者、オンラインメディア発行人を経て独立。2009年にPublickeyを開始しました。 マイクロソフトは米イリノイ州シカゴで開催中のイベント「Microsoft Ignite 2024」で、Excel上でCopilotがPythonコードを生成、実行してくれる「Copilot in Excel with Python」が米国版(EN-US)Windows環境において正式版になったことを明らかにしました。 マイクロソフトは今年(2024年)9月、Excel上でPythonコードを実行可能にする新機能「Python in Excel」を正式リリースしています。 そしてそれに合わせて、Excel上で生成AIを用いてPythonコードを生成、実行できる「Copilot in Excel with Python」をパブリックプレビューと
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 Netflixは、11月29日に独占配信を開始するドラマ『Senna(セナ)』の撮影にあたり、主人公である往年のF1スター、アイルトン・セナが使用したものを含む、当時のレーシングカーの数々を独自に製作したことを明らかにしました。 『Senna』は、1994年にレース中の事故によって他界したF1チャンピオン、アイルトン・セナの生涯を追う全6話のドラマ。そのストーリーは、セナがレースの世界に足を踏み入れるきっかけになったレーシングカートとの出会いに始まり、英国に渡って参戦したフォーミュラ・フォードを経て、F1の頂点に上り詰める姿、そしてさらにあの悲劇的な事故までを描きます。 見どころは、日本でも大人気だったセナの
テクニカルジャーナリスト。東京工芸大学特別講師。monoAI Technology顧問。IT技術、半導体技術、映像技術、ゲーム開発技術などを専門に取材を続ける。スポーツカー愛好家。 1990年代までは、モニターと言えば、ブラウン管が主流だった。 かくいう筆者も、1995年前後に「(当時として)最高のゲーム体験のために」と奮い立ち、ソニーのトリニトロン管の高画質モニター「KX-29HV3」を、約25万円くらいで購入したことがあり、今でも時々、当時のゲーム機をこれに繋いで懐かしさに耽ることがある。 90年代といえば、ノートPCなどでは既にカラー液晶モニターが普通に採用されていた時代だったので、モニター製品への液晶パネルへの採用が始まった頃だったが、当時の液晶モニターは「残像感」が強く、ゲームとの相性は芳しくなかった。 時代が進んだ現在では、現実問題として、最新のゲーミングモニター製品では「遅延
ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 米司法省は、9月に連邦地裁がGoogleの反トラスト法(独占禁止法)違反を認定したことを受けて、インターネットにおいて支配的立場を持つ検索エンジンによる競争の抑圧を防止するため、同社がウェブブラウザー「Chrome」を売却する必要があると述べています。 この要求には、GoogleのモバイルOSであるAndroidにおいて、同社の検索エンジンを優先することを防止する制限を課すことなども含まれています。司法省は今回の競争回復策を実行してもそれほど効果がないと認められる場合には、Android事業を手放す要求を追加する可能性もあるとしています。 司法省は裁判所への提出書類のなかで、Chromeの売却に関し「この重要
コルグのMIDIキーボードはかなり所有しています。25鍵「nanoKEY」が1つ、37鍵「microKEY-37」が2つ、61鍵「microKEY-61」が1つ。いずれも本体に音源を持っていない、MIDIキーボードです。 筆者はGarageBandなどのiPadソフトシンセサイザーを外部MIDIキーボードで鳴らすスタイルでライブ演奏をしているので、持ち運びに便利なコンパクトMIDIキーボードは重宝しているのです。また、音源モジュールだけのシンセサイザーもそこそこあるので、MIDIキーボードはあればあるほどいい。そして、コルグのMIDIキーボードは入手性も良いときた。 そんなコルグが25鍵のフォルダブルキーボード「nanoKEY Fold」を11月28日に発売するというのですから、当然買います。 126グラムで、折りたたみ時147 x 73 x 17mm、使用時282 x 73 x 14mm
カシオが高温・高湿度に強いサウナ用ウォッチ『サ時計』を開発、12月2日よりMakuakeでクラウドファンディングを実施します。 サ時計は耐熱電池や低透湿樹脂を採用し、サウナの高温多湿に耐える腕時計。 機能としてはシンプルな時刻表示と、サウナの室内で滞在時間を計るためよく使われる12分計のみを搭載します。 大きなモード切替ボタンと12分計リセットボタンを備え、サウナに入ってからの経過時間と、時間制の施設などでは気になる現在時刻をワンプッシュで確認できること、防水・低透湿ケースで風防の曇りを抑え、文字盤が見やすいことが特徴です。 本体は丸く小ぶりで、バンドは温浴施設のロッカーキーなどでも使われるカールバンドを採用します。 防水は5気圧、電池寿命は約5年、本体サイズと重さは 約40.2 x 35.4 x 12.9mm・約24.5g。耐熱性能としては、「設定温度100度以下のサウナで、腕に着用した
まずStable Diffusion 3.5 Large Turboから。このcheckpointは名前からも分かるように、Stable Diffusion 3.5 Largeの高速版。蒸留してsteps数を約20から4へ落とすことに成功している。ご存知のように同じ設定であればstep数は生成時間に比例し、20から4だと1/5の時間で生成可能となる。 RTX 4090を使いLarge / 20 stepsで約10秒かかるところが、Large Turbo / 4 stepsだと約2秒(実測値)。これならミドルレンジのGPUでも十分な生成速度となるので朗報だろう(参考までにFLUX.1 [dev]は同一環境で約8秒)。 ただ、SDXL TurboやLCM LoRAなど過去にもstep数を減らし高速化する技術はあったものの、出てくる絵は大雑把となるように、このLarge Turboも同様な仕上が
次のページ
このページを最初にブックマークしてみませんか?
『テクノエッジ TechnoEdge』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く