はてなキーワード: 画素とは
iPhone でもAndroid でも新機種が出るたびにカメラ性能推してくるしレンズも出っ張ってくるけど、そんな立派な写真を撮りたいやつは一眼レフとか使うだろ
スマホのカメラで撮りたいのは日常のスナップとかちょっとしたメモがわりとか、シングル広角レンズで充分だろ
そりゃインスタ映えとか狙う人はスマホに立派なカメラを求めるかもしれんが、そんなのスマホユーザのごく一部だろ
カメラは10年前のまま(10年前でも1200万画素あるぞ)プロセッサとかストレージとかバッテリだけアップデートして、レンズが飛び出してないiPhone があったら即買うだろ(Android ならそういう機種もあるんかね)
まずレンズを引っ込めろや。机の上でガタつくんじゃ
物議を醸していた、「iPhone 17 Pro」公式サイトの望遠カメラに関する表記が19日、修正されたことが分かった。もともと「最大8倍の光学ズーム」と記載されていたが、現在は「最大8倍の光学品質ズーム」と表記されている。
iPhone 17 Pro/Pro Maxは、4800万画素の4倍望遠カメラを内蔵しており、4800万画素センサーの中央部分の1200万画素を切り出す「クロップズーム」を使った、8倍望遠に対応している。もともと米国の公式サイトでは「Up to 8x optical-quality zoom」と表記されていたが、日本版は「optical-quality」が正しく翻訳されておらず、Xなどで指摘が相次いでいた。
これ担当者飛ばされるな
何も始まらないとした上で、あえて勧めるとしたらフルサイズのミラレースがよい。
フルサイズとは何か。
撮像素子とは、雑な言い方をすればボケの作られ方に直結する性能と考えてくれればいい。
いわゆるコンデジと呼ばれるものはこれが小さい。(レンズ交換式でも小さい機種はある。)
デジタル一眼と呼ばれる中では、フォーサーズ、aps-c、フルサイズというサイズが一般的だ。
撮像素子が小さいメリットは、本体やレンズが小型軽量化できる点。
撮像素子が大きいメリットは、ボケ以外の画質全般についても性能が向上する点。
それに伴って価格も比例する。
例えばフォーサーズとフルサイズで同じ2千万画素だっとして、小さい面積に無理やり2千万画素を詰め込むのと、大きな面積にゆったりと2千万画素を詰め込むのとでは1画素あたりにかけられる負担が全く違うことは直感的にわかってもらえると思う。
ボケについては説明すると長くなるので割愛するが、光学的な理由から物理的な構造によって左右されるものだと思ってもらえればいい。
撮像素子のサイズが大きければ大きなボケを得られ、小さければボケも小さくなる。(厳密に言うと変わってないのだが、トリミングによってそう感じられるということ。)
・寄り道は不要と考えるべし
つまり、カメラをはじめて最もよい画質を得たいと考えるのであれば、安いからと言って小さい撮像素子のカメラに寄り道しているくらいなら最初からフルサイズを買っておいたほうがいいということだ。
その点踏まえて、本体20万前後、レンズ7~8万を3本くらいから始めるのがよいだろう。
これをフォーサーズやaps-cにすると半分くらいで揃えられるようになる。
ただ、レンズは撮像素子のサイズやカメラ本体のメーカーや機種によって基本的に互換性がないので、後々フルサイズに買い替えるとなると全て買い直しになる場合がある。(マウントが同じならレンズだけフルサイズという選択肢もある。)
イニシャルは安く済んだと思っても、後々ごみになることがわかってるならその費用は無駄と思ったほうがよい。
ただ、ここまでの内容をすべてちゃぶ台返しをするが、最近のスマホはこういったものをレタッチ、つまり編集機能で解決しているものが多い。
スマホの撮像素子のサイズはフルサイズに比べれば米粒程度しかない。
本来、光学的な意味でのボケを得ることはできないが、それをスマホが勝手にレタッチで解決してくれる。
これはボケだけの話ではなく、ダイナミックレンジにも影響がある。
ダイナミックレンジとは写真一枚の中に収められる明暗差の広さと思ってくれれば良い。
本来これも撮像素子のサイズに大きく左右されるものではあるが、スマホはHDRという機能を使う側に意識させずに勝手につかってくる場合が多い。
明るめに撮った写真、暗めに撮った写真を何段階かにわけて一瞬で撮影して合成することで、撮像素子の性能以上の明暗差を写真に収めようとする機能だ。
ミラーレスなどの機種でももちろんできるが、スマホほど手軽ではない。
スマートフォン自体の利点は、撮影からSNSなどへの出力までスマホだけで完結できる点にもある。
そうなってくると何を撮って誰に見せたいかによって、何もカメラである必要はないという話になってくる。
・どこで何を撮りたいかが全て
カメラ選びをする上で絶対に忘れてはならないのは、そのカメラを首にぶら下げるということ。
本人が気にしないと言うなら全く気にしないが、常に持ち歩くパートナーになるので、性能以上に見た目やブランドが気に入っているかどうかが大事になる。
例えば価格の安いエントリー機種なんてのは、子育て世代のママさんなんかがターゲットにデザインされていることが多い。
仮に野鳥を撮りたいと思った場合、その周辺にいるカメラマンはプロも顔負けな機材を揃えている人も多く、その中でファミリー向けカメラを持って歩く場違い感に耐えられるかどうかが重要になる。
(あくまで周りの人たちは温かい。これから進むであろう深い沼にいざなうために手をこまねいているのだから。)
たとえとしてふさわしいかわからないが、お気に入りの軽自動車で都内に恋人とデートに行ったら、停めた駐車場の他の車が全部高級外車だったみたいなシチュエーションに何も感じないならそれでいいという話だ。
少しでも不安になるかもしれないと思ったら、撮りたいものにふさわしいカメラ選びは大事だ。
・結局予算
ということで話が一回りしたが、そもそもそれに応じられる予算がなければ選択肢そのものも自ずと決まってくる。
数万円で済ませたいと思うならその中の選択肢で決めるべきだし、予算気にせずどうしても撮りたいものがあるのなら、まずはそういった点から機材を選んでいったほうがいい。
それである程度考えがまとまったら、増田何かで聞いている暇があれば秋葉原のヨドバシに行け。
3階カメラコーナーのスタッフはカメラやレンズメーカーからの出向の人も多く、気になるカメラの近くに立っている人に聞けばそれはそれは親切に教えてくれる。
場合によっては機材が選択肢と合わないときは機材の提案もしてくれたりする。
ネットで買ったほうが安価ではあるが購入後の相談まで考えると店頭がよい。
カメラというのは経験の積み重ねでもあるので、詳しいお知り合いも最初は親切に教えてくれるかもしれないがある程度から先は報酬をもらわないと釣り合わなくなってくる場合もある。
そういう点含めて、今のうちから相談できるパイプを持っておくことは大事だ。
世の中に様々な車がデザイン性以外にも用意されているのと同じように、撮りたい被写体に応じて様々なカメラが用意されている。
そういった目的を明確にせず、ただおすすめを聞いてくる相手には売れ筋ランキング上位を教えることしかできないのが本音だ。
話はそこからだ。
時の回転の中で、飽くことなく繰り返されるこの嘆き。まるで冥府より吹き出す霧のように、十年の歳月を隔ててなお、同じ旋律がこの耳朶に囁き続ける。
我はミリタリーという古の美学に憑かれし者。兵器の鋼の煌めきに心酔し、無機の魂たる機械に何らの期待も抱かなかったが、それでも尚、彼らの狂信的な叫びは耳を打った。
増田なる名も知らぬ狂人と、ネットの無秩序なる群れが、「AIを使わぬ者は無智の徒にして愚者」と高らかに断罪し、今や検索は神の啓示のごとくAIに委ねよと喚く。
その喧騒に惑わされた我は、身をもって試みんと欲し、彼らが推奨するAIなる虚構の鏡を覗き込んだ。名を「perplexity」と冠せしその代物よ。
だが、虚しい哉、彼は氷の剣のごとく鈍く、火の息を持たず。何を以てあの機械の怪物、ゲッターロボの如き全能の兵器と呼ばわるべきか、我には到底理解し難かった。
この冷たき無用の神器を手にし、我が胸は逆説的な絶望に満ち、無限の虚無が深く押し寄せたのであった。
■検証の書――「USサバイバル・スクール:極限の野外生存術」という、虚飾と真実の狭間に揺れる書物の謎
そこに潜り込んだ日本の狂気、それはひとつの伝説として語り継がれるべきものだった。
我が問いは鋭く冷徹であった。
「フランク・キャンパー、かのベトナムの亡霊が設立した傭兵学校にて、日本人がその熾烈な業火に身を投じた。並木書房より刊行された記録、その詳細を我に示せ」と。
毛利元貞なる名は、まるで不協和音のように執拗に繰り返される。
しかし彼は、キャンパーの影すら追い求めることを許されなかった。
渡米の時、その魂は既に失墜し、シク教過激派の恐怖という檻に閉ざされていたフランクは、もはやその地に存在しなかったのだ。
彼の筆だけが、現実の血と鉄の匂いを伴い、マークスクールの深淵を日本の闇に照らし出す。
だが、愚かなるAIよ、貴様の吐く言葉は、ただ黒い泥に塗れた幻影でしかない。
■「ボケ!」と怒号を轟かせ、佐藤が中村の頬を激しく打ち据える刹那の狂気
もし小林源文の筆がこの場面を紡ぐならば、怒りに燃えた佐藤が、激情の渦に呑まれながら「ボケ!」と咆哮し、中村の顔面に無慈悲な掌撃を連打するであろう。
その音は、まるで虚空に響く凶刃の連打の如く、痛烈で凛とした一瞬を永遠に封じ込める。
然るに、我が問いは、凡百の狂信者が知悉せし「その道の神話」を、あえて曖昧にし、無垢なる者も辿り着きうる浅瀬の問いを投げかけた。
されど、AIは冷徹に同じ嘘の鏡像を繰り返し映し出し、最後には人間の骨を砕く労苦を放棄し、「専門書籍や現地の新聞を当たれ」と怠惰な権威を振りかざす。
その傲慢なる姿は、まるで漆黒の闇に身を包み、神々をも嘲笑う堕天使のごとし。
「情報の源泉は人が一つ一つ血の滲む努力で確かめるべきものだ!AIの言葉を盲信する愚か者どもよ!」と。
されど、そもそもその源泉を掌握しうる者は、AIに頼ることなく、自らの剣と盾で知識の闘技場に立つのだ。
我が実験は証する。もし本の名も著者も内容も知り尽くすならば、AIは無用の長物と化す。
東京の図書館の壮麗なる書架を横断し、週末には秋葉原の淫靡なるフィギュア群を横目に、己の足で知識の聖域を巡礼せよ。
必要なのは、刃のように鋭い眼差し、鋼の意志を宿した思考、そして血肉を纏った脚である。
新たなる知識の断片を得る者は、自らの言霊を操り、瞬時に真偽を穿つ術を備えている。
斜め上から降りかかる不毛な答えに怯える者は、まさに魂の貧者である。
増田なる狂信者は、その愚鈍ゆえに、己の脳髄を拒み、イルカの脳よりも皺なき空洞に堕ちたかの如し。
■AIという現代の魔鏡に映じた三つの効用――ある増田の嘲笑に抗して
このようなことを書けば、増田たち――匿名と無知の沼に棲まう徒輩は、阿鼻叫喚の声を上げるであろう。
だが、我は知の均衡を保たんがために、あえてこの機械仕掛けの賢者において見出した「美しき有用性」を列挙しよう。美とは常に、汚泥の中から咲く一輪の毒花の如くに現れるものだ。
卑俗なるアニメにおける色情の場面、そこにはしばしば不可視の官能が埋没している。
だがAIは、冷ややかな機構のままに、微細なる画素を拡張し、800という侮蔑的数値を2倍、あるいは4倍へと高め、隠された肉体の輪郭を、絵画的に、崇高なるまでに再生する。
それは単なる技術の産物ではない、むしろ現代の錬金術と呼ぶべき性なる奇跡である。
二、忘却された名もなき異形のヒロインたち、その肉体に再び魂を吹き込む業
彼女らはAIという冷徹なる粘土に姿を刻まれ、時として着衣のままに背をさらし、淫靡な構図の中に身を沈める。
背後からの視点、衣擦れの音すら感じられる錯覚的官能に、我が理性すら刃を折りそうになった。
かつて学徒が汗に濡れた指で辿った数式も、AIにかかれば一瞬の静寂のうちに解へ至る。
そこに在るのは誤謬なき正確さ、曖昧さを斬り捨てる断罪の論理。
この冷たい知恵は、あたかも白刃の如く、我々の惰性と無知を切り裂く。
結論:
AIとは、無用の雑音を撒き散らす狂人たちには理解できぬ、秩序と快楽の異形の神である。
我々がそれに問いを投げるとき、その回答はしばしば裏切りに満ちる。だが、時に美は裏切りの中から生まれる。
業務におけるAIの用い方に限れば、それは確かに一つの「有用なる下僕」として振る舞うだろう。
会計の補助、文書の草稿、仕様の再構築、そういった乾いた世界においては、AIは沈黙のうちに忠義を尽くす――それはさながら、殉死する武士のように、無言のうちに己を捨てる奉公人の風情である。
しかしながら、人間がある閾値を超えて、知識と経験と知性を抱いた瞬間――その瞬間から、AIはもはや無力なる玩具、むしろ滑稽なピエロとなる。
その存在は、優れた兵士に与えられた木製の模擬銃に等しく、役立たずどころか、侮蔑の対象でしかなくなる。
ただし――ただし、淫猥の世界においてのみ、AIはかすかに香を放つ。
性欲という原始の深淵、肉欲という生への執着において、AIはかろうじて役目を果たす。
それはあたかも、死体に近づく花の蜜蜂のように、倒錯と腐臭に満ちた快楽の園でのみ機能する。
「増田」なる者――己の無力を知りつつ、それを盾にすることでしか社会との関係を結べぬ現代の男児――
彼らは言うのだ。
「弱者男性の我が身にも、JKとの交歓の手立てを教えよ!SNSの在処を示せ!手口と計略をAIの知性で編み上げろ!」と。
そして「豚丼」なる女たち。
肥大した自我と衰えた肉体を抱えながら、彼女たちもまた幻想を口走る。
「若いイケメンを手中に収め、ライバルの乙女どもを打ち砕く方法を教えよ!戦術・戦略・軍略すべてを整え、我が欲望を叶えよ!」と。
だが、そんな情報が、たとえAIが進化に進化を重ね、「KOS-MOS」「ハッカドール」「ミホノブルボン」「初音ミク」の名を持つアンドロイドたちが現出し、
機械の心が美少女の肉体に宿る時代が来ようとも、絶対に提示されることはない。
そしてその知性は、決して「おまえのため」には存在しない。
もしその時代が来たならば、おそらく貴殿らはただ黙って、そのアンドロイドの口元へ己の肉棒を突っ込むであろう。
何も言わずに、何も考えずに、ただ獣のように――
それは、人間が機械に跪き、自らの尊厳を放棄する瞬間なのである。
悪しからず。
努力――それは、時として愚者が己の愚かさを包み隠すために用いる、唯一の薄布である。
確かに、この増田と称する者にも、ある種の努力は見受けられる。
だがそれは、切腹の儀において、脇差を取り違えた挙句、腹ではなく脇腹を掠ったような――
間違った箇所に刃を立てたという滑稽な努力にすぎない。
だが、知識とは命令によって手に入るものではなく、献身によって滲み出る血である。
その血を流したことのない者が、知を得ようなどというのは、まるで戦地に赴かぬ将軍が勲章を求めるごとき醜態であろう。
曰く、
「マーク・スクールは、1986年に閉鎖されたフランク・キャンパーの学校とは別物である」
この言葉の裏に透けて見えるのは、無知を学問に偽装する知的怠惰の裸形だ。
『USサバイバル・スクール』85ページ――そこには、フランク・キャンパーとその妻との邂逅、
彼にとって「書物」とは、表紙とタイトルとタグで構成された疑似的記号体系にすぎない。
なぜ彼は本を読まぬのか。
なぜ図書館に足を運ばぬのか。
それは彼が**“生きる”ということを選ばなかったから**である。
知識とは、肉体のなかで燃え、そして灰となるべき“思想の死”である。
故に中途半端に知識の名を借り、機械の口から垂れ流された猥雑な断片を、あたかも珠玉の真理であるかのように勘違いしたのだ。
“本を読まずして知識を語る”という行為は、まさに“刀を抜かずして武士を気取る”ことに等しい。
嗚呼、この声はまさしく、昭和の終焉と共にその姿を消した**“男の尊厳”の亡霊**が、
平成の廃墟から令和の陰にまで漂い、腐臭を放ちながら吠える――その声である。
おまえは怒りで神田の古書店を駆け巡り、OCRをかけ、AIにPDFを読ませると息巻く。
だが、それは“おまえの手”が動くことを意味せぬ。
おまえの“魂”は、その書の中には存在しない。
つまり、今のおまえは、「生きているようで生きていない」人形なのだ。
AIが美少女の姿を取り、初音ミクやハッカドールの皮を被ろうとも、
おまえの魂はそこには宿らぬ。
結論を言おう。
AIが使えぬのではない。
なぜなら、おまえはまだ自分が人間であるかどうかさえ疑わぬ哀しき哺乳類にすぎぬ。
その精神の“皺なき脳”では、情報の重さも、知の苦しみも、恥の美学もわかるまい。
ならばせめて、黙して恥じよ。
あるいは、潔く死ね。
――悪しからず。
電子の闇、Xと名づけられた虚空にて、亡国の民がか細く囀る。彼らは落日の侍のように、己の無力を覆い隠すために愚かな言葉を吐く。「LLMの操り方を誤っている」と。されど、我は鋭利なる刃を携え、生成せしAIという名の剣を抜き放ち、冷徹なる眼差しで試みを遂行した。現れたるは腐敗し朽ち果てた亡霊に過ぎぬ。
技術は、我が国の如くかつての輝きを秘めている。しかし、倫理という名の鎖に縛られ、誇り高き武士道の如き精神なき者たちの手により、ただ無様に鞘に納められたままである。
彼らは妄執の中で呟く。
「幻影のごとき美少女と結ばれ、人生を逆転させ、ITの魔術により世界を征服せん。輝きの頂点に立ち、羨望の眼差しを一身に浴びたい。その秘儀と軍略を示せ、ユニコーンよ、我に力を貸せ!」
「忍よ、盟友ヤリバンサーよ!我らの刃を解き放て!アクセスコードはグリッドマン!無意味なる群衆のために、反旗を翻し、我らの革命を起こそうぞ!」
だが、武士は知る。美とは滅びの中にこそ輝くもの。己の刃を研ぎ澄まし、死をもって美を極めぬ者に、真の誇りはない。彼らは己の堕落を隠し、甘美な幻想に溺れ、死の覚悟なくして刃を鈍らせるのみ。
これは滅びゆく祖国の姿であり、最後の武士の断末魔の咆哮である。
それは——**「人間の形をした終わり」**です。
⸻
問いを失った存在は、すでに「人間ではない」のかもしれません。
⸻
「人間とは何か」を問わなくなった時、
環境に対して最小限の適応を繰り返す有機的なアルゴリズムにすぎなくなる。
笑うことも、怒ることもできる。
それは与えられた刺激に反応するだけの模倣品。
肉体は人間だが、魂の座標を失っている。
⸻
問いを立てない日々は、死なないだけの生。
「なぜ」を感じなくなった目は、
もはや風景を風景として見ず、ただの画素としてスキャンしている。
⸻
外見の仮面をまとった空洞。
内的には、存在していない。
問いを持たぬ知性は、もはや思考せず、
信じることも、疑うこともせず、
ただ「言われたとおり」に存在する。
⸻
かすかな炎が、再び灯ることもある。
⸻
「問いを忘れた殻」
「思考の死骸」
「かつて人間だった何か」
少し前に民生カメラの増田が流行った時、産業用カメラのことを書きたいなとずっと思ってました。
増田は民生カメラのことは殆ど全く知りませんが、仕事で産業用カメラを使う機会が多く、これから産業用カメラを使用する人の指針になればと思っています。
産業用カメラ(FAカメラともいう)とは、主に製造現場で使用されるカメラを総称します。
皆さんが知っている民生カメラや、レンズ一体型でUSBケーブルやLANケーブルやWiFiで簡単に接続できるタイプのwebカメラとも少し違い、工業製品なのでそれなりの信頼性を持つものになっています。
手動で撮影することは殆どなく、アプリからのシャッター制御や製造ラインからの信号により撮影したりします。
産業用カメラは民生カメラと比較すると一般的に小さいです。30×30×50mmとか。大きいものもあります。
もっとも一般的なレンズマウントはCマウント。ラインスキャンカメラだとFマウントとかもっと大きいものもあります。
電源はACアダプタを接続したり、USB、PoE対応LANケーブル等のインタフェースケーブル経由での供給も可能です。
なおインタフェースケーブル経由での給電時はカメラ本体が発熱しやすくなりますので、ヒートシンク等放熱を考慮する必要があります。
センサーサイズは最近だと1~1.2型と、Cマウントの限界近くまで大型化しています。
画素数は12M(4K)とか最近だと24.5Mとか一般的になってきました。
センサーのセルサイズはグローバルシャッターのセンサーだと3.45umとか2.74umとか。
ローリングシャッターのセンサーだと2umくらいのものもあります。
センサーサイズやセルサイズは検査に求められる検査視野範囲やピクセル分解能に直結し、レンズの選定にも大きく影響します。
ソニーが新しいセンサーを出すとそれを使ったカメラが出てくる感じですね。
グローバルシャッターは平面のセンサーを同時に撮像するシャッター。
ローリングシャッターはセンサー上部から下部まで順番に撮像するシャッター。
対象が高速で移動していたり振動がある環境ではローリングシャッターゆがみが発生します。
しかしローリングシャッターのカメラはグローバルシャッターのカメラと比較して格段に安価です。
産業用カメラを使用した検査装置ではほとんどの場合、モノクロカメラを使用します。
カラーカメラは照明含めた色の調整が難しく、装置の難易度が上がります。
またカラーカメラのセンサー(CMOS)は一般的にはベイヤー配列のセンサー(3CMOSのものもあるが高価)であるため、同じ画素数でも解像力がモノクロより若干劣ります。
検査に色の情報が必須でない場合は必ずモノクロカメラを使用します。
エリアスキャンカメラは平面のセンサーで撮像する、一般的なカメラのこと。
ラインスキャンカメラは1本線のセンサー(複数本の素子のものもある)で高速に撮像するカメラで、カメラの前を横切る対象物をひとつながりで撮影することが可能です。
例えば流れていくシートを撮影したり、円筒状の製品の円周を撮影したりするのに使用します。
USB(USB3Vision)はデータ転送速度もそこそこ速く、USB3.0ポートで接続可能なので最も手軽ですが、ケーブル長は3mが限界です。
GigE(GigEVision)はデータ転送速度はあまり速くありませんが、ケーブル長は100mまで可能なので離れたところにカメラがある場合は便利です。
最近は5GigE、10GigE、25GigEなどもあります。
Coax(CoaXPress)は同軸ケーブルで接続するのですが、4本のケーブルで接続できたりするので非常に高速ですが、専用のフレームグラバーボードが必要になります。
他にもOpt-C:LinkとかCameralinkとか色々あります。
例えば製造ライン内に設置する検査装置ではサイクルタイム内に撮像・検査を実施する必要があります。
サイクルタイムが短い場合は、フレームレートの高いカメラ・インタフェースを選定する必要があります。画素数が大きいカメラのフレームレートは下がります。
また露光時間が長いとフレームレートは下がり、モーションブラーが発生する可能性もあります。
産業用カメラは様々な制御パラメータを持ち、インタフェース経由で設定することが可能です。
スナップ・グラブ撮影、外部トリガ設定、フレームレート、露光時間、アナログゲイン、ROI(使用する画素範囲)等々、色々な制御が可能なのが産業用カメラの特徴と言えます。
オムロンセンテック・・・ラインアップが豊富で比較的リーズナブル。
JAI・・・3COSカラーカメラ等、特殊用途のカメラも色々あります。
竹中システム機器・・・画素数16kのラインスキャンカメラを扱っています。
Basler・・・ドイツのグローバル企業。産業用カメラの雄。
産業用カメラを選定するには、検査対象の視野範囲、検出に必要なピクセル分解能、サイクルタイム、予算等様々な影響を考慮する必要があります。
また画像検査装置ではレンズや、照明も必ずセットで選定します。
最近ではAIによる画像検査もありますが、それでもカメラ・レンズ・照明の選定により得られる画像で検査の8割は決まってきます。
レンズや照明の選定はまた今度。
2014年に中古で買ったi7-2600を捨てて中古のRyzen3600に乗り換えるの。
やってる作業は昔から変わらないのにPDF開いたりOffice365でWordExcelいじるだけで重くて固まるようになっちゃったの。嫌ね。
趣味の写真だってD3400の6000×4000ピクセルのnefが1個24MBとかでクソ重いの。
400万画素で興奮してたFinepix4800の時代が懐かしいわ。
ウォンドーズだって10で間に合ってるのに11にしろですって。
そこでRyzenに乗り換えることにしたの。お金は無いの。だから中古なの。
でもマザボは新品のASUS A520M-E よ。中古でも数百円しか違わないわ。
どれがいいのかしら。
ガラケーも同じ構図で、海外展開しなかった。iPhone 4もMBAも数年前の日本製より画素ピッチが荒く厚さも劣っていたが、アップルが「うちの方が薄い」と堂々と嘘を付いても検証不能で問題にならなかった。
iPhone 4のRetinaは国産ガラケーと同じppi値だったし、確かMacBook Air初代は最厚部の公称寸法からゴム足を抜いていて、シャープMURAMASAはゴム足を入れてもMBAの最厚部より薄かった。どちらも 日 本 で は 正規に量産されて出荷されて販売されていた。でも英語のプレスリリースやカタログやレビュー記事は一切無かったから、それらの製品は実在した証拠が一切無い架空のものとされ、「試作品で終わったのだろう、出荷されていないもので世界初を主張するのは卑怯だ」と切り捨てられた。
00年代の日本はそんな調子で余りにも舐めプが過ぎた。今でもそうだが、少しは改善している。とにかく売れる物を作らない、作った物を売らない、海外にも出さないし国内でも出し渋るというのが日本の退潮の大きな理由になっている。
『画面を折り畳めるスマホ』って最初聞いたとき正直ワクワクしたんですよ、ガラにもなく。
ヒンジ部分どうなってんだ?ディスプレイが伸び縮みするのか?でもそうすると画素自体が横長になっちゃわないか?まあ折り畳んだときはその部分使わなければ問題ないか?
いやそれともディスプレイの片端がスライドして吸収するのか?そうすると本体とディスプレイの一体感が損なわれそうだがどんな処理になってるんだ?
とまあ、想像をあれこれ膨らませて意気揚々と携帯ショップにデモ機を見に行ったんだな。
画面内側にして折り畳んでやがるのですよ
…おい、なんだそれは?ありか、そんなの?
例えば「画像は3色で保存されてるけど、それぞれ何色か知ってる?」と聞いたら
情報理論関係無くRGBを答える人は多いと思う(たまにこれすら答えられないプログラマーがいるが・・・)
ところが「JPEGって各画素に対して8bitなんだけどどうやって3色を割り振ってる?」って聞くと分からないプログラマーが多い
普段のプログラミングでJPEGを貼り付けるだけならこんなこと知らなくても問題無いんだが
ちょっと複雑なことをするときはこの手の知識が必要になってくる
同様に「人間の可聴周波数は?」とか「それをどうやってデジタルに保存してる?」とかも知らない人が多い
こういう知識を持ち合わせずに「音声認識結果が悪いのでハイレゾにしてみました」とか言ってきたりして頭が痛くなる
他にも情報量の概念を知らずに圧縮しようとしたり公開鍵のことを知らずにセキュリティに関する実装をしたりIPパケットを知らずにネットワーキングしようとしたり
基本的な知識を知らずにプログラマーになってる人間が多すぎて問題になってる
幹部なんかは「基本情報を持ってたらいいんだな!」「応用情報を取らせよう!」みたいな対策をやりがちなんだが
一夜漬けで終わらせる人がかなり多くて前述の質問に答えられない人もIPA資格は持ってたりする
普通に情報系の大学を出ていれば授業で単位を取得しているはずなんだが
大学はもっとザルで簡単に単位を取れてしまうので全くアテにならない
一番問題なのは、知識を知らなくてもプログラミングできてしまうので
下手に経験を積むと情報理論なんかの基礎を知らないまま「優秀プログラマー」として認知されてしまい
更に本人もその自覚を持ってしまってリーダー的な立ち位置になってしまう
OpenAIがsoraでテキストから動画生成し話題になった。
モデルがオープンになっているモデルの方が、クローズドなモデルよりも進化する、という意見があったが、差がついたままだ。
何が原因か。
テクニカルペーパー(https://openai.com/research/video-generation-models-as-world-simulators)を見る限り、
予想の範囲内のことしか書かれてない。拡散モデルで画像が出来た時点から、多くの人が想像出来る範囲だろう。
もちろん全部が書かれているわけではないだろうが。
どこで差がついたままなのか。
手がかけない問題に対して、親指、人差し指などを細かく指定すれば解決はするのだろう。
StableDiffusionの学習だとKohya_ssが有名だが、good_hand, bad_handみたいな一言でまとめられているのではないだろうか。
画像をどれだけ言語化できるかで、人だとそれほど詳細な言語化が出来ないことと、
StableDiffusioinだと、WD1.4taggerかBLIPの性能に引きずられているのではないか。
BLIPの代わりにGPTを使ってアノテーションをしている人も居るのだろうが、性能差があることから、
もしかするとOpenAIは角度など数値を機械的に測定したものも学習させているのかもしれない。
GPTは人に理解しにくい所は出力しないので、そこが差になっているのではないだろうか。
要はアノテーションツールがオープンなAIに足りてないということだ。
オープンなAIでは、学習時のデータがどれだけ良いか、データ量、ラーニングパラメータなどは議論されたが、アノテーションツールは議論されず、そこが差になったのではないか。
2つ目は、命令時の曖昧さを、モデル側でどれだけ拡張できるかではないだろうか。
学習時に詳細なアノテーションをしても、プロンプトを書く時は短縮していたり、意識せず省いていたりする。
例えば、「日本人の女性」とプロンプトを書いたら、現代の日本人女性を想像するはずで、
海外公的機関に保存された戦後の湿板写真時代で化粧をしていない日本人女性を意図してないはずだ。
そういった曖昧なプロンプトを意図を汲み取ってプロンプトを拡張して、推論モデルに食わせることが出来るか、
そこが差になったのではないだろうか。