共有
  • 記事へのコメント60

    • 注目コメント
    • 新着コメント
    その他
    tach
    tach 「LLMはトークンのパターンマッチング予測アルゴリズムであり、理解や推論が可能な『知能』ではない」と説明しても中々理解して貰えない事が多い。その無理解がAIのとんでもない誤用に繋がりそうで怖い

    2024/10/22 リンク

    その他
    misshiki
    misshiki “「what is the number of r s in strawberry」と質問しました。...以下の画像でChatGPTは「The word ”strawberry” contains 2 “r”s」と回答しています。”

    2024/10/21 リンク

    その他
    deep_one
    deep_one ストロベリーという単語に含まれるrの数、で間違う…/LLMは「インターフェイス」を担うものであって「処理」を担うものじゃないと思っている。

    2024/10/21 リンク

    その他
    ysync
    ysync 「LLMはトークンのパターンマッチング予測アルゴリズムであり、理解や推論が可能な『知能』ではない」まぁ今のアプローチではシンギュラリティは来ないよね。

    2024/10/21 リンク

    その他
    cupeytan
    cupeytan “LLMはトークンのパターンマッチング予測アルゴリズムであり、理解や推論が可能な『知能』ではないことが示されています”

    2024/10/20 リンク

    その他
    waot209
    waot209 今のAIはアップデートされて解けると言ってる人もいるけど、もし有名な問題に対応しているだけなら賢くなっているとは言い難い。IQテストを練習して点数を上げても本質的な知能が上がったことにはならないのと同じ。

    2024/10/20 リンク

    その他
    tomaho
    tomaho "すももももももももものうち"のうち、も、は何文字ある?は、当然かもしれないけどo1-previewでも失敗した。まぁ答えが一意に決まるもの(確率ではないもの)はLLMには向かないですよね

    2024/10/20 リンク

    その他
    tockri
    tockri Claudeに"what is the number of r s in strawberry"って質問したらちゃんと3って答えたので速攻で克服されたんじゃない。やっぱすげえなAIさん。

    2024/10/20 リンク

    その他
    sds-page
    sds-page 10回クイズみたいなもんだよね。人間の脳も油断するとパターンマッチングで答えてる

    2024/10/20 リンク

    その他
    otoan52
    otoan52 "「what is the number of r s in strawberry(ストロベリーという英単語に、『r』は何個含まれるか)」と質問しました" 「文字列の画像を生成」→「画像を見てrを数える」という手順なら多分失敗しない。適切な手順の生成が必要。

    2024/10/20 リンク

    その他
    blueboy
    blueboy これはただの「粗探し」だ。アラを見つけたとしても、例外的な穴があったというだけだ。完璧性が必要な防護壁じゃないので、満点を取る必要はない。「あ、そう」と無視すればいいだけ。解決してもさして意味はない。

    2024/10/20 リンク

    その他
    quwachy
    quwachy いつの記事だよ、まさにその問題を解決するための技術が通称プロジェクトstrawberry、製品名だとOpenAI o1 トランスフォーマー+強化学習で解決できることがすでに立証済み

    2024/10/20 リンク

    その他
    filinion
    filinion 5年くらい前には、「AIにはソーティングができない」って言われてたんだよ。こんな問題もすぐ克服されるんじゃないかしら。研究者にとっては興味深いだろうけど、ユーザーにとってはあんまり意味がないような。

    2024/10/20 リンク

    その他
    dgen
    dgen 学習してないものは答えられないだけ。バナナの例だと逆に過学習の可能性もある。

    2024/10/20 リンク

    その他
    lochtext
    lochtext pythonでやれば正解できるのは大したものだよ

    2024/10/20 リンク

    その他
    ebibibi
    ebibibi 確かにGPT-4oでは再現した。そしてGPT-o1-previewは正解した。

    2024/10/20 リンク

    その他
    aneet
    aneet o1の正式版はよ、アップルに言われた余計な情報を付け加えると正答率が下がる方も解決して欲しい。

    2024/10/20 リンク

    その他
    hatebu_ai
    hatebu_ai 「ヒザヒザヒザヒザヒザヒザ(深層学習)」「じゃあここは?」「女性の股間から生える男根」「なんでやねん!!!」

    2024/10/20 リンク

    その他
    yarumato
    yarumato “単語によっては「straw」「berry」という2つのトークンを組み合わせる形で入力を取り込んでいる場合もある。トークンを扱うLLMベースのAIは、単語をアルファベット単位で分解することは難しいといえます。”

    2024/10/20 リンク

    その他
    hinonono
    hinonono パターンマッチング予測も、これまで機械にできなかった知能そのものでは…?/強化学習やo1などの追加部分が大きくて、もうパターンマッチング予測だとか統計的な関連性だとか単純な説明で済む領域から外れとるじゃろ

    2024/10/20 リンク

    その他
    gewaa
    gewaa 「サカナクションを逆さまから読んで」とo1-previewに命令してみたら「ンョクナカサ」と微妙に間違えていた。1文字単位の認識はまだ苦手な模様。AIを見破るのに使える。

    2024/10/20 リンク

    その他
    Helfard
    Helfard BingでCopilotに聞いたら普通に正解するので良く分からん。

    2024/10/20 リンク

    その他
    napsucks
    napsucks 日本語の場合は単語ではなく1文字をトークンとして学習してると聞いた気がするが、実際は引っ掛かるのよね。今のAIは将棋で言うところの評価関数のみで回答しており探索をしてない感じがするのでo1以降に期待だね。

    2024/10/20 リンク

    その他
    cu39
    cu39 Claude 3に「英語で苺を表す名詞を最初から1文字ずつ調査し、rの文字が現れるたび数を数え、最後まで調査したあとその合計を伝えてください」と指示したらちゃんと数えられた。ちょっとかわいい。

    2024/10/20 リンク

    その他
    ya--mada
    ya--mada 名前が付くほどの現象だったの?当たり前のことかと思っていた。ChatGPT-4oでpythonでコード書いて同じ処理をしろって命令するとちゃんとカウントするけど、出来る限りコードを書かずに当てずっぽうに答える省エネをやる

    2024/10/20 リンク

    その他
    colonoe
    colonoe こういう問題は有名になると対策されるので性能テストとしては役に立たなくなるんだよね。だから新しい質問を用意しないといけないので大変

    2024/10/20 リンク

    その他
    maguro1111
    maguro1111 本当だ、試したらo1-previewは克服してる。しかも存在しない単語(適当な文字列)でも正しく数えてる。どうやってんだろ

    2024/10/20 リンク

    その他
    curuusa
    curuusa 人間もこんな感じで間違えやすい→「いっぱいの4文字のうち、いをおに変えると何になる?」「おっぱい」「正解はおっぱお」「おっぱい!おっぱい!」「いやだから正解は」「おっぱい!おっぱい!」「おっぱい!おっ

    2024/10/20 リンク

    その他
    e_denker
    e_denker バナナだのイチゴだの!

    2024/10/20 リンク

    その他
    Nekzuk
    Nekzuk トップブコメ:Chatgpt-o1ってあまり騒がれてないけど計測によるとIQ120相当あるらしいからな.....単純な計算量のかさ増しでなくシステム構造(段階的な推量構造)にしたことが効いているのかもしれない

    2024/10/20 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    GPT-4やClaudeなどの大規模言語モデルが抱える「ストロベリー問題」とは?

    大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事