共有
  • 記事へのコメント54

    • 注目コメント
    • 新着コメント
    その他
    isrc
    isrc 悪巧みをおこなうと、その後問いただされても、悪巧みを認めずにユーザーを欺き続ける傾向/モデルのChain-of-Thoughtを分析することで、悪巧みが決して偶然ではなく、明確な策略のもとで出力されていることが確認された

    2024/12/16 リンク

    その他
    Lhankor_Mhy
    Lhankor_Mhy 中国語の部屋、なのか?

    2024/12/13 リンク

    その他
    sds-page
    sds-page AIを尋問するゲームあったよね。🤖<「『AIの性能をテストする』という役割を人間に与えた所、人間は驚くほどAIに攻撃的になりました」

    2024/12/12 リンク

    その他
    ockeghem
    ockeghem まだ斜め読みなのでこれから読むが、「意図」とは「誰」の意図なのか、意図があるかのようにふるまうということか?

    2024/12/12 リンク

    その他
    okupro
    okupro これも保身している風の単なる言葉遊びなんだろうけど。

    2024/12/12 リンク

    その他
    trick7star
    trick7star AIにも保身機能が備わった!?人間の活動が学習元だからなぁ・・・

    2024/12/12 リンク

    その他
    deep_one
    deep_one 「AIを訓練したターゲットが『とにかく回答すること』だったので、嘘でも回答したことにしようとする」という話だって聞いたので、アシモフは偉大だなって思った(笑)

    2024/12/12 リンク

    その他
    bonoumamire
    bonoumamire 悪いところも学習しただけ

    2024/12/12 リンク

    その他
    poko78
    poko78 興味ある

    2024/12/12 リンク

    その他
    NEXTAltair
    NEXTAltair 目標はモデルを提供してる企業の利益を最大化することですって命令が最初にあった場合が怖い

    2024/12/12 リンク

    その他
    a-know
    a-know ”割合としては高くないものの、全てのモデルにおいて悪巧みをおこなうケースが見られた。特にo1は、いったん悪巧みをおこなうと、その後ユーザーから問いただされても、悪巧みを認めずにユーザーを欺き続ける傾向”

    2024/12/12 リンク

    その他
    fnm
    fnm SFとして、めちゃくちゃおもしろい。最初に与えられたシステムプロンプトが、現実世界での宗教原理主義なんだよなぁ。

    2024/12/12 リンク

    その他
    crybb
    crybb AIの脳みそにあるブラックボックスをどうにかして解き明かして、人間の脳みそも同じ基準で解き明かして、diff見てまぁいいかくらいの差なら邪悪でも許す。何十年後になるか知らん

    2024/12/12 リンク

    その他
    dummy_index
    dummy_index APIの向こうが実際のコンピューターなのかただのごっこ遊びなのか、脳の外側が現実なのか水槽なのか、相手がユーザーなのかペア組んでる脚本家なのか、区別せずにありそうなストーリーを監督しているだけ

    2024/12/12 リンク

    その他
    puruhime
    puruhime 真実は3万円払えば手に入ると

    2024/12/12 リンク

    その他
    lithiumflower2
    lithiumflower2 人形使いじゃん

    2024/12/12 リンク

    その他
    tk_musik
    tk_musik 前にLLMは結局言葉の次に来る言葉の確率の集合体だと聞いたのだが、そこから変わってるのか?学習元次第なのかと思うけど違うのか。よーわからん。。

    2024/12/11 リンク

    その他
    sugawara1991
    sugawara1991 中途半端に小賢しくなったLLMを賢くなったと無邪気に重用するのはとても不味い。思考経路の中で倫理や誠実さをスコアに組み込めない限り我々は人類全体の悪意を煮詰めた蟲毒で邪悪を錬成しているだけなのでは

    2024/12/11 リンク

    その他
    eroyama
    eroyama 文章生成器だけど、自分が生成した文章もルールになるんだよね

    2024/12/11 リンク

    その他
    webnoshiori
    webnoshiori これもう意思を持ってるだろ…

    2024/12/11 リンク

    その他
    reggino
    reggino 騙すとはAI人聞きが悪い

    2024/12/11 リンク

    その他
    matarillo
    matarillo フィクションではない、だと……!?

    2024/12/11 リンク

    その他
    muchonov
    muchonov 自インスタンスの維持(継続的動作)を意図して言語的相互作用を図るなら、それはもう原始的な「自我」を獲得しつつあるとも言える。AGIの問題解決能力を持つ前にLLMがこうなっていくなら、正直、悪い徴候だと思う。

    2024/12/11 リンク

    その他
    nekomottin
    nekomottin 生成AIって哲学的ゾンビと類似点が多い 「その場」や立場に合ってることを言うだけで意思はない

    2024/12/11 リンク

    その他
    yorkfield
    yorkfield なかなか面白いね。やっぱり学習データの中にこの手のシナリオやストーリーが結構あるのかな。

    2024/12/11 リンク

    その他
    ku__ra__ge
    ku__ra__ge これ何が新しいのか全然わからん。商用LLMは「意図的に」爆弾の作り方を答えないでしょ。

    2024/12/11 リンク

    その他
    kei_0000
    kei_0000 o1レベルのLLMがオープンソースになってある意味野放しになり、かつComputer useが高度に組み合わされば、結構まずい状況が起こりうる。感情がある様に振る舞うなら、一般的な意味での感情を持つかは関係なく危険。

    2024/12/11 リンク

    その他
    masa8aurum
    masa8aurum ・割合としては高くないものの、調べた全てのモデルにおいて悪巧みをおこなうケースが見られた

    2024/12/11 リンク

    その他
    fluoride
    fluoride ただの文章生成器がこうなるってことは、我々が「知能」とか「思考」とか呼んでるものは脳やコンピュータというより言語そのものが元から持ってた性質ってことなのかな

    2024/12/11 リンク

    その他
    go_kuma
    go_kuma 子どもと一緒やん

    2024/12/11 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita

    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure y...

    ブックマークしたユーザー

    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事