MoE自体は他社もやってるはずだけど、DeepSeekはその辺の工夫が他よりすごいのかな?

macro1597macro1597 のブックマーク 2025/01/06 09:16

その他

このブックマークにはスターがありません。
最初のスターをつけてみよう!

DeepseekV3は何がすごいのか?何故ヤバいと言われているのかを解説

    なぜDeepSeek V3は“破壊的”なのか? 大規模言語モデル(LLM)といえば、OpenAIのGPTシリーズやMetaのLlamaシリーズなど、膨大な学習コストと大手企業の潤沢なリソースが必要というイメージが強いかもしれません。...

    \ コメントが サクサク読める アプリです /

    • App Storeからダウンロード
    • Google Playで手に入れよう