2025-02-12

anond:20250210161058

中国で人気の」とこちらが指定してるけどね。

1.58bit版はかろうじて動いてる感じだね。GPUメモリしか使ってない。GPU使用率が上がらないのはCPUSSDボトルネックなのかllama-cppやCUDAカーネル最適化不足の可能性がありそう。

色々調整してやっと 0.6tok/sec程度だから使い物にならない。上記問題解決したら1.58bit版でも普通ゲームPCで5tok/secぐらいは出そう。

32B版はサクサク動作(25tok/sec程度)するけど常用したいと思えるような知能ではない。コーディングも任せられない感じ。ざっくりと使うなら問題ない感じだし、違法な事でも何でも答えるので面白いのは面白い

記事への反応(ブックマークコメント)

ログイン ユーザー登録
ようこそ ゲスト さん