サクサク読めて、アプリ限定の機能も多数!
なんで小数かというと逆伝播のために微分可能な計算でなければならなかったからだが、1、0、-1からの逆変換ってどうやってやるのだろう。
rryu のブックマーク 2024/03/02 20:22
Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ[あとで読む][AI]なんで小数かというと逆伝播のために微分可能な計算でなければならなかったからだが、1、0、-1からの逆変換ってどうやってやるのだろう。2024/03/02 20:22
このブックマークにはスターがありません。 最初のスターをつけてみよう!
gigazine.net2024/02/29
Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。 [2402.17764] The Era of 1-bit LLMs: All Larg...
65 人がブックマーク・9 件のコメント
\ コメントが サクサク読める アプリです /
なんで小数かというと逆伝播のために微分可能な計算でなければならなかったからだが、1、0、-1からの逆変換ってどうやってやるのだろう。
rryu のブックマーク 2024/03/02 20:22
このブックマークにはスターがありません。
最初のスターをつけてみよう!