0001お断り ★2024/02/29(木) 16:34:34.47ID:/Cz/NJMF9
Microsoftの中国チームがとてつもないLLMをリリースした。それが「BitNet 1.58Bits(」だ。
彼らが発表したグラフを引用しよう。
画像
この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。
通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。
しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。
このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。
詳細はソース 2024/2/28
彼らが発表したグラフを引用しよう。
画像
この表によると、BitNetはLlamaよりも3倍高速でしかも高精度ということになる。
この圧倒的なスピードの秘密は、BitNetが文字通り「1ビットで処理している」からだ。
通常、LLMをふくむディープラーニングされたニューラルネットは巨大な行列の積和演算(掛け算と足し算)を必要とする。
推論時も学習時もそうだ。
しかし、1ビット、つまり、行列の中身が0か1しかないのであれば、全ての計算を加算演算のみにできる。
加算と乗算では計算速度も負荷も段違いに異なるため、これだけのスピードの差が出ている。また、当然ながらメモリ効率も高い。
このため、この論文では「積和演算に最適化されたGPUではなく、加算処理のみに特化した新しいハードウェアの出現」までもが予言されている。
今現在、世界各国が血眼になってGPUを確保し、囲い込んでいることを考えると、実に痛快な論文だ。
詳細はソース 2024/2/28
Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ
Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。
[2402.17764] The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
従来のモデルであれば入力に対して「0.2961」などのウェイトをかけ算してから足し引きする必要がありましたが、「-1」「0」「1」の3値のみであればかけ算が不要になり、全ての計算を足し算で行えるようになります。
今回の手法を利用することで行列演算に必要なかけ算の量を大幅に削減できるため、論文では「1bitの大規模言語モデル用の新たなハードウェア設計への扉を開く」と述べられています。
詳細はソース 2024/2/29
https://arxiv.org/pdf/2402.17764.pdf)
1ビットLLMの衝撃! 70Bで8.9倍高速 全ての推論を加算のみで!GPU不要になる可能性も
2月は中国では春節というお正月があり、春節にはみんな休む。それもあってか、12月から1月にかけて怒涛の論文発表が行われて毎日「デイリーAIニュース」を配信している筆者...
The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits
Recent research, such as BitNet, is paving the way for a new era of 1-bit Large Language Models (LLMs). In this work, we...
Microsoftが1.58ビットの大規模言語モデルをリリース、行列計算を足し算にできて計算コスト激減へ
Microsoftの研究チームがモデルのウェイトを「-1」「0」「1」の3つの値のみにすることで大規模言語モデルの計算コストを激減させることに成功したと発表しました。
0066アフターコロナの名無しさん2024/02/29(木) 16:56:36.33ID:1ESxecW20
>>1
よく分からんがNVIDIA死亡ということか?
よく分からんがNVIDIA死亡ということか?
0084アフターコロナの名無しさん2024/02/29(木) 17:02:46.78ID:3f+PYSnB0
フフフ、分かったぞ!分かった!
おそらく>>1は何か説明しようとしているのだ!
おそらく>>1は何か説明しようとしているのだ!
0005アフターコロナの名無しさん2024/02/29(木) 16:38:10.67ID:QqzsS9+y0
なるほどーふーむ
0006アフターコロナの名無しさん2024/02/29(木) 16:38:21.04ID:o4HXO5Vb0
超簡単なRISCプロセッサー?
0008アフターコロナの名無しさん2024/02/29(木) 16:40:01.88ID:D1nzz2mw0
スマホの操作減らせ
はい/いいえ
ログイン
とかとにかく操作が多い
はい/いいえ
ログイン
とかとにかく操作が多い
0011アフターコロナの名無しさん2024/02/29(木) 16:40:10.59ID:2lku4xnd0
天才っているんだなぁ
0015アフターコロナの名無しさん2024/02/29(木) 16:40:27.93ID:xAl/EghQ0
NVIDIA終了のお知らせ
0017アフターコロナの名無しさん2024/02/29(木) 16:40:35.25ID:Ujt5AlD60
メモリ使用効率良すぎだろ
ブレイクスルーレベルだはこんなの
ブレイクスルーレベルだはこんなの
0021アフターコロナの名無しさん2024/02/29(木) 16:41:05.55ID:WVEIhqDx0
んで実用レベルに達するのはいつ
0022アフターコロナの名無しさん2024/02/29(木) 16:41:10.55ID:SgsmzYaV0
よく分からんけどすごいな
0024アフターコロナの名無しさん2024/02/29(木) 16:42:15.22ID:FkFgDKi50
マイニングマチコ先生
0026アフターコロナの名無しさん2024/02/29(木) 16:43:20.19ID:ovSCEAY30
中国のチームというのがなんとも…
スパイウェア入ってそう
スパイウェア入ってそう
0030アフターコロナの名無しさん2024/02/29(木) 16:44:06.30ID:fKumo8bb0
ボリビディアー
0032アフターコロナの名無しさん2024/02/29(木) 16:46:00.00ID:xKXTDXCD0
NVDA暴落きちゃうの?
0034アフターコロナの名無しさん2024/02/29(木) 16:47:00.51ID:lLZKIRuT0
>>32
既にナイアガラ状態だよ
既にナイアガラ状態だよ
0053アフターコロナの名無しさん2024/02/29(木) 16:51:59.48ID:xKXTDXCD0
>>34
700ドル割ってから起こして
700ドル割ってから起こして
0035アフターコロナの名無しさん2024/02/29(木) 16:47:08.99ID:LcwZN37A0
とりあえずグラボの値段は下がるのか?
あとnVidiaの株は?下がったら買い?
あとnVidiaの株は?下がったら買い?
0036アフターコロナの名無しさん2024/02/29(木) 16:47:38.01ID:xsv53fBF0
エヌビ死亡かよ、半導体銘柄も死亡で日経終わるじゃん
0037アフターコロナの名無しさん2024/02/29(木) 16:47:42.46ID:g1AX7xzF0
値が0と1で示すって2ビットじゃないの
0038アフターコロナの名無しさん2024/02/29(木) 16:47:46.67ID:Cbj8E8Fv0
GPUが不要になる
0039アフターコロナの名無しさん2024/02/29(木) 16:47:47.92ID:5zuC3Z9G0
まじかよ!
ちょっとコンビニでLLM買ってくる!
ちょっとコンビニでLLM買ってくる!
0040アフターコロナの名無しさん2024/02/29(木) 16:47:48.86ID:0LCX4rJE0
昔1ビットオーディオっての売ってた会社があったな
0041アフターコロナの名無しさん2024/02/29(木) 16:48:11.94ID:KHQykFXi0
赤いGPU
0042アフターコロナの名無しさん2024/02/29(木) 16:48:14.52ID:8AEDUN5I0
asicかよ
0044アフターコロナの名無しさん2024/02/29(木) 16:49:55.14ID:xBnSIQBF0
なんて技術だよ
1ビットLLMが商品化されたなら、CRJやSunCrownが完成しているってことじゃない
これからは9Seven^tenの時代が来るんだな
1ビットLLMが商品化されたなら、CRJやSunCrownが完成しているってことじゃない
これからは9Seven^tenの時代が来るんだな
0045アフターコロナの名無しさん2024/02/29(木) 16:49:55.52ID:OFGFeSiH0
何を行っているのかわからない
0046アフターコロナの名無しさん2024/02/29(木) 16:50:05.84ID:UF/+0SyH0
ソフトとハードの
バランスブレイカーきたねこれ
バランスブレイカーきたねこれ
0047アフターコロナの名無しさん2024/02/29(木) 16:50:13.39ID:H2xQCqiR0
中国ねぇ…
0048アフターコロナの名無しさん2024/02/29(木) 16:50:29.89ID:c5T5+nuQ0
これからはわざわざGPU用意しなくてもじゃなくてCPUだけで計算できるようになるよ
コスパもスピードもめっちゃあがるよ
って論文
コスパもスピードもめっちゃあがるよ
って論文
0049アフターコロナの名無しさん2024/02/29(木) 16:50:32.46ID:/X6uDavg0
あーこれね
理屈上はうまく行きそうだけど
やってみるとそうは行かないんだよね
理屈上はうまく行きそうだけど
やってみるとそうは行かないんだよね
0055アフターコロナの名無しさん2024/02/29(木) 16:53:02.86ID:+6HdWcsS0
>>49
そう思ってた時期が俺にもあったわ
俺も子供の頃はこんなの机上の空論だと思ってた
そう思ってた時期が俺にもあったわ
俺も子供の頃はこんなの机上の空論だと思ってた
0050アフターコロナの名無しさん2024/02/29(木) 16:50:46.01ID:l45El4We0
期待して開いたらチャイナチームって見てガッカリだよ
これまでチャイナが発表した先進技術で実売まで漕ぎ着けた物
一つでもあるのだろうか?
これまでチャイナが発表した先進技術で実売まで漕ぎ着けた物
一つでもあるのだろうか?
0052アフターコロナの名無しさん2024/02/29(木) 16:51:32.12ID:+6HdWcsS0
何言ってるか分からない人が多いと思うから説明しとくよ
論理というのは詰まるところ足し算なんだよ
たとえば
1+1=2
ほらね?
論理というのは詰まるところ足し算なんだよ
たとえば
1+1=2
ほらね?
0057アフターコロナの名無しさん2024/02/29(木) 16:53:47.53ID:K8xxC+S30
AIに関する新しいアルゴリズムが発案されて
小数点演算機能のの貧弱な雑魚CPUでも推論や学習がが出来る様になる
小数点演算機能のの貧弱な雑魚CPUでも推論や学習がが出来る様になる
0059アフターコロナの名無しさん2024/02/29(木) 16:54:27.40ID:K8xxC+S30
>>57
途中送信…
こんな感じ?
途中送信…
こんな感じ?
0060アフターコロナの名無しさん2024/02/29(木) 16:54:46.79ID:XFNNcf5M0
-1か
そりゃ0と1があるのに-1が無いのは片手落ちだな
乙武呼ばないと
そりゃ0と1があるのに-1が無いのは片手落ちだな
乙武呼ばないと
0061アフターコロナの名無しさん2024/02/29(木) 16:54:52.25ID:yGQ6UsKP0
どこの株を買えばいいの?
0064アフターコロナの名無しさん2024/02/29(木) 16:56:16.71ID:lLZKIRuT0
>>61
マイクロソフト
マイクロソフト
0063アフターコロナの名無しさん2024/02/29(木) 16:55:17.71ID:JAruybzQ0
GPU確保に遅れをとる中国のディスカウント運動の一貫だろ
明らかに有り得ない内容だがアホが少しでも騙されればいいな系の
明らかに有り得ない内容だがアホが少しでも騙されればいいな系の
0067アフターコロナの名無しさん2024/02/29(木) 16:57:34.50ID:Cbj8E8Fv0
さようならエヌビディア
0068アフターコロナの名無しさん2024/02/29(木) 16:57:46.36ID:uHVeUVOi0
マジで?wwww
0069アフターコロナの名無しさん2024/02/29(木) 16:58:13.05ID:ooRbhkZs0
APUでGPUが無くなる未来
0073アフターコロナの名無しさん2024/02/29(木) 16:58:58.15ID:ZD0fY3Gr0
これで大騒ぎしてるのは日本だけな
日本以外ではほとんど話題になっていない
ヒント:論文の著者は全員中国人
日本以外ではほとんど話題になっていない
ヒント:論文の著者は全員中国人
0075アフターコロナの名無しさん2024/02/29(木) 16:59:22.97ID:Qwf92oqV0
>>73
microsoftなんだが
microsoftなんだが
0076アフターコロナの名無しさん2024/02/29(木) 16:59:42.16ID:Z/nToRmv0
LLMはありますっ!
コメント