数十億パラメータの巨大AI、“たった1つのパラメータ”を削除するだけで完全崩壊。Appleなどが研究報告 [fcf0A4★] (4)

←← 掲示板一覧に戻る ← スレッド一覧に戻る

1 枯れ果てた名無し@転載禁止 (eced3fdb) 2024/12/02 (月) 18:27:54.042 ID:bf187h9n4

1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。

今回は、大規模言語モデル(LLM)の数十億のパラメータの中でたった1つのパラメータを削除するだけで、モデルのテキスト生成能力が完全に崩壊することを発見した論文「The Super Weight in Large Language Models」に注目します。

研究チームは、このパラメータを「スーパーウェイト」と名付けました。70億のパラメータを持つMetaのLlama-7Bモデルでは、このスーパーウェイトをゼロにするだけで、モデルのテキスト生成能力が完全に失われ、ゼロショットタスクの精度が大幅に低下しました。

https://www.techno-edge.net/article/2024/12/02/3882.html

2 枯れ果てた名無し@転載禁止 2024/12/03 (火) 19:11:47.471 ID:jiHxO1SNW

人間のニューロン、シナプスにも当てはまったりするんかな

3 枯れ果てた名無し@転載禁止 2024/12/03 (火) 19:56:41.503 ID:rLyt78dxs

はぇ〜面白い

4 枯れ果てた名無し@転載禁止 2024/12/04 (水) 15:20:16.375 ID:b3xfeBgGO

デススターの排気口みたいなね