1 枯れ果てた名無し@転載禁止 (eced3fdb) 2024/12/02 (月) 18:27:54.042 ID:bf187h9n4
1週間の気になる生成AI技術・研究をいくつかピックアップして解説する連載「生成AIウィークリー」から、特に興味深いAI技術や研究にスポットライトを当てる生成AIクローズアップ。
今回は、大規模言語モデル(LLM)の数十億のパラメータの中でたった1つのパラメータを削除するだけで、モデルのテキスト生成能力が完全に崩壊することを発見した論文「The Super Weight in Large Language Models」に注目します。
研究チームは、このパラメータを「スーパーウェイト」と名付けました。70億のパラメータを持つMetaのLlama-7Bモデルでは、このスーパーウェイトをゼロにするだけで、モデルのテキスト生成能力が完全に失われ、ゼロショットタスクの精度が大幅に低下しました。
https://www.techno-edge.net/article/2024/12/02/3882.html
2 枯れ果てた名無し@転載禁止 2024/12/03 (火) 19:11:47.471 ID:jiHxO1SNW
人間のニューロン、シナプスにも当てはまったりするんかな
3 枯れ果てた名無し@転載禁止 2024/12/03 (火) 19:56:41.503 ID:rLyt78dxs
はぇ〜面白い
4 枯れ果てた名無し@転載禁止 2024/12/04 (水) 15:20:16.375 ID:b3xfeBgGO
デススターの排気口みたいなね