Language: 英語 | 日本語 || ログイン |

1 件の該当がありました. : このページのURL : HTML

伊藤, 山本晋一郎, 大久保弘崇, 粕谷英人, "言語モデルの理解促進のためのGPT-2内部構造の視覚化手法の比較," 第22回情報学ワークショップ, 2024年12月.
ID 317
分類 研究会・全国大会等
タグ
表題 (title) 言語モデルの理解促進のためのGPT-2内部構造の視覚化手法の比較
表題 (英文)
著者名 (author) 伊藤 菜摘,山本晋一郎,大久保弘崇,粕谷英人
英文著者名 (author) ,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya
編者名 (editor)
編者名 (英文)
キー (key) ,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya
書籍・会議録表題 (booktitle) 第22回情報学ワークショップ
書籍・会議録表題(英文)
巻数 (volume)
号数 (number)
ページ範囲 (pages)
組織名 (organization)
出版元 (publisher)
出版元 (英文)
出版社住所 (address)
刊行月 (month) 12
出版年 (year) 2024
採択率 (acceptance)
URL
付加情報 (note)
注釈 (annote)
内容梗概 (abstract) 現在ChatGPTなどの言語モデルの利用が広まっているが、この言語モデルの内部構造を理解することで、言語モデルをより効果的に活用することができると考えられる。本研究では、すでに提案されているGPT-2モデルの内部構造の可視化手法を調査し、これらを用いることで把握できるGPT-2の内部情報について検討する。また既存手法の拡張として、GPT-2内のTransformerブロックの各レイヤーの出力から予測される、確率の高い上位複数個のnextトークンを表示する機能の追加を提案する。この機能により、GPT-2における最終的なnextトークンの予測過程の視覚的な理解を支援可能となる。
論文電子ファイル 利用できません.
BiBTeXエントリ
@inproceedings{id317,
         title = {言語モデルの理解促進のためのGPT-2内部構造の視覚化手法の比較},
        author = {伊藤 菜摘 and 山本晋一郎 and 大久保弘崇 and 粕谷英人},
     booktitle = {第22回情報学ワークショップ},
         month = {12},
          year = {2024},
}