Detail of a work
Tweet | |
伊藤, 山本晋一郎, 大久保弘崇, 粕谷英人, "言語モデルの理解促進のためのGPT-2内部構造の視覚化手法の比較," 第22回情報学ワークショップ, 2024年12月. | |
ID | 317 |
分類 | 研究会・全国大会等 |
タグ | |
表題 (title) |
言語モデルの理解促進のためのGPT-2内部構造の視覚化手法の比較 |
表題 (英文) |
|
著者名 (author) |
伊藤 菜摘,山本晋一郎,大久保弘崇,粕谷英人 |
英文著者名 (author) |
,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya |
編者名 (editor) |
|
編者名 (英文) |
|
キー (key) |
,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya |
書籍・会議録表題 (booktitle) |
第22回情報学ワークショップ |
書籍・会議録表題(英文) |
|
巻数 (volume) |
|
号数 (number) |
|
ページ範囲 (pages) |
|
組織名 (organization) |
|
出版元 (publisher) |
|
出版元 (英文) |
|
出版社住所 (address) |
|
刊行月 (month) |
12 |
出版年 (year) |
2024 |
採択率 (acceptance) |
|
URL |
|
付加情報 (note) |
|
注釈 (annote) |
|
内容梗概 (abstract) |
現在ChatGPTなどの言語モデルの利用が広まっているが、この言語モデルの内部構造を理解することで、言語モデルをより効果的に活用することができると考えられる。本研究では、すでに提案されているGPT-2モデルの内部構造の可視化手法を調査し、これらを用いることで把握できるGPT-2の内部情報について検討する。また既存手法の拡張として、GPT-2内のTransformerブロックの各レイヤーの出力から予測される、確率の高い上位複数個のnextトークンを表示する機能の追加を提案する。この機能により、GPT-2における最終的なnextトークンの予測過程の視覚的な理解を支援可能となる。 |
論文電子ファイル | 利用できません. |
BiBTeXエントリ |
@inproceedings{id317, title = {言語モデルの理解促進のためのGPT-2内部構造の視覚化手法の比較}, author = {伊藤 菜摘 and 山本晋一郎 and 大久保弘崇 and 粕谷英人}, booktitle = {第22回情報学ワークショップ}, month = {12}, year = {2024}, } |