Language: 英語 | 日本語 || ログイン |

1 件の該当がありました. : このページのURL : HTML

中川, 山本晋一郎, 大久保弘崇, 粕谷英人, "LLMによるCoq学習のためのデータセット形式," 第32回ソフトウェア工学の基礎ワークショップ, 2025年11月.
ID 341
分類 研究会・全国大会等
タグ
表題 (title) LLMによるCoq学習のためのデータセット形式
表題 (英文)
著者名 (author) 中川 海都,山本晋一郎,大久保弘崇,粕谷英人
英文著者名 (author) ,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya
編者名 (editor)
編者名 (英文)
キー (key) ,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya
書籍・会議録表題 (booktitle) 第32回ソフトウェア工学の基礎ワークショップ
書籍・会議録表題(英文)
巻数 (volume)
号数 (number)
ページ範囲 (pages)
組織名 (organization)
出版元 (publisher)
出版元 (英文)
出版社住所 (address)
刊行月 (month) 11
出版年 (year) 2025
採択率 (acceptance)
URL
付加情報 (note)
注釈 (annote)
内容梗概 (abstract) 本研究は、大規模言語モデル(LLM)に定理証明支援系Coqの知識を学習させ、モデルがプログラムコードの正しさを形式的に証明できる環境の構築を目的とする。Coqは形式的検証に基づくプログラミング言語であり、プログラムの正しさを厳密に保証できることから、安全性が重視される分野で広く利用されている。一方、近年の生成AIはコード自動生成を可能にしたものの、その出力にはしばしば誤りが含まれるという課題がある。本研究では、LLMにCoqの知識を学習させることで、生成コードに対して形式的検証を行い、正しさを保証できる仕組みの実現を目指す。通常のプログラミング言語を対象とした学習ではソースコードを中心にデータセットを構成するが、Coqの学習にはコードに加えて、証明過程や証明中のゴール状態といった時系列的・論理的情報を含める必要がある。そこで本研究では、Coqにおける定理、証明スクリプト、証明状態などの情報をどのように整理・表現すればLLMが効果的に学習できるかに着目し、最適なデータセット形式を探究する。
論文電子ファイル 利用できません.
BiBTeXエントリ
@inproceedings{id341,
         title = {LLMによるCoq学習のためのデータセット形式},
        author = {中川 海都 and 山本晋一郎 and 大久保弘崇 and 粕谷英人},
     booktitle = {第32回ソフトウェア工学の基礎ワークショップ},
         month = {11},
          year = {2025},
}