Detail of a work
| Tweet | |
| 中川, 山本晋一郎, 大久保弘崇, 粕谷英人, "LLMによるCoq学習のためのデータセット形式," 第32回ソフトウェア工学の基礎ワークショップ, 2025年11月. | |
| ID | 341 |
| 分類 | 研究会・全国大会等 |
| タグ | |
| 表題 (title) |
LLMによるCoq学習のためのデータセット形式 |
| 表題 (英文) |
|
| 著者名 (author) |
中川 海都,山本晋一郎,大久保弘崇,粕谷英人 |
| 英文著者名 (author) |
,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya |
| 編者名 (editor) |
|
| 編者名 (英文) |
|
| キー (key) |
,Shinichiro Yamamoto,Hirotaka Ohkubo,Hideto Kasuya |
| 書籍・会議録表題 (booktitle) |
第32回ソフトウェア工学の基礎ワークショップ |
| 書籍・会議録表題(英文) |
|
| 巻数 (volume) |
|
| 号数 (number) |
|
| ページ範囲 (pages) |
|
| 組織名 (organization) |
|
| 出版元 (publisher) |
|
| 出版元 (英文) |
|
| 出版社住所 (address) |
|
| 刊行月 (month) |
11 |
| 出版年 (year) |
2025 |
| 採択率 (acceptance) |
|
| URL |
|
| 付加情報 (note) |
|
| 注釈 (annote) |
|
| 内容梗概 (abstract) |
本研究は、大規模言語モデル(LLM)に定理証明支援系Coqの知識を学習させ、モデルがプログラムコードの正しさを形式的に証明できる環境の構築を目的とする。Coqは形式的検証に基づくプログラミング言語であり、プログラムの正しさを厳密に保証できることから、安全性が重視される分野で広く利用されている。一方、近年の生成AIはコード自動生成を可能にしたものの、その出力にはしばしば誤りが含まれるという課題がある。本研究では、LLMにCoqの知識を学習させることで、生成コードに対して形式的検証を行い、正しさを保証できる仕組みの実現を目指す。通常のプログラミング言語を対象とした学習ではソースコードを中心にデータセットを構成するが、Coqの学習にはコードに加えて、証明過程や証明中のゴール状態といった時系列的・論理的情報を含める必要がある。そこで本研究では、Coqにおける定理、証明スクリプト、証明状態などの情報をどのように整理・表現すればLLMが効果的に学習できるかに着目し、最適なデータセット形式を探究する。 |
| 論文電子ファイル | 利用できません. |
| BiBTeXエントリ |
@inproceedings{id341,
title = {LLMによるCoq学習のためのデータセット形式},
author = {中川 海都 and 山本晋一郎 and 大久保弘崇 and 粕谷英人},
booktitle = {第32回ソフトウェア工学の基礎ワークショップ},
month = {11},
year = {2025},
}
|