软件缺陷的预测、检测、定位与修复是软件工程领域的研究热点。这些研究通常都依赖于大规模缺陷库以评估其有效性。此外,随着数据挖掘和机器学习技术的发展,数据驱动的缺陷预测、检测、定位与修复正成为新的研究热点。但缺乏大规模高质量的软件缺陷库严重制约了此类研究的进展。为此,本项目计划研究大规模高质量软件缺陷库的构造方法。研究内容包括:\\   1)研究如何基于软件版本管理系统自动收集软件缺陷并抽取精准的缺陷补丁;\\   2)研究针对并发缺陷等特定类型的复杂缺陷的收集、整理和标注方法,构建特定类型的软件缺陷库;\\   3)基于大规模缺陷库,量化评估现有的缺陷定位与缺陷修复方法,明确其优缺点,探索可能的突破方向;\\   4)以大规模缺陷库为基础,以缺陷签名挖掘和缺陷修复模式挖掘为突破口,研究如何以数据驱动的方式提高缺陷定位的准确率以及缺陷修复的成功率。\\   本项目构建的大规模高质量缺陷库将成为软件缺陷相关研究的关键性基础数据,推动相关领域取得新突破。\\   --以上研究得到国家自然科学基金的重点项目资助 2023年~2027年