【缺陷】 对比实验代码 正常
##文件及说明
Bug_training_cm.py 论文对比实验代码
tfidf文件夹包含tfidf训练模型
training包含w2v以及d2v训练好模型
exper_filehash.sql为验证数据集
------------------------
训练集为5845条数据 ,测试集为650
效果不好的原因是因为一个bugid对应的相似bugid数量较少
dongyang.rar
目前参考论文《Combining Word Embedding with Information Retrieval to Recommend Similar Bug Reports 》中的The Overall Framework 复现流程已经走通,但是在我们现在的数据集上测试效果欠佳,初步考虑原因是一个file对应多个bug_id的数据量较少。
© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号
加入QQ群
关注微信APP
预览