深度学习in软工问题 - 确实激发创新

登录注册

【缺陷】对比实验代码正常

由陈明添加于 2018-09-16 21:25

##文件及说明

Bug_training_cm.py 论文对比实验代码

tfidf文件夹包含tfidf训练模型

training包含w2v以及d2v训练好模型

exper_filehash.sql为验证数据集

------------------------

训练集为5845条数据 ,测试集为650

效果不好的原因是因为一个bugid对应的相似bugid数量较少

( 103.417 MB) 陈明, 2018-09-16 21:21

回复（1）▪ 赞

胡东阳 7年前

目前参考论文《Combining Word Embedding with Information Retrieval to Recommend Similar Bug Reports 》中的The Overall Framework 复现流程已经走通，但是在我们现在的数据集上测试效果欠佳，初步考虑原因是一个file对应多个bug_id的数据量较少。

赞回复︿

登录后可添加回复