深度学习in软工问题 - 确实激发创新

登录注册

【缺陷】第一次讨论结果正常

由胡东阳添加于 2018-08-21 22:34

1、第一阶段目标：运用document embedding (例如doc2vec)方法解决传统经典bug研究问题，例如bug localization、bug分类、bug指派等。传统方法主要是基于bug的自身属性或者利用传统的信息抽取方法（例如TF-IDF）来计算文本的相似度。

2、经过调研，对于传统的bug localization问题，目前已有研究利用人工神经网络（例如word embedding, word2vec）方法来研究此类问题。但是word2vec方法只考虑了词与词之间的相似度，很难将一些bug的结构属性加入到模型中，但是doc2vec方法在word2vec基础上考虑了文档标签，所以可以将bug的属性很容易的加入到人工神经网络的模型中去，使模型参考因素更多，更加健壮。所以我们猜测doc2vec方法解决传统的bug localization问题效果会更好。

3、第一阶段计划：运用doc2vec方法对bug localization问题进行研究，并与前人的工作做对比，比如与word2vec方法做实验对比，验证我们实验方法的优越性。

4、下一阶段计划：我们在传统bug问题上走通后，再想办法移植到github上的新式研究问题，例如给用户推荐项目，预测issue的解决时间之类的。

07372035.pdf

( 255.304 KB) 胡东阳, 2018-08-22 09:01

07582745.pdf

( 861.251 KB) 胡东阳, 2018-08-22 09:01

07774514.pdf

( 450.202 KB) 胡东阳, 2018-08-22 09:01

fse14.pdf

( 1.77 MB) 胡东阳, 2018-08-22 09:01

Learning to Rank Relevant Files for Bug Reports Using Domain know.pdf

( 802.538 KB) 胡东阳, 2018-08-22 09:01

回复（4）▪ 赞

胡东阳 7年前

数据集：https://figshare.com/articles/The_dataset_of_six_open_source_Java_projects/951967

赞回复︿

胡东阳 7年前

相关网站资料：

1、https://blog.csdn.net/aliceyangxi1987/article/details/75097598

2、https://blog.csdn.net/surehao/article/details/19623345

3、https://blog.csdn.net/lk7688535/article/details/51321466

4、https://blog.csdn.net/mpk_no1/article/details/72836024

赞回复︿

胡东阳 7年前

附件 07372035.pdf 已添加

附件 07582745.pdf 已添加

附件 07774514.pdf 已添加

附件 fse14.pdf 已添加

附件 Learning to Rank Relevant Files for Bug Reports Using Domain know.pdf 已添加

描述已更新。 (查看差别)

状态从新增变更为 正在解决

% 完成 从 0 变更为 20

赞回复︿

张洋 7年前

描述已更新。 (查看差别)

赞回复︿

登录后可添加回复

当前状态正在解决
选定优先级正常
指派给 --
里程碑 --
开始日期 2018-08-21
结束日期
预计工时(H) 0.00 小时
完成度 20%
关联Commit 无

Trustie(确实)
QQ群：1071514693

头像设置