公告×

尊敬的用户,项目开发模块已全面升级。为避免数据不一致问题,后续项目开发请基于新版开展,老版项目开发模块将不再维护。如果您的项目出现数据迁移不完整等问题敬请添加QQ群1071514693反馈,我们将及时处理。新版Forge使用说明和问题反馈也可通过使用讨论吧
图像
03/02/2016 23:23

一、度量的提出:

对之前的GQM模型改进,从开发者的贡献代码量、开发质量和社交活跃度三个方面评价,具体如下:

image


CCGN(changed lines of code):变更的代码行数。

CMT(number of commits):提交代码的次数。

IRPT(number of reports):提交的问题报告(issue report)的数量。

GBG(generated bugs):平均每行代码引入的缺陷数。

GQI(generated quality issues):平均每行引入的代码质量问题数。

CMNT(number of comments):评论的数量,包括issue、pull request和commit的评论。

AAT(average active time):平均活跃时间,即计算某个开发者相邻社交活动间隔时间的平均值。

二、实验进展

目前分析了python排名前五的三个项目(httpie,flask,requests的开发者贡献度的指标,分析结果在附件中,目前粗略分析了开发者开发质量的两个指标GBG和GQI的相关关系,结果如下:

对三个项目分别分析:

httpie:

image

pearson相关系数:-0.01115682


httpie:

image

pearson相关系数为-0.01006093

image

pearson相关系数为0.268149

从这三个项目分别的分析结果可以看出,开发者在开发过程中引入的代码质量问题与引入的bug数的相关性很小,也就是说,开发者的开发水平较差不一定引入的bug就多。这与常识不太相符。

将三个项目数据合在一起做pearson相关,也得到一样的结果:image

pearson相关系数为:0.1419347


下一步打算进一步分析其他指标的关系,尤其对个体开发者,以时间为维度分析其开发质量的变化



( 64.8 KB) 15Luy, 03/02/2016 22:48
( 241 KB) 15Luy, 03/02/2016 22:48
( 350 KB) 15Luy, 03/02/2016 22:48
( 45 KB) 15Luy, 03/02/2016 22:48
回复 (10)
10?1449542945
余跃 4年前
roadfar 写到:
yuyuenudt 写到:
roadfar 写到:
老师师兄,所有的实验代码包括数据获取的都传到了这个项目的版本库中,请审阅~
上次那个 blame error 是什么原因?

目前没查出原因,我们debug拿出出错的commit sha敲blame也出错

那你们就不管了吗?

上次不是说了吗,你们可以看下sha对应的commit,看下要blame的文件的具体内容啊。

3051?1565316234
15Luy 4年前
yuyuenudt 写到:
roadfar 写到:
老师师兄,所有的实验代码包括数据获取的都传到了这个项目的版本库中,请审阅~
上次那个 blame error 是什么原因?

目前没查出原因,我们debug拿出出错的commit sha敲blame也出错

10?1449542945
余跃 4年前
roadfar 写到:
老师师兄,所有的实验代码包括数据获取的都传到了这个项目的版本库中,请审阅~
上次那个 blame error 是什么原因?

3051?1565316234
15Luy 4年前
老师师兄,所有的实验代码包括数据获取的都传到了这个项目的版本库中,请审阅~

3051?1565316234
15Luy 4年前
jacknudt 写到:

下一步不是分析其他的指标关系,应该是确认你的已有分析是不是有疏漏?

以及,为仔细分析什么没有关系?

好的尹老师,我再做进一步分析~

3051?1565316234
15Luy 4年前
yuyuenudt 写到:
spearman?

去除没有写代码的记录后,总共有444条,spearman相关系数为0.2677245,弱相关

3051?1565316234
15Luy 4年前
yuyuenudt 写到:

我看了你的all.csv,好多都是NA啊?你怎么处理的?

还有,如果去掉NA,就没有几个数据了。。

好的师兄,我处理以下稍后上传结果

10?1449542945
余跃 4年前

我看了你的all.csv,好多都是NA啊?你怎么处理的?

还有,如果去掉NA,就没有几个数据了。。

5?1460204756
尹刚 4年前

下一步不是分析其他的指标关系,应该是确认你的已有分析是不是有疏漏?

以及,为仔细分析什么没有关系?

10?1449542945
余跃 4年前
spearman?

问题和建议
还能输入50个字符 Submit

加入QQ群

关注微信APP


×