Multi-discussing during issue resolution

登录注册

胡东阳/ Multi-discussing during issue resolution

【缺陷】 2018.06.04结果的几个表正常

由胡东阳添加于 2018-06-04 20:42

1、包含平均解决时间的平均跨issue的评论者信息在表multi_tag1_3562_no_mem.csv中，其中ave_multi_user_time字段值就是ave_multi_issues*60*24/interval。

2、接着，我们提取了all_user_ids>5,8,10的值导到表all_user_ids_dayu5.csv、all_user_ids_dayu8.csv、all_user_ids_dayu10.csv中。其中ratio_mul_all_user字段为multi_user_ids/all_user_ids。

3、R语言文件在r_wilcox_test.R中。

multi_tag1_3562_no_mem.csv

( 151.29 KB) 胡东阳, 2018-06-04 20:25

all_user_ids_dayu5.csv

( 10.952 KB) 胡东阳, 2018-06-04 20:28

all_user_ids_dayu8.csv

( 3.485 KB) 胡东阳, 2018-06-04 20:28

all_user_ids_dayu10.csv

( 2.259 KB) 胡东阳, 2018-06-04 20:28

multi_tag1_no_mem.csv

( 206.62 KB) 胡东阳, 2018-06-04 20:42

r_wilcox_test.R

( 601 Bytes) 胡东阳, 2018-06-04 20:42

dy_model.R

( 1.436 KB) 胡东阳, 2018-06-04 20:44

icse2016focus.pdf

( 1.896 MB) 胡东阳, 2018-06-07 08:22

回复（5）▪ 赞

张洋 7年前

张洋 7年前

def getEntropy(data, unit='shannon'): base = { 'shannon' : 2., 'natural' : math.exp(1), 'hartley' : 10. } if len(data) <= 1: return 0 counts = Counter() for d in data: counts[d] += 1 probs = [float(c) / len(data) for c in counts.values()] probs = [p for p in probs if p > 0.] ent = 0 for p in probs: if p > 0.: ent -= p * math.log(p, base[unit]) return ent 

赞回复︿

输入就是data，是一个数组，输出就是熵值，调用就直接getEntropy(data)

赞回复︿

胡东阳 7年前

附件 icse2016focus.pdf 已添加

赞回复︿

张洋 7年前

boxplot(interval~tag,data=data,main="The issue resolution latency of two tag",
ylab="interval",xlab="The issue resolution latency of 0 and 1 ",ylim=c(0,400000))
wilcox.test(interval~tag,data=data)

boxplot(log(interval+0.5)~round(24*60*ave_multi_user_time),data=data,xlim=c(0,100))

result<-lm(scale(log(interval+0.5))~
scale(log(all_user_ids))
+scale(log(multi_user_ids+0.5))
+ave_multi_issues,data=M)
summary(result)
require(car)
vif(result)

赞回复︿

胡东阳 7年前

附件 dy_model.R 已添加

赞回复︿

登录后可添加回复

当前状态新增
选定优先级正常
指派给 --
里程碑 --
开始日期 2018-06-04
结束日期
预计工时(H) 0.00 小时
完成度 0%
关联Commit 无

Trustie(确实)
QQ群：1071514693

头像设置