17765?1483088285

【缺陷】 2018.06.04结果的几个表 正常


胡东阳添加于 2018-06-04 20:42

1、包含平均解决时间的平均跨issue的评论者信息在表multi_tag1_3562_no_mem.csv中,其中ave_multi_user_time字段值就是ave_multi_issues*60*24/interval。

2、接着,我们提取了all_user_ids>5,8,10的值导到表all_user_ids_dayu5.csv、all_user_ids_dayu8.csv、all_user_ids_dayu10.csv中。其中ratio_mul_all_user字段为multi_user_ids/all_user_ids。

3、R语言文件在r_wilcox_test.R中。


回复(5)
  • 39?1705884565
    张洋 6年前
    39?1705884565
    张洋 6年前

    def getEntropy(data, unit='shannon'):<br /> base = {<br /> 'shannon' : 2.,<br /> 'natural' : math.exp(1),<br /> 'hartley' : 10.<br /> }<br /> if len(data) &lt;= 1:<br /> return 0<br /> <br /> counts = Counter()<br /> <br /> for d in data:<br /> counts[d] += 1<br /> <br /> probs = [float(c) / len(data) for c in counts.values()]<br /> probs = [p for p in probs if p &gt; 0.]<br /> <br /> ent = 0<br /> <br /> for p in probs:<br /> if p &gt; 0.:<br /> ent -= p * math.log(p, base[unit])<br /> <br /> return ent<br />

    输入就是data,是一个数组,输出就是熵值,调用就直接getEntropy(data)

  • 17765?1483088285
    胡东阳 6年前

    附件 icse2016focus.pdf 已添加

  • 39?1705884565
    张洋 6年前

    boxplot(interval~tag,data=data,main="The issue resolution latency of two tag",
              ylab="interval",xlab="The issue resolution latency of 0 and 1 ",ylim=c(0,400000))
    wilcox.test(interval~tag,data=data)

    boxplot(log(interval+0.5)~round(24*60*ave_multi_user_time),data=data,xlim=c(0,100))

    result<-lm(scale(log(interval+0.5))~
                 scale(log(all_user_ids))
               +scale(log(multi_user_ids+0.5))
               +ave_multi_issues,data=M)
    summary(result)
    require(car)
    vif(result)

  • 17765?1483088285
    胡东阳 6年前

    附件 dy_model.R 已添加

0?1470885445
登录后可添加回复
  • 当前状态 新增
  • 选定优先级 正常
  • 指派给 --
  • 里程碑 --
  • 开始日期 2018-06-04
  • 结束日期
  • 预计工时(H) 0.00 小时
  • 完成度 0%
  • 关联Commit

© Copyright 2007~2021 国防科技大学Trustie团队 & IntelliDE 湘ICP备 17009477号

问题和建议
还能输入50个字符 提交

加入QQ群

关注微信APP


×