1、对项目集进行了连通图的划分,整个依赖关系集被划分成了398个子连通图,得到每一个连通子图中包含的节点集合,方便之后绘制某一个项目的依赖关系网络。
2、正在整理db –engines排行榜前100的项目。
尹 刚 写到:抱歉!请具体说明一下没发布成功是怎么回事?我们继续改进。
与db-engines的排名对比是一个很好的选择。另外,也可以考虑一些学术研究的排名方法,这样,你们的成果起点会更高。但无论如何,先把自己的结果做出来,这个是第一步。
然后可能还要花不少时间,去实现其他方法,然后进行结果对比。db-engines的排名方法我们无法实现,但我们是不是可以想办法和它对比?
@余跃(yuyuenudt) @WangTao(wangtao)
好的。
没有发布成功可能是我最近刚换了mac系统,整不太明白
抱歉!请具体说明一下没发布成功是怎么回事?我们继续改进。
与db-engines的排名对比是一个很好的选择。另外,也可以考虑一些学术研究的排名方法,这样,你们的成果起点会更高。但无论如何,先把自己的结果做出来,这个是第一步。
然后可能还要花不少时间,去实现其他方法,然后进行结果对比。db-engines的排名方法我们无法实现,但我们是不是可以想办法和它对比?
@余跃(yuyuenudt) @WangTao(wangtao)
刚刚打的内容,不知道为什么没有发布上去。重新打一遍。。。。
1、与db-engines排名对比
2、pr得分值的由来及背后的意义
3、junit\testng case_study (正在迭代4-5跳项目集)
4、database的各软件的差异,以及复用它们的各软件差异(后者没有想法)
5、杨程师兄那边的项目成长规律
根据pr排名分析前10、中间10、后10,每单位时间的fork数
目的是训练前10、中间10、后10的成长曲线作对比,预测新项目的fork规律
我猜想:
1、pr排在前的基本上功能比较基础,代码比较成熟,没什么再需要人参与开发和修改的,fork数较少。
(愉悦师兄说下载量多也可能顺便fork,我没有考虑到)
2、成长曲线正态分布,项目刚出现吸引好多人参与,fork多,到比较成熟之后,再开发修改的就少了,fork少了。
(愉悦师兄说后边应该不是下降应该是增长平缓)
现在杨程师兄在绘fork曲线图。