课程选择依据上次分析内容和课程方面指标的分布图,以及最后最少留20门课程为标准,选择课程,选择课程的结果如下:
这些课程都是比较活跃课程。
课程统计的分析的指标主要分析课程中用户的作业评分与论坛活跃度,作业提交时间与评分之间的关系。
分析用户作业评分与论坛发帖数的相关性,计算皮尔森相关系数
可以出来直接分析相关性,相关性很差,基本不具有相关性。这显然是由于数据太过稀疏,分布的太大,个体对于整个相关性影响很大。
如果他们相关,这个折线应该是总体成一个上升趋势,计算相邻两点之间的直线斜率,再求和表示这个折线的趋势,然而这样的结果也不怎么好
这个非常大应该说比较好,但是他实际的折线图不是一直上升的,而是波动很大
这是消息数最多的课程
作业最多的课程
学生数最多的课程
这样也还是没有分析出有价值的规律,希望通过数据能和老师交流一下。
编程作业的大概情况由池舒淇分析了一下,已经发布。