20170602-Combining Click-Stream Data with NLP Tools to Better Understand MOOC Completion-郭守超

发布者:张淼发布时间:2017-06-02浏览次数:71

时间

2017/6/02

地点

会议室312

出席人员

于春燕、徐志红、胡晓静、郭守超、肖刚、张淼

曹乃龙、郭庭纶、孙慈睿

汇报主题

20170602-Combining Click-Stream Data with NLP Tools to Better Understand MOOC Completion-郭守超.pdf

20170602-Combining Click-Stream Data with NLP Tools to Better Understand MOOC Completion-郭守超.pptx

汇报人

郭守超

会议内容

一、汇报内容

本文通过文本长度、社会协作、情感分析等NLP指标,以及视频观看、页面浏览等点击流数据,预测MOOC的完成情况

二、讨论内容

  • 于春燕:必须达到正太分布的数据才能进行后面的分析?如何达到正太分布,前期需要处理?什么情况会影响是否为正太分布?

郭守超:是否为正太分布可以用统计工具得出,对于不符合正太分布的情况,可以进行剔除。是否为正太分布和抽样对象以及指标设计有关系

  • 于春燕:这篇文章通过数据分析可以得出一些结论。但这些结论比较常见,它的意义是什么?

郭守超:在于如何构建预测模型,本文抽样320人做模型,然后用这个模型对整个学生的实际成绩分析

  • 于春燕:这个模型在哪里?

郭守超:没有具体的模型,主要通过一些指标来进行分析构建;

  • 胡晓静nlp软件用的哪些?

郭守超:本文例举了很多,不同工具可以得到不同的效果

  • 曹博士:建议阅读reference的第 22篇,原理和本文几乎是一样,但是更简单易懂;