计算机技术与发展第29卷摇第11期摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇Vol.29摇No.11
2019年11月Nov.摇2019COMPUTERTECHNOLOGYANDDEVELOPMENT
基于行为分析的在线课程成绩预测模型
(1.重庆文理学院软件工程学院,重庆402160;
任占广1,尚福华2
2.东北石油大学计算机与信息技术学院,黑龙江大庆163318)
摘摇要:随着大学在线课程占全部课题比重的不断提高,为了更加科学地分析在线学习行为和准确地预测在线课程成绩,提出了一种基于行为分析的在线课程成绩预测模型。首先,对学习行为及成绩预测策略进行了系统分析,构建了在线平台数据处理、成绩预测算法设计、成绩预测及算法优化的在线成绩预测机制;其次,利用数据挖掘技术收集在线学习行为数据,结合在线用户的操作特点对行为数据进行分析,提取了与成绩密切相关的10种行为指标数据并存储到数据库中;最后,以“玩课网冶平台的重庆文理学院“大学生计算机基础冶课程后台数据库作为实验数据基础,结合该课程实施特点,分析了学生学习行为,确定了学习行为指标等级,提取和转换了学生学习行为数据,并利用神经网络实现了在线课程成绩的预测。实验结果表明成绩预测的准确率较高。关键词:行为分析;数据处理;神经网络;成绩预测
中图分类号:TP39摇摇摇摇摇摇摇文献标识码:A摇摇摇摇摇摇文章编号:1673-629X(2019)11-0139-05doi:10.3969/j.issn.1673-629X.2019.11.028
OnlineCourseGradePredictionModelBasedonBehaviorAnalysis
(1.SchoolofSoftwareEngineering,ChongqingUniversityofArtsandSciences,Chongqing402160,China;2.SchoolofComputer&InformationTechnology,NortheastPetroleumUniversity,Daqing163318,China)
RENZhan-guang1,SHANGFu-hua2
Abstract:Withtheincreasingproportionofonlinecoursesinallsubjects,inordertoanalyzeonlinelearningbehaviorsmorescientificallyandpredictonlinecoursegrademoreaccurately,abehavioranalysis-basedonlinecoursegradepredictionmodelisproposed.Firstly,thelearningbehaviorandgradepredictionstrategyaresystematicallyanalyzed,andanonlinegradepredictionmechanismisconstructed,whichincludesdataprocessingofonlineplatform,designofgradepredictionalgorithmandoptimizationofgradepredictionalgorithm.Secondly,dataminingtechnologyisusedtocollectonlinelearningbehaviordata,andaccordingtotheonlineuser爷soperationalcharac鄄teristics,thebehaviordataisanalyzed,and10kindsofbehaviorindicatorsareextractedandstoredinthedatabase.Finally,withthedatabaseofthecourse“ComputerBasisforCollege冶ofChongqingUniversityofArtsandSciencesastheplatformof“Wankewang冶,combinedwiththecharacteristicsofcourseimplementation,weanalyzethelearningbehaviorofstudents,determinetheleveloflearningbehaviorindicators,extractandtransformthedataofstudents爷learningbehavior,andutilizetheneuralnetworktofinishthepredictionofonlinecoursegrade.Theexperimentshowsthattheperformancepredictionismoreaccurate.Keywords:behavioranalysis;dataprocessing;neuralnetwork;gradeprediction
0摇引摇言
随着互联网技术的飞速发展,网络课程已经成为继传统课堂之外最主要的学习途径,因其不受时间和空间等,得到了当代大学生的追捧[1]。在网络课程的学习过程中将产生大量的用户行为数据,而如何利用神经网络、机器学习、数据挖掘等技术,根据在线
学习行为,建立合理有效的成绩预测模型,科学分析影响在线课程成绩的相关因素,已成为大数据挖掘领域的重要研究方向[2]。目前,已经有部分学者对行为分析及成绩预测做了研究。例如,文献[3]对网络商务课程用户的学习行为与反思性学习的影响等级进行研究;文献[4-5]分别分析了在线学习行为与学习态度、
收稿日期:2018-12-24摇摇摇摇摇摇修回日期:2019-04-25摇摇摇摇摇摇网络出版时间:2019-06-27
基金项目:国家自然科学基金(61170132);国家科技重大专项资助项目(2017ZX05019005-006);重庆文理学院校级科研项目(Z2015RJ05)作者简介:任占广(1988-),男,助理实验师,硕士研究生,研究方向为移动计算、机器学习等;尚福华,教授,博士(后),研究方向为人工智能、
软件工程等。
网络出版地址:http://kns.cnki.net/kcms/detail/61.1450.TP.20190627.1111.0.html
摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇计算机技术与发展摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第29卷·摇14摇0·
自我效能感和先验知识的关系。以上针对学习行为的研究,在对象和样本的选择上都有一定的局限性,同时,在线学习行为分析的主观干预度比较强,不具有一定的普遍性。文献[6]提出了基于PCA-RBF网络的学生写作成绩预测模型,虽然该模型提高了预测的准确率,但是收敛速度较慢。文献[7]提出了基于决策树C4.5算法的学生成绩预测模型,侧重分析了影响成绩的因素,但是准确率不高。文献[8]提出了基于频繁模式聚类课程关联分析和成绩预测模型,对课程分类及较差课程的预测的准确性较高,具有一定的参2摇在线学习行为分析
在线用户即网络用户,根据CNNIC(中国互联息中心)的定义,网络用户是指“在最近6个月使用在线学习行为即在线用户利用网络学习平台进行学习互联网的6岁以上的公民冶,是网络使用者的总称[11]。的所有操作行为,例如提交作业、在线观看等。在线学习行为分析就是通过数据挖掘、大数据分析等手段对学习行为数据进行处理,主要包括三个阶段:行为数据准备、行为数据分析、行为数据结果输出,如图2所示。
考价值。
综上所述,国内关于学习行为和成绩预测的研究还处在起步阶段,对在线学习行为数据的采集和挖掘还不够深入。因此,文中提出一种基于行为分析的在线课程成绩预测模型,分析并提取了在线学习行为数据,构建了成绩预测模型,完成了在线课程成绩预测,达到了预期的效果。
1摇模型构建
成绩预测模型是在线课程学习平台的重要组成部分,是从数据采集、数据分析、数据处理到成绩预测的整个过程[9-10]等技术获取用户在线学习过程中的所有行为数据。数据采集是指利用数据库、网页抓取,如鼠标的操作、课程课件或者视频的观看、键盘的录入等。由于采集的数据过于多样化、过于冗余,需要进一步对数据进行除杂、降噪等规范化、标准化处理,一方面压缩了数据总量,另一方面便于存入到关系型数据库中。数据标准化后,结合在线学习平台的特点、课程本身的安排等,提取与成绩密切相关的行为数据。最后,利用神经网络算法,以在线课程指标及在线课实成绩作为类标,完成预测算法的设计,并根据预测效果、在线课程方案等进一步的调整,使其更加适合在线学习平台。在线课程成绩预测模型如图1所示。
图1摇基于在线行为分析的成绩预测模型
()()图2摇在线学习行为分析模型
在线学习行为分析主要包括三个方面:行为构成要素分析、行为交互方式分析以及行为操作方式分析[12-13]主体和行为客体的分析(1)行为构成要素分析即对在线学习平台的行为
。
[14-16]是大学生,也就是研究的对象。。在线学习平台的主体行为客体是指与行为主体进行交互的客观对象,比如学习系统、网络环境等。文中的行为主体分析就是对大学生的认知结构、学习动机、学习习惯、学习规律的分析,行为客体分析主要是对在线学习资源类型、构成等的分析。而学习资源作为承载学习内容、知识信息的重要载体,它的设计与安排的合理性、创新性将直接影响到大学生在线学习的效果。
的交互和行为主体与网络平台的交互的分析(2)行为交互方式分析即对行为主体与行为客体
[14-16]前者即为大学生与在线课程内容的交互,如浏览学习。内容、检索学习内容、分享学习内容等。后者即为大学生与在线学习平台的交互,如作业的完成与提交、问题的提出、添加学习笔记等。文中主要分析大学生提出问题的次数、在线观看学习视频的时长、登陆在线学习平台的次数、作业提交次数以及提交的时间间隔等。
的所有行为轨迹的分析(3)行为操作方式分析即行为主体在网络平台上
,也就是对在行为交互过程中
摇第11期摇摇摇摇摇摇摇摇摇摇摇任占广等:基于行为分析的在线课程成绩预测模型·141·
的所有操作行为的分析[14-16]。行为操作数据是学习行为数据的最主要的组成部分,同时也是研究的重点和难点。在一定程度上,行为轨迹数据反映了在线学习用户的学习习惯、学习时间安排、学习兴趣等。文中主要分析与在线课程学习密切相关的键盘输入、鼠标操作等操作行为。
行为指标在线注册人数课程登陆次数课件观看时长课件观看完成度课件重复观看次数结课后课件观看次数
问题提问次数作业提交次数作业提交与发布时间差作业提交时间间隔
通过以上三个方面的分析,结合在线学习平台的交互和操作方式、在线学习资源的构成与安排、在线学习用户本身的特点、任课老师的意见等,利用调查问卷、在线课程学习讨论会等多种形式最终确定了10种学习行为指标,并对这10种行为指标进行了编码,如表1所示。
表1摇在线课程学习行为指标
描述----单位:分钟L1/总时长
--------作业提交时间-作业发布时间(单位:天)两次作业提交的时间差(单位:天)
编码P1P2L1L2L3L4L5E1E2E3
摇摇文中以在线学习平台“玩课网冶的用户网络操作日志及在线课程数据库作为原始数据,首先对操作日志数据、课程数据进行分析,找到它们之间存在的相关性,并对其进行整合,形成学习行为特征数据,并存入数据库;其次,提取与成绩密切相关的全部学习行为指
标数据;再次,结合表1的在线课程学习行为指标,对行为指标数据进行相关度分析,并确定相应的学习行为指标;最后,将确定好的行为指标数据进行标准化处理,并将标准化数据存入到成绩预测支撑数据库中,如图3所示。
图3摇在线行为数据分析与处理机制
3摇实摇验
束课程以后学生无法继续观看相关学习资料,因此,结课后视频/课件观看次数L5也符合本次实验的行为指标。除去学习行为指标P1和L5,剩下的8个学习行为指标数据作为本次实验输入,结合该课程教学、考核方2所示。
案等,将8个行为指标分为A、B、C、D四个等级,如表
按照表2的指标等级,收集了2018-2019第一学
3.1摇实验数据分析与处理
实验选取“玩课网冶平台的重庆文理学院“大学生计算机基础冶课程后台数据库作为实验数据基础,该课程是针对大一理工类学生开设的公共必修课程,采用线上自主学习、线下实际操作的教学方式。由于是必修课程,学生只有完成平台信息注册,并通过任课教师的审核通过,才能进入所在的班级学习并通过最终的期末上机实操考试获得相应的学分。学习者的在线学习平台的注册行为是一种强制的、被动的行为,因此在本次实验中,不应将在线注册人数P1作为输入元素;当学期末结束课程后,在线级自动解散,结
年的1000名学生的8个行为指标数据(根据学习行为指标等级进行了分类处理,便于后续实验数据的录入和神经网络的训练)和真实成绩(真实成绩分为四个等级:优秀A、一般B、及格C、不及格D),由相应的任课老师提供,用G表示,如表3所示。
摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇计算机技术与发展摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇摇第29卷·摇14摇2·
表2摇行为指标等级
指标P2
A级>500>15>20>10<2<7L1ABBAAACB…CC
L2BBCACBA…CBB
L3ACCACBC
>80
B级500-40015-1020-159-73-480-50
C级399-3009-56-35-749-20
D级<300<5<9<3>14
E2ABBBCBA…CC
E3AADBCBCABB
>7<20
L1L2L3L5E1E2E3
>0.850.85-0.750.74-0.614-9
<0.6
8-10
L5ABCAADA…BCC
E1ABB
11-14
表3摇处理后学生行为数据及真实成绩
序号12345678109
P2AABCBCB
GABBACBA…CBC
AA
DACBA…CC
D
DA…C
3.2摇算法实现
……
D
Step2:利用样本集R训练网络,直到达到预期值;Step3:将能够识别的样本构成集合R';
Step4:输入R',计算每个隐藏神经元的激活Step5:将H沿每一行重新排列,得到排序后的矩Step6:对H'的每行分别假定一个切入点将该行
…
考虑到行为指标的输入与成绩预测结果的输出都是四类等级值,因此,本次实验采用前向神经网络完成前期的训练和后期的成绩预测。记该前向神经网络的神经元的输入个数为p,输出个数为q,隐藏个数为s,则前向神经网络结构如4所示。
值Hij;
阵H',记每行排序映射为fi;
分割成2块,计算分割后的信息增益矩阵N,选择N中的最大值Nmax,构建决策树的一个节点;续执行;
Step7:P'=P'-fi,若P'不为空,则转到Step4继Step8:搜索整棵决策树,寻找所有重要的节点。通过计算共寻找到重要节点6个,所以隐藏神经
psq元个数s=6。3.3摇成绩预测
实验在内存为4GB、主频为3GH、操作系统为Win7的台式电脑上进行,使用Matlab将处理过的标准数据集导入到前向神经网络中。学习行为数据集共选取了1000名大一学生的行为数据,其中500名学生行为数据作为训练子集,200的行为数据作为验证子集,300的行为数据作为测试子集,测试子集作为最
图4摇前向神经网络结构
4个,所以该网络的输入神经元个数p=8,输出神经元的个数q=4,而隐藏神经元个数s的确定是该网络的关键,具体步骤如下:
Step1:将s的值设置无穷大;
因为影响成绩的行为指标共8个,而成绩结果有
摇第11期摇摇摇摇摇摇摇摇摇摇摇任占广等:基于行为分析的在线课程成绩预测模型·143·
终的成绩预测结果。
前向神经网络的收敛情况如图5所示,预测结果如表4所示。
表4摇预测与真实成绩对比
A
预测结果真实结果
[2]摇吴摇强,方摇睿,韩摇斌,等.基于决策树-LMBP神经网络
的学生成绩分析及预测模型的研究[J].成都信息工程大学学报,2018,33(3):274-280.
[3]摇STRANGK.Howstudentbehaviorandreflectivelearning
impactgradesinonli-nebusinesscourses[J].JournalofAp鄄pliedResearchinHigherEducation,2016,8(3):390-410.[4]摇PRIORDD,MAZANOVJ,MEACHEAMD,etal.Digital
literacyandselfefficacy:flow-oneffectsforonlinelearningB6548
C7491
D4343
118118
101100ESM10-1051015图5摇迭代次数误差均方图
如图5所示,当迭代到第11次时,验证子集的误差率达到最低,当迭代到第17次时,算法结束。如表
4或者所示及,优秀和不及格的学生全部预测正确格的34人预测发生错误,预测准,确只有一般率高达88郾67%,说明该模型比较适合在线课程成绩的预测。4摇结束语
文中提出了一种基于行为分析的在线课程成绩预测模型,以“玩课网冶平台在线数据为基础,结合重庆文理学院“大学生计算机基础冶课程用户行为数据,分析并找到了与在线课程成绩密切相关的学习行为指标数据,实现了在线课程成绩的预测,为在线课程的实施、发展、改革等提供了很好的参考作用。虽然该模型整体预测的准确率较高,但是当学习行为指标数据越接近指标等级临界点时,预测的错误的概率就越高。因此,还需要获取更多的样本集合,对神经网络进行训练,调整隐藏神经元个数,从而降低误差率。
参考文献:
[1]摇陈晋音性化学习推荐,方摇航[,J]林.计算机科学摇翔,等.基于在线学习行为分析的个
,2018,45(11A):422-426.
behavior[J].TheInternet&HigherEducation,2016,29:91-[5]摇97BUTCHER.
impactstudentsKR爷,onlineSUMNERlearningT.Howbehaviorsdoes?prior[J]knowledge
.Interna鄄
tionalJournalofCyberBehaviorPsychology&Learning,[6]摇胡2011,1(4):1-18.
成绩预测模型摇帅,顾摇艳[,J姜].摇计算机与现代化华.基于PCA-,2016(1):69-72RBF网络的学生写作
.[7]摇王黎黎[J],刘学军.决策树C4.5算法在成绩分析中的应用
[8]摇73何.
.河南工程学院学报:自然科学版,2014,26(4):69-分类模型和学生成绩预测算法研究摇楚,宋摇健,卓摇桐.基于频繁模式谱聚类的课程关联
[J].计算机应用研究,
[9]摇2015,32(10):2930-2933刘志妩机应用与软件.基于决策树算法的学生成绩的预测分析.
,2012,29(11):312-314.
[J].计算
[10]王法玉无线网用户学习兴趣度行为分析,姜摇妍.基于自组织神经网络和模糊聚类的校园
[J].计算机应用研究,
[11]2018,35(1):186-1罗海艳.
行为分析系统,杨摇勇[,J王].摇控制工程珏,等.基于云计算的移动用户上网
,2018,25(2):218-223.[12][肖宇航D].北京.行为分析:北方工业大学技术在,2018用户.管理系统中的应用研究[13]大学王子清,2018.大学生学习行为分析研究与应用.
[D].苏州:苏州[14]王范大学摇祎.,2018在线学习行为分析及应用研究.
[D].武汉:华中师
[15]张大胤[D].桂林.基于互联:广西师范大学网环境,2018下学.
习行为的数据挖掘研究[16]周预测方法研究摇剑,薛摇景[,J韩].摇计算机时代崇,等.基于,2018(12):71-74BP神经网络的学生成绩
.