• 基于学习数据分析的学业成绩预测研究

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 第1章 绪论

    1.1 研究背景及意义

          自“数字中国”建设上升为国家战略以来,以人工智能、大数据、云计算为代表的数字技术不断加快与各行各业的深度融合,在我国经济社会发展由“高速度”转为“高质量”的过程中发挥了至关重要的作用。教育数字化转型作为数字中国建设的重要支撑,对于我国全面深化教育改革、创新人才发展模式、把握数字时代发展先机具有重要的战略意义[1]。中国在2015 年正式启动“互联网+”和 “大数据 ”战略,特别强调在教育领域充分利用信息技术,挖掘教育大数据,以促进 “互联网+教育”的深度融合。在“互联网+”时代背景下,远程教育发展正面临着机遇与挑战,传统的教育方式已经不能满足学习者的学习需求,因此在信息技术条件的支撑下催生了在线学习的学习方式。在线学习作为远程教育一种重要形式,使学习可以不受时间、地点的限制,满足学习者多样化需求。2018 年教育部制定《教育信息化 2.0 行动计划》是为了促进新时代的教育信息化,大力推动“互联网+教育”发展。报告提出要大力推进智慧教育,包括构建以学习者为中心的智慧教育,将人工智能应用于教育和管理等领域,利用信息技术加快推动人才培养模式和教育方式的改革。

          随着教育和科学技术的发展,各种在线学习平台如 Moodle、MOOC 等开始在全球范围涌现,推动了教育信息化发展的新模式。国内外高校也根据需求开始在教育平台上开设课程,这是因为与传统教育相比,在线教育的优势在于不受时间和地域的限制,而且资源可以共享,这使世界各地的所有用户能够在任何时间和任何地方访问和学习各种高质量教育资源。但随着在线教育的广泛发展,其劣势也渐渐显露出来,由于教学模式单一化、交互性差以及门槛较低并且缺少相应的监督体系,这对于缺乏自律性、自主性的学习者就会导致出现课程完成度较低和辍学率较高等问题。大量MOOC学习者中途辍学(退出学习),只有10%的注册学习者能够完成课程[2]。如何减少这些现象发生,就需要研究者利用信息技术手段对教育大数据进行分析和挖掘,并运用学习分析技术来研究平台数据背后潜在的在线学习行为特征信息。教育数据挖掘可用于分析在线学习者的行为特征,探索学习风格和行为模式的倾向性,预测学业成绩,并为不同类型的学习者量身定制学习服务,从而为教学策略的制定,及时实施学业预警等干预措施提供科学依据。

          为了配合新冠肺炎疫情防控要求,教育部提出“停课不停学”的口号,倡导利用网络平台教学来进行教学以实现居家学习。疫情之下,以教育信息化为基础的在线教育规模爆发,在迎来高速发展新机遇的同时也迎来更大的挑战。因此,鉴于在线教育课程平台的广泛应用和在线学习行为本身的复杂性,对学习者的在线学习行为进行分析的研究有相当大的意义和空间。

     

    1.2 国内外关于学业成绩预测的研究

     

          国外关于学业成绩预测的研究非常多,研究时期也比较早,从 2000 年开始,关于学业成绩预测的定量研究就已经开始大范围开始。学业成绩预测,需要依靠多学科来支持,特别是计算机科学与数学挖据技术,由于国外发达国家互联网发展比国内要早,关于这方面的研究自然要早些。国外的教学环境与国内的教学环境有很大区别,在国内,基础教育阶段,大多数采用的是传统的教学环境,利用信息系统较少。然而国外的基础教育已经经历了多个阶段的发展,从传统的教学环境到封闭式信息系统教学环境,再到开放式信息系统教学环境,到如今的新型教学环境如智能电脑,MOOC 等。随着教学环境的改变,教师对学生的评价方式、学生学业成绩的呈现方式都发生了大的改变。

          早在 1971 年,英国兰开斯特大学 Entwistle, N. J[3]等就对学生的学习动机、学习方法和考试技巧与学生学业成绩的关系进行研究。他们以 898 名大学生、562 名师范学院学生、190 名专职学院学生为研究对象,建立数据样本,通过多种心理学量表和标准化考试对这些学生进行测试,获得相关数据,根据这些心理学指标和测试成绩分数,分析他们之间的相关性,从而预测学生的学业成绩,对学生的学业成绩预测比较精准,达到了预测目的,为教师进行教学提供了很好的帮助。

    国外关于学业成绩预测的研究 20 世纪前期主要是基于传统的教学环境,研究对象大多是对高校学生进行相关研究。后期随着教育环境的改变,相关研究逐渐增多,研究对象层次也逐步扩大。随着计算机科学的发展,数据挖掘技术的不断更新,在教育领域的研究也更加深入,研究方法和手段变得多样化。国内关于“学业成绩”的研究相对国外并不多,研究的时间比较晚,从 2010 年才逐渐增多。关于“学业成绩”的研究主要涉及影响“学业成绩”的因素以及其他心理学概念与“学业成绩”的关系。

          国内关于“学业成绩”研究主要是研究“学业成绩”的影响因素,例如:学业成就、学业情绪、自我效能感、学习策略、成就动机、学习动机、学业评价、家庭社会地位等。易芳等认为中小学学生学业成绩的影响因素中有六个因素相关程度最大,其中学习动机和自我效能感对学业成绩的影响最大。姜涛认为学业成绩的影响因子有 34 个之多,例如学习信心、教师鼓励等,还发现 10 个学业成绩预测因子,并给中学教师提出了提高学生学业成绩

    关于学业成绩与其他影响因素以及其他心理学概念的关系的研究,国内关于学业成绩预测的研究并不多,主要可以包括两大类:第一类是对学业成绩预测的定性研究,第二类是对学业成绩预测的定量研究,通过建立预测模型来对学业成绩进行精准预测。

          第一类对学业成绩预测定性研究并不多,陈楠从心理学角度,在定性程度下,研究了显性自恋和隐性自恋与学生学业成绩的关系。陈玉佩通过对自我效能感的研究来预测学生学业成绩。

          第二类对学业成绩预测的定量研究相对较多。尤佳鑫等对学生在云学习平台积累的多种属性和过程性数据进行分析,建立了多元回归模型,并对在校大学生的学业成绩进行预测,并根据影响学生学业成绩的因素对学生进行教学干预。通过有针对性的教学干预,取得了较好的效果。罗敏等通过对空军招收飞行员的多项心理认知能力进行测试,并将测试分数与这些学生的高考成绩进行相关分析,建立多元回归模型。利用多元回归模型来预测未来空军招收飞行员的高考成绩。闻是之等基于对学生在一段时间内的测试成绩,运用灰色系统理论,建立了学业考试平均成绩的预测模型。综上可知,国内关于学业成绩预测的研究尽管也有不少,但是相较于国外,国内的研究时间相对较晚,研究的领域也都是对国外研究的跟进。通过学生以往的学业成绩数据来分析预测学生后续学习的学业成绩的研究则相对较少。

    • 第2章 相关理论及技术概述

    2.1 学业成绩概念

          学业成绩可看作是学生在完成一系列教学活动后产生的认知、行为、技能、情感态度的结果总和,常用的观测指标是最终成绩分数,这既离不开学生的学习准备和学习过程,也与学生的成果质量密切相关。

    2.2 学业成绩预测

          学业成绩预测作为学习预测中的主要内容,常与学习预警混淆,如表所示,对学习预警与学习预测进行了区分。学习预警是根据学习者的学习情况进行预测并警示,从中总结教育规律并进行解释,可以帮助教师进行干预监督,提高学生学习;而学业成绩预测是学习预警的前提条件,能为学习预警和调整教学策略提供重要依据。

     2-1 学习成绩预测与学习预警区别

          由此可见,学业成绩预测是在教学评价等理论的指导下,通过确定学业成绩预测因素,选取问卷量表、教务系统或在线教学平台等数据源,从中采集相应数据,运用预测算法来建立成绩预测数据模型,找出对学习成绩影响重大的变量,筛选出存在不同程度学习危机的学生,从而助力师生及时调整教与学的状态。

    2.3 学习分析

          当下,学术界对“学习分析”还没有严密的定义。多个机构或者个人都对其进行过界定下表显示其主要定义来源。首届学习分析和知识国际学术会议期间对其定义是测量、收集、分析和报告有关学生及其学习环境的数据,用以理解和优化学习及其产生的环境的技术[4]EDUCAUSE研究机构对其定义是利用数据和模型,预测学习者在学习中的进步、表现和发现潜在问题[5]G.Siemens教授认为利用数据挖掘成果,学习者产生的数据和分析模型探究信息和社会联系,并且对学习做出预测和建议[6]。新媒体论坛(NMC)的地平线报告认为学习分析松散地组合了一系列数据收集工具和分析技术,研究学生的投入情况、绩效和学习进展情况,以期及时将研究结果用于修订课程、教学和评估[7]。虽然在学习分析内涵上还未统一,但在方法与过程,即收集数据、分析数据和呈现数据是类似的;另外,如分析学习者的学习成效的模型框架通常是一样的。学习分析主要关注学习者的学习过程与学习发生的环境,通常是在已有的数据集上进行分析建模来解释,根据分析结果发现学习规律;或评估学习者的学习表现,为其提供相应反馈和干预从而促进更加有效学习。 数据挖掘的扩展到了不同的领域,如医疗、交通等等。而在教育领域的应用是与其他领域不一样的,因为人的学习是复杂的,不能只关注数据,研究者更应该关注到人。学习分析的内涵是在教育挖掘的基础上发展而来的,对其内涵的理解与延伸,主要应从教育领域的视角分析其要素与特征,才能将它更好地与教育数据挖掘区分开来。

    2.4 教育数据挖掘

          数据挖掘(DM)指从大型数据集中提取出有潜在价值的信息或模式的过程[8]。教育数据挖掘(EDM)指应用数据挖掘方法从与教育有关的数据集中挖掘出有意义的信息的过程,可为教辅人员、学习者、平台开发者和教育研究者等提供服务。2012 年,美国国家教育部发布了《通过教育数据挖掘和学习分析促进教与学》报告[9],报告列出了教育数据挖掘的四个研究目标,如下表。

     2-2 教育数据挖掘研究目标

         可见教育数据挖掘是以数据挖掘为基础的,可以理解为两个领域的结合,教育领域的发展需要数据分析领域的支撑。这也体现了对教育研究人员的新要求,要能用好教育过程中产生的各种数据。教育数据挖掘的出发点是数据,从数据中挖掘出我们认为有用的信息。近年来人工智能和智能教学的广泛应用,教育数据挖掘方法的应用成为研究重点。所以在挖掘方法的拓展和工具的开发,将会囊括多个领域,特别的在可视化应用方面的需求会成为主流。

    • 第3章 基于学习数据分析构建学业预测模型

    3.1 研究设计

    3.1.1研究问题与方法

          本文旨在基于教育数据挖掘探究预测分析 MOOC 学习者学业成绩。与研究目的相关的 2个子问题分别为:(1)预测学业成绩的关键行为指标有哪些?(2)哪些算法模型可用于学业成绩的分类预测,且准确度、适用性等预测性能较好? 在研究方法上,对问题(1)的研究采用相关分析法;对问题(2)的研究采用分类分析法。

    3.1.2 研究对象与数据编码
          本研究数据来源于中国大学 MOOC 平台的“信息化教学能力之五项修炼”课程项目。该课程于2017 年 6 月正式发布,截至 2020 年 12 月共举办了 9 期,每期历时 7 周。课程共 6 个单元,包括学习准备篇、备课篇、制作篇、授课篇、评价篇及发展篇。每单元需要学习者平均观看 12 个视频和浏览 5个文档,参与 3 ~5 次讨论。最终成绩由单元测验 (40% ) 、单元作业与互评( 10% ) 、课程讨论( 30% )和期末考试( 20% ) 加权而成。本文选取课程第一期和第二期( 2017 年 6 月—2017 年 12 月) 的学习者为研究对象,共 8 387 名。这些学习者的学习行为被平台系统记录下来后形成了数据集。“由于学习行为是在学习过程中发生的各种与学习相关的行为,且较为庞杂,所以将学习行为适当分类是对其进行深入研究和形式化表达的前提[10]。”交互是学习的基本方式,也是学习行为的主要表现形式,以交互的参与对象为标准,MOOC 学习者在学习过程中的行为数据可分为人机交互学习行为( 如学习者与学习内容或学习平台之间的交互) 和人际交互学习行为( 如师生之间的交互、学生之间的交互) 两类[11]。基于此,本文主要采集了学习者学习过程的行为数据,同时收集了其学习结果数据,并根据交互方式对行为数据进行分类,以此作为成绩预测的基础。各项数据字段信息的分类描述见表3-1。

    3-1 学习行为分类

    3.1.3 研究思路与技术路线

          本研究的基本思路如下: ( 1) 基于中国大学 MOOC 的系统后台,获取学习行为数据,并使用Notepad + + 工具、R 语言和 Excel 软件对原始数据进行预处理与格式化,包括数据的清理、集成、归约及变换等工作,并提取参与考核与各项交互学习的行为数据; ( 2)运用相关分析法对 MOOC 学习者的行为特征进行分析,解析各类学习行为之间以及学习行为与学业成绩之间的复杂相关性,进一步确定对学业成绩具有显著影响的行为指标; ( 3)基于筛选出的行为指标,选定人工神经网络、贝叶斯、决策树和支持向量机 4 种算法对 MOOC 学业成绩进行预测,并根据准确率、精确率、召回率和 F1 值等指标综合评价 4 种算法的预测效果,以更好地拟合学习行为与学业成绩之间的相关关系,发现具有潜在学业风险的学习者。

    3.2 研究过程与结果

    3.2.1 数据筛选及预处理

          本研究选取的数据集中共包含 8 387 名学习者的学习行为和成绩的详细信息。在原始数据集中,存在大量重复、冗余和具有缺失值的字段信息,严重影响了数据挖掘的准确性和有效性。因此,我们事先使用 Notepad + + 工具、R 语言和 Excel 软件对这些数据进行了预处理,包括清理、集成、归约及变换等工作,以保证后续分析的效率与精度。需要说明的是,从两期学业成绩和学习行为的数据分布来看,本课程辍学率颇高,约 70% 的学习者几乎没有参与过课程活动或只在开课初期学习了极少内容。显然,这一类学习者的学习动机不强,属于无效学习者或未参与者,其学习数据的研究意义不大,已在预处理过程中剔除。在过滤掉无效学习者后,本研究选取了对各模块学习活动均有参与的学习者的相关数据,共获得有效样本 2 486 条。另外,为保证各项学习数据衡量标准的统一,我们对这些数据进行了归一化处理,避免了数据类型和单位等属性的差异,并将数值的取值范围限定在[0,1]这一区间之内。

    3.2.2学习行为与学业成绩的相关性分析

          在数据筛选和预处理的基础上,本研究提取了 11 项学习行为指标,包括学习者提交作业频次、参与测验频次、参加考试频次、浏览公告频次、浏览评分标准频次、在线学习时长、观看教学视频频次、浏览教学文本频次、发表主题帖频次、浏览主题帖频次和评论主题帖频次。接着,使用皮尔逊相关分析法对上述所有学习行为之间以及学习行为与学业成绩之间的关系进行分析,得到的相关系数矩阵见表3-2。

    3-2 学习行为与学业成绩相关分析矩阵

    : **表示在 0. 01 水平上显著相关

          根据分析结果可知,上述 11 项学习行为与最终成绩之间均呈现显著相关关系。其中,在线学习时长、浏览公告次数、参与测验次数、参加考试次数、浏览评分标准次数和观看教学视频次数与总成绩的相关系数均在 0. 5 以上,说明这些学习行为与学业成绩之间存在强相关性; 浏览教学文本次数和提交作业次数与学业成绩的相关系数在 0. 2 到 0. 5 之间,说明这两项学习行为与学业成绩之间的相关性较弱; 发表主题帖次数、浏览主题帖次数和评论主题帖次数与学业成绩的相关系数均低于 0. 2,说明这 3 项学习行为与学业成绩之间的相关性最弱。

    各项学习行为之间亦具有显著相关关系。在线学习时长与其他大部分学习行为( 除发表主题帖次数之外) 之间均存在强相关关系,说明学习者的学习活动主要集中在视频学习、资源浏览、公告查询、作业提交与互评等方面,比较符合 MOOC 学习的一般特征与基本规律; 参与测验次数、参加考试次数与提交作业次数之间存在强相关关系,浏览公告次数和浏览评分标准次数之间存在强相关关系,观看教学视频次数和浏览教学文本次数之间存在较强相关关系,说明参与考核行为、界面交互行为和内容交互行为内部具有较强相关性; 在人际交互行为中,评论主题帖次数和浏览主题帖次数之间具有强相关性,但二者与发表主题帖次数之间的相关性较弱,说明学习者主动思考、提问或参与讨论的积极性不高。

    3.2.3学业成绩的分类预测与算法评估

          目前,数据挖掘领域常用的分类算法有人工神经网络、朴素贝叶斯、决策树和支持向量机等。本研究选取上述 4 种主流算法对学业成绩进行分类预测,以判断学习者最终成绩的所属类别。具体思路为: 以 60 分为阈值将学业成绩分为及格和不及格两类,同时将数据集中的 2 486 条有效样本随机分为训练集( 60% ) 和测试集( 40% ) ,并选取上述 11 项行为指标作为输入变量,运用 Python 程序设计语言,嵌入以上 4 种算法,分别对学习者的学习情况进行分类预测( 及格或不及格) ,结果见表3-3。

    3-3 不同分类器的预测结果

          本研究选取了准确率、精确率、召回率和 F1 值等指标( 见表 3-4) ,对以上算法模型的性能进行综合评估,以更好地拟合学习行为与学业成绩之间的复杂关系,发现具有潜在学业风险的学习者。由表 4可知,在综合考虑各评估指标的基础上,通过人工神经网络算法得到的分类器的性能最好,其预测的准确率为 0. 889,召回率为 0. 883,F1 值为 0. 870,在所有分类算法中皆为最高,尽管其精确率略低于贝叶斯和支持向量机,但在 0. 85 以上。相对而言,其他 3 种算法的预测效果不甚理想,在各评估指标上的数值分布也不均衡,不能很好地满足教育教学的实际需求。需要说明的是,由于课程性质、教学情境和行为指标不同,基于不同数据集构建的算法模型性能可能不同。在本研究使用的数据集中,人工神经网络算法的分类效果最好,但在其他数据集中未必如此。不过,算法模型的构建过程、比较方法与评估指标可在其他研究情境和教学实践中进行迁移。

    3-4 算法模型的评估指标

    : TP( True Positives) 指被正确地划分为正例的个数,即实际为不及格且被分类器划分为不及格的实例数;

    FP( False Positives) 指被错误地划分为正例的个数,即实际为及格但被分类器划分为不及格的实例数;

    FN( False Nega-tives) 指被错误地划分为负例的个数,即实际为不及格但被分类器划分为及格的实例数;

    TN( True Negatives) 指被正确地划分为负例的个数,即实际为及格且被分类器划分为及格的实例数.

     

    3.3 研究结论

          本研究以中国大学 MOOC 平台的课程数据为分析对象,运用教育数据挖掘的研究方法,探索了能有效预测 MOOC 学习者学业成绩的关键行为指标与 4 种算法模型,并对学习者的群体学习特征与行为模式进行了分析,主要结论包括两方面。

    第一,在学业成绩与学习结果的预测指标方面,有 4 类共 11 项学习行为与学业成绩之间存在显著相关关系,可作为 MOOC 学习成绩预测与学业预警的关键指标,分别是界面交互行为( 在线学习时长、浏览公告次数和浏览评分标准次数) 、内容交互行为( 观看教学视频次数和浏览教学文本次数) 、人际交互行为( 发表主题帖次数、浏览主题帖次数和评论主题帖次数) 和参与评价行为( 参与测验次数、参加考试次数和提交作业次数) 。综合考虑各项学习行为与学业成绩之间的相关系数和学习群体特征的聚类分析结果,在线学习时长、浏览公告次数、浏览评分标准次数、观看教学视频次数、查看教学文本次数、参与测验次数、参加考试次数和提交作业次数 8 项指标的参照价值相对较高。

    第二,在预测算法方面,综合准确率、精确率、召回率和 F1 值4 种评估指标,人工神经网络算法的性能优于朴素贝叶斯、决策树与支持向量机 3 种算法,能够更好地拟合学习行为与学业成绩之间的复杂相关性。但由于算法特性、数据样本、预测指标和分类类别等方面的差异,需要根据不同的教学研究与应用情境选择合适的算法进行分析。

    3.4 教学策略与干预措施

    1.优化课程内容设计,提供丰富、多样且有价值的内容资源

          在线学习时长、浏览公告次数、观看教学视频次数、浏览教学文本次数和参与考核次数等行为指标综合反映了学习者的学习动机、学习兴趣、学习效率和学习效果,体现了课程内容对学习者的吸引程度以及课程内容与学习需求、知识基础和学习风格的匹配程度。对于具有辍学风险的学习者,如果他们在线学习时间较长,观看教学视频( 或文本) 次数、浏览教学公告次数和参与测验次数较多( 或其中部分行为比较频繁) ,表明其知识基础较薄弱,很可能无法完全理解和掌握学习内容的重、难点,学习效率低下,效果不佳。如果他们在线学习时间较短,相关学习行为的频次较低,则表明其学习动机不强,学习需求不高或对教学视频的接受程度不高。

    为此,需要优化 MOOC 内容设计,为学习者提供多样化的内容资源,力求从课程内容和资源的价值、质量、种类及难易程度等方面激发其学习兴趣与内在动机。首先,可以将学术研究和专业实践的优质成果融入教学内容,并加以合理组织,确保课程内容的前沿性与知识结构的逻辑性。其次,对学习者的学习需求和风格偏好进行个性化分析,为其推送多样化且针对性强的学习资源。例如,为学业导向的学习者( 如大学生) 提供学术性较强的视频资源,为职业导向的学习者( 如在职人员) 提供应用性较强的视频资源。再次,针对学习者的知识基础和能力起点,开发难易程度不同的教学资源。例如,为成绩优秀的学习者提供拓展性学习资源,促进其深层次学习,为成绩欠佳的学习者制作通俗易懂、容易理解的视频资源,或根据课程进度为其提供补充性资源或知识链接。

    2.创新教育教学方式,促进个性化深度学习

          在线学习时长、浏览帖子次数、发表帖子次数和评论帖子次数等行为指标综合反映了学习者进行主动探究、思考问题、参与合作和开展讨论或评论等深度学习活动的积极性。如果辍学者在讨论区提问次数较多,表明课程难度较大,他们在学习过程中存疑颇多; 如果辍学者或其他学习者参与讨论次数较少,表明他们参与讨论、协作与互评等交互学习活动的积极性不高或课程缺少相关任务设计。

    为此,应将 MOOC 平台及各种数字化学习工具结合起来,创新教育教学方式,通过灵活的教学设计和有组织的任务活动,为学习者提供多元学习路径,引导他们积极开展自主学习、探究学习与协作学习,维持学习进程,提升学习绩效,满足个性化深度学习需求,使其能学、会学。例如,以“任务驱动”和“问题解决”为主线,在视频教学的基础上,结合教学重、难点,设计研究性学习活动,为优秀型和良好型学习者创设科学、真实、复杂、开放的问题情境或学习任务,使其能够围绕研究问题构建学习共同体,开展深度交互,整合不同观点、意见与思路,探索问题解决方案,进一步提升知识水平与高阶思维能力; 充分利用在线学习社区化、点对点互动和直播教学的优势,定期开展直播教学或专项辅导,通过集中讲授、个别化指导和师生一对一讨论,及时帮助普通型和风险型学习者解决学习困惑及疑难问题,促进其对课程内容的深入理解。

    3.注重发展性评价,提升学习效果,促进认知发展

          参与测验次数、参加考试次数、提交作业次数、浏览帖子次数、发表帖子次数和评论帖子次数等行为指标综合反映了学习者对教学评价的态度和课程评价促进学习者发展的程度。通过聚类分析可知,在本研究使用的数据集中,学习者在整体上呈现“参加测验和考试频次较高,参与论坛讨论和作业互评频次较低”的特征,体现了他们重视结果评价而非过程评价,重视考试分数而非互评结果。然而,有意义的在线深度学习过程应是能够促进学习者认知发展的过程。鉴于此,需要变革以甄别为目的的评价方式,建立发展性课程评价体系,通过质性评价、数据化评价和思维可视化评价的有机融合,发挥评价的发展功能,正确处理教与学的关系,促进学习者知识建构与认知发展,使其学得有意义。首先,在多元评价理念的观照下,尝试融入档案袋评价和表现性评价等质性评价方式,引起学习者对其学习过程和发展价值的重视。其次,运用数据挖掘、学习分析与人工智能等现代信息技术构建智慧化评价环境,通过多通道互动实现对学习数据的自动获取和全面采集,实时监控学习者的学习进程,以便及时了解他们的学习效果和行为特征,精准把握其实际学习情况,有针对性地提供个性化反馈与教学干预。再次,引入思维分析工具( 如思维导图、知识图谱等) 对学习者的知识结构与学习路径进行可视化分析,有效诊断其最近发展区,评估他们的发展潜能,更好地实施因材施教,促进个体发展。

     

    • 第4章 总结与展望

    4.1总结

          党的十八大以来,我国出台了多项相关政策,加快了教育信息化的进程,为推动教育数字化转型发挥了积极作用。教育部高等教育司发布的 2022 年工作要点中提出要全方位推进高等教育的数字化,通过“智慧高教”提升教育发展质量,构建“数字化、中国特色、高质量“的教育体系,建设“全民学习、终身学习”的学习型社会。国家智慧教育平台“爱课程”和“学堂在线”的上线,是教育数字化战略行动的阶段性成果,为素质教育的发展注入了新的动力,深化了新时代的教育教学改革。结合在线教育平台中行为数据具有多样性、分散性等特点,深入分析学习行为数据则成为全面掌握学习者学习规律、合理划分学习风格、精准预测学习效果的关键。通过分析挖掘学习行为数据,并且借助数据挖掘技术来对学习者进行风格分类、成绩预测等研究,发掘其中隐含的问题,可以为在线教育平台的高效教学提供科学依据,进一步可为教育者、学习者、技术人员提供精准教学反馈,提高效率。

    本文主要做了以下工作:

    1)首先阐述了论文的研究背景及选题意义,通过前期文献综述的撰写进一步了解国内外有关学业成绩预测的研究现状。

    2)阐述了学业成绩预测及学习分析、相关理论,以及数据挖掘的定义、教育数据挖掘定义。这些理论为后续研究提供了理论依据,也为学业成绩预测后续分析奠定了基础。

    3)基于 MOOC 数据对有效预测学习者学业成绩的行为指标及算法模型和教学干预策略进行了探究。

    4)基于分析结果提出优化教学策略与干预措施。

    4.2展望

          通过网络实现的教育过程,不要求师生在时间和空间上严格同步,学生极易形成松散的学习心态。而学业成绩是评估和检验在线教学质量和成效的核心要素,它能将学生的学习结果进行有效量化,一方面直接体现出学生对知识技能的掌握程度,另一方面间接表现出教师的教学水平。因此,通过对学习过程中的相关数据与学习成绩建立预测模型,来预测学生的成绩,已逐渐成为在线教育中的迫切诉求。通过学习成绩预测,不仅可以诊断学情,促进在线教与学的和谐共生;也可以服务教学,促进实施个性化的干预预警机制,为更多学习者创造更加个性化的学习体验。

    • 参考文献

    [1]祝智庭,郑浩,许秋璇,吴永和.教育数字化转型的政策导向与生态化发展方略[J].现代教育技术,2022,32(09):5-18.

    [2]Liyanagunawardena T R,Parslow P;Wiliams S.Dropout:MO0C Participants' Perspective[C]//Emoocs 2014:The Second Mooc European Stakeholders Summit,10-12th February 2014,Lausanne,Switzerland,2014:95-100.

    [3]Entwistle N J, Nisbet J, Entwistle D & Cowell M D. The academic performance of students: I. Prediction from scales of motivation and study methods [J]. British Journal of Educational Psychology, 1971, 41(3): 258-267.

    [4]Bakharia, A, & Dawson, S. SNAPP: A bird’s-eye view of temporal participant interaction [C]. [2011-11-16].  the  1st  International  Conference  on  Learning  Analytics  and  Knowledge: http://lak12.sites.olt.ubc.ca/.

    [5]Retalis, S., Papasalouros, A., Psaromiligkos, Y., Siscos, S. and Kargidis, T. Towards networked learning  analytics  –  a  concept  and  a  tool.  Proceedings  of  the  5th  International  Conference  on Net-worked Learning, Lancaster, UK[DB/OL]. 2011-12-10 .http://bit.ly/jiPDwR.

    [6]G. Siemens, What is learning analytics[EB/OL] . http://www.elearnspace.org/blog/2010/08/25/w hat-are-learning-analytics/,2011-11-20.

    [7]NMC. The Horizon Report 2011 Edition[EB/OL] . http://wp.nmc.org/horizon2011/sections/learn ing-analytics/, 2011-11-20.

    [8]JiaweiHan, MichelineKamber, JianPei.  数据挖掘:概念与技术[M].机械工业出版社,2012.

    [9]Enhancing  Teaching  and  Learning  through  Educational  Data  Mining  and  Learning  Analytics [DB/OL] . [2012-10-12] . http://www.ed.gov/edblogs/technology/files/2012/03/edm-la-brief.pdf.

    [10]彭文辉. 网络学习行为分析及建模[D]. 武汉: 华中师范大学,2012: 89.

    [11]范逸洲,刘敏,欧阳嘉煜,等. MOOC 中学习者流失问题的预测分析: 基于 24 篇中英文文献的综述[J]. 中国远程教育,2018( 4) : 5-14,79.

    • 标签:
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部