• 可解释性网络学习资源进化预警技术研究

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 1 引言

    2   

    网络学习资源是“互联网”+教育体系的核心要素。《中国教育现代化 2035》提出:“创新教育服务业态,建立数字教育资源共建共享机制”。《教育信息化 2.0行动计划》提出:“引入‘平台+教育’服务模式,整合各级各类教育资源公共服务平台和支持系统……建成国家数字教育资源公共服务体系”。此次新冠肺炎疫情对各级各类教育系统都产生了巨大冲击,凸显出海量网络学习资源进化不足导致的质量不佳与个性化缺失问题的严重性。如何供给满足多元化需求、吸引用户使用和参与建设、可持续演化发展的高质量网络学习资源,既影响国家教育信息化战略的推进,也是网络教育研究中长期存在的关键性问题。网络学习资源群体进化预警的关键技术研究,不仅在创新预警技术方面具有科学意义,同时具有广阔的应用前景,能够有力支撑国家教育资源公共服务体系的高质量建设,提升全国各地智慧教育云平台中大规模网络学习资源的管理效能,为全民终身学习提供更加优质的学习资源服务。可解释人工智能(Explainable AI, XAI)是以可理解的方式向人类解释,并呈现智能系统行为与决策的新一代人工智能, 其目标是使用户能够理解和信任机器学习算法所产生的结果和输出,使人工智能系统具备类人化的解释能力,建立起人与机器之间信任的桥梁,进而形成人工智能、社会科学、认知心理、人机交互多领域研究的融合交叉。在教育领域,知识产品将直接应用于人类学习,透明度、可解释和可信任是确保教育系统和学习者之间建立成功联系的重要纽带。可解释性的网路资源预警技术是促进网络学习资源优化的有效手段。

     

    • 2 相关研究

    2.1 网络学习资源进化预警研究

       前网络学习预警研究主要采用数据挖掘技术来实现。研究者们通过整合学习者的背景信息、过去的学习成绩以及当前课程学习的过程性数据,选择适合的数据挖掘方法,比如预测/分类、聚类、关联分析、时间序列分析等,进而构建学习预警模型,以实现课程成绩预警、学业表现预警与辍学预警。随着人工神经网络技术的快速发展及其在教育领域的拓展应用,采用神经网络模型开展在线学习成绩预警的研究也日渐增多。例如,李景奇等开发了基于 BKTBayesian Knowledge Tracing)的网络教学跟踪评价模型,可以实现网络学习的成绩预测与预警;Yang 等使用在线视频学习行为数据训练了一个时间序列神经网络,用来对 MOOC 学习者的成绩进行动态预警;陈晋音等基于在线学习行为特征数据,提出了一种基于 BP 神经网络的学习成绩预测方法。除了研究在线学习成绩预警外,有学者开始关注网络学习过程中的情绪与情感状态监测及其预警。例如,Fei MOOC 平台中的课程论坛交互文本数据为样本,融合 Word2vec 模型与机器学习算法构建了学习者情感分类器,用于预测 MOOC 学习者的情感变化;Wang 等利用语义分析模型来跟踪在线学习者的情感倾向,并通过情感量化机器学习方法构建了学业预警模型,能够及时发现无法正常完成学业的学生;还有学者结合情感分析技术,建立机器学习模型,识别在线学习者的抑郁、焦虑等心理状态,进而开展多层面的心理预警。总体来看,网络学习预警研究呈现出从认知层面到非认知层面、从经典数据挖掘算法到神经网络算法不断拓展和升级的趋势。

    2.2 可解释性人工智能在网络学习中的应用

      机器学习模型可解释性总体上可分为事前ante-hoc可解释性和事后post-hoc可解释性其中,ante-hoc可解释性指通过训练结构简单、可解释性好的模型或将可解释性结合到具体的模型结构中的自解释模型使模型本身具备可解释能力.post-hoc可解释性指通过开发可解释性技术解释已训练好的机器学习模型.根据解释目标和解释对象的不同,post-hoc可解释性又可分为全局可解释性(global interpretability)和局部可解释性(local interpretability全局可解释性旨在帮助人们理解复杂模型背后的整体逻辑以及内部的工作机制局部可解释性旨在帮助人们理解机器学习模型针对每一个输入样本的决策过程和决策依据

           Gabriel Novillo Rangone提出了运用可解释机器学习进行教育数据挖掘;黄昌勤基于学生的答题记录运用可解释性机器学习对学生进行知识追踪;卢宇利用lrp算法解释基于循环神经网络的DLKT模型;胡钦太利用贝叶斯网络对复杂教学环境中的多模态学习行为分析进行可解释研究。可解释性人工智能技术也已经嵌入到一些实际教学应用当中。C.Conati开发的ACSP自适应智能导师系统,系统使用了具有自解释机制的可解释方法,提供了一系列交互性解释性界面,会给出为什么得出该判断的理由、预测的原因以及对学习者的分数计算规则;Barria-Pineda设计实现了基于学习者特定目标的学习推荐系统,并对推荐结果给出了解释, 当鼠标悬停在推荐的学习活动上时,会向学习者显示说明,并给出视觉形式和文本形式两种解释M. Afzaal将学习分析技术与可解释的机器学习相结合 提供自动和智能的可操作的解释性反馈支持学习者以数据驱动的方式进行自我调节学习

     

     

     

    • 3 网络学习资源进化预警模型建构

       网络学习资源群体进化预警模型开发主要包括两项任务:①根据学习者的评论数据和版本迭代数据,对网络学习资源下一时刻有可能出现的进化状态进行估计,如果网络学习资源有可能进入衰退态或者死亡态,模型发出预警提醒;②针对处于预警的网络学习资源,探究其处于衰退态或者死亡态的原因,方便学习资源建设者或管理者对网络学习资源进行再优化。目前,网络学习资源群体进化预警模型主要存在三大挑战:①网络学习资源包括电子文档、词条、微课、动画等多种形态,进化过程中还会不断产生各种类型的数据,这些多模态数据如何有效融合来对资源进化状态进行评估?②网络学习资源所蕴含的关联网络层次信息能否融合于进化预警模型之中?③当网络学习资源有可能处于衰退态或者死亡态时,其原因是什么?能否根据网络学习资源的评论数并由模型自动给出预警原因分析?

       首先,针对挑战①中的多模态网络学习资源进化状态估计问题,我们将多模态网络学习资源的进化要素项数据,作为网络学习资源群体进化预警模型的主要输入特征。其次,针对挑战②中的关联网络层次信息融合于预警模型问题,我们设计双曲图网络神经结构作为其特征表示,因为双曲图网络神经结构具有较强的图结构层次信息保存能力。最后针对挑战③中预警原因自动分析问题,我们设计双向的双曲门循环单元(Bi-hyperbolic GRU)和条件随机场(CRF)结合的结构,提取网络学习资源负面评论数据中的关键词,形成词云,作为自动的预警原因分析解决方案。此处设计 Bi-hyperbolic GRU 结构,是为了更好地抽取评论信息中的关键词信息,而 CRF 则可以使得模型的关键词标注更加符合认知的规律。整体模型结构如下图所示。

    • 4 网络学习资源进化预警模型应用

    4.1评论数据的前期整理

       将前期工作已经标记的学习元平台相关的学习者评论数据,进行清洗、去重、标记整理后,作为网络学习资源群体进化预警模型的数据层。数据层样式如上图图输入层所示,数据包括网络学习资源进化要素信息、网络学习资源关联网络信息和网络学习资源学习者评论数据信息。数据的标记分别表示[-1]表示进化状态分类标记,即某一时刻网络学习资源的真实进化状态,真实进化状态分为:死亡态(-2)、衰退态(-1)、初始态(0)、成长态(+1稳定 态(+2);②评论数据的关键词标记基于 BIO 标注体系,B-EVA 表示评价关键词开始,I-EVA 表示评价关键词连续,B-ATT 表示评价态度关键词开始,I-ATT 表示评价态度关键词连续,O 表示不是关键词。

    4.2预警模型之进化状态估计

       网络学习资源预警的挑战之一是多模态的数据表示融合问题。我们分别使用独热码(One-Hot)方式、双曲图神经网络方式以及 Word2Vector其主要过程为:①将关联网络表示为三元组的形式作为输入;设计嵌入矩阵矩阵每一行表示节点的相邻节点信息。嵌入矩阵将每个节点通过 LOOKUP 的方式转化为低维向量,②通过隐藏层的方式将嵌入向量实现非线性降维;③将隐藏层的输出向量输入到双曲距离计算公式中,计算两节点之间的双曲距离;④将双曲距离映射到欧氏距离;⑤计算损失函数,使得相邻节点的距离小于非相邻节点的距离。最终将网络学习资源进化要素特征、网络学习资源关联网络信息特征以及网络学习资源学习者评论数据特征进行合并,作为进化状态估计的特征表示,经过双曲映射之后,输入到双曲前馈神经网络中,得到进化状态估计值yt

    4.3预警模型之原因分析

       网络学习资源进化预警的挑战之一为资源处于衰退态的原因分析。我们设计 Bi-Hyperbolic GRU+CRF 结构,抽取评论数据中的负面情感评价关键词以及建设新意见关键词,以词云的形式呈现给网络学习资源建设者,帮助他们更好地改进网络学习资源,以实现网络学习资源的不断进化。为了更好地提取关键词信息,我们设计 Bi-Hyperbolic GRU 结构。Bi-Hyperbolic GRU+CRF 模型主要步骤为:①对已经基于 BIO 标注体系的标注数据,进行特征的表示;②重新表征后的特征再输入 Bi-Hyperbolic GRU,使用Bi-Hyperbolic GRU 可以有效地提取语句上下文的信息,更精准地抽取关键词;③ 经过 Bi-Hyperbolic GRU 中前向 GRU 和反向 GRU 提取的特征进行合并,作为随机条件场(CRF)的输入;④ 最终 CRF 通过公式,求解每个词属于某种标记的概率关键词云就是将模型预测的最大概率值的情感偏向关键词输出。

    4.4模型的训练和应用

       为了更好地训练模型,得到最佳的模型参数,本项目拟根据中文维基百科、百度百科等词条预训练词向量,获得较全面准确的词向量分布。最终为了更好地探究预警模型运行的可行性和应用效果,我们还将把上面设计的网络学习资源群体进化预警模型,部署到学习元平台实际运行一年,观察在现实世界中,模型运行的稳定性和预警的准确性,以便为网络学习资源预警技术的推广积累宝贵的经验。

    • 标签:
    • 网络学习资源预警技术
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部