• 教育知识图谱的应用

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 前言
      近年来,随着互联网+教育模式的普及,教育领域逐渐积累了海量具有应用价值的教育数据。但不同来源的教育数据之间结构不同,没有建立起相应的联系,难以直观地服务于教学参与者,迫切需要人工智能、大数据等新兴技术采集并处理相关的教育数据,为教师、学生和家长群体提供智能服务,持续促进教育应用的智能化。知识图谱作为人工智能技术在知识工程方面的代表,能够有效地处理和分析数据,重构知识之间的联系,为数据决策或者分析提供支持。在2019年的“全国教育信息工作会议”上,知识图谱和深度学习、大数据一起被列为智能教育时代下的重点研究内容,针对教育知识图谱的研究也成为了教育技术的研究热点。教育知识图谱能够基于教学过程中产生的教学数据和资源,对不同学科的多层次知识结构进行准确地表征,为教育教学对知识的建模提供可能性。多模态资源区别于传统的单一媒体资源形式,泛指教学过程中产生的大量文本、视频、音频以及图片信息。结合多模态资源,能够在知识挖掘的过程中丰富知识的特征表示,提升教育信息挖掘的准确程度。同时,通过教育知识图谱对大量无序的多模态资源进行处理,能够有效地破解多模态资源汇聚融合的难题,对于生成个性化学习路径、教育资源推荐等智能教育应用具有极大的意义。 
    • 10.3.1智能问答
    10.3.1.1智能问答的发展
      智能问答是自然语言处理中的重要分支,通常以一问一答的人机交互形式定位用户所需知识并提供个性化信息服务。它能让计算机自动并以精准自然语言形式回答用户所提出的问题且不同于搜索引擎。
      如表1所示,智能问答的历史可以追溯至1950年,计算机科学之父阿兰·图灵为了检验计算机是否具备精准应答问题的能力,提出机器能否思考的判断方案——图灵测试,自此翻开了自然语言人机交互的篇章。20世纪60年代前后,首批问答系统问世,Green等人设计的Baseball程序可用普通英语回答有关棒球比赛的问题,1971年月球科学大会上,LUNAR系统首次亮相,它可以回答月岩样本分析的相关问题,但这一时期的QA系统只停留在处理领域结构化数据层面上。20世纪70年代前后,语言学的兴起、马尔科夫假设等理论的提出、数据库构建成本降低,使得问答系统构建难度也因此而降低。该时期的问答系统集成自然语言处理、知识表示等方法分析用户问题,耶鲁大学开发的SAM系统便是这一时期的产物,它引入计划的概念并使用脚本来理解问题,但是其缺点在于脚本未就绪则系统将无法工作。20世纪90年代,计算机运算能力提升,基于机器学习的自然语言处理诞生,智能问答进入了开放领域、自由文本时期。智能问答研究热点转向基于大规模文档集的问答、研究领域从限定领域延展至开放领域,研究对象从固定语料库延伸至互联网。2002年,密歇根大学开发了一个支持多语言的WQA系统,用户可以使用多语言提问。同时期有影响力的问答系统还有Webclopedia、LAMP等。
       2009年,WolframResearch公司推出的WolframAlpha在线自动问答系统能给出答案与答案相关的所有信息,这一时期的系统越渐成熟,涵盖多领域多语言的知识数据,配有相应的可视化界面。当2011年IBM公司研发的“沃森”在美国知识竞赛节目《危险边缘》中战胜两位顶尖人类选手后,基于深度学习的智能问答再次成为研究热点。
    表1智能问答项目
     
    10.3.1.2基于知识图谱的问答系统
      近年来,随着知识图谱概念渗透到各领域,基于知识图谱的智能问答逐渐成为焦点之一,在金融、医疗、旅游、农业、电商等垂直领域,都不乏相关研究,例如李贺等人构建的基于疾病知识图谱的问题系统,杜泽宇等人的电商知识图谱的问答系统,由于医疗和电商等领域对该类系统的需求较大,因此完善程度也较好。这些基于知识图谱的问答系统,或利用当中的知识数据结合深度学习构建问答系统;或利用图谱的推理能力理解问题;或融合问题与三元组的信息编码至向量空间,在向量空间内完成问题相关的相似度计算任务,得出用户所需近似答案。归结基于知识图谱问答系统的构建方法有3种,即语义解析(semanticparsing,SP)、信息检索(informationretrieval,IR)、向量建模(vectormodeling,VM)。学术界有一种说法称主流方法只分为语义解析和信息检索,只是近年来将深度学习应用于两种传统的方法,更将VM归结一种类似IR的方法。在该领域,一些研究者旨在深入研究KBQA的子任务,例如问题实体检测、关系抽取、多跳推理等,一些研究者则研究整体的通用框架,如Pei等人设计基于TransE的中文领域知识图问答通用框架,涉及多模型融合。本文以这些任务中使用到的关键技术为侧重点对该领域技术现状以及展开阐述。
    10.3.1.3问答数据集
      研究KBQA离不开数据集,而不同数据集通常针对不同QA任务,包括简单问题和复杂问题。一些研究者为达成研究目的还需要扩充公共数据集或独自构建数据集,如Miller等人为了验证其网络功能而提出MovieQA数据集。但大多数研究者会选择使用公共基准数据集,既省去构建时间而专注于算法模型的设计,又便于对比同类模型。而人工标注数据集往往需要高成本人力物力,因此数据集的构建者会使用模版构建问答数据集,但仅使用模版生成问题的数据集缺乏多样性,而缺乏多样性的数据集作为训练数据时通常会降低模型对复杂问题的泛化能力,因此近年来数据集的构建者会以构建高质量数据集为目标。本文归纳整理了近些年来具有代表性数据集,如表2所示。从体量上看,数据集的规模已从千级别扩展至百万级别,其中含有复杂问题的数据集体量往往较小。从基于的知识库看,早期数据集一般基于Freebase构建,2016年Freebase被收购后,KGQA数据集大多基于Wikidata和DBpedia。近3年,数据集的问题焦点放在了多样性、SPARQL以及推理过程上。考虑到以往的数据集很少有推理过程,2021年,Shi等人基于Wikidata数据加入推理过程构建KQAPro,它包含了多样的简单问题与复杂问题,且保证了其规模与质量,无疑是近年来高质量的数据集之一。
    表2基于知识图谱的问答数据集
    10.3.1.4构建方法
      本节对目前主流的基于模板的语义解析方法、基于语义查询图的方法、基于编码解码的方法进行介绍,并对其进行归纳总结如表3所示。基于模板的语义解析方法其核心在于模板于规则的制定、语义查询图的核心在于如何用语义图来表示自然语言的句子结构、编解码的方法的核心在于构建编码模型捕获句子特征、基于检索的方法其核心在于句法的信息如何映射为特征图或句子特征转为空间向量。
    表3构建方法对比分析
     
      语义解析方法是一种语言学方法,其思想是将非结构化的自然语言问题映射为一系列结构化逻辑形式,例如语义图和高级查询语言(如SPARQL,Cypher等)。而基于模版的语义解析方法其思想在于将问题先转换为人为预定义的规则或模版,再转换为可执行的查询。如图1所示,输入的问题首先被映射为逻辑形式,该过程通过预定义模版规则进行映射,得到实体与关系,再进一步转化为图数据库的可执行查询得到知识图谱中的相应的答案。本文归纳整理了近年来在这方面的研究如表4所示。
       基于模板的语义解析方法其核心在于模板的构建其优点在于过程清晰可解释性强但此类方法需要结合语言学的知识无论是自动或半自动的构建方案都需要一定的工作量
    图1基于模板的语义解析流程
    表4基于模板的语义解析方法的研究
     
    • 10.3.2知识检索
    10.3.2.1知识检索的定义
      知识检索由情报检索、信息检索和文献检索衍化而来,指“通过对检索对象语义层次上的标引,提高查全率和查准率”(《计算机科学技术名词》第三版),“从知识资源或知识库中,按照一定的方式和技术,并根据用户的需求找出相关知识的过程”(《管理科学技术名词》第一版),或“一种基于知识组织体系,能够实现知识关联和语义检索的智能化的检索方式”(《图书馆·情报与文献学名词》第一版);在辞书学中,检索这一概念通常对应search和access两个术语,前者指利用检索词(search word)查找特定信息的过程,后者指辞书中的信息能被相对便捷地查检到(relative ease with which information can be located)。为进一步明晰知识检索的概念,使其适用于专业词表尤其是术语词典编纂研究,我们有必要对知识检索进行定义。
      知识检索以知识为研编对象。对知识的第一种理解维度源于哲学认识论,侧重波普尔“三个世界”理论中的“世界3”,即相对于“主观知识”的“客观知识”。达尔伯格认为,知识可分为知识因子(knowledge elements)、知识单元(knowledge units)等四个层次,我国知识组织研究奠基者王知津等将这种知识表述为由众多“知识因子”和“知识关联”组成的“网状结构”;辞书学将词目承载的知识分解为各类信息范畴(information categories);专科词典是特定“学科领域知识体系化语言表达的结果”,Henning Bergenholtz和Sven Tarp将专科词典中的知识分为语言知识和百科知识及其子类。第二种理解维度源于信息/知识管理领域,以DIKW模型为代表,指相对于数据、信息乃至智慧的知识。其中,信息是经过结构化加工后带有意义的数据,而知识被视为经过加工后可“被利用”、“助于产生新信息”或带有判断的信息(information with judgement)。结合研究对象特点,本文侧重第一种解释,将知识检索的对象视为术语词条承载的各类客观知识。
      知识检索以检索为研编活动。检索有广狭之分,广义的检索“对信息工作者而言”,指信息/情报存储与检索,“通过建立检索系统来解决文献查找问题”;狭义的检索“对用户而言”,仅包括广义检索的“后半个过程”,即“信息查检”。结合研究对象特点,本文侧重广义检索中的检索系统设计和评价研究,突出学科领域专家在术语分析中的作用。
    10.3.2.2 知识检索功能框架
      根据上述对知识检索的定义探讨,面向专业词表尤其是术语词典的知识组织功能性研究以对专业知识体系及其构成要素的检索为基本功能,以检索系统设计或设计特征为研究重点,包括有效性和增效性两个外延。
      (专业)知识检索的有效性,源于信息/情报检索中的“检索效率”。广义检索效率衡量指标包括“查全率、查准率、检索方便性及成本等”;狭义检索效率以查全率和查准率为主。王知津等基于情报学的“专指性”与“查准率”、“网罗性”与“查全率”等概念,提出“知识组织概念模型”;曾蕾针对知识组织系统,提出歧义消解(简称消歧)、同义控制、关系建立和表呈特性的功能及其方法;美国国家信息标准组织文件ANSI/NISO Z39.29—2005(R2010)收录了曾蕾提出的前三项功能及其方法,将其作为词汇控制的主要原理和方法,利于提升词表检索系统的查全率和(或)查准率。检索效率现已拓展于基于本体、动态的知识检索模型研究等,而术语知识检索属于细粒度的知识组织研究,仍待发挥研究者的学科领域专业优势,作为智能检索研究的理论基础和必要补充。
      较之有效性,(专业)知识检索的增效性是基于特定领域知识多维性原理的特色设计,超出潜在用户对查全率、查准率等有效性指标的基本心理预期。随着知识关联研究的深入,多维度知识关联与融合研究渐成趋势,如苏新宁等谈到知识组织的“多维性原则”以及“不同学科”、“同一学科内不同维度”的知识关联。该视角与术语工作相关标准相契合,如国际标准ISO860:2007和国家标准GB/T 16785—2012《术语工作 概念和术语的协调》谈到“概念的多样性”,源于“专业”、“科技”、“文化”及“社会经济”等方面的不同而形成的概念差异(或称歧义、多义)。术语标准化工作要对此类概念进行协调,但若从知识检索角度而言,术语概念多样性及协调可被视为知识增值的契机,因为检索到一个术语可获得超出基本心理预期的多维度专业知识。
      通过文献综合,我们搭建出知识检索功能框架(表5),该理论框架面向专业词表尤其是术语词典检索性能设计和评价相关研究,涉及知识检索的有效性和增效性两个外延。知识检索有效性的主要指标参考狭义的检索效率,包括查得全和查得准(在量化研究中表述为查全率和查准率),其主要因素借鉴张琪玉等和ANSI/NISO的相关内容。知识检索的增效性借鉴“知识增生”这一术语,指通过知识点间的多维度关联与对照,可提供新的理解角度,促进新知的产生,从而“在知识服务中发挥更大效应”。我们根据现有规范名词(2016年《管理科学技术名词》)代之以“知识增值”,其主要因素参考概念协调相关内容,以及“知识关联”的类型,整合为不同媒体间以及同一媒体内的概念协调。根据研究对象的媒体和领域等特点,主要因素可适当增减。
    表5 知识检索功能框架
     
    • 10.3.3“人工智能+”视域下的教育知识图谱应用前景
      (一)助力教育大数据智能化处理
      教育大数据是人工智能教育应用的基础。教育大数据的分析与挖掘是从“数据”到“知识”的萃取过程。通过知识图谱,我们可以将教育领域海量且繁杂的大数据整合为一个语义化的知识网络,破解数据汇聚融合的难题,并优化数据价值的攫取过程,如图2所示。
    图2知识图谱在教育大数据智能化处理中的应用
      从数据汇聚融合的角度来看,教育大数据价值密度低、数据稀疏的特性,需要融合多源异构的教育数据才能保证分析结果的精准性。而当前的教育大数据在汇聚融合过程中,缺乏统一标准与规范,数据模式动态变迁困难,多源异构数据难以语义化融合,“数据孤岛”“数据烟囱”等问题依然严重,因此,急需一种灵活可扩展、智能自适应的数据模式,将现有数据进行多维度深度融合。知识图谱作为一种轻量级的数据模式,并且具有语义关联、动态可扩展的能力,能够在一定程度上实现多源异构数据统一建模与管理。
      首先,需要由学科专家和知识工程师从教学、管理、科研三个维度定义知识图谱的标准模式;其次,需要由大数据工程师将海量的教学日志数据、教学资源数据以及学习行为、学习测评数据与标准模式进行映射;再次,通过知识校验技术将不同数据源中的实体进行融合;最后,利用实体链接技术将数据与各类资源库和知识库进行关联。
      从数据的分析与挖掘层面来看,对于教育领域的文本、视频等非结构数据的处理,传统文本挖掘算法(文本分类算法、潜在语义分析算法等)以及CNN、RNN等深度学习模型,由于缺乏语境上下文以及领域知识,其分析效果欠佳。这就需要借助知识图谱提供的教育领域知识,进一步提升性能。
      此外,当前“数据驱动”理念指导下的教育大数据分析与挖掘技术,能够很好地处理具有“相关关系”特征的问题,但对于因果判断、溯因推理、决策规划等“因果关系”问题却捉襟见肘。究其原因,“数据驱动”的方法严重依赖数据本身的特征,缺乏领域知识和专家经验的融入。而通过知识图谱提供的先验知识去赋能教育大数据的分析挖掘,能够增强机器学习算法的学习能力,提高机器的认知水平,实现“数据”与“知识”双向驱动的教育大数据智能化处理。
      (二)助力教学资源语义化聚合
      近年来,随着泛在学习环境以及MOOC、SPOC、微课等开放教育资源的出现,知识的获取方式呈现跨端、跨源、跨模态的特性,学习资源面临着分散无序、知识碎片、共享困难、关联缺失等严重问题,学习资源的语义化聚合逐渐成为教育技术研究的热点问题。
      知识图谱以其语义化关联、智能组织聚合的能力,为机器理解复杂的学习资源和构建知识语义网络提供了新的思路,它是进行海量教育资源组织、表征与管理,实现教育资源融合的关键技术之一。知识图谱之于学习资源的作用,主要体现在以下两个方面:
      1.面向知识组织的学习资源语义化关联
      目前,在线学习平台通常采用“资源—索引—元数据”的模式来组织学习资源,无法根据学习者现有的知识结构或认知水平,为其推荐最切合的学习资源。通过利用知识图谱对学习资源进行知识化标引和链接,建立以知识为中心的资源语义关联模式,使得非结构化的学习资源通过结构化、知识化的加工,成为有语义关联关系的知识对象,实现从内容资源到资源图谱的转化,为学习者提供了可重组、可融合、可创生的知识体系。此外,知识图谱还将资源使用记录与学习者个性特征、知识状态进行关联,能够为学习者提供更加个性化的资源服务。
      2.融合多模态资源,构建跨媒体知识图谱
      在多环境下利用多媒体通道进行多模态学习,成为“互联网+教育”时代人类学习的主流模式,也是信息加工理论、多媒体学习认知理论倡导的知识建构方式,这使得学习资源逐渐从单一有限的媒体资源,向海量多源的异构媒体资源演进。而如何将语言、视觉、听觉等不同类型的媒体资源进行融合,对现实世界中的知识进行统一的语义表征、关联理解,成为当前学习资源聚合亟待解决的问题。
      跨媒体知识图谱通过视、听、语言等感知算法,来分析、挖掘跨媒体中的知识,将来源于不同媒体中的实体对象进行语义关联,为解决上述问题提供了新的技术支撑。跨媒体知识图谱的构建过程大致如下:首先,通过图像识别、音频分析、语音识别、自然语言处理等机器学习技术,从图片、视频、语音、文本等媒体资源中,识别出知识实体和实体属性;其次,将不同媒体中的实体通过特征向量进行表达,并映射到统一的共享向量空间中;最后,通过欧几里德、余弦距离等计算公式,度量实体与对象之间的相似性,并将相似的实体对象进行融合。
      (三)助力智慧教学更加高效化
      1.教学目标精准定位,助力“以学定教”
      教学目标作为教学过程的出发点和风向标,它的精准定位决定着教学设计和教学过程的有效性。教学目标的精准定位取决于两个要素:一是要精准定位学生当前的知识和能力状况,二是要精准预测学生未来的知识掌握状态和能力发展程度。以知识图谱为代表的人工智能技术为教学目标的精准定位,提供了新的技术手段,主要表现在:
      (1)基于学科知识图谱,能够精准探测学生在各知识点的掌握状态。借助于教育大数据的采集技术,智能学习系统能够记录学生在作业、练习、考试、答疑等各个环节的学习轨迹;结合学习分析技术,以知识图谱的形式可视化展示学生知识点的掌握程度,能够精准定位学生学习短板以及薄弱知识点。
      (2)结合知识追踪技术以及相关教育学理论,动态预测学生各知识点的掌握变化情况。每个学生的学习状态、学习进度、知识程度都各不相同且动态变化,需借助人工智能技术进行动态预测。知识追踪技术是当前智能教育领域新兴的一种预测手段,它通过学习者外在的、显性的学习表现或行为序列,来预测学习者内在的、隐性的知识技能状态。2015年,斯坦福大学提出的深度知识跟踪模型,已初步应用于沪江英语、扇贝英语、义学教育等在线学习平台。
      2.知识结构更加可视化,助力“高效建构”
      由关联主义学习理论可知,知识是一个由事实、概念、命题和原则等要素通过关系构成的网络,而学习的本质也就是增强学习者对该网络的认知,建构学习者个体的认知结构。知识结构的可视化,正是通过图形、图表、地图等视觉表征手段,呈现知识内在结构和关联关系的辅助工具。在智慧教学中,知识结构可视化工具,为学习者有效组织知识、高效建构知识,提供了认知脚手架。
      目前,基于知识图谱的知识结构可视化,已成为智能化教学平台的基本组件,如,全球最大的适应性学习平台Knewton就采用了知识图谱作为其平台的知识组织工具;可汗学院也将知识图谱作为其学科知识可视化的表征工具;WolframResearch公司构建的知识搜索引擎,也采用了知识图谱作为底层支撑技术;国内的伟东云教育也推出了基于知识图谱的智能化知识导航和管理工具———寻知图。
      (四)赋能学习者画像模型的构建
      用户画像是一种以用户行为大数据为基础,融合文本挖掘、情感分析、知识抽取、数据可视化等技术,以标签化的信息模型描述用户多维特征的建模方法,其本质就是对画像主体“打标签”。
      学习者画像是用户画像的一种特殊形态,主要用于描述学习者的学科知识、认知能力、学科素养、学习风格以及情感状态等方面的个性特征,它是开展个性化支持服务的前提和基础。学习者画像的一般过程包括:学习行为数据获取、学习行为数据分析、用户标签抽取、用户画像生成四个环节。当前,学习者画像模型的构建,面临以下挑战:一是行为数据的稀疏性、缺失性、偏差性和隐私性,导致画像模型的精准度一直都比较低;二是学习者画像模型是以标签形式表征的,这些标签对于机器来说是难以直接理解的,导致学习者画像的语义性和可计算性大大减弱。
      将知识图谱运用于学习者画像建模与分析,不仅能够基于知识图谱对标签进行语义泛化和语义关联;而且能够基于学习者的知识图谱进行标签传播,提高数据的可用性以及标签的可理解性,从而将学习者画像的建模从基于行为的建模转向基于语义的建模。例如,加拿大阿萨巴萨卡大学的学习分析研究专家Siemens以及哥伦比亚大学的教育数据挖掘专家Baker,共同提出了构建个性化学习图谱(PersonalLearningGraph)的构想,进而构建了基于个性化学习图谱的学习者数字画像。
      (五)赋能适应性学习的诊断
      当前的智慧教育更加突出强调“以学习者为中心”的教学理念,而如何评测、诊断学习者对于知识和技能的真实掌握状况,仍是全球教育信息化面临的难题。根据认知主义理论观点,学习是面对真实的问题情境,通过学习者的心理加工和信息处理,形成和建立认知结构的过程,而学习诊断是通过诊断性测试,来对学习者的认知结构进行评估的过程。
      目前的学习诊断方法,可分为基于学科专家的学习诊断和基于人工智能的适应性学习诊断两种。基于学科专家的学习诊断,主要依靠经验对学习者的知识与能力状态进行评估,缺乏教育测量学思想的融入,具有较大的偶然性和主观性。其诊断的大致过程是:首先,由学科专家或心理测量专家确定认知属性及其层级结构;然后,根据Q矩阵理论,编制诊断性测验项目;最后,对被试在测验项目上的反应模式进行分析,进而推知学习者的认知结构。这种方法存在费时费力、测验可重用性差、个性化支持不足等问题。
      而知识图谱等人工智能技术支持下的学习诊断,能够基于学习者客观的学习过程数据,以知识空间理论、认知诊断理论为基础,以统计测量、学习分析、数据可视化、数据挖掘等智能技术为手段,为不同的学习者选择适应性的测评工具、测评内容,设置差异化的测评过程,并自动生成目标达成度、认知及知识维度的分析报告,从而实现学习诊断过程的智能化、客观化、个性化。此外,还可以对未达成的学习目标进行认知和知识等方面的归因分析,对其缺失的知识提供补救措施,能够有效地帮助学习者发展和完善其认知结构。因此,和普通学习诊断相比,基于知识图谱的学习诊断,实现了诊断过程的自适应和个性化。
      (六)赋能个性化学习的推荐
      个性化学习是教育发展的本质追求和价值取向,也是人工智能技术赋能教育的最佳实践。然而,当前指数式增长的学习资源,使得学习者的“认知负荷”和“学习迷航”问题日益加剧,学习资源的极大丰富与个性化学习服务供给不足之间的矛盾日益突出。而个性化学习推荐能够根据学习者当前的知识状态,为其推荐适切的个性化学习资源和学习路径,成为实现精准个性化学习的关键和基础。
      已有的研究发现,传统基于协同过滤的推荐、基于内容的推荐以及二者混合的推荐方法,不仅存在冷启动、数据稀疏、可拓展性差等诸多问题,而且也无法应对教育领域个性化学习推荐的复杂性。即便是基于深度学习、增强学习等的个性化学习推荐方法,也无法融入教育教学的领域知识(如,学习者的知识状态、认知能力以及学习资源的难度等)。针对上述问题,朱天宇等人提出了领域知识驱动的个性化推荐方法,并将其成功应用于“智学网”,这一研究充分证明了教育领域知识对个性化学习推荐的重要性。基于上述研究成果,我们认为,知识图谱作为一种组织和表征知识的工具,反映了知识点的先后顺序以及认知依赖关系,提供了较完善的教学知识体系;参照知识图谱来实现个性化的学习资源推荐以及个性化学习路径规划,符合知识的认知规律和教学的基本逻辑,能够解决现有个性化学习推荐方法缺乏领域知识的问题。
      可见,基于知识图谱的个性化学习推荐,能够根据知识间蕴含的前驱和后继关系,综合考虑学习者的认知风格、当前的知识状态等特征,为他们推送个性化、有针对性的学习资源和学习路径。具体可分为以下几个阶段:
      (1)学习者个性化需求分析阶段。根据学习者的信息交互、操作交互等学习行为,识别学习者当前正在学习的知识内容,定位学习者的知识盲点、缺失概念,生成学习需求数据库,并根据学习活动进行动态调整。(2)学习者个性化测评阶段。个性化测评的目的是对学习者的知识水平、学习风格、认知能力等各方面的差异性进行量化分析,为学习资源的个性化推荐和学习路径的动态规划提供依据。(3)个性化知识子图生成阶段。根据学习者的个性化学习需求以及学习者的知识水平、学习风格、认知能力等个性特征,从学科的知识图谱中抽取学习者待学习的知识点,形成个性化知识子图。(4)个性化学习推荐阶段。个性化学习推荐,包括学习资源推荐和学习路径推荐两种协同推荐模式。学习资源推荐,主要针对薄弱知识点推荐相应的微课、教学测验等;学习路径推荐,主要为学习者推荐从当前知识点到目标知识点之间的学习对象序列以及学习活动序列。
      (七)赋能智能教育机器人
      《地平线报告》连续多年预测教学机器人将成为持续影响教育领域的关键技术;英国开放大学发布的2019年度《创新教学报告》也指出,“机器人陪伴学习”将成为教育领域可能出现的“创新教学法”。教育机器人能够充当学习者的学习助手、智能学伴,为其提供答疑、导航、推荐、提问、社交等智能服务,对于增强学习兴趣、激发学习动机、提高学习效果具有重要作用。同时,教育机器人也能够辅助教师进行教学监控、教学管理、自动答疑,延伸教师的表达能力、知识传递能力和沟通能力。
      当前,教育领域应用的机器人主要是对话型或聊天型,该类机器人通过机器学习和知识图谱等技术让机器理解人的语言,在对人类意图进行深入分析的基础上,经过简单的逻辑推理和规则匹配过程,对学习者的提问进行回应抑或完成某项明确具体的任务。比如,对话型机器人是一个集语言感知、语音识别、智能决策、自动反馈为一体的复杂系统,涉及自然语言处理、知识图谱、知识推理、增强学习等诸多人工智能技术,而知识图谱在其中起到了决定性作用。
      如图3所示为对话型教育机器人的基本结构,主要包括自然语言处理模块、对话管理模块、知识图谱模块、自然语言生成模块四大部分。其基本处理流程如下:自然语言处理模块将学习者输入的文字与语音数据转变为机器的内部表示,在知识图谱的辅助下,基于深度学习技术对输入进行实体识别、实体链接、指代消解、语义理解等处理,最终解析为槽值对的形式;对话管理模块综合学习者的输入数据以及知识图谱中的信息,经过知识推理、语义消歧、上下文理解、语义检索等操作生成问题答案,最后交由自然语言生成模块反馈给当前学习者。在该过程中,知识图谱相当于教育机器人的大脑记忆系统,存储了教育领域海量的常识性知识,以及学习者的情感状态、兴趣偏好、知识技能等数据信息,使得机器人拥有了类似人类大脑的记忆、思考、推理和研判能力。
    图3对话型教育机器人的基本结构
     
    • 参考文献
    [1]郑泳智,朱定局,吴惠粦,彭小荣.知识图谱问答领域综述[J].计算机系统应用,2022,31(04):1-13.DOI:10.15888/j.cnki.csa.008418.
    [2]王鑫, 邹磊, 王朝坤,等. 知识图谱数据管理研究综述[J]. 软件学报, 2019, 30(7):36.
    [3]高茂, 张丽萍. 融合多模态资源的教育知识图谱的内涵,技术与应用研究[J]. 计算机应用研究, 2022, 39(8):11.
    [4]Zhao Z,Wang X,Xu X,et al.Multi-Modal Question Answering System Driven by Domain Knowledge Graph[C]//2019 5th International Conference on Big Data Computing and Communications (BIGCOM).IEEE,2019.
    [5]Kim D,Kim S,Kwak N.Textbook Question Answering with Multi-modal Context Graph Understanding and Self-supervised Open-set Comprehension.[C]//Meeting of the Association for Computational Linguistics.Association for Computational Linguistics,2019.
    [6]李振,周东岱,王勇.“人工智能+”视域下的教育知识图谱:内涵、技术框架与应用研究[J].远程教育杂志,2019,37(04):42-53.DOI:10.15881/j.cnki.cn33-1304/g4.2019.04.006.
    [7]张治,刘小龙,余明华,祝智庭.研究型课程自适应学习系统:理念、策略与实践[J].中国电化教育,2018(04):119-130.
    [8]杨跃,白素,袁金月.“三多”语境下大学英语教学Presentation的学生能动性建构[J].外语电化教学,2015(02):24-29.
    [9]朱珂,王玮,李倩楠.跨媒体智能的发展现状及教育应用研究[J].远程教育杂志,2018,36(05):60-68.DOI:10.15881/j.cnki.cn33-1304/g4.2018.05.009.
    [10]辛继湘.当教学遇上人工智能:机遇、挑战与应对[J].课程.教材.教法,2018,38(09):62-67.DOI:10.19877/j.cnki.kcjcjf.2018.09.011.
    [11]李菲茗,叶艳伟,李晓菲,史丹丹.知识追踪模型在教育领域的应用:2008—2017年相关研究的综述[J].中国远程教育,2019(07):86-91.DOI:10.13541/j.cnki.chinade.20181214.001.
    [12]王颖. 基于知识图谱的产品画像构建研究[D].南京理工大学,2018.
    [13]祝智庭.CAI的教学策略设计(之四)[J].电化教育研究,1998(04):49-52+67.
    [14]郭磊.认知诊断理论及其应用[J].心理技术与应用,2013(02):27-31+34.DOI:10.16842/j.cnki.issn2095-5588.2013.02.007.
    [15]师亚飞,彭红超,童名文.基于学习画像的精准个性化学习路径生成性推荐策略研究[J].中国电化教育,2019(05):84-91.
    [16]朱天宇,黄振亚,陈恩红,刘淇,吴润泽,吴乐,苏喻,陈志刚,胡国平.基于认知诊断的个性化试题推荐方法[J].计算机学报,2017,40(01):176-191.
    [17]唐杰,李浩君,邱飞岳.mCSCL环境下协作分组的伙伴模型研究[J].中国远程教育,2012(02):48-51.DOI:10.13541/j.cnki.chinade.2012.02.004.
    [18]李青,闫宇.新技术视域下的教学创新:从趣悦学习到机器人陪伴学习——英国开放大学《创新教学报告》(2019版)解读[J].远程教育杂志,2019,37(02):15-24.DOI:10.15881/j.cnki.cn33-1304/g4.2019.02.003.
    [19]李振,周东岱,刘娜,欧阳猛.人工智能应用背景下的教育人工智能研究[J].现代教育技术,2018,28(09):19-25.

    [20]李贺,刘嘉宇,李世钰,.基于疾病知识图谱的自动问答系统优化研究[J].数据分析与知识发现,2021,005(005):P.115-126.

    [21]杜泽宇,杨燕,贺樑,.基于中文知识图谱的电商领域问答系统[J].计算机应用与软件,2017,34(5):7.

    • 标签:
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部