• 人工神经网络分析PISA数据

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 一、实验目的

     

     

     

    教育数据挖掘方法与应用实验报告

    姓名

    王雯清

    学号

    202105720130

    年级

    2021

    专业

    教育技术学(师范)

    学院

    教育科学与技术学院

     

     

    实验人工神经网络分析

    一、实验目的

    实验三的目的是通过使用SPSS Modeler中的人工神经网络模型来分析影响数学成绩的因素。我们希望通过构建一个类神经网络模型,能够识别和理解那些对数学成绩有显著影响的变量,从而为教育工作者提供决策支持,帮助他们优化教学策略,提高学生的数学成绩。

     

    • 二、实验工具

    二、实验工具

    1、IBM Modeler软件:用于构建、训练和评估类神经网络模型。

    2、数据集:包含学生的个人信息、家庭背景和数学成绩等数据

    • 三、实验原理

    三、实验原理

    人工神经网络是一种模仿人脑神经元工作机制的数学模型,它由大量的节点(或称神经元)相互连接而成。每个节点都与其他节点通过权重进行连接,权重的大小代表了连接的强度。人工神经网络通过学习数据集中的模式,自动调整权重,从而实现对未知数据的预测。

    在本实验中,我们将构建一个神经网络,该网络包括输入层、隐藏层和输出层。输入层接收原始数据,隐藏层对数据进行处理和转换,输出层输出预测结果。通过训练神经网络,我们可以得到影响数学成绩的因素,并对其进行解释和分析。

    1. 具体来说,我们将采用以下步骤进行实验:
    2. 数据准备:首先,我们需要准备一个包含学生数学成绩和相关影响因素的数据集。这些影响因素可能包括学生的学习时间、家庭背景、教师的教学方法等。
    3. 构建神经网络模型:在SPSS Modeler中,我们可以通过拖放的方式构建神经网络模型。我们需要确定网络的层数、每层的节点数、激活函数等参数。
    4. 训练神经网络:使用准备好的数据集对神经网络进行训练。在训练过程中,神经网络会自动调整权重,以最小化预测误差。
    5. 模型评估:训练完成后,我们需要对模型的性能进行评估。常用的评估指标包括准确率、召回率、F1值等。
    6. 结果解释:通过对神经网络的权重进行分析,我们可以得到影响数学成绩的主要因素,并对其进行解释和分析。模型评估:使用测试集对训练好的类神经网络模型进行评估,计算模型的性能指标(如准确率、召回率等),以衡量模型的预测能力。同时,分析模型中各个因素的权重和影响程度,了解哪些因素对学生成绩的影响最大。
    • 四、实验步骤

    1、 “源”中拖拽出“Statistics 文件”到数据流编辑区,并编辑数据,从“字段选项”选项卡中拖拽“导出”节点到数据流编辑区,建立连接,设置MATH为十个PVMATH的平均值

    2、“字段选项”选项卡中拖拽“过滤器”节点到数据流编辑区,过滤不需要的节点,建立连接

    3、从“字段选项”选项卡中拖拽“导出”节点到数据流编辑区相连接。右键编辑“导出”节点参数,将数值型“MATH”字段变换为标记型字段,命名为“MathClass”,设置公式“MATH >= 500”,true 值对应“高”,false 值对应“低”,设置好后确定应用。

    4、“字段选项”选项卡中拖拽“类型”节点到数据流编辑区相连接,并编辑“类型”节点,将“MathClass”字段的角色设置为“目标”,其余字段设置为“输入”。

    5、从“建模”选项卡中拖拽“类神经网络”节点到数据流编辑区连接并右键编辑。“字段”选项卡“模型”选项卡“注释”选项卡使用预定义角色,“模构建选项”选项卡具体勾选如图。

    6、点击运行得到结果

    • 五、实验结果

    根据实验步骤得出以下图表

    根据图表可以得出以下实验结果:

    1、模型准确性分析:模型使用了径向基函数(Radial Basis Function, RBF),这是一种常用于支持向量机(SVM)和神经网络中的函数,能够处理非线性问题。准确性为29.2%表明模型对于预测学习者的数学成绩具有一定的识别能力,但仍有较大的提升空间。

    2、父亲是否有ISCED5A的证书、母亲是否有ISCED5A的证书、与父母的交流、家里有多少辆车、自身形象、家里有多少电视、父亲是否有6的证书、父亲是否有ISCED4的证书、母亲是否有ISCED4的证书、母亲接受的最高学历都是影响学习者数学成绩高低的重要变量,且呈现如图所示的不同重要性。

    3、预测值和观测值的一致性分析显示:预测值和观测值均为低的为94.3%,说明模型在预测数学成绩低的学习者时具有较高的准确性。预测值和观测值均为高的为30.8%,这可能意味着模型在预测数学成绩高的学习者时准确性较低,或者是高数学成绩的学习者在总体中的比例较低。

     

    • 六、分析与讨论

    分析:

    1、模型具有一定的预测能力:使用径向基函数的模型能够识别出学习者的数学成绩特征,当前的准确率达到29.2%,说明模型在预测数学成绩方面有一定的效果,但还有较大的提升空间。

    2、多因素影响数学成绩:父亲和母亲的受教育水平(ISCED5A证书、ISCED4证书)、家庭背景(如家庭车辆数量、电视数量)、与父母的交流以及个人因素(如自身形象)等都是影响学习者数学成绩的重要因素。

    父亲和母亲的受教育水平:

    A父母拥有更高层次的教育证书(如ISCED5A或ISCED4),通常意味着他们能够更好地支持孩子的学习,包括提供学习资源、辅导孩子以及强调教育的重要性。

    B父母的教育水平可能与他们对教育的态度和期望有关,这些因素可以影响孩子对学习的态度和动力。

    家庭背景:

    A家庭车辆数量和电视数量可能反映了家庭的经济状况和文化资本。家庭经济条件好可能意味着有更多的资源用于教育,如课外辅导、教育软件等。

    B电视数量可能间接反映家庭对媒体和技术的接触程度,这可能影响孩子的学习环境和习惯。

    与父母的交流:

    A父母与孩子的交流质量,包括沟通频率、交流内容、家长参与孩子学习的情况等,都可能对孩子的学习态度和成绩产生重要影响。

    B家长的鼓励和支持可以提高孩子的自信心和动力,从而可能提高数学成绩。

    个人因素:

    A自身形象和自我认知可能影响孩子的自信心和动机,这些心理因素对学习成就有重要影响。

    B学习者的个人兴趣、学习习惯和时间管理能力等也可能影响他们的数学成绩。

    3、模型在预测低成绩学习者时更准确:模型在预测数学成绩较低的学习者时准确性较高,而在预测高成绩学习者时准确性较低,可能反映了模型对于高成绩学习者的特征识别不足,或者高成绩学习者样本较少

    措施:

    1、家庭教育支持:鼓励家长获取更高水平的教育证书,提高他们对数学教育的理解和支持。同时,鼓励家长与孩子进行积极的数学交流,为孩子提供良好的学习环境和资源。

    2、个性化教育:了解每个学生的学习特点和需求,根据其家庭背景和个体差异提供个性化的教育和辅导。这可以包括针对学生的数学弱点进行有针对性的辅导,提供额外的学习支持和资源。

    3提供支持和资源:学校可以提供辅导班、数学俱乐部等额外的学习支持和资源,为学生提供更多学习机会和交流平台。这将帮助学生在数学学习中得到更全面的帮助和支持。

    • 七、总结或个人反思

    总结:

    1模型的准确性:使用径向基函数(RBF)的模型对于预测数学成绩具有一定的识别能力,但其准确率仍有待提高。

    2影响数学成绩的因素:父母教育程度、家庭条件和个人形象等因素都对数学成绩有重要影响,这与以往研究结果相符。

    3预测结果的一致性:该模型在预测数学成绩低的学习者时具有较高的准确性,但在预测数学成绩高的学习者时准确性较低。

    反思(主要是针对准确率不高)

    1、模型选择的重要性:在选择预测模型时,需要考虑模型的适用范围和局限性。如果模型的准确性不能满足实际应用需求,需要尝试其他算法以提高预测准确性。

    2个性化预测的重要性:由于不同学生的成绩受到不同因素的影响,建立个性化的预测模型可能更能满足实际应用需求。在建模时,需要考虑到不同学生之间的差异,进行合理的个别处理。

    • 标签:
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部