• 2012年12月4-18日毕业论文计划

    普通类
    • 支持
    • 批判
    • 提问
    • 解释
    • 补充
    • 删除
    • 2012年12月4日至18日我的论文进展计划

    (1)根据资源的标题、关键词、标签、文本聚类等,实现资源自动归类,将用户上传的资源自动归到对应类别中;

    (2)自动设置用户分类,在用户填写学科、教材等信息后,自动给该用户生成此教材版本的目录,他可以通过此目录查到他教学所需的资源。

                                                                       何冬杰

                                                                 2012年12月4日

     

    泛在学习:泛在学习就是指无时无刻的沟通,无处不在的学习,是一种任何人可以在任何地方,任何时刻获取所需的任何信息的方式。就是利用信息技术提供学生一个可以在任何地方、随时、使用手边可以取得的科技工具来进行学习活动的4A(Anyone,Anytime,Anywhere,Anydevice)学习。

    泛在学习特点:学习的持续性,学习资源的可访问性,信息获取的直接性,学习者同步或异步的交互性,服务内容推送性或主动性,教学行为的场景性。

    泛在学习的优势:

    (1)学习者为中心,学习是积极主动的学习。(2)学习的凡在性,随时随地学习,(3)计算设备便携先进。                                                                

    黄晨.Lib2.0的观念与变革—以维基(Wiki)和标签(Tag)为例.图书馆杂志,2007(8)

    标签其实就是关键词。

    Tag(标签)是一种更为灵活、有趣的分类方式,你可以为每篇日志、每个帖子或者每张图片等添加一个或多个Tag(标签) ,你可以看到网站上所有和你使用了相同Tag的内容,由此和他人产生更多的联系。Tag体现了群体的力量,使得内容之间的相关性和用户之间的交互性大大增强。

    原型系统的工作原理是这样的,每个人都可以用自己提炼的关键词来给一个资源添加标签,这些标签反映了资源的不同侧面和特征。多个标签指向同一资源,一个标签指向多个资源,由此组成了一个多对多的标签网络。基于标签的增删和用户的点击反馈,系统可以进行标签的聚合以控制资源描述,而用户也通过对标签的访问和组合逐渐逼近自己需求的信息。与此同时,通过对于相同标签的“粘贴”和访问,用户很容易在信息发现的同时也找到了志趣相同的朋友。

     

    1. 黄建年.关于TAG分类及相关理论问题的研究.图书馆杂志,2008(7)

     

    关于TAG:自1998 年, 美国人约舒亚# 沙科特提出TAG以来, TAG 得到了极大发展。2004 年, 中文网站B logBUS[ 1]、365KEY[2] 等开始应用TAG, 使得TAG在国内逐渐流行。目前Tag 广泛应用于新闻分类、论坛专题化、网站的Tag 化等各个领域。

    TAG处理对象:TAG处理的对象主要集中在非学术性资料上,但是随着搜索引擎中学术性资料的增加,学术性数据库与用户交互功能的增强,TAG势必会逐渐进入学术领域。

    1. 肖明.自动分类研究进展.图书馆自动化,2000(5)

    自动分类从标引方法来划分自动分类标引可分为抽词分类标引法( Derivat iveindex ing ) 和赋词分类标引法( Assigned index ing ) 。

    •  
    • 删除无实质意义的语词和泛指词;
    • 删除无检索意义的高频词;
    • 对剩余文献进行排序并统计词频;
    • 统计文献中词的共现频率并排序;
    • 选择词频最高的词或者词组作为文献的标引词;
    • 将计算机选出的词或者词组归入一定的类, 并将分类号与文献地址存储在数据库中。

    赋词分类标引法的主要工作流程是:

    • 为受控词表中的每一个叙词建立一个小词表;
    • 由计算机利用词频统计标准去识别文献中的关键词。如果某个叙词的小词表中的词能够同从文献中抽取的词相匹配, 则该叙词就被计算机指定用来标引该篇文献。

    自动分类的实现途径进行划分,可将自动分类分为自动聚类和自动归类两大类型。

    自动聚类是指从待分类对象中提出特征, 再将提出的全部特征进行比较, 并根据一定的原则将具有相同或相近特征的对象定义为一类, 设法使各类中包含的对象大体相等。

    自动归类是指先分析被分类对象中的特征, 然后将其与各种类别中对象所具有的共同特征进行比较, 再将对象归化为特征最接近的一类并赋予响应的分类号。

    自动分类研究未来发展方向:

    • 基于语料库构建自动分类系统
    • 构建实用性更强的自动分类专家系统
    • 构建适合自动分类的机读分类法
    • 进一步提高文献自动标引水平
    • 加强对因特网信息资源的自动分类研究

    乐庆玲.基于协同机制的Tag资源自动分类研究.知识组织与知识管理,2007(9)

    Tag资源自动分类方案:

    • 利用传统分类法中已被验证的科学分类方法,由人工设计一定数量的基本Tag类,进行分类整理。
    • 建立一个基本覆盖所有汉语词汇和英语热门词汇的候选Tag集,形成Tag或Tag组合与基本类的对应关系, 并通过候选Tag集提供Tag列表, 建议用户使用通用性强的标签。
    • 建立Tag资源自动分类系统, 定期对Tag资源进行搜索, 实时更新Tag候选集, 并提供相关数据。
    • 引进自动分类器对用户提交的Tag资源进行自动分类, 分类信息与用户提交的Tag关联保存, 通过机器学习的方法, 提取分类规则, 应用到下次分类过程中并不断进行动态的学习更新。
    1. 孙波.文本素材资源的自动分类算法研究.中国电话教育,193期
    2. (以后要看)
    1. 基于多元统计分析的电子文本自动分类算法;
    2. 基于汉字字频向量的中文文本自动分类算法;
    3. 基于模糊模式识别的文本自动分类算法;
    4. 基于特征相关性的汉语文本自动分类算法;
    5. 基于向量空间模型的文本自动分类算法。

    基本思想:用文本内的特征项信息与分类中的固定特征项信息作最大匹配,用匹配的结果作为文本分类的标准。

    面临困难:原先的自动分类算法使文本类别是唯一的,而教育资源库中同一资源可能对应于多个分类;分类标准在整个系统运行过程中是不变化的,这不利于资源库的建设和发展。

    基本思路:

    (1)、文本预处理:将文件预处理为纯文本文件;

    (2)、分类知识学习,包括统计词库的建立,各个分类特征向量的建立和阈值的确定。

    (3)、新文本分类:计算相似度值,根据类的阈值确定是否属于该类。

     

    关于毕业论文的一些疑惑及解答:

    (1)学习元平台现在是怎么对学习资源进行分类的?一个学习资源指的是一个学习元,还是细化到学习元里边的文本文件,音视频文件,图片什么的?

    丁回复:一个学习元

    余回复:*****资源只考虑到学习元层面,再细就不用考虑了

    (2)我的毕业论文题目是“基于标签的学习资源自动分类研究”,我的理解是,学习元里的所有学习资源都是有标签的,然后让我设计算法,将这些带有标签的学习资源划分到现有的类别中去。我不知道我的理解对不对。

    丁回复:如一个学习元A标签是“小学数学 认识简单的图形”,另一个学习元B的标签是“小学数学 简单数字计算”,要求能实现到这2个学习元能归为一类,都是属于小学数学的类别里;另如一学习元C是“中学数学 一元二次方程”,C学习元和A、B学习元虽然都属于数学类别里,但C学习元离AB要远一点,最理想的状态是:系统能将每一个学习元和其他学习元直接的关系由近至远表示出来。

    余回复:*****学习元部分有标签,部分无标签,部分标签质量不高,需要用文本聚类的方式,自动或半自动提取学习元的标签

    (3)我的毕业论文需要我做的核心部分应该是如何自动分类,我不知道那个现有类别是不是也要我去设计,因为关于现有类别,我看的文献资料中也有提到,说类别是不断的变化的,需要设计算法,自动生成现有类别什么的。

    丁回复:类别不用你去设计,可以参照系统本身的分类体系,然后将标签纳入分类体系中

    余回复:  *****核心是自动分类,现有类别不需要你去设计,但一个资源会属于多个类别,将学习元自动归到相关类别中即可

    (4)我的论文要求我最终在学习元上做出什么东西出来,我猜是完成一个模块的功能,给这个模块输入的是有标签的学习资源,输出是属于哪些现有分类。我不知道我的猜测是否对。

    丁回复:同意你的想法。

    余回复:   *****是一个模块,其他需要归类的模块可以调用,如系统每次生产一个新学习元,可自动建议其归类,

    还有:因为有些分类可能是系统里没有的,如果能有一些手工加入的分类也可以?如java和程序设计,系统里可能还没有这样的分类体系,系统可以在后台设定java是属于程序设计的一部分。

    (5)我的毕业论文题目是"基于标签的学习资源自动分类研究",我问了丁国柱师兄,师兄说有标签的学习资源就是一个学习元。让我研究主要是研究如何根据学习元的标签将他归到现有的树状类别中去,我不知道这个理解对不对。问师兄他们,他们也不确定是不是这样。

    余回复:就是将现有学习元归到合适的类别中去

    开题报告建议:

    1.尽量用比较学术的语气阐述

    2.国内现状调研不足,重点可以分析国内的教育资源管理系统的标签设计应用(国家资源网、百分网、粉笔网.....N多教育应用网站的tag如何使用?)

    国家资源网不知道是不是国家基础教育资源网?资源应该是已经固定在数据库中,有固定分类,和一些关键字,没有标签,资源搜索时也是根据资源的描述呀,标题呀等一些属性的描述进行字符匹配的,表面上看不出哪儿使用了标签。

    3.格式问题(是否采用了北师的专门开题格式?每段应该是空2格吧等等)

    4.请阐述详细点,说清楚为什么怎样做(也就是现状是什么?不足之处是什么?你觉得如何改进),要有条理,思路要清晰。

    • 标签:
    • 计划
    • 进行
    • 用户
    • 2012年
    • 12月
    • 学习元
    • 自动
    • 毕业论文计划
    • 标签
    • tag
    • 资源
    • 18日
    • 分类
    • 类别
  • 加入的知识群:
    学习元评论 (0条)

    评论为空
    聪明如你,不妨在这 发表你的看法与心得 ~



    登录之后可以发表学习元评论
      
暂无内容~~
顶部