摘要:大数据时代的到来, 对数据挖掘技术的应用提出了更高要求。首届 “学习分析技术与知识国际会议” 的召开, 将数据挖掘方法与学习管理系统建立关联, 并从分析学习者的行为中来改善和提升物理教育效率。本文将从数据挖掘的方法、 内容、方向、 结果呈现等方面, 就其在学习分析中的应用展开探讨, 并从优化数据挖掘方法上来改善学习分析技术的有效应用。
关键词:数据挖掘;学习分析;关键技术;应用探讨
大数据时代下信息指数型增长已经成为趋势, 对于海量数据的分析及呈现, 迫切需要从数据挖掘技术的应用中来获取有效信息。现代教育领域中对信息化技术的应用较为广泛, 各类虚拟学习环境的构建需要符合学生的学习特性, 这些数据即多又杂, 更需要专门的软件工具来进行改善和处理。可以说, 学习分析技术是数据分析及数据挖掘技术基础上发展而来的应用, 因此, 从学习分析定义及数据模型的构建上来增强对学生学习行为的研究, 有助于科学的评估和预测学生的表现, 改善学生的学习方式。虚拟技术中的学习环境的营造, 可以通过数据挖掘技术来实现, 特别是对于海量教育数据的有效提取, 以帮助教育者进行分析和改进教学决策。
1 学习分析中的关键技术
1.1聚类技术
对于数据挖掘中的聚类, 主要从抽象对象的集合分组中来进行归类, 聚类是对具有相似特性的多个类或簇进行分组的过程, 并利用显性或隐性方式进行描述。在聚类分析中, 不同算法下对相关数据的分类集合也是不同的, 因此需要结合数据特征来进行有效的聚类操作。在虚拟学习环境中, 对于每门课程知识的建构, 可以从学生的不同表现上来进行分组聚类。如对于学习积极性高的团体, 可以从增强知识拓展及关联度上来满足学生学习要求; 对于成绩较低、 参与度不高的学生, 可以从激励措施的组建上来增强学生的学习积极性。可见, 对于聚类技术的运用, 关键是要从学生学情的分组上, 融入不同的虚拟分组策略, 以激发学生能够更好的参与学校, 增进小组间学习的交流和协作。
1.2关联规则的挖掘
从大数据环境中对相关联数据的挖掘, 主要是通过数据库中各项集的可信度、 支持度的取值来进行。对于某数据库来说, 利用形式化语言进行描述时, 每一个事务都是集合, 而每个集合都是M项, X、 Y是其中的两项, 其关联规则表示为X ⇒ Y的蕴含式。对于数据库中的各个事务规则来说, 其所占的总事务百分比就是该规则的可信度。可见, 对于关联规则的挖掘主要是通过对数据库的事务间的关系进行关联。在虚拟网络环境下, 对于各类关联规则的挖掘, 有助于我们从学生的学习行为中来挖掘关联关系, 对于这些关联关系进行关注, 从中来转变和调整教学策略, 增强学生对知识的学习融合度, 更好的提升教学效率。为此, 可以通过对课程资源进行关联规则挖掘,通过学生访问量, 以及学生的学习成绩进行对比, 从中发现成绩与那些资源的访问有关系, 并从学习资源的重组中来增强学生的访问量。如对于某些访问量不高的资源, 在与学生的成绩关联上作用不大, 可以进行有选择性的删除, 避免占用学生的学习时间, 也提升了资源整合的效率。
1.3分类算法
对于数据挖掘中的数据分类是基于某一共同特性而建立的数据分组, 其分类方法可以是基于学生的某类学习行为, 也可以是针对某一个体或群体。以决策树为例, 对于分类方法的运用主要从分类规则的设定中, 以判断各决策树的结构是否健壮, 对于分类对象的属性定义是否准确, 能否加快决策树的访问速度。对于学习行为进行分析时, 分类算法可以预测学生的学习成绩, 并从中来关联学习动机。如针对学习积极性较低的学生, 可以从补救措施的激励上来增进参与度。对于决策树在构建分层教学模型中, 依据决策树的层次关系来优化教学内容, 能够更好的促进分层教学效率。同时, 对于决策树的D3算法分类, 可以从学生数据库进行学习能力分类, 便于教师采取相应对策来改善学生的学习态度。
1.4时间序列分析
对于学习环境中的学生学习状态的分析是实时的, 其产生的数据量也是按照时间序列进行排列的。因此, 在进行学习行为分析时, 可以从时间序列来动态的收集学生信息, 及时发现学习行为中的问题, 并灵活调整教学资源来优化虚拟教学。时间序列是数据挖掘中的重要技术, 如在学生课程资源的挖掘中, 能够结合访问时间、 教育资源的关键词进行检索, 以分析学习者的学习行为及趋势, 通过反馈来重新编排和优化教学内容, 提升教学资源的利用率。如在时间序列分析中可以完成练习作业的布置, 结合学习者对相关课程的跟踪数据, 从而明确练习的重点。在Moodle平台上, 借助于对学习者行为数据的挖掘与分析, 可以预测学生对某类知识的掌握程度, 从而有针对性的开展作业辅导。另外, 在对系统进行检测时, 可以利用前馈神经网络 (FFNN) 、 支持向量机技术 (SVM) 、 概率集合SFAM分类器来进行准确分类, 提升时间序列的分析优势。
2.基于用户的学习分析技术实践
基于学习管理的各类分析工具的应用, 对于提升高等教育, 尤其是远程教育改革中发挥了重要作用。以某院校网络教学为例, 通过对各指标数据的分类挖掘, 如 “上网人数” 、 “登陆次数” 、 “在线时长” 、 “浏览资源次数” 、 “论坛发帖总数” 等有关学习行为的汇总, 来反映学生网络学习的频度、 进度、 以及均衡性, 并从组织、 引导和改进上来优化网络资源结构, 跟踪学生的学习行为。通过数据挖掘技术在学习分析中的应用, 能够从教学上获取各类活动的总量及平均情况, 以监测网络学习工作现状, 为教学评估和网络教学实施提供参考。
2.1课程资源浏览情况分析
结合 《开放教育学习指南》 要求, 对于网络课程模块的监测与分析结果中, 能够清晰的反映各类资源浏览的页面个数、 各学习者对各模块及内容的关注程度; 如对于浏览频次较高的资源页面, 表明受到学习者的关注。在课程章节设计、 体验区, 问题库、 以及资料库等模块使用分析中, 学生的学习习惯能够从其参与度、 个人人均浏览频次等参数中来获得。如对于各章节内的资源访问量较高, 说明学生从课程的学习及体验需求较高, 学习者在模拟的体验区能够参与到网络互动, 激发学习兴趣; 对于问题库的访问量也较大, 说明学生能够从常见问题的解答中来释疑解惑, 便于学习者尽快掌握网络学习方法。
2.2自主学习路径分析
对于学习过程静态信息的获取, 可以帮助我们从中来梳理学生的 “自主学习路径” 。以聚类算法为例, 通过对网络资源模块的访问跳转进行分析, 以 “浏览时间+学号” 作为键值, 以 “浏览顺序” 为序列, 以 “浏览模块” 为预测值来建构挖掘结构, 从中来获得各模块信息的转换情况, 从中来获得学习者的自主学习路径。如在 “课程章节” 与 “体验区” 模块的对比分析中, 学习者的跳转访问概率较低, 而在 “资料库” 与 “问题库” 等辅助模块中, 学习者的跳转概率较大, 说明学生对学习方法的了解较为侧重, 也为我们进一步优化课程链接, 拓宽学习资源提出了要
3.结语
随着对数据挖掘领域的研究深入, 对于计算机技术与心理学、 教育学的知识的融合更加紧密, 因此从数据挖掘的专业化上, 依据现代专门教育理论, 从学习分析的心理认知、 行为认知中进行阐释将会成为主流。同时, 对于现有数据挖掘交互信息的分类, 一方面从课程资源的访问上来探索学习规律, 另一方面从学生认知、 社会层面来对学生的学习行为进行跟踪和提取, 加深对其剖析, 揭示隐藏的知识信息以改善教育决策。另外, 在数据挖掘个性化上, 对于传统的依据学生行为的分析, 难以从总体情况上来提升教学决策参考, 而Siemens教授从构建学习者模型视角, 分析学习者的学习过程, 从中来获取某一类学生的特征值, 以提供个性化的教学服务。对于学习分析技术中的数据挖掘运用, 重在从数据误解方法上来提升教育资源的针对性、 可操作性和灵活性, 满足各类学生的不同需求。
参考文献 :
[1] 魏顺平.学习分析技术:挖掘大数据时代下教育数据的价值[J]. 现代教育技术. 2013(02).
[2] 魏雪峰,宋灵青.学习分析:更好地理解学生个性化学习过程 — —访谈学习分析研究专家George Siemens教授[J]. 中国电化教育. 2013(09).
[3] 孙洪涛. 学习分析视角下的远程教学交互分析案例研究[J]. 中国电化教育. 2012(11).
[4] 吴青,罗儒国.学习分析:从源起到实践与研究[J]. 开放教育研究. 2015(01).
[5] 胡艺龄,顾小清,赵春.在线学习行为分析建模及挖掘[J].开放教育研究. 2014(02).