[摘 要] 大数据的时代背景下,统计学专业迎来了机遇,同时也面临着巨大的挑战。结合大数据分析的特点,分别从培养目标的定位、信息技术教育的提升以及实践教育的增强这三个角度,探讨统计学专业教学改革的方向。
[关 键 词] 大数据;统计学;全数据模式;样本数据
[中图分类号] G642 [文献标志码] A [文章编号] 2096-0603(2016)31-0184-02
目前,“大数据”已经逐渐成为了妇孺皆知的热词。虽然大数据的精确概念是在2009年前后提出来,并于2012年开始流行,然而对于大数据技术的应用早已开展。例如,沃尔玛公司通过销售数据分析,对关联商品组合促销,提升销售量;谷歌公司通过用户的搜索关键词,能够快速地定位流行疾病的病源地。并且随着互联网技术的进步,各种大数据技术的成功案例层出不穷。美国政府在2012年3月发布的《大数据研究和发展倡议》,把大数据称作“未来社会发展的新石油”,把发展大数据研究提到国家战略的高度上来。2015年,《中国大数据发展调查报告》表明近几年来我国大数据市场价值接近40%的速度在增长,2015年达到了115.4亿元。全球化的背景下,大数据已经走进了每一个角落,正在给我们的政府管理、企业运行和信息获取创造价值和机遇;与此同时,也对我们的生活、学习和工作提出了变革要求。
作为一门收集整理数据,并结合数学模型进行量化分析,进而作出推断预测的学科,统计学是一门综合性和应用性比较强的学科。这一属性十分契合大数据分析的要求,因此大数据时代的到来,推动了统计专业的快速发展。近年来,很多的新兴院校都相继开设了统计专业,统计学专业正在面临一个繁荣期。然而,就像一把双刃剑,大数据给统计学专业腾飞和发展荣幸了机遇,与此同时,也对传统的统计学的教育和教学提出了迫切的变革需求。
一、大数据在统计分析中的新特点
(一)数据收集方式的改变
在传统的统计中,数据的收集是通过人为对样本的属性进行逐一采集、整理,形成一系列横平竖直的结构化数据,然后利用这些样本信息,进行描述分析、统计推断。然而,现代的信息技术使得样本数据的收集实现了信息化和自动化。例如,,通过爬虫程序直接抓取互联网数据,工业生产中的传感器获取的数据等等。另外,数据的形式呈现出多样化,除了传统的表格数据,还有诸如文本数据、音频数据和视频数据等。这就需要在统计专业学生培养过程中,一方面重视信息收集方式的教学;另一方面做好多维数据处理技术的传授工作。
(二)样本数据模式和全数据模式
传统统计中,由于数据收集能力的限制,很多时候我们无法获取全数据,只能通过随机样本,利用少数的特征对总体的属性进行统计推断。在大数据时代,数据获取的方式和技术发生了巨大的变化,人们可以通过互联网、即时通讯工具以及数据库,获取各种海量数据。面对这样的海量数据,随机抽样不再有太大的意义了。因此,大数据背景下,全数据就是样本数据,即样本就是总体。传统的统计分析重点是,通过样本信息预测总体的特征属性,大数据分析更加侧重于发现海量数据下的各种关联细节。
(三)模型分析的弱化
传统的统计中,侧重在变量之间建立模型,刻画出变量之间的因果关系,而相关分析只是作为进行模型分析之前,进行数据探索的一个小小的手段而已。然而,在大数据中,数据的结构复杂,变量众多,体量较大,有时候很难用一个“普世”函数描述出变量之间的准确关系。无法综合评价出变量之间关系的情况下,我们可以部分揭示出变量之间的关系。事实上,由于相关分析无需太多的模型假设,运算成本较低等众多原因,使得相关关系的分析成为大数据分析的基础。
(四)模型的复杂性和精确性难以量化平衡
传统的统计学处理的数据,都是在时间和空間设定的情况下结构化的数据。在数据的处理上遵循数据清洗整理,利用经典统计模型,在设定的精度范围里对总体的特征进行推断和分析。这样的过程中,模型的复杂度和精确度,都可以在我们事先设定的情况下进行。然而,在大数据背景下,一方面,数据的收集过分依赖技术手段,很难进行人为的精度控制。另一方面,数据的来源无论是空间上还是时间上都更加复杂,格式多样,这就使得数据前期的清洗处理变得非常困难,由于存在系统性的偏差,很难将全部的杂质项从数据中萃取掉。在秉持“数据多比少好”的情况下,就得接受数据混乱和不确定性的代价。在大数据中忽略一部分模型的精确性,并不是说不要模型的精确性,而是指我们对于模型的精确性的可控性在减弱。
二、统计专业教学改革的方向
时代的发展、技术的进步对于统计学专业提出更高的期望和要求,结合统计学专业现有教学体系中存在的问题,给出了统计学专业教学改革的方向。
(一)培养目标的定位
过去国内对于统计专业定位是分割成诸如经济统计、数理统和其他的统计几个类别。学校的招生过程也是按照这样的几个类别进行招生。这就使得学生的培养被固定在几个人为设定的格子里,湮灭了各个知识之间的交叉结构。自从统计学专业被升格为一级学科之后,这种状况有所改善。随着大数据的出现,统计分析技术的服务范围已经不再局限于诸如学术庙堂、政府部门以及高端公司等这样的精英圈子;普通的社会机构、企业和工厂等各行各业对统计专业产生了迫切需求。
因此,在统计学专业的定位上,应该摒弃传统的简单分割成经济统计和数理统计的理念。大数据背景下,统计学作为一项分析工具,需要与其他专业做好衔接和服务工作,培养多元化的分析人才。在统计学专业培养目标的定位上,应该充分考虑统计分析的工具性,促进统计专业与各自优势学科的交叉和融合,形成“多元化”的培养目标。既能培养出理论分析的精英人才,也能培养出简单数据管理者。
(二)统计理论和信息技术的平衡
传统的统计学专业的课程体系中,专业主干课程围绕数理基础、统计分析以及信息技术这样的几块。通常偏重的统计理论侧重于数理逻辑课程的教学;而侧重与统计应用相关的内容(如经济统计)侧重于统计分析的课程教学。这样的安排都忽略了对统计专业学生进行信息技术的培养。纵观整个数据分析的流程,从最初的数据收集,数据的分析和结论,都是离不开信息技术的支持。特别是大数据分析,无论是硬件上面还是软件上面,都对数据分析的参与者提出了很高的要求。
- 《新课程》杂志征稿通知
- 论文发表中的DOI是什么意思
- 《新课程》杂志论文知网收截图
- 新课程杂志主管单位主办单位说明
- 如何提高发表论文的“命中率”
- 《现代职业教育》杂志每版字数调整为2000字
- 现代职业教育杂志中国知网全文收录截图
- 中国知网期刊大全检索《现代职业教育》杂志
- 编辑在论文发表工作中的重要性
新课程杂志社提示:
本文标题:大数据背景下统计学专业教学改革的思考
当前网址:http://www.xinkecheng.cn/laigao/9879.html