欢迎来到学术参考网

探析大数据时代统计学专业教学体系的改革

发布时间:2015-05-07 13:58

  一、大数据时代统计学专业发展的新特点

  (一)数据化的信息收集

  传统的统计研究主要是对已收集的数据进行各种技术分析,包括描述性分析、推断性分析、截而分析、时间序列分析等,侧重点在于技术分析手段的使用上。然而大数据时代,关注的是信息本身。现代信息系统的使用使大数据成为可能,文字、地理方位、沟通等,任何事物都可以量化,一切现象都可以用数据或表格来诊释。因此,大数据背景下世界是由各种信息和数据所构成的。

  (二)数据模式的研究对象

  在信息处理能力受限制的过去,人们缺少用来分析所收集数据的工具,因此产生了随机抽样。随机抽样法的目的是用最少的数据获得最多的关于总体的信息,从而使用样本对总体进行推断。然而,在大数据时代,数据处理的方式和技术发生了巨大的改变,人们可以通过互联网、数据库以及各种通讯工具获得海量数据,这时随机抽样就失去了它原来的意义。简单廉价的数据收集方法,足够的数据处理和存储能力,使得全数据模式成为可能。因此,大数据背景下样本即为总体。放弃随机抽样分析的捷径,采用所有数据的方法,可以发现一些隐藏在海量数据下的细节。

  (三)混杂性的数据处理思维

  传统的统计学处理数据的步骤是首先对数据进行整理和清洗,剔除不完整的或者异常值,然后再利用样本信息,在允许的误差范围内对总体进行推断和分析,即通过调整精确度的大小来对总体进行研究和分析。然而,在大数据背景下,来自各个时间和空间的数据来源纷杂,格式广泛,在萃取或处理数据的时候,很难做到把所有的数据都进行仔细地清洗。这种情况下,必须接受数据的混乱和不确定性,因为数据多比少好,因此更多的数据信息更加智能、更加精确的算法系统还重要。当拥有大量数据的时候,可以忽略一部分精确性,但并不是说不需要精确性,而是数据规模不断扩大时,确切的数量已经不再那么重要了,可以通过大规模的数据来发现事物背后的规律。

  (四)相关关系的基础分析方法

  传统的统计中,大部分相关关系分析仅限于寻求线性关系,或是在建立假设的基础上揭示数据相互之间的因果关系,例如Granger经验就是依据时间序列数据对变量之间的因果关系进行的判断,但往往会产生一些虚假的因果关系。这是因为统计关系并没有蕴含多少真实的因果关系。在大数据背景下,数据点以数量级方式增长,用数据驱动的相关关系分析不再需要建立在假设的基础上,所以相关关系分析不容易受偏见的影响而发生错误。大数据时代相关关系通过回答“是什么”的问题,为人们认识世界提供了一种新的视角。因此,相关关系统计分析是大数据预测的基础。

  二、统计学专业教学体系中存在的问题

  大数据背景下传统的统计学专业教学体系存在的问题凸显,具体体现在以下几个方面。

  (一)培养目标无法适应大数据时代的社会需求

  传统的统计学专业教学体系的培养目标是通过统计专业核心课程内容的介绍,锻炼学生收集、整理和分析数据的能力,培养“应用型”统计专业人才。然而,大数据的出现,使得通过数据分析获得知识、商机和社会服务的能力,从以往局限于少数的学术精英圈子扩大到了普通的社会机构、企业和政府部门,各行各业对统计数据、统计分析的需要使得统计学专业受到了前所未有的关注。大数据背景下,要求统计学作为一种分析工具,能够与其他专业相互衔接,相互服务,培养“复合型”专业人才。因此,传统的统计学专业教学体系培养目标存在两个方而的挑战:第一,如何协调统计与其他专业之间的关系;第二,如何从“应用型”向“复合型”人才进行转变。

  (二)忽视数据的收集和创新

  传统的统计学专业教学体系重视数据的分析技术,更多的课程设置是围绕着数据分析方法和技术展开的,例如多元统计分析、时间序列分析、统计预测与决策分析等。基础的数据收集部分只在统计学原理中有一章的内容介绍,而且是作为非重点一带而过的。大数据以海量的数据为分析研究的对象,将一切社会经济现象进行量化,重视的是信息的收集和数据的创新,包括数据的再利用,数据的重组,数据的扩展,数据的折旧以及数据的开放等各个方面。这些内容在原有的教学体系中是没有体现的。

  (三)与大数据时代脱节的教学内容

  传统的统计学专业教学体系原有的教学内容,在近二十年内变化不大。专业的主干课程有统计学原理、国民经济核算、计量经济学、抽样技术与方法等。而在大数据背景下,教学内容以数据模式为研究对象,强调对所有的数据进行分析,而不是开展随机抽样;允许不精确的存在,而不是在给定的精确程度下对总体进行推断和分析;关注海量数据之间的相关关系,而不是强调数据之间的因果联系。这些内容都无法在现有的教学体系中体现,因此,传统的专业教学体系与大数据时代是脱节的。

  (四)实践教学环节薄弱

  随着“应用型”统计专业人才培养目标的提出,学校对实践教学的重视增强,与过去相比,现有的专业教学体系中已经增加了实践教学环节。但是,在大数据背景下,实践教学仍然是统计学专业教学体系中的薄弱环节。主要表现在两个方而:(1)以模型驱动为主的实践教学模式已不适应大数据时代的要求。现有的实践教学内容并不是从数据出发,而是通过寻求一些适合模型的数据来“证明”这个模型的确有意义。这种思维方式与大数据时代的要求是不适应的,因为创造模型的目的是适应现实数据,而不是由模型驱动。(2)以SPSS、Eviews为主的软件教学已无法处理大数据。现有的实践教学中,主要讲授的是传统的统计分析软件SPSS和Eviews,因为这两种软件发展成熟,操作简单,可以处理一般的计量模型和时间序列。但是,大数据时代数据是海量的、复杂的,用简单的软件已无法处理和实施。

  三、统计学专业教学体系改革的方向

  根据以上分析,时代的发展对统计学专业提出了更高的要求,现有的教学体系中存在的各种问题即为统计学专业教学体系改革的方向。

  (一)准确定位统计学专业的人才培养目标,重新设计主干课程的教学内容

  大数据时代要求培养“复合型”统计专业人才,因此教学体系的培养目标要从简单的“应用型”向“复合型”转变。“复合型”统计专业人才要求学生除了具备数据收集、处理和分析的能力外,还要对统计学应用领域的背景知识有一定的了解。因此,按这个培养目标,需要对现有教学体系中的主干课程重新进行调整和设计。专业主干课程分为方法和应用两个方面。方法类的课程除了原有的计量经济学、时间序列分析、多元统计分析等外,又增加了机器学习、模拟算法、数据挖掘,R软件分析(或SAS软件分析)等处理复杂大数据的方法的课程。应用类课程在保留原有的国民经济核算,金融统计,证券投资,会计学基础外,增加一些统计学应用领域的基础知识课程,例如商业统计、生物统计、保险与精算统计等。此外,适当调整各专业主干课程的课时,一些课程可以增加课时,如软件分析、数据挖掘等,一些课程可以缩减课时,仅作一些简单的介绍,如抽样技术等。

  (二)转变固有的思维方式,在大数据背景下积极推进教学改革

  大数据时代,数据更多、更杂,传统统计学思维方式受到了极大的挑战。因此,以大数据为背景,转变固有的思维方式,从以统计技术方法为中心转换到以信息数据为中心,推进统计学专业教学改革十分重要。具体来说,可以弱化传统的推理论证的教学模式,强化数据收集、数据处理和数据分析的能力培养;强调数据本身的价值,让数据说话,用简单的方法了解数据背后所隐藏的信息和规律;使用项目式训练,让学生从项目中真正体验数据化处理的整个过程,达到理论和方法的结合;加强课堂教学与实验教学的统一和贯通,如在传统的教学过程中,将统计学原理、多元统计分析结合SPSS软件介绍,而时间序列分析又采用E-views进行介绍,造成学生疲于学习各种软件,实际上SAS,R等统计软件可以实现所有的功能,用一种软件与课堂教学融合贯通能帮助学生更好更深地掌握软件的使用。

  (三)创新实践教学模式,加强实践教学的开展

  从以模型驱动的实践教学模式转变为以数据驱动的教学模式,构造课堂案例教学、实验教学、课后项目式训练、校外实习基地锻炼四位一体的创新型实践教学模式。计算机快速发展的今天使得大数据成为现实,在处理数据的时候,根据数据的特征创造出新的计算方法来满足实际需要,这就是数据驱动模式。在实践教学的过程中,要强调统计数据、计算机编程以及统计分析软件的结合。目前,R软件和SAS软件显示出了强大的数据处理和数据分析功能,实践教学环节中可以把这两种中的一种融入到专业课程中去,将计算机软件与课堂教学结合起来。此外,课后的项目式训练和校外实习可以带动学生了解和掌握整个数据分析实践的流程,激发学生学习的兴趣,在实践教学的过程中要多鼓励、多开展。

上一篇:探析对统计学的认知

下一篇:心理统计学考试成绩的影响因素及策略