欢迎来到学术参考网

分析计算机数据库的发现和挖掘

发布时间:2015-12-15 14:28

摘 要:数据库的发现和挖掘,为全球的经济信息处理提供了便利,同时它也为人类的日常生活带来便利。在全球运行的各个行业里,数据库的发现和挖掘技术应用无处不在。它成为了社会体系中不可缺少的一部分。

关键词:数据库的发现;数据挖掘的地位
  随着经济的发展,我们的生活在不断的变化,伴随着这种变化,计算机的应用应运而生,它成为了我们生活中不必可少的帮手。它在各个领域中充当着主角的角色。数据库的发现和挖掘为信息数据的处理起到了辅助的作用,有了他们的帮助,信息数据处理将会变得更加快速,更加准确。现在我将对计算机数据库的发现和挖掘进行分析。         
一、数据库与数据挖掘的关系     
  数据库是以一定的组织形式存放在计算机存储介质上的相互关联的数据的集合,它用
  于描述事物本身和事物之间的联系。并且它是由作为商业数据计算机化管理的早期方法而产生的。而数据的挖掘是数据库应用和研究的一个新领域。它是将海量的信息数据进行挖掘,筛选出所需要的知识,这些知识是未先知的,有效的,能够帮助人们解决问题的。并且它是以通过对历史数据的分析统计得出用户感兴趣的结果为目标,进而对人类的行为决策作出影响。它以数据库为铺垫,进行多学科领域的交叉研究。     
二、数据挖掘与传统分析方法的区别     
  数据挖掘与传统的数据分析方法的本质区别是,数据挖掘是在没有在明确假设的前提下,对信息进行深入挖掘,发现知识。它挖掘后得到的信息应是具有先未知、有效和可实用性三个特征。     
三、数据挖掘成为数据处理中的主导地位     
  近年来,数据挖掘引起了信息产业界的极大关注。由于经济的迅速崛起,信息产业不断扩大,现在的计算机数据存储容量已经超过了人们使用该数据存储和使用其中数据的能力,这就引发了计算机行业的又一次革新,这次革新的产物便是数据挖掘,数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(KDD),也有人把数据挖掘视为数据库中知识发现过程中的一个基本步骤。知识的发现过程,分为以下三个步骤:(1)数据准备、(2)数据挖掘、(3)结果表达和解释。数据挖掘与机器学习相结合,它们的技术提供了推动KDD过程的算法,并成为了KDD核心,被运用在各个领域之中。
  随着数据挖掘技术的发展,其功能的发现更是用于指定数据挖掘任务中要找的重要模式类型。数据挖掘工作的任务一般可以分为两类,即描述类与预测式。描述性的挖掘任务是用来刻划数据库中的数据的一般特性,而预测性挖掘任务则是根据当前的数据进行推断,进而预测新的数据。这两种任务既是数据挖掘工作中的首要任务,又是数据挖掘工作能够更好完成的基石。
  数据挖掘的产生为企业,为人类生活作出了很大的贡献。下面我将以贝尔大西洋和美国万国宝通银行为例进行说明。
  (1)贝尔大西洋公司是一家以电话电报为主营业务的公司,当它面对报告电话问题时,它会采用一些方法进行应对。随着时代的变迁,它们所采用的方法也在改变。而促使它改变的理由就是潜伏在它商业背后的巨大利润。1991年,贝尔大西洋公司采用的是专家系统做此决定,在1999年,公司改变策略,专家系统被数据挖掘创建的一组规则取代,这些与机器学习相结合所得到的规则每年为公司节省了1000多万美元。
  (2)美国万国宝通银行,在二十世纪八十年代时,使用的是统计学的方法将贷款申请分为三类,肯定接受的申请,肯定拒绝的申请和需专家判定的申请。专家预测申请者是否会拖延还款时间的准确率只有百分之五十,而使用数据挖掘与机器学习产生的规则预测的准确率达到了百分之七十。
  由此可见,数据挖掘的研究是成功的,它为企业获得了更大的利益,更为员工操作的烦琐提供了简洁。并且在信息处理领域中,占据了主导的地位。     
四、数据挖掘的技术与工具     
 伴随着越来越多的软件供应商加入数据挖掘的这一行列,使得现有的挖掘工具的性能得到了近一步的增强,这也使得其价格的门槛迅速降低,为应用的普及带来了可能。为了使数据挖掘更加普遍,使用者在使用时对其在技术与工具上的了解也成为了很重要的一部分。下面我将向大家介绍一下数据挖掘工作中的数据挖掘技术与工具。
(一)数据挖掘的技术方法分为三种:决策树、神经网络及规则归纳。
  (1)决策树的核心是某种归纳算法,它是先利用训练集生成一个测试函数,然后在根据不同的取值建立分支,形成一个决策树,最后在将它转化为规则。使用者利用这些规则对新事例进行分类。
  (2)神经网络,它是建立在可以自学的数学模型基础之上的,在结构上模仿生物神经网络,是一类非线性的,通过训练达到学习目的的预测模型。
  (3)规则归纳,他是数据挖掘领域中,最常用的一个格式。它由一连串的“如果......就“这样的逻辑规则对数据进行细分,从而产生一组非体系结构的条件集,然后将这个条件集用于预测新数据。
  这三种方法,分别为不同的人群提供了不同的方法,使得人们在使用的过程中,没有后顾之忧。进而发挥出数据挖掘的最大潜力。
(二)数据挖掘工作的工具
  1、数据挖掘工具的分类
  一般来讲,数据挖掘工具根据其使用的范围分为两类:专用数据挖掘工具和通用数据挖掘工具。专用数据挖掘工具是针对某个特定的领域问题提供解决方案的,它在涉及算法的时候充分的考虑到数据和需求的特殊性,并且做了优化;而另一类是不区分具体的数据含义的,它采用通常的挖掘算法,处理常见的数据类型。
  2、数据挖掘工具的选择
  数据挖掘工作是一个过程,只有将数据挖掘工具提供的技术和实施经验与企业的业务逻辑和需求紧密结合,并在实施的过程中不断的磨合,才能取得成功。因此在选择数据挖掘工具的时候,要全面的考虑多方面的因素,慎重选择。
  数据库的发现与挖掘,在数据大量产生和被收集的时代产生,给社会,给人类注入了新的生存力量。在科技日益发达,生存环境不断的改变下,新的力量,它的作用是无穷的,我们赖以生存的社会,需要科技的不断创新,需要新的发现。数据库的再次深入研究在这个快速发展的时代,又一次得到了大家的认可,又一次得到了成功的喜讯。我们通过应用数据挖掘,了解和获得了更大的利润所在,它的建立标志着社会的进步。它在我们即将被数据和信息的汪洋大海淹没中,伸出了援助之手。因此,它的发现和创造是伟大的。
     
参考文献:
[1]张晓丹.中国西部科技[J].山西出版社.2009(6)
[2]安淑芝等.数据仓库和数据挖掘[M].北京:清华大学出版社,2005
[3]耶鲁大学等著.杨冬青等译.数据库系统概念[M].2009
[4]纪希禹.数据挖掘技术应用实例[M].2009(8)

上一篇:探寻讲与练的“黄金分割点”

下一篇:高校计算机工程教育实践教学改革探索