欢迎来到学术参考网
当前位置:发表论文>论文发表

大数据毕业论文开题报告

发布时间:2023-12-12 05:54

大数据毕业论文开题报告

写作点拨:

一、 开题报告封面

论文题目、系别、专业、年级、姓名、导师

二、 论文的背景、目的和意义(目的要明确,充分阐明该课题的重要性):

论文的背景、理论意义、现实意义

三、国内外研究概况(应结合毕业设计题目,与参考文献相联系,是参考文献的概括):

理论的渊源及演进过程、国内有关研究的综述、国外有关研究的综述

四、论文的理论依据、研究方法、研究内容(思想明确、清晰,方法正确、到位,应结合所要研究内容,有针对性)

五、研究条件和可能存在的问题

六、预期的结果

七、论文拟撰写的主要内容 (论文提纲)

八、论文工作进度安排(内容要丰富,不要写得太简单,要充实,按每周填写,可2-3周,但至少很5个时间段,任务要具体,能充分反映研究内容)

开题报告的内容一般包括:题目、理论依据(毕业论文选题的目的与意义、国内外研究现状)、研究方案(研究目标、研究内容、研究方法、研究过程、拟解决的关键问题及创新点)、条件分析(仪器设备、协作单位及分工、人员配置)、课题负责人、起止时间、报告提纲等。

综述开题报告的综述部分应首先提出选题,并简明扼要地说明该选题的目的、相关课题研究情况、理论适用、研究方法。  提纲 开题报告包含的论文提纲可以是粗线条的,是一个研究构想的基本框架。

可采用整句式或整段式提纲形式。在开题阶段,提纲的目的是让人清楚论文的基本框架,没有必要像论文目录那样详细。

硕士论文开题报告

硕士论文开题报告模板4500字

本课题来源于作者在学习和实习中了解到的两个事实,属于自拟课题。

其一,作者在2011年7月在XXX公司调研,了解到现如今各行业都面临着数据量剧增长,并由此带来业务处理速度缓慢,数据维护困难等问题。为了应对此挑战,很多企业开实施大数据发展战略。现如今的大数据发展战略可以概括为两类,一类是垂直扩展。即采用存储容量更大,处理能力更强的设备,此种方式成本较大,过去很多大公司一直采用此种方法处理大数据。但自从2004年Google发布关于GFS,MapReduce和BigTable三篇技术论文之后,云计算开始兴起,2006年Apache Hadoop项目启动。随后从2009年开始,随着云计算和大数据的发展,Hadoop作为一种优秀的数据分析、处理解决方案,开始受到许多 IT企业的关注。相较于垂直扩张所需的昂贵成本,人们更钟情于采用这种通过整合廉价计算资源的水平扩展方式。于是很多IT企业开始探索采用Hadoop框架构建自己的大数据环境。

其二,作者自2013年4月在XXX实习过程中进一步了解到,因为关系数据库在存储数据格式方面的局限,以及其Schema机制带来的扩展性上的不便,目前在大部分的大数据应用环境中都采用非结构化的数据库,如列式存储的Hbase,文档型存储的MangoDB,图数据库neo4j等。这些非结构化数据库因为可扩展性强、资源利用率高,高并发、响应速度快等优势,在大数据应用环境中得到了广泛的应用。但此种应用只解决了前端的业务处理,要真正利用大数据实现商务智能,还需要为决策支持系统和联机分析应用等提供一数据环境——数据仓库。为此,导师指导本文作者拟此题目,研究基于Hadoop框架的数据仓库解决方案。

二、研究目的和意义:

现如今,数据已经渗透到每一个行业,成为重要的生产因素。近年来,由于历史积累和和数据增长速度加快,各行业都面临着大数据的难题。事实上,大数据既是机遇又时挑战。合理、充分利用大数据,将其转变为海量、高增长率和多样化的信息资产,将使得企业具有更强的决策力、洞察发现力和流程优化等能力。因此,很多IT企业都将大数据作为其重要的发展战略,如亚马逊、FaceBook已布局大数据产业,并取得了骄人的成绩。事实上,不止谷歌、易趣网或亚马逊这样的大型互联网企业需要发展大数据,任何规模的企业都有机会从大数据中获得优势,并由此构建其未来业务分析的基础,在与同行的竞争中,取得显著的优势。

相较于大型企业,中小企业的大数据发展战略不同。大公司可以凭借雄厚的资本和技术实力,从自身环境和业务出发,开发自己的软件平台。而中小企业没有那样的技术实力,也没有那么庞大的资金投入,更倾向于选择一个普遍的、相对廉价的解决方案。本文旨在分析大数据环境下数据库的特点,结合当下流行的Hadoop框架,提出了一种适用于大数据环境的数据仓库的解决方案并实现。为中小企业在大数据环境中构建数据仓库提供参考。其具体说来,主要有以下三方面意义:

首先,目前主流的数据库如Oracle、SQL Server都有对应自己数据库平台的一整套的数据仓库解决方案,对于其他的关系型数据库如MySQL等,虽然没有对应数据库平台的数据仓库解决方案,但有很多整合的数据仓库解决方案。而对于非结构化的数据库,因其数据模型不同于关系型数据库,需要新的解决方案,本文提出的基于Hive/Pentaho的数据仓库实现方案可以为其提供一个参考。

其次,通过整合多源非结构化数据库,生成一个面向主题、集成的.数据仓库,可为大数据平台上的联机事务处理、决策支持等提供数据环境,从而有效利用数据资源辅助管理决策。

再次,大数据是一个广泛的概念,包括大数据存储、大数据计算、大数据分析等各个层次的技术细节,本文提出的“大数据环境下的数据仓库解决方案及实现“丰富了大数据应用技术的生态环境,为大数据环境下的数据分析、数据挖掘等提供支撑。

三、国内外研究现状和发展趋势的简要说明:

本文研究的主体是数据仓库,区别于传统基于关系型数据库的数据仓库,本文聚焦大数据环境下基于非结构数据库的数据仓库的构建与实现。因此,有必要从数据仓库和大数据环境下的数据库两方面进行阐述。

(一) 数据仓库国内外研究现状

自从Bill Inmon 在1990年提出“数据仓库”这一概念之后,数据仓库技术开始兴起,并给社会带来新的契机,逐渐成为一大技术热点。目前,美国30%到40%的公司已经或正在建造数据仓库。现如今随着数据模型理论的完善,数据库技术、应用开发及挖掘技术的不断进步,数据仓库技术不断发展,并在实际应用中发挥了巨大的作用。以数据仓库为基础,以联机分析处理和数据挖掘工具为手段的决策支持系统日渐成熟。与此同时,使用数据仓库所产生的巨大效益又刺激了对数据仓库技术的需求,数据仓库市场正以迅猛的势头向前发展。

我国企业信息化起步相对较晚,数据仓库技术在国内的发展还处于积累经验阶段。虽然近年来,我国大中型企业逐步认识到利用数据仓库技术的重要性,并已开始建立自己的数据仓库系统,如中国移动、中国电信、中国联通、上海证券交易所和中国石油等。但从整体上来看,我国数据仓库市场还需要进一步培育,数据仓库技术同国外还有很大差距。为此,我国许多科技工作者已开始对数据仓库相关技术进行深入研究,通过对国外技术的吸收和借鉴,在此基础上提出适合国内需求的技术方案。

(二) 非结化数据库国内外研究现状

随着数据库技术深入应用到各个领域,结构化数据库逐渐显露出一些弊端。如在生物、地理、气候等领域,研究面对的数据结构并不是传统上的关系数据结构。如果使用关系数据库对其进行存储、展示,就必须将其从本身的数据结构强行转换为关系数据结构。采用此种方式处理非结构数据,不能在整个生命周期内对非关系数据进行管理,并且数据间的关系也无法完整的表示出来。在此背景下,非结构化数据库应运而生。相较于关系数据库,非结构数据库的字段长度可变,并且每个字段的记录又可以由可重复或不可重复的子字段构成。如此,它不仅可以处理结构化数据,更能处理文本、图象、声音、影视、超媒体等非结构化数据。近年来,随着大数据兴起,非结构数据库开始广泛应用,以支持大数据处理的多种结构数据。

目前,非结构化的数据库种类繁多,按其存储数据类型分,主要包含内存数据库、列存储型、文档数据库、图数据库等。其中,常见的内存数据库有SQLite,Redis,Altibase等;列存储数据库有Hbase,Bigtable等;文档数据库有MangoDB,CouchDB,RavenDB等;图数据库有Neo4j等。近年来,我国非结构数据库也有一定发展,其中最具代表的是国信贝斯的iBASE数据库。可以预见在不久的将来,伴随这大数据的应用,非结构数据库将会得到长足的发展和广泛的应用。

四、主要研究内容和要求达到的深度:

本文研究的方向是数据仓库,并且是聚焦于大数据这一特定环境下的数据仓库建设,其主要内容包括以下几点:

1. 非结构数据库的数据仓库解决方案:本文聚焦于大数据这一特定环境下的数据仓库建设,因为大数据环境下的数据仓库建设理论文献很少,首先需要以研究关系数据库型数据仓库的解决方案为参考,然后对比关系数据库和非结构数据库的特点,最后在参考方案的基础上改进,以得到适合非结构数据库环境的数据仓库解决方案。

2. 非结构数据库和关系数据库间数据转换:非结构数据库是对关系数据库的补充,很多非结构数据库应用环境中都有关系数据库的身影。因此,非结构数据库和关系数据库间数据转换是建立非结构数据库需要解决的一个关键问题。

3. 基于非结构数据库的数据仓库构建:本文拟采用手礼网的数据,分析其具体的数据环境和需求,为其构建基于非结构数据库的数据仓库,主要包括非结构数据库的数据抽取,Hive数据库入库操作和Pentaho前台数据展现等。

五、研究工作的主要阶段、进度和完成时间:

结合研究需要和学校教务管理的安排,研究工作主要分以下四阶段完成:

第一阶段:论文提纲:20XX年6月——7月

第二阶段:论文初稿 :20XX年8月——10月

第三阶段:论文修改:20XX年11月——2014年3月

第四阶段:最终定稿:20XX年4月

六、拟采用的研究方法、手段等及采取的措施:

在论文提纲阶段,本文拟采用调查统计的方法,收集目前大数据环境下数据库应用情况,着重统计各类型数据库的应用比例。同时采用文献分析和个案研究的方法研究数据仓库构建的一般过程和对应的技术细节,并提出解决方案。在论文初稿和修改阶段,本文拟通过实证研究,依据提纲阶段在文献分析中收集到的理论,基于特定的实践环境,理论结合实践,实现某一具体数据仓库的构建。最后采用定性和定量相结合的方法,详细介绍大数据环境下数据库和数据仓库的特点,其数据仓库实现的关键问题及解决方案,以及数据仓库个例实现的详细过程。

七、可能遇见的困难、问题及拟采取的解决办法、措施:

基于本文的研究内容和特点分析,本文在研究过程中最有可能遇到三个关键问题。

其一,非结构数据库种类繁多,每类数据库又对应有不同的数据库产品,由于当下非结构数据库没有统一标准,即便同类数据库下不同产品的操作都不尽相同,难以为所有非结构数据库提出解决方案。针对此问题,本文拟紧贴大数据这一背景,选择当下大数据环境中应用最多的几类数据库的代表性产品进行实现。

其二,虽然经过二十年的发展,数据仓库的理论已日趋完善,但大数据是近几年才发展起来的技术热点,大树据环境下的数据仓库建设理论文献很少。针对此问题,本文拟参考现有的成熟的关系数据库环境下数据仓库构建方案和非结构化数据仓库理论,研究适合非结构数据库的数据仓库构建方案,请导师就方案进行指导,然后再研究具体技术细节实现方案。

其三,基于大数据环境的数据仓库实现是本文重要的组成部分,要完成此部分的工作需要企业提供数据支持,但现在数据在企业当中的保密级别都很高,一般企业都不会将自己的业务数据外传。针对此问题,本文拟采用企业非核心业务数据进行数据仓库实现。

八、大纲

本文的基本构想和思路,文章拟分为导论、大数据环境下的数据库介绍、大数据下数据仓库关键问题研究、基于XX电子商务的大数据下数据仓库实现、结论五部分。

导论

一、研究背景

二、国内外研究现状述评

三、本文的主要内容与研究思路

第一章 大数据环境下的数据库介绍

第一节 大数据对数据库的要求

第二节 关系数据库和非结构数据库比较

第三节 大数据下常用非结构数据库介绍

小结

第二章 大数据下数据仓库关键问题研究

第一节 非结构数据模型和关系数据模型的转换

第二节 基于多源非结构数据库的数据抽取

第三节 数据类型转换

第四节 数据仓库前端展示

第三章 大数据下数据仓库实现方案

第一节 大数据环境介绍

第二节 实现方案

第二节 Hive介绍

第三节 Pentaho介绍

第四章 基于XX电子商务的大数据下数据仓库实现

第一节 需求分析

第二节 模型设计

第三节 概要设计

第四节 基于Hive的数据入库操作实现

第五节 基于Pentaho的数据仓库前端展示实现

结论

毕业论文的开题报告该怎么写

毕业论文的开题报告该怎么写

开题报告是指开题者对科研课题的一种文字说明材料,这是一种新的应用写作文体。开题报告,就是当课题方向确定之后,课题负责人在调查研究的基础上撰写的报请上级批准的选题计划。

[1]毕业论文开题报告

开题报告是指开题者对科研课题的一种文字说明材料。这是一种新的应用写作文体,这种文字体裁是随着现代科学研究活动计划性的增强和科研选题程序化管理的需要应运而生的。开题报告一般为表格式,它把要报告的每一项内容转换成相应的栏目,这样做,既便于开题报告按目填写,避免遗漏;又便于评审者一目了然,把握要点。

开题报告包括综述、关键技术、可行性分析和时间安排等四个方面 。

开题报告作为毕业论文答辩委员会对学生答辩资格审查的依据材料之一。

由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题。

开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法。

开题报告是由选题者把自己所选的课题的概况(即"开题报告内容"),向有关专家、学者、科技人员进行陈述。然后由他们对科研课题进行评议。亦可采用"德尔菲法"评分;再由科研管理部门综合评议的意见,确定是否批准这一选题。开题报告的内容大致如下:课题名称、承担单位、课题负责人、起止年限、报名提纲。

报名提纲包括:

(1)课题的目的、意义、国内外研究概况和有关文献资料的主要观点与结论;

(2)研究对象、研究内容、各项有关指标、主要研究方法(包括是否已进行试验性研究);

(3)大致的进度安排;

(4)准备工作的情况和目前已具备的条件(包括人员、仪器、设备等);

(5)尚需增添的主要设备和仪器(用途、名称、规格、型号、数量、价格等);

(6)经费概算;

(7)预期研究结果;

(8)承担单位和主要协作单位、及人员分工等。

同行评议,着重是从选题的依据、意义和技术可行性上做出判断。即从科学技术本身为决策提供必要的依据。

[2]如何撰写毕业论文开题报告

开题报告的基本内容及其顺序:论文的.目的与意义;国内外研究概况;论文拟研究解决的主要问题;论文拟撰写的主要内容(提纲);论文计划进度;其它。

其中的核心内容是“论文拟研究解决的主要问题”。在撰写时可以先写这一部分,以此为基础撰写其他部分。具体要求如下:

1.论文拟研究解决的问题

明确提出论文所要解决的具体学术问题,也就是论文拟定的创新点。

明确指出国内外文献就这一问题已经提出的观点、结论、解决方法、阶段性成果、……。

评述上述文献研究成果的不足。

提出你的论文准备论证的观点或解决方法,简述初步理由。

你的观点或方法正是需要通过论文研究撰写所要论证的核心内容,提出和论证它是论文的目的和任务,因而并不是定论,研究中可能推翻,也可能得不出结果。开题报告的目的就是要请专家帮助判断你所提出的问题是否值得研究,你准备论证的观点方法是否能够研究出来。

一般提出3或4个问题,可以是一个大问题下的几个子问题,也可以是几个并行的相关问题。

2.国内外研究现状

只简单评述与论文拟研究解决的问题密切相关的前沿文献,其他相关文献评述则在文献综述中评述。基于“论文拟研究解决的问题”提出,允许有部分内容重复。

3.论文研究的目的与意义

简介论文所研究问题的基本概念和背景。

简单明了地指出论文所要研究解决的具体问题。

简单阐述如果解决上述问题在学术上的推进或作用。

基于“论文拟研究解决的问题”提出,允许有所重复。

4.论文研究主要内容

初步提出整个论文的写作大纲或内容结构。由此更能理解“论文拟研究解决的问题”不同于论文主要内容,而是论文的目的与核心。

[3]毕业论文开题报告的格式(通用)

由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题说清楚,应包含两个部分:总述、提纲。

1 总述

开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法、必要的数据等等。

2 提纲

开题报告包含的论文提纲可以是粗线条的,是一个研究构想的基本框架。可采用整句式或整段式提纲形式。在开题阶段,提纲的目的是让人清楚论文的基本框架,没有必要像论文目录那样详细。

3参考文献

开题报告中应包括相关参考文献的目录

4 要求

开题报告应有封面页,总页数应不少于4页。版面格式应符合以下规定。

毕业设计开题报告怎么写?

毕业设计(论文)开题报告

题目。

1. 本课题的来源、选题依据。

2. 本课题的设计(研究)意义(相关技术的现状和发展趋势)。

3. 本课题的基本内容、重点和难点,拟采用的实现手段(途径)。

4. 文献综述(列出主要参考文献的作者、名称、出版社、出版时间以及与本课题相关的主要参考要点)。

指导教师意见。

指导教师。

系意见。

开题报告填写要求:

1、学生接受毕业设计(论文)任务书后,要围绕课题方向查阅文献、收集资料,进行调研,充分了解课题相关技术的现状和发展趋势,在此基础上确定自己的课题研究范围。

2、开题报告应着重说明课题来源、选题依据,本课题的设计(研究)意义,课题的主要内容、重点和难点,拟采用的实现手段(途径)。

3、开题报告作为毕业设计(论文)答辩委员会对学生答辩资格审查的依据材料之一。

4、此报告应在指导教师指导下,由学生在毕业设计(论文)工作前期内完成,经指导教师签署意见审查后生效。开题报告通过后,原则上一般不再随意改题。如确有特殊原因需改题者,须由学生写出书面报告,经指导教师签署意见,教研室审核批准方可。改题后,需重新撰写开题报告。

5、开题报告内容必须按现代制造工程系统一设计的电子文档标准格式打印,完成后应及时交给指导教师签署意见。

6、学生查阅资料的参考文献应在3篇及以上,开题报告的字数要在1000字以上。

毕业论文的开题报告怎么写

毕业论文开题报告范文 [1]毕业论文开题报告 开题报告是指开题者对科研课题的一种文字说明材料。这是一种新的应用写作文体,这种文字体裁是随着现代科学研究活动计划性的增强和科研选题程序化管理的需要应运而生的。开题报告一般为表格式,它把要报告的每一项内容转换成相应的栏目,这样做,既便于开题报告按目填写,避免遗漏;又便于评审者一目了然,把握要点。 开题报告包括综述、关键技术、可行性分析和时间安排等四个方面 。 开题报告作为毕业论文答辩委员会对学生答辩资格审查的依据材料之一。 由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题。 开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法。 开题报告是由选题者把自己所选的课题的概况(即"开题报告内容"),向有关专家、学者、科技人员进行陈述。然后由他们对科研课题进行评议。亦可采用"德尔菲法"评分;再由科研管理部门综合评议的意见,确定是否批准这一选题。开题报告的内容大致如下:课题名称、承担单位、课题负责人、起止年限、报名提纲。报名提纲包括: (1)课题的目的、意义、国内外研究概况和有关文献资料的主要观点与结论; (2)研究对象、研究内容、各项有关指标、主要研究方法(包括是否已进行试验性研究); (3)大致的进度安排; (4)准备工作的情况和目前已具备的条件(包括人员、仪器、设备等); (5)尚需增添的主要设备和仪器(用途、名称、规格、型号、数量、价格等); (6)经费概算; (7)预期研究结果; (8)承担单位和主要协作单位、及人员分工等。 同行评议,着重是从选题的依据、意义和技术可行性上做出判断。即从科学技术本身为决策提供必要的依据。 [2]如何撰写毕业论文开题报告 开题报告的基本内容及其顺序:论文的目的与意义;国内外研究概况;论文拟研究解决的主要问题;论文拟撰写的主要内容(提纲);论文计划进度;其它。 其中的核心内容是“论文拟研究解决的主要问题”。在撰写时可以先写这一部分,以此为基础撰写其他部分。具体要求如下: 1.论文拟研究解决的问题 明确提出论文所要解决的具体学术问题,也就是论文拟定的创新点。 明确指出国内外文献就这一问题已经提出的观点、结论、解决方法、阶段性成果、……。 评述上述文献研究成果的不足。
提出你的论文准备论证的观点或解决方法,简述初步理由。 你的观点或方法正是需要通过论文研究撰写所要论证的核心内容,提出和论证它是论文的目的和任务,因而并不是定论,研究中可能推翻,也可能得不出结果。开题报告的目的就是要请专家帮助判断你所提出的问题是否值得研究,你准备论证的观点方法是否能够研究出来。 一般提出3或4个问题,可以是一个大问题下的几个子问题,也可以是几个并行的相关问题。 2.国内外研究现状 只简单评述与论文拟研究解决的问题密切相关的前沿文献,其他相关文献评述则在文献综述中评述。基于“论文拟研究解决的问题”提出,允许有部分内容重复。 3.论文研究的目的与意义 简介论文所研究问题的基本概念和背景。 简单明了地指出论文所要研究解决的具体问题。 简单阐述如果解决上述问题在学术上的推进或作用。 基于“论文拟研究解决的问题”提出,允许有所重复。 4.论文研究主要内容 初步提出整个论文的写作大纲或内容结构。由此更能理解“论文拟研究解决的问题”不同于论文主要内容,而是论文的目的与核心。 [3]毕业论文开题报告的格式(通用) 由于开题报告是用文字体现的论文总构想,因而篇幅不必过大,但要把计划研究的课题、如何研究、理论适用等主要问题说清楚,应包含两个部分:总述、提纲。 1 总述 开题报告的总述部分应首先提出选题,并简明扼要地说明该选题的目的、目前相关课题研究情况、理论适用、研究方法、必要的数据等等。 2 提纲 开题报告包含的论文提纲可以是粗线条的,是一个研究构想的基本框架。可采用整句式或整段式提纲形式。在开题阶段,提纲的目的是让人清楚论文的基本框架,没有必要像论文目录那样详细。 3 参考文献 开题报告中应包括相关参考文献的目录 4 要求 开题报告应有封面页,总页数应不少于4页。版面格式应符合以下规定。 开 题 报 告 学 生: 一、 选题意义 1、 理论意义 2、 现实意义
二、 论文综述 1、 理论的渊源及演进过程 2、 国外有关研究的综述 3、 国内研究的综述 4、 本人对以上综述的评价 三、论文提纲 前言、 一、 1、 2、 3、 ··· ··· 二、 1、 2、 3、 ··· ··· 三、 1、 2、 3、 结论 四、论文写作进度安排 毕业论文开题报告提纲 一、开题报告封面:论文题目、系别、专业、年级、姓名、导师 二、目的意义和国内外研究概况 三、论文的理论依据、研究方法、研究内容 四、研究条件和可能存在的问题 五、预期的结果 六、进度安排 [4]毕业论文 毕业论文是高等学校应届毕业生总结性的独立作业,是学生运用在校学习的基本知识和基础理论,去分析、解决一两个实际问题的实践锻炼过程,也是学生在校学习期间学习成果的综合性总结,是整个教学活动中不可缺少的重要环节。撰写毕业论文对于培养学生初步的科学研究能力,提高其综合运用所学知识分析问题、解决问题能力有着重要意义

上一篇:科学小论文800范文

下一篇:小学课外科技活动论文