sts论文模板

发布时间：2023-03-08 13:22

sts论文模板

传统时间序列聚类的缺点：

1）时间序列聚类的研究一般采用等长划分，会丢失重要特征点，对聚类结果有负面影响。

2）采用时间序列测量值不能准确度量相似度。

如下埃博拉出血热、卫生部在数值上很相似，但教育部和卫生部在形状更相似。若是以形状作为度量传统的欧氏距离可能就不太合适了。

不等长时间序列滑窗STS聚类算法：

1）通过标准分数z_score预处理，消除时间序列观测值数量级差异的影响。

2）更改了相似度计算的方式，采用基于滑窗的方法计算不等长序列的距离。

3）采用类k-means的聚类算法的中心曲线计算方法。

时间序列数据因其趋势信息的直观展现形式，广泛应用于社交网络、互联网搜索和新闻媒体数据分析中。例如：Google应用搜索流感的相关信息的时间序列预测流感爆发趋势。根据某话题热度时间序列数据趋势的规律性，通过聚类区分不同类型的时间序列数据。同一类簇的Twitter话题具有相同或相似的发展趋势，进而应用于话题的发展趋势的预测。

时间序列聚类算法可以分为两类。

1）基于原始数据的时间序列聚类算法。

2）基于特征的时间序列聚类算法。

基于特征的时间序列聚类算法指根据原始数据从时间序列中提取形态特征（极值点位置、分段斜率）、结构特征（平均值、方差等统计值特征）、模型特征（模型的预测值），从而根据这些特征值进行聚类。这类方法的优点解决了不等长时间序列聚类问题，缺点是减弱了原始数据值得影响，聚类的形状趋势信息往往比较粗糙。

3. HOW

一、距离度量公式

STS距离计算的是累加时间序列间每个时间间隔斜率差的平方，公式

如上图所示，g1、g2和g2、g3的欧式距离的数值更相近。g1、g2的STS距离大于g2、g3的数值。在形状距离上，STS距离计算方式表现更好，一定程度上可以解决欧式距离度量时间序列局部特征信息确实和受观测数值数量级差异影响大的问题，但是依旧无法度量不等长时间序列的距离。

基于滑窗的STS距离公式。

如上图所示，当计算不同长度的时间序列的s和r的距离时，先不断平移时间序列s，然后找到s和r距离最近的字段，就如同上图虚线之间的位置，此时s和r距离最近，这个最近距离作为s和r之间的距离。

二、预处理过程

z-score标准分数用数据观测值和观测值平均值的距离代替原观测值。z-score处理后的数据平均值为0，标准差为1。标准差的作用是统一量纲，去除数值的数量级差异影响。

总结

本论文提出了形状距离的不等长时间序列的聚类方法。我们可以学到的有

1）z-score统一量纲，消除数值数量级差异，聚类效果更好。

2）计算x和y时间序列的STS距离，可以平移其中一个时间序列，求最小值作为STS距离值，这就消除了同一时间序列不同起始点的影响。

求一篇围绕关于基因组学的研究内容、热点及进展的1000字小论文，急求。

　　李宝键教授在“展望21世纪的生命科学”一文中谈到基因组研究计划研究重要性时，引用《Scinence》上“第三次技术命革”中的一句话：“下一个传大时代将是基因组革命时代，它正处于初期阶段。”在当前的研究水平上，只要涉及生命体重要现象的课题，几乎离不开对基因及其作用的分析。2000年6月26日，英美两国首脑会同公私两大人基因组测序集团向世人正式宣告，人基因组的工作草图已绘制完成。科学家把这作为生命科学进入新时代的标志，即后基因组时代(post-genome era)。因此有必要对基因组及其研究内容和进展作一个了解。
　　1基因组学及其研究内容
　　基因组(GENOME)一词是1920年Winkles从GENes和chromosOMEs组成的，用于描述生物的全部基因和染色体组成的概念。1953年Watson和Crick发现DNA双螺旋结构，标志分子生物学的诞生，随着各学科的发展，当前生物学研究进入新的进代，在生物大分子水平上将不同的研究技术和手段有机的结合以攻克生物学难题。
　　基因组研究可以理解为：(1)基因表达概况研究，即比较不同组织和不同发育阶段、正常状态与疾病状态，以及体外培养的细胞中基因表达模式的差异，技术包括传统的RTPCR，RNase保护试验，RNA印迹杂交，但是其不足是一次只能做一个。新的高通量表达分析方法包括微点阵(microarrary)，基因表达序列分析(serial analysis of gene expression，SAGE)，DNA芯片(DNA chip)等；(2)基因产物-蛋白质功能研究，包括单个基因的蛋白质体外表达方法，以及蛋白质组研究；(3)蛋白质与蛋白质相互作用的研究，利用酵母双杂交系统，单杂交系统(one-hybrid sys　tem)，三杂交系统(thrdee-hybrid system)以及反向杂交系统(reverse hybrid system)等。
　　1986年美国科学家Thomas Roderick提出了基因组学(Genomics)，指对所有基因进行基因组作图(包括遗传图谱、物理图谱、转录图谱)，核苷酸序列分析，基因定位和基因功能分析的一门科学。因此，基因组研究应该包括两方面的内容：以全基因组测序为目标的结构基因组学(struc　tural genomics)和以基因功能鉴定为目标的功能基因组学(functional genomics)。结构基因组学代表基因组分析的早期阶段，以建立生物体高分辨率遗传、物理和转录图谱为主。功能基因组学代表基因分析的新阶段，是利用结构基因组学提供的信息系统地研究基因功能，它以高通量、大规模实验方法以及统计与计算机分析为特征。随着1990年人类基因组计划(Human Genome Project，HGP)的实施并取得巨大成就，同时模式生物(model organisms)基因组计划也在进行，并先后完成了几个物种的序列分析，研究重心从开始揭示生命的所有遗传信息转移到从分子整体水平对功能的研究上。第一个标志是功能基因组学的产生，第二个标志是蛋白质组学(proteome)的兴起。
　　2 结构基因组学研究内容
　　结构基因组学(structural genomics)是基因组学的一个重要组成部分和研究领域，它是一门通过基因作图、核苷酸序列分析确定基因组成、基因定位的科学。遗传信息在染色体上，但染色体不能直接用来测序，必须将基因组这一巨大的研究对象进行分解，使之成为较易操作的小的结构区域，这个过程就是基因作图。根据使用的标志和手段不同，作图有三种类型，即构建生物体基因组高分辨率的遗传图谱、物理图谱、转录图谱。
　　2.1遗传图谱
　　通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率，确定他们的相对距离，一般用厘摩(cM，即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多，但是在DNA多态性技术未开发时，鉴定的连锁图很少，随着DNA多态性的开发，使得可利用的遗传标志数目迅速扩增。早期使用的多态性标志有RFLP(限制性酶切片段长度多态性)、RAPD(随机引物扩增多态性DNA)、AFLP(扩增片段长度多态性)；80年代后出现的有STR(短串联重复序列，又称微卫星)DNA遗传多态性分析和90年代发展的SNP(单个核苷酸的多态性)分析。
　　2.2物理图谱
　　物理图谱是利用限制性内切酶将染色体切成片段，再根据重叠序列确定片段间连接顺序，以及遗传标志之间物理距离［碱基对(bp)或千碱基(kb)或兆碱基(Mb)的图谱。以人类基因组物理图谱为例，它包括两层含义，一是获得分布于整个基因组30 000个序列标志位点(STS，其定义是染色体定位明确且可用PCR扩增的单拷贝序列)。将获得的目的基因的cDNA克隆，进行测序，确定两端的cDNA序列，约200bp，设计合成引物，并分别利用cDNA和基因组DNA作模板扩增；比较并纯化特异带；利用STS制备放射性探针与基因组进行原位杂交，使每隔100kb就有一个标志；二是在此基础上构建覆盖每条染色体的大片段：首先是构建数百kb的YAC(酵母人工染色体)，对YAC进行作图，得到重叠的YAC连续克隆系，被称为低精度物理作图，然后在几十个kb的DNA片段水平上进行，将YAC随机切割后装入粘粒的作图称为高精度物理作图.
　　2.3转录图谱
　　利用EST作为标记所构建的分子遗传图谱被称为转录图谱。通过从cDNA文库中随机条区的克隆进行测序所获得的部分 cDNA的5＇或3＇端序列称为表达序列标签(EST)　，一般长300～500bp左右。一般说，mRNA的3＇端非翻译区(3＇-UTR)是代表每个基因的比较特异的序列，将对应于3＇-UTR的EST序列进行RH定位，即可构成由基因组成的STS图。截止到1998年12月底，在美国国家生物技术信息中心(NCBI)数据库中分布的植物EST的数目总和已达几万条，所测定的人基因组的EST达180万条以上。这些EST不仅为基因组遗传图谱的构建提供了大量的分子标记，而且来自不同组织和器官的EST也为基因的功能研究提供了有价值的信息。此外，EST计划还为基因的鉴定提供了候选基因(cand　idantes)。其不足之处在于通过随机测序有时难以获得那些低丰度表达的基因和那些在特殊环境条件下(如生物胁迫和非生物胁迫)诱导表达的基因。因此，为了弥补EST计划的不足，必须开展基因组测序。通过分析基因组序列能够获得基因组结构的完整信息，如基因在染色体上的排列顺序，基因间的间隔区结构，启动子的结构以及内含子的分布等。
　　3功能基因组学研究
　　功能基因组学(functional genomics)又往往被称为后基因组学(postgenomics)，它利用结构基因组所提供的信息和产物，发展和应用新的实验手段，通过在基因组或系统水平上全面分析基因的功能，使得生物学研究从对单一基因或蛋白质的研究转向多个基因或蛋白质同时进行系统的研究。这是在基因组静态的碱基序列弄清楚之后转入基因组动态的生物学功能学研究。研究内容包括基因功能发现、基因表达分析及突变检测。基因的功能包括：生物学功能，如作为蛋白质激酶对特异蛋白质进行磷酸化修饰；细胞学功能，如参与细胞间和细胞内信号传递途径；发育上功能，如参与形态建成等采用的手段包括经典的减法杂交，差示筛选，cDNA代表差异分析以及mRNA差异显示等，但这些技术不能对基因进行全面系统的分析。新的技术应运而生，包括基因表达的系统分析，cDNA微阵列，DNA芯片等。鉴定基因功能最有效的方法是观察基因表达被阻断或增加后在细胞和整体水平所产生的表型变异，因此需要建立模式生物体。
　　比较基因组学(Comparative Genomics)是基于基因组图谱和测序基础上，对已知的基因和基因组结构进行比较，来了解基因的功能、表达机理和物种进化的学科。利用模式生物基因组与人类基因组之间编码顺序上和结构上的同源性，克隆人类疾病基因，揭示基因功能和疾病分子机制，阐明物种进化关系，及基因组的内在结构。目前从模式生物基因组研究中得出一些规律：模式生物基因组一般比较小，但编码基因的比例较高，重复顺序和非编码顺序较少；其G+C%比较高；内含子和外显子的结构组织比较保守，剪切位点在多种生物中一致；DNA 冗余，即重复；绝大多数的核心生物功能由相当数量的orthologous蛋白承担；Synteny连锁的同源基因在不同的基因组中有相同的连锁关系等。模式生物基因组研究揭示了人类疾病基因的功能，利用基因顺序上的同源性克隆人类疾病基因，利用模式生物实验系统上的优越性，在人类基因组研究中的应用比较作图分析复杂性状，加深对基因组结构的认识。此外，可利用诱变技术测定未知基因，基因组多样性以及生物信息学（Bioinformatics）的应用。
　　4蛋白质组学研究
　　基因是遗传信息的携带者，而全部生物功能的执行者却是蛋白质，它有自身的活动规律，因而仅仅从基因的角度来研究是远远不够的，必须研究由基因转录和翻译出蛋白质的过程，才能真正揭示生命的活动规律，由此产生了研究细胞内蛋白质组成及其活动规律的新兴学科—　—蛋白质组学（proteomics）。蛋白质组（proteome）是由澳大利亚Macquarie大学的Wilkins和Williams于1994首先提出，并见于1995年7月的“Electrophonesis”上，指全部基因表达的全部蛋白质及其存在方式，是一个基因、一个细胞或组织所表达的全部蛋白质成分，蛋白质组学是对不同时间和空间发挥功能的特定蛋白质群体的研究。它从蛋白质水平上探索蛋白质作用模式、功能机理、调节控制以及蛋白质群体内相互作用，为临床诊断、病理研究、药物筛选、药物开发、新陈代谢途径等提供理论依据和基础。 蛋白质组学旨在阐明生物体全部蛋白质的表达模式及功能模式，内容包括鉴定蛋白质表达、存在方式（修饰形式）、结构、功能和相互作用方式等。它不同于传统的蛋白质学科，是在生物体或其细胞的整体蛋白质水平上进行的，从一个机体或一个细胞的蛋白质整体活动来揭示生命规律。但由于蛋白质具有多样性和可变性，复杂性，低表达蛋白质难以检测等，应该明确其研究的艰难性。总体上研究可以分为两个方面：对蛋白质表达模式（或蛋白质组成）研究，对蛋白质功能模式（目前集中在蛋白质相互作用网络关系）研究。对蛋白质组研究可以提供如下信息：从基因序列预测的基因产物是否以及何时被翻译；基因产物的相对浓度；翻译后被修饰的程度等。由于蛋白质数目小于基因组中开放阅读框（ORF, open reading frame）数目，因此提出功能蛋白质组学（functional proteomics），功能蛋白质指在特定时间、特定环境和试验条件下基因组活跃表达的蛋白质，只是总蛋白质组的一部分。功能蛋白质组学研究是位于对个别蛋白质的传统蛋白质研究和以全部蛋白质为研究对象的蛋白质研究之间的层次，是细胞内与某个功能有关或某种条件下的一群蛋白质。
　　对蛋白质组成分析鉴定，要求对蛋白质进行表征化，即分离、鉴定图谱化，包括两个步骤：蛋白质分离和鉴定。双向凝胶电泳（2-DGE）和质谱（MS）是主要的技术。近年来，有关技术和生物信息学在不断并迅速开发和发展中。蛋白质组研究技术体系包括：样品制备；双向聚丙烯酰胺凝胶电泳（two-dimensional polyacrylamide gel electrophoresis,2-D PAGE）；蛋白质的染色；凝胶图像分析；蛋白质分析；蛋白质组数据库。其中三大关键是：双向凝胶电泳技术、质谱鉴定、计算机图像数据处理与蛋白质数据库。
　　5与基因组学相关学科诞生
　　随着基因组学研究的不断深入，人类有望揭示生命物质世界的各种前所未知的规律，完全揭开生命之谜，进而驾驶生命，使之为人类的社会经济服务。基因组研究和其它学科研究交叉，促进一些学科诞生，如营养基因组学（nutritional genomics），环境基因组学（environmental genomics），药物基因组学（phamarcogenomics），病理基因组学（pathogenomics），生殖基因组学(reproductive genomics)，群体基因组学(population genomics)等。其中，生物信息学正成为备受关注的新型产业的支撑点。
　　生物信息学是以生物大分子为研究，以计算机为工具，运用数学和信息科学的观点、理论和方法去研究生命现象、组织和分析呈指数级增长的生物信息数据的一门科学。研究重点体现在基因组学和蛋白质两个方面。首先是研究遗传物质的载体DNA及其编码的大分子量物质，以计算机为工具，研究各种学科交叉的生物信息学的方法，找出其规律性，进而发展出适合它的各种软件，对逐步增长的DNA 和蛋白质的序列和结构进行收集、整理、发布、提取、加工、分析和发现。由数据库、计算机网络和应用软件三大部分组成。其关注的研究热点包括：序列对比，基因识别和DNA序列分析，蛋白质结构预测，分子进化，数据库中知识发现（Knowledge Discovery in Database, KDD）。这一领域的重大科学问题有：继续进行数据库的建立和优化；研究数据库的新理论、新技术、新软件；进行若干重要算法的比较分析；进行人类基因组的信息结构分析；从生物信息数据出发开展遗传密码起源和生物进化研究；培养生物信息专业人员，建立国家生物医学数据库和服务系统［5］。20世纪末生物学数据的大量积累将导致新的理论发现或重大科学发现。生物信息学是基于数据库与知识发现的研究，对生命科学带来革命性的变化，对医药、卫生、食品、农业等产业产生巨大的影响。
　　邹承鲁教授在谈论21世纪的生命科学时讲到，生物学在20世纪已取得巨大的发展，数理科学广泛而又深刻地深入生物学的结果在新的高度上揭示了生命的奥妙，全面改变了生物学的面貌。生物学不仅是当前自然科学发展的热点，进入21世纪后将仍然如此。科学家称21世纪是信息时代。生物科学和信息科学结合，无疑是多个学科发展的必然结果。

关于论文前言

我是复制的，希望对楼主能有所帮助

※ Multiplexing：一种同时采用多种样品的测序方法，能够大大提高测序速度。
※ 突变（Mutation）：DNA序列上任一种可以被遗传的变易。
※ 核苷酸（Nucleotide）：DNA和RNA的基本组成部分，通常包含一分子核糖，一分子磷酸和一分子碱基。多个核苷酸通过磷酸二酯键连接成一条链状。
※ 细胞核（Nucleos）：真核细胞中的一种细胞器，内含遗传物质。
癌基因（Oncogene）：一种能够导致癌症的基因。许多致癌基因都直接或间接地控制细胞的成长速度。
※ 噬菌体（phage）：一种以细菌为宿主细胞的病毒。
※ 物理图谱（Physics Map）：物理图谱描绘DNA上可以识别的标记的位置和相互之间的距离(以碱基对的数目为衡量单位)，这些可以识别的标记包括限制性内切酶的酶切位点，基因等。物理图谱不考虑两个标记共同遗传的概率等信息。对于人类基因组来说，最粗的物理图谱是染色体的条带染色模式，最精细的图谱是测出DNA的完整碱基序列。
※ 质粒（Plasmid）：质粒是细菌的染色体外能够自我复制的环状DNA分子。它能够和细胞核中的染色体明显地区别开来，而且并不是细胞生存的必要物质。一些质粒适宜于引入到宿主细胞中去，并利用宿主细胞的DNA大量繁殖，因此我们常常采用质粒作为外源DNA的载体，外源DNA借助于质粒在宿主细胞中大量繁殖。
※ 多基因病（Polygenic Disorder）：有多个基因位点共同决定的遗传病（如心脏病、糖尿病、一些癌症等）。这类疾病的遗传由多个基因位点共同控制，因而比单基因病的遗传更为复杂。
※ 多聚酶链式反应（PCR）：一种体外扩增DNA的方法。PCR使用一种耐热的多聚酶，以及两个含有20个碱基的单链引物。经过高温变性将模板DNA分离成两条链，低温退火使得引物和一条模板单链结合，然后是中温延伸，反应液的游离核苷酸紧接着引物从5‘端到3’端合成一条互补的新链。而新合成的DNA又可以继续进行上述循环，因此DNA的数目不断倍增。
※ 多聚酶（Polymerase）：多聚酶具有催化作用，能够加快游离的核苷酸和DNA模板结合形成新链的反应速度。
※ 多态性（Polymorphism）：多个个体之间DNA的差异称为多态性。DNA变异概率超过1％的变异，比较适宜作为绘制连接图谱的证据。
※ 引物（Primer）：预先制备的比较短的核苷酸链，在新链合成过程中作为引物，游离的核苷酸在引物之后按顺序和模板上的碱基结合，形成新链。
※ 原核生物（Prokaryote）：原核生物没有细胞膜，结构清晰的核以及其他细胞器。细菌是原核生物。
※ 探针（Probe）：是一条DNA单链或者一条RNA链，具有特定的序列，并且使用放射性元素或者免疫特性物质进行标记。探针和克隆库中的某条互补片段结合成一条双链结构，我们可以借助于探针的检测来获知与其互补的链的位置。
※ 启动子（Promoter）：DNA上的一个特定位点，RNA聚合酶在此和DNA结合，并由此开始转录过程。
※ 蛋白质（Protein）：一种由一条或者多条肽链构成的大分子。每条肽链上核苷酸的顺序是由基因外显子部分的碱基序列决定的。蛋白质是细胞、组织和器官的重要组成部分，每种蛋白质都具有特定的功能。酶、抗体和激素等都是蛋白质。
※ 嘌呤（Purine）：一种含氮的单环结构物。是核苷酸的重要组成部分，有腺嘌呤A和鸟嘌呤G两种。
※ 嘧啶（Pyrimidine）：一种含氮的双环结构，是核苷酸的重要组成部分。分为胞嘧啶C，胸腺嘧啶T和尿嘧啶U三种。
※ 重组克隆（Recombinant Clone）：将不同来源的DNA片段合成在一个DNA分子中，这种技术称为重组，得到的分子为重组克隆。
※ DNA重组技术（Recombinant DNA Technology）：在细胞体外将两个DNA片段连接成一个DNA分子的技术。在适宜的条件下，一个重组DNA分子能够被引入到宿主细胞中并在宿主细胞中大量繁殖。
※ 调控序列（regulatory regions and sequence）：一段控制基因表达的DNA片段。
※ 限制性内切酶（Restriction enzyme， endonuclease）：这种酶能够识别出DNA上特定的碱基序列，并在这个位点将DNA酶切。细菌中有400中限制性内切酶，能够识别出100中DNA序列。
※ 酶切位点（Restriction Enzyme cutting site）：DNA上一段碱基的特定序列，限制性内切酶能够识别出这个序列并在此将DNA酶切成两段。
※ 限制性长度多态性（Restriction fragment length polymorphsm）：从不同个体制备的DNA，使用同一种限制性内切酶酶切，切得的片段长度各不相同。酶切片段的长度可以作为物理图谱或者连接图谱中的标记子。通常是在酶切位点处发生突变而引发的。
※ 核糖核酸RNA（Ribonucleic acid）：从细胞的细胞核和细胞质部分分离出来的化学物质。在蛋白质合成和其他生化反应中起着重要作用，RNA的结构和DNA的结构类似，都是有核苷酸按照一定顺序排列成的长链。RNA可以分为信使RNA、转运RNA、核糖体RNA以及其他类型的RNA。
※ 核糖体RNA（Ribonsomal RNA rRNA）：存在于核糖体中的RNA。
※ 核糖体（Ribonsome）：细胞质中含有rRNA和相关蛋白质的细胞器，是蛋白质的合成场所。
序列位置标签（Sequence Tagged Site, STS）：一段短的DNA序列（200－500个碱基对），这种序列在染色体上只出现一次，其位置和碱基顺序都是已知的。在PCR反应中可以检测处STS来，STS适宜于作为人类基因组的一种地标，据此可以判定DNA的方向和特定序列的相对位置。ETS是cDNA上的STS。
※ 性染色体（Sex Chromosome）：在人类细胞中是X或者Y染色体，性染色体决定了个体的性别。雌性细胞中含有两个X染色体，而雄性细胞中含有1个X染色体和1个Y染色体。
※ 鸟枪法（Shotgun method）：使用基因组中的随机产生的片段作为模板进行克隆的方法。
※ 单基因病（Single Gene Disorder）：一个基因的等位基因之间发生了突变造成的疾病。
※ 体细胞（Somatic Cells）：个体中除了生殖细胞及其母细胞之外的细胞，都是体细胞。
※ 串联重复序列（Tandem repeat sequences）：在染色体上一段序列的多次重复，称为串联重复序列。常用来作为物理图谱中的标记子。
※ 端粒（Telomere）：是染色体的末端部分，这一特殊结构区域对于线型染色体的结构和稳定起重要作用。
※ 转录（Transcription）：以某一DNA链为模板，按照碱基互补原则形成一条新的RNA链的过程，是基因表达的第一步。
※ 转运RNA（tRNA）：转运RNA具有特殊的结构，其一端包含3个特定的核苷酸序列，能和信使RNA上的密码子按照碱基配对原则进行结合。另一端则带有一个氨基酸。因此转运RNA能够同细胞质中游离的氨基酸结合并运到核糖体上，核糖体按mRNA上的遗传信息将氨基酸装配成蛋白质。
※ 转化（Transformation）：将外源DNA整合到某一细胞基因组中的过程。。
※ 翻译（Translation）：mRNA上携带的遗传信息指导蛋白质的合成过程，称为翻译。
※ 病毒（Virus）：一种不具备细胞结构的生物体。只能寄生在宿主细胞中才能生存。病毒一般包含核酸以及外壳蛋白，有些动物的病毒的外面也偶尔覆盖一层细胞膜。病毒进入宿主细胞之后，利用宿主的合成机制复制出大量的后代。。
※ 酵母菌人工合成染色体（Yeast Artificial Chromosome）：一种能够克隆长达400Kb的DNA片段的载体，含有酵母细胞中必需的端粒、着丝点和复制起始序列。
(卜东波、伍树明翻译整理)
生物信息名词
§§§ BLAST （Basic Local Alignment Search Tool），基本的基于局部对准的搜索工具；一种快速查找与给定序列具有连续相同片断的序列的技术。
§§§ Entrez 美国国家生物技术信息中心所提供的在线资源检索器。该资源将GenBank序列与其原始文献出处链接在一起。
§§§ NCBI 美国国立生物技术信息中心（National Center for Biotechnology Information），1988年设立，为美国国家医学图书馆（NLM）和国家健康协会（NIH）下属部门之一。提供生物医学领域的信息学服务，如世界三大核酸数据库之一的GenBank数据库，PubMed医学文献检索数据库等。
§§§ Conserved sequence 保守序列。演化过程中基本上不变的DNA中的碱基序列或蛋白质中的氨基酸序列。
§§§ Domain 功能域。蛋白质中具有某种特定功能的部分，它在序列上未必是连续的。某蛋白质中所有功能域组合其起来决定着该蛋白质的全部功能。
§§§ EBI 欧洲生物信息学研究所（European Bioinformatics Institute）。 The National Center for Biotechnology Information (NCBI) at the NationalLibrary of Medicine (NLM), National Institutes of Health (NIH)
§§§ EMBL 欧洲分子生物学实验室（uropean Molecular Biology Laboratory）。
§§§ GenBank 由美国国家生物技术信息中心提供的核酸序列数据库。
§§§ Gene 基因。遗传的基本的物理和功能单位。一个基因就是位于某条染色体的某个位置上的核苷酸序列，其中蕴含着某种特定功能产物（如蛋白质或RNA分子）的编码。
§§§ DUST A program for filtering low complexity regions from nucleic acid sequences.
§§§ Gene expression 基因表达。基因中的编码信息被转换成行使特定功能的结构产物的过程。
§§§ Gene family 基因家族。一组密切相关的编码相似产物的基因。
§§§ Gene mapping 基因作图。对DNA分子（染色体或质粒）中基因的相对位置和距离进行确定的过程。
§§§ Genetic code 遗传密码。以三联体密码子的形式编码于mRNA中的核苷酸序列，决定着所合成蛋白质中的氨基酸序列。
Genome 基因组。某一物种的一套完整染色体组中的所有遗传物质。其大小一般以其碱基对总数表示。
§§§ Genomics 基因组学。从事基因组的序列测定和表征描述，以及基因活性与细胞功能关系的研究。
§§§ HGMP 英国剑桥的人类基因组绘图计划（Human Genome Mapping Project）。
§§§ Informatics 信息学。研究计算机和统计学技术在信息处理中的应用的学科。在基因组计划中，信息学的内容包括快速搜索数据库方法的开发、DNA序列信息分析方法的开发和从DNA序列数据中预测蛋白质序列和结构方法的开发。
§§§ Physical map 物理图谱。不考虑遗传，DNA中可识别的界标（如限制性酶切位点和基因等）的位置图。界标之间的距离用碱基对度量。对人类基因组而言，最低分辨率的物理图谱是染色体上的条带图谱；最高分辨率的物理图谱是染色体中完整的核苷酸序列。
§§§ Promoter 启动子。DNA中被RNA聚合酶结合并从此起始转录的位点。
§§§ Proteome 蛋白质组。一个基因组的全部蛋白产物及其表达情况。
§§§ Regulatory region or sequence 调控区或调控序列。控制基因表达的DNA碱基序列。
§§§ Ribosomal RNA 核糖体RNA。简写为rRNA。是一组存在于核糖体中的RNA分子。
§§§ Sequence tagged site 序列示踪位点，简写为STS。在人类基因组中只出现一次的位置和序列已知的长约200到500bp的短DNA序列片断。由于可以通过PCR检测到，STS在将来源于许多不同实验室的基因图谱和测序数据进行定位和定向时非常有用，并且STS在人类基因组的物理图谱中也具有界标的作用。表达的序列标签（ESTs）就是那些得自cDNAs的STSs。
§§§ Single-gene disorder 单基因病。由单个基因的等位基因的突变所导致的遗传病（如杜兴肌营养不良和成视网膜细胞瘤等）。
§§§ UniGene 美国国家生物技术信息中心提供的公用数据库，该数据库将GenBank中属于同一条基因的所有片断拼接成完整的基因进行收录。
§§§ 非蛋白质编码区（“Junk”DNA）占据了人类基因组的大部分，研究表明“Junk”是许多对生命过程富有活力的不同类型的DNA的复合体，它们至少包括以下类型的DNA成份或由其表达的RNA成分：内含子（intron）、卫星（Satellite）DNA、小卫星（minisatellite）DNA、微卫星（microsatellite）DNA、非均一核RNA（hmRNA）、短散置元（short interspersed elements）、长散置元（long interspersed elements）、伪基因（pseudogenes）等。除此之外，顺式调控元件，如启动子、增强子等也属于非编码序列。
双重序列对比两序列间的对比分析。最常见的方法为Needle-Wunsch方法。能够利用的软件如BLAST、FASTA等。
§§§ Autosome 常染色体。与性别决定无关的染色体，人双倍体染色体组含有46条染色体，其中22对常染色体，一对与性别决定有关的性染色体（X和Y染色体）。
sex chromosome. 包括序列（核酸与蛋白）搜索，结构比较，结构预测，蛋白质域，模体（Motif ），测序，发育与进化分析，双向电泳成像分析，质谱蛋白质鉴定，三维蛋白结构模建与成像，基因组图谱比较，基因预测，非编码区功能位点识别，基因组重叠群集装，后基因组功能分析，结构基因组学以及药物基因组学等等。
在BLAST2.0，2.05新版中启用了gapped BLAST、PSI-BLAST 和PHI-BLAST。gapped BLAST是比原BLAST 更灵敏更快的局部相似联配（俗称局部同源）搜索法；PSI- BLAST用迭代型的剖面打分算法，每次迭代所费时间与前者相同，它可检索弱同源的目标；PHI-BLAST 98年刚出台，是模体（Motif ）构造与搜索软件，是更灵敏的同源搜索软件。例如线虫§§§ 的CED4是apoptosis 的调控蛋白，含有涉及磷酸结合的P 环模体，在各种ATP 酶和GTP 酶中可发现。在用gapped BLAST搜索NR数据库时，CED4仅跟人凋亡调控蛋白Apaf-1显著同源或相似（其中含有P-loop保守区）。但PHI- BLAST搜索，另有一个显著同源（E=0.038 ）目标，是植物抗病蛋白Arabidopsis thaliana T7N9.18，证实此动物与植物蛋白确实在apoptosis 中有相似的功能。另有，按PHI- BLAST搜索在MutL DNA修复蛋白中的ATP 酶域，II型拓扑异构酶，组氨酸激酶和HS90家族蛋白，发现一个新的真核蛋白族，共有HS90型ATP 酶域。再有在古核tRNA核苷酸转移酶中发现核苷酸转移酶域，在细菌DNA 引物酶的古核同源体中发现螺旋酶超家族II的模体VI。用以往的搜索法这些是得不到的。
深层事项：
后基因组时期的主要任务：Data mining ，即从完全测序的基因组中预测功能。
1 、序列、结构和功能自分子生物学产生以来，均相信序列决定结构，结构决定功能。随着基因组学的发展，对此理解已有长足的深化。同源序列（具有共同祖先）未必具有相同的功能；相同功能未必源自同源序列。相异序列可能有相似的结构；序列与结构不相似的蛋白可能会有相似的功能。现在发现存在不相似（在序列与结构水平上）酶催化相同的生化反应。当然亦存在甚至结构水平上很相似的酶催化不同的生化反应。例如人与鼠的3?- 羟甾类脱氢酶，1AHH和1RAL；前者是Rossmann折叠，而后者是TIM-桶。肯定，这些相似酶不是共同祖先趋异的结果，而是不同祖先趋同的结果。如结构决定功能还是合理的，那么至少在功能活性位点具有相似结构特征（即3D- 功能模体）。属于今后研究的课题，对了解酶催化机制与功能蛋白的小分子模拟具有很大价值。何谓功能？功能有层次的：表型的，细胞的和分子的。目前开始高层功能预测，分子相互作用、代谢途径和调控网络。目前，已从结构基因组学，功能基因组学和蛋白质组学多种角度研究基因组功能。
2 、结构基因组学中的生物信息学希望大通量地测定和模建完全测序基因组的全部蛋白三维结构。生物信息学可以发挥作用，一方面规划好测定的对象，另一方面可靠地模建结构。
3 、功能基因组学中的生物信息学美国HGP 已编制1998-2003 的新五年计划。提出八项目标：其中目标7 特指生物信息学和计算生物学，其实几乎每项目标都要生物信息学，例如目标4 功能基因组学中的非编码区功能位点预测，基因表达分析（如DNA Chip）以及蛋白质全局分析（如蛋白质组学）。
§§§ 蛋白质组学（Proteomics）
1.蛋白质组学研究的目的和任务 20世纪中期以来，随着DNA双螺旋结构的提出和蛋白质空间结构的X射线解析，开始了分子生物学时代，对遗传信息载体DNA和生命功能的主要体现者蛋白质的研究，成为生命科学研究的主要内容。90年代初期，美国生物学家提出并实施了人类基因组计划，预计用15年的时间，30亿美元的资助，对人类基因组的全部DNA序列进行测定，希望在分子水平上破译人类所有的遗传信息，即测定大约30亿碱基对的DNA序列和识别其中所有的基因（基因组中转录表达的功能单位）。经过各国科学家8年多的努力，人类基因组计划已经取得了巨大的成绩，一些低等生物的DNA全序列已被阐明，人类3%左右DNA的序列也已测定，迄今已测定的表达序列标志（EST）已大体涵盖人类的所有基因。在这样的形势下，科学家们认为，生命科学已经入了后基因组时代。在后基因组时代，生物学家们的研究重心已经从解释生命的所有遗传信息转移到在整体水平上对生物功能的研究。这种转向的第一个标志就是产生了一门成为功能基因组学（Functional Genomics）的新学科。它采用一些新的技术，如SAGE、DNA芯片，对成千上万的基因表达进行分析和比较，力图从基因组整体水平上对基因的活动规律进行阐述。但是，由于生物功能的主要体现者是蛋白质，而蛋白质有其自身特有的活动规律，仅仅从基因的角度来研究是远远不够的。例如蛋白质的修饰加工、转运定位、结构变化、蛋白质与蛋白质的相互作用、蛋白质与其它生物分子的相互作用等活动，均无法在基因组水平上获知。正是因为基因组学（Genomics）有这样的局限性，于90年代中期，在人类基因组计划研究发展及功能基因组学的基础上，国际上萌发产生了一门在整体水平上研究细胞内蛋白质的组成及其活动规律的新兴学科——蛋白质组学（Proteomics），它以蛋白质组（Proteome）为研究对象。蛋白质组是指“由一个细胞或一个组织的基因组所表达的全部相应的蛋白质”。测定一个有机体的基因组所表达的全部蛋白质的设想，萌发在1975年双向凝胶电泳发明之时。1994年Williams正式提出了这个问题，而“蛋白质组”的名词则是由Wilkins创造的，发表在1995年7月的Electrophoresis杂志上。蛋白质组与基因组相对应，但二者又有根本不同之处：一个有机体只有一个确定的基因组，组成该有机体的所有不同细胞斗拱享用一个确定的基因组；而蛋白质组则是一个动态的概念，她不仅在同一个机体的不同组织和细胞中不同，在同一机体的不同发育阶段，在不同的生理状态下，乃至在不同的外界环境下都是不同的。正是这种复杂的基因表达模式，表现了各种复杂的生命活动，每一种生命运动形式，都是特定蛋白质群体在不同时间和空间出现，并发挥功能的不同组合的结果。基因DNA的序列并不能提供这些信息，再加上由于基因剪接，蛋白质翻译后修饰和蛋白质剪接，基因遗传信息的表现规律就更加复杂，不再是经典的一个基因一个蛋白的对应关系，一个基因可以表达的蛋白质数目可能远大于一。对细菌，可能为1.2～1.3;对酵母则为3;而对人,可高达10。后基因组和蛋白质组研究，是为阐明生命活动本质所不可缺少的基因组研究的远为复杂的后续部分，无疑将成为21世纪生命科学研究的主要任务。

案例研究论文的写作思路论文

无论是身处学校还是步入社会，大家一定都接触过论文吧，论文是学术界进行成果交流的工具。你写论文时总是无从下笔？下面是我整理的案例研究论文的写作思路论文，欢迎大家分享。

尽管案例研究性质是实证研究，但作为一篇MBA学位论文，学员还是应当尽可能地体现出应有的学术水平。从这个意义上讲，案例研究类的学位论文不同于在课堂上应用的案例讨论或案例研究。

总体上讲，可供参考的研究思路，首先应该寻找基础理论与所研究案例的结合点。也就是说，要明确论文的研究背景、文体、意义和方向。在此前提下，学员可以充分收集案例研究对象的相关资料，越详细越好。在占有和消化资料的基础上，学员可以运用一定的研究框架或方法，对研究对象进行系统的分析，结合相关理论知识或工作经验，得出一些启发性的结论或建议，并将之整理成文。

此外，学员还可以按以下思路撰写此类论文：案例的背景分析、问题分析、解决问题的方法、措施分析、相关结论分析、案例的启示性意义分析等。

一篇规范的案例研究类MBA学位论文，其基本的研究内容（研究意义与理论文献，案例基本情况介绍，对案例的例析，结论和建议）。

第一，研究意义与理论文献。MBA学员应在这部分介绍与将要研究的案例相关研究背景、研究问题、研究目的与意义及基础文献，为后文将要分析的案例奠定基础。理论分析可以以文献回顾的方式或以研究重点总结的方式进行，然后可以对此做出评论并进而提出自己的倾向性观点或理论模式，以此为参照可以对案例加以分析和研究。

第二，案例基本情况介绍。案例研究与理论研究不同，案例的情况千差万别，熟悉某一理论的读者或论文评阅人并不一定知道学生将要研究的案例中涉及的企业或事件。所以_,在这部分应当把研究对象的基本情况和相关信息、资料进行较客观、较详细的介绍，以使读者或论文评阅人对论文的研究对象有一个初步的了解。

第三，对案例的剖析。在这部分，应依据理论设计或相关知识，有层次、有重点地对案例中的某些或部分问题进行专门的分析和论述。研究过程可以按流程的顺序展开，也可以按所涉及的问题的类别展开，视MBA学员对案例材料的掌握和对理论分析的程度而定。这是论文的核心部分，MBA学员应综合运用相关知识，在案例所给定的条件限制下，进行相应的分析。这在很大程度上是对MHA学员的基本功和综合能力的考验。

第四，结论与建议。案例研究的最终结论应当基于案例，但又不完全拘泥于案例。在对案例进行系统的分析和研究后，MBA学员应当结合相关理论知识或实践经验，把在案例分析过程中得到的启发或“火花”以启示、结论或建议的形式表述出来，并整理成文。这也是案例研究的最终“落脚点”.没有结论和建议的案例分析，可以说是一篇不完整的案例研究论文。

拓展阅读：案例研究的论文范文

就培养幼儿行为习惯这一问题而言，是有关幼儿生活和学习的共同重要之处。对于幼儿而言，只有有良好的行为习惯，才能在学校和家里以及各个公共场所控制好自己，保护好自己。当然，培养幼儿行为习惯是指的积极方面的，也就是说，要培养乐观，正确以及科学合理的行为习惯。当一个幼儿拥有良好的行为习惯，不管在生活中，还是在学习中，他都可以把握住内心，积极学习，乐观生活，不断进步。但是与此同时，培育幼儿良好的行为习惯并非一件容易的事情，这需要老师和学生一起花功夫和耐心，一点一点积累起来，最后才能养成好的习惯。

良好的行为习惯对于幼儿的身心健康、知识的获取、能力的培养、个性的形成都起到至关重要的作用。它将伴随幼儿的一生，对其影响具有根深蒂固的效果。好的习惯将受益一生，坏的习惯一旦养成了将很难改正，甚至会使其终身受害。因此，良好的行为习惯作为教育的基础和归宿，应该最先培养，它将是幼儿的成人之根本。世纪捷克著名教育思想家夸美纽斯说：德行应在邪恶尚未占据心灵之前早早就教。家长作为幼儿的第一任老师，家庭是幼儿的第一堂课，在培养幼儿良好行为习惯方面具有责无旁贷的义务，良好的'行为习惯对促进幼儿的认知、情感、道德、行为等都有着事半功倍的效果，将使幼儿一生受益。

美国学者山姆针对儿童成长需求做出了内容划分维度和具体要求。他将“幼儿的行为习惯”内容主要分为个人及社会发展、社会与文化、个人的健康与安全。针对此，我们可知不同年龄段的儿章有不同的、具体的社会性发展的目标、内容和要求。新时期幼儿成长阶段的全身心发展具有着鲜明的特征，对其行为习惯展开划分的话，大致能够衍分为以下4个层面内容。

1、优秀思想品德行为习惯的培养

我国著名教育学家鲁洁的思想充分展示了德育的重要性。认为德育是内在的、隐性的、精神的，对于一个人生活行为有重大意义。具体来说，儿童品德习惯具体囊括了幼儿在讲文明礼貌、关心友爱伙伴、集体纪律性、诚实勇敢等方面的内容。对于这方面内在的优秀道德习惯的培养，老师和家长要注意从环境的方面进行感染，时刻注重幼儿文明行为及礼貌常识的引导教育，是幼儿良好行为习惯培养的首要内容。

2、优秀生活行为习惯的培养

生活行为习惯是保证幼儿在生活之中趋于规律化、理性化发展的重要保证。根据阿德勒建立了人格发展理论，认为生活风格是获得童年早期形成的优越和完美的手段。因此注重幼儿生活各个方面的影响具有十分重大的意义。在具体实践中，培育幼儿生活习惯可以从各个方面着手，比如睡眠习惯、饮食习惯，只有从小的方面抓住开始，使得幼儿自觉养成优秀生活行为习惯，成为其自觉地行为。比方说针对幼儿应当引导其展开少餐多食的行为习惯，饭前不能够吃甜食与零食，

3、优秀学习习惯的培养

学习习惯对于一个人的一生而言具有十分重大影响。根据欧文的性格养成学说，即也就是说人从出生以后忧郁受到良好的教育，因而养成各个良好的习惯。根据幼师经验，幼儿的学习习惯培养相当重要，幼儿学习兴趣、活动参与、正确读写、握笔、坐姿、图书阅读姿势、文具用品整理等方面内容，这些学习习惯是保证幼儿日后学习成长的根本，只有促使其具有了良好的学习能力及行为习惯，才能确保更好的生存在社会之中，达到终身受益发展的目的。

4、优秀卫生习惯的培养

卫生习惯培养的主要内容囊括了日常洗手、面部清洁、身体正解及手帕等日用品使用等方面事宜。根据张宗麟的教育理念，对幼儿所进行的教育的基础是不能割裂幼儿生活和社会的练习。在现实里面，应该培养幼儿正常生活的卫生习惯开始，引导其学会自己挤牙膏、使用牙刷、脸盆、毛巾等，教育其经常洗手、洗澡、修建指甲，注重卫生习惯。另外还要告诫其不能随地吐痰、随地大小便、丢弃生活废弃物、做好垃圾分类等基本常识内容。

幼儿行为习惯培养教育的案例分析

1、幼儿思想品德行为习惯培养的案例分析

在班级中有个叫李宇豪的小孩子，由于家庭原因，此幼儿脾气暴躁且任性。在同小朋友相处的过程中，经常肆意的指挥别的小朋友，无辜推搡别的小朋友，且言语上也相对过激，别的小朋友稍有反驳，其便损毁别的小朋友的作品。

针对这种情况我们可知该案例中李宇豪小朋友的思想道德习惯行为有待加强。要解决这类案例，首先应该知道幼儿的心理是什么？思想道德行为习惯和环境之间的关系如何？思想品德行为习惯根据鲁洁的德育观可知，其本就是内在的、隐性的以及精神上的，所以对这类案例我们可以利用儿童心理学理论，了解在家庭成长环境不完善的幼儿的心理，可知李宇豪小朋友由于爸妈不在家，安全感不够，且爷爷奶奶对其较为溺爱，因而较为霸道，根据类似心理特征对其思想道德习惯进行引导，并结合诺斯丁的关心理论，给予其足够的关心。比方说通过在班级中采取游戏活动引导的方式，进行促使李宇豪小朋友在思想上提高认识，积极融入到成长环境之中，协调和群体小朋友的关系，减少任性的行为。

2、幼儿生活行为习惯培养的案例分析

我班有一个叫于文博的小朋友，这个小朋友在日常生活中存在着诸多的不良习惯，诸如不爱吃饭，挑食、厌食、浪费的情况严重，并且别的小朋友在午休的时候，他也不睡觉，要么躲在被窝里做别的事情，要么就是拉着别的小朋友一起玩耍，影响了别的小朋友休息。

根据成长方法论，我们可以知道幼儿在不同时期也有不同的需求，由于环境潜移默化的影响以及幼儿存在的模仿心理，以上案例中的于文博的不良习惯是长期形成的，因此促使其养成良好的生活行为习惯需要一个过程，所以要循序渐进，首先从其需要以及思想上改变不良生活行为的观念，结合欧文的性格养成学说，给予其足够个性化的教育，使其养成合乎理性的性格。

3、卫生行为习惯培养的案例分析

我班一个叫孟思妍的幼儿，这个小朋友日常中经常出现饭前便后不洗手，要么就是洗手时候水龙头开的过大，溅湿衣袖的情况。

这种卫生行为习惯是不好的，且这样不良的卫生行为习惯在幼儿中比较常见，但是如何改变这种行为却是一根难题。良好的卫生行为习惯能够使幼儿的生活更加健康，要想改善这种行为要以一步一步循循善诱的方式，促使李明养成了饭前便后正确洗手的卫生习惯。并且要多多在无形之中灌输这种思想，根据马洛斯需求理论可知，幼儿也有基本的情感需求，因此对于幼儿的卫生习惯培养，一定要有耐心，讲究技巧，多多演示，以少数带动多数，这样就可以达到培育幼儿优秀的卫生习惯的目的。

4、学习行为习惯培养的案例分析

小朋友李珉宇十分的调皮，经常扰乱课堂纪律，上课不集中精神听讲，不爱学习。

根据幼儿心理学方面的观点可知，在这一阶段幼儿的笔者在统筹此年龄阶段幼儿心理特征以及成长方法论的基础之上可以知道，幼儿在幼儿时期也具有阶段性的特征，不爱学习并非幼儿的常态。根据马洛斯需求理论可知，幼儿在这一时期也是具有学习需要以及欲望的，这时一种心理上的需要。只是幼儿年龄太小，这种心理上的需要有人来引导。要紧紧围绕成长方法论这一理论基础，抓住幼儿特点，采取旁敲侧击潜在的方式，激发幼儿的学习兴趣。

总之，幼儿的良好行为习惯养成并不是一朝一夕就可以完成的，而是一个相对长期的、循序渐进的过程，因此，它要求我们幼儿园、家庭、社会都需要共同努力的为幼儿创造一个有利的良好环境，使幼儿可以耳濡目染，潜意识里自觉的养成良好的行为习惯。幼儿教育起到至关重要的作用，培育幼儿良好行为习惯不可忽视。针对培育幼儿良好行为习惯这一过程中，要注意结合幼儿心理活动和儿童成长论，认清楚现实情况，针对目前实际，因材施教，一切从实际出发，将幼儿各个方面的习惯引导好。

参考文献

[1]于松梅,王波.学前全纳教育中自闭症幼儿的教育建议

[2]吴卫东.双性化视角的幼儿性别角色教育[J].教育探索,2011,(6):21-22.

[3]高芹.STS教育对幼儿科学教育的启示[J].教育探索,2011,(5

上一篇：论文质量模板评价

下一篇：燃料电池毕业论文

sts论文模板