投期刊-创作、查重、发刊有保障。

生物信息学综述论文3900字_生物信息学综述毕业论文范文模板

发布时间:2020-11-24 13:37:00

  导读:生物信息学综述论文3900字论文在进行写作的时候也并非一件易事,而且在写作的过程当中也都是尤为严格的,所以很多人都会觉得写作论文太难了,本论文分类为生物信息学论文,下面是小编为大家整理的几篇生物信息学综述论文3900字范文供大家参考。


  生物信息学综述论文3900字(一):计算机算法在生物信息学中的应用综述论文


  摘要:在人类基因组计划的推动下,生物信息学得到了人们的广泛关注,并呈现出数量多、计算量大等鲜明特征,因此要求在生物信息学中采用计算机算法,以提高生物信息学处理问题的效率。以生物信息学中常用的计算机算法为切入点,进一步从基因表达数据分析、基因组序列信息分析、生物序列差异和相似性分析、遗传数据分析以及蛋白质结构与功能预测5个方面,论述了计算机算法在生物信息学中的典型应用。


  关键词:生物信息学;基因;计算机算法;数据分析


  0引言


  生物信息学(Bioinformatics)作为一门新兴的交叉学科,是随着生命科学和计算机科学的高速发展而出现的。它通过充分利用生物学、信息学、数学、物理学、统计学以及计算机网络等工具或手段,对大量生物数据信息进行有效的阐明和分析,使之成为具有相应生物意义的生物数据信息。其涵盖了基因组信息的获取、处理、分配、存储等多个方面,通过对生物信息的比较和分析,从而获取基因编码以及核酸和蛋白质结构功能等信息,是最具活力和发展前景的学科之一。然而,生物信息学在我国由于起步较晚,加之其自身呈现出的数量多、计算量大等特征,使生物信息学面临着计算瓶颈。基于此,笔者结合自己的工作实践,对计算机算法在生物信息学中的应用进行探讨,以期为在生物信息学中进行有效的数据挖掘提供理论支持。


  1生物信息学中常用的计算机算法


  算法作为计算机科学的一个重要分支,在计算机科学中居于核心地位。在信息时代,算法作为解决问题的重要工具之一,其通过输入符合规范的信息,从而在短时间内快速获取所需要的输出,现已在各个领域得到了广泛应用。在生物信息学中,计算机算法的应用也对生物信息学的发展起着积极推动作用。生物信息学中常用的计算机算法主要包括以下几种:


  (1)分治法。分治法即在解决大的问题实例时,通过将该问题实例分解为具有相同问题的几个小的问题实例,再采用递归方法依次对这些小的问题实例求解,然后将所得的解合并,从而得出大的问题实例的解。分治法主要应用于合并排序、最近对和凸包问题等领域。而在生物信息学中,可以通过分治法来分析处理序列比对以及序列联配等问题。其中,序列比对在生物学中是最为常见的问题之一,通过PSW-DC算法、生物序列比对算法,在分而治之方法理念的指导下,将Query序列划分成几个片段,再分配给对应的处理器,然后并行地按照Smith-Waterman算法和目标序列进行对比,最终根据相应规则的扩展过程得到最优化的序列匹配[1]。


  (2)图算法。图算法指通过特制的线条算图求得问题实例解的一种便捷算法。图作为一种非线性结构,极具复杂性。因此,图算法无论是在工程、人工智能、数学领域,还是在生物信息学、计算机科学领域均得到了广泛应用。其中,在生物信息学中,运用图算法能够解决很多生物信息学问题,例如:DNA测序、蛋白质测序等。


  (3)贪婪算法。贪婪算法指在一定标准下,通过制定一系列步骤构造问题实例的解,并从众多解中选取局部最优的一个。选取不具有撤销性,因而依此选取直至全局达到最优。在生物信息学中,贪婪算法主要应用于解决基因组重排、反序排列等问题[2]。该算法在生物信息学中的应用不仅能够使问题得到最优解,而且具有较高的运算速度,是一种有效且可行的计算机算法。


  (4)动态规划算法。动态规划算法是指将大的问题实例分解为若干小的、类似的、交错的子问题实例,通过从下到上的递推方式求得最优值,并将子问题实例的解进行有效存储,防止重复计算子问题,从而得到问题最优解决方案的一种算法策略。将动态规划算法运用到生物信息学中,能够有效地分析并处理数据之间的重叠性以及相关性等特点,因此主要应用于DNA序列比较、局部及全局序列联配、多重联配、基因预测及填充表达缺失数据等问题中[3]。


  2计算机算法在生物信息学中的典型应用


  2.1基因表达数据分析


  基因表达数据分析一直是生物信息学研究的热点和难点。在当今的工作实践中,往往采用计算机算法中的聚类分析对基因表达数据进行分析处理,通过把表达规律相近的基因聚成一类,从而找出相互之间有关联的基因,并分析基因功能。计算机算法可以通过基因的转录调节网络,观察基因的表达模式随环境变化或在药物作用下作出的相应改变,阐明基因相互间的调节作用,并对基因的启动子加以研究,分析具有相同表达模式的同类启动子的组成特性。计算机算法中的聚类分析作为分析基因表达数据的重要方法之一,不仅能够 ,所以在动力方面稍显不足,同时生物信息方面由于自身学科的原因,计算机人才储备相对不足,信息技术中一些成熟的理论方法未能与生物问题结合;掌握大数据技术的人才往往集中于IT产业界,但计算机研究人员往往不能敏锐地发现生物问题的本质,从而无法在生物与计算机技术的交叉上有所突破。


  除经济和人才外,大数据技术在生物信息方面的应用还受到以下几方面挑战:


  (1)复杂网络问题。观察各种复杂系统得到的大数据,直接反映的往往是一个个孤立的数据和分散的链接,但这些反映相互关系的链接整合起来就是一个网络。例如,基因数据构成基因网络,但目前类似的网络研究主要有社交网络的数据挖掘,其研究主题与基因组学不同,不能直接移植到生物信息领域。因此,对复杂网络的研究需要相关理论的进一步发展。


  (2)统计与真相问题。大数据研究的是对数量巨大的数据作统计性的搜索、比较、聚类、分类等,继承了统计科学的一些特点。但严格来讲,统计学无法检验逻辑上的因果关系。例如,根据统计结果可以得出“吸烟的人群肺癌发病率比不吸烟的人群高几倍”的正确结论,但无法根据统计结果得出“吸烟致癌”的逻辑结论。企业的目标是追求利润,只要从数据挖掘中发现某种措施与增加企业利润有较强的相关性,就会采取这种措施。这导致大数据技术在商业领域广泛流行,但在生物信息方面应用不足。


  (3)数据挖掘问题。生物信息数据包括DNA序列、蛋白质序列、蛋白质各级空间结构数据基因表达、代谢途径、文献等多种数据,各种数据的特性不同、存储方式不同,给数据集成、分析、挖掘带来了很多困难。例如,目前的数据库管理系统并不适合生物信息中数量最大的生物序列数据存储和检索,从而导致无法直接使用数据挖掘技术。


  (4)数据标识问题。要想有效利用数据并挖掘其中的信息或知识,必须找到最合适的数据表示方法。数据表示方法和最初的数据产生有着密切关系。如果原始数据有必要的标识,就会大大减轻数据识别和分类的困难。但这在生物信息方面存在一定困难,例如无法对碱基序列直接标记,甚至为了实现标记会破坏原有的信息,使数据源受到污染。


  3研究展望


  大数据时代新的思维模式不断冲击传统的思维模式,并带来思维的变革。大数据技术的发展将会促使基因序列、蛋白质序列、蛋白质结构与功能、分子间相互作用、信号通路、调控原件等热点问题的解决,大数据技术将会推进生物信息科学研究的不断进步。未来研究需解决如下问题:


  ①大数据隐私问题。大数据技术涉及到云计算等,大量数据需要外包计算,疾病等相关数据或者全基因组关联数据通常需要严格保护,在外包计算过程中一旦泄露,会给用户造成极大损失;②经济效益问题。云计算是按使用量付费,花费集中在计算、存储和数据传输几个方面。Wilkening等[7]认为,在处理突发性计算、未知规模计算和时间敏感计算问题时,云计算可以减少成本。但是如果长期、大规模使用云计算,还是建设自己的云计算平台为好。

相关文章

新能源电力系统储能技术的研究是为了解决可再生能源(如太阳能和风能)的间歇性和不稳定性,以确保能源供应的稳定性和可靠性。

2023-08-14

空气冷却塔是一种常见的工业设备,主要用于将热水或蒸汽通过喷淋装置喷淋在填料层上,然后经过填料层的大面积接触,使热水或蒸汽释放热量,被空气冷却后排出

2023-07-26

随着互联网和移动互联网的普及,新媒体已经成为了人们获取信息和交流的主要渠道之一。在这个背景下,品牌传播的方式也发生了很大的变化

2023-06-16
100%安全可靠 100%安全可靠
7X18小时在线支持 7X18小时在线支持
支付宝特邀商家 支付宝特邀商家
不成功全额退款 不成功全额退款