一、文献综述
NationalCenterofBiotechnologyInformation(NCBI)是美国国家生物技术信息中心,于1988年11月成立。它是基于生物医学问题,在分子水平上使用数学和计算的方法进行研究的大型生物信息平台。
随着科技的发展,开发利用体内生物活性物质作为药物使用一直为人们所向往,这使得生物学在药学研究中开始占有更大的比重。生物技术所涵盖的不仅是药物的新的生产技术,也是先进的研究手段[1]。而庞大的生物学数据支持,又是药学研发不可或缺的一部分。
NCBI作为全球最大的生物信息平台,涵盖着著名的核昔酸和蛋白质序列数据库GenBank。GenBank是国际电脑互连网(INTERNET)上最大的有关分子生物学的数据库系统之一[2],该数据库收录了1981年至今的各国科学家直接提交注册的基因序列、各种科技期刊论文中报道的基因序列和各种专利中公开的序列,涵盖了诸如Pubmed、Entrez、Blast、OMIM、Taxonomy、Structure等信息检索方式[3]。随着基因组学正逐步成为发现新的药物治疗靶标,鉴定先导化合物,论证药效,研究代谢规律及毒副作用的有效方法[4],GenBank数据库的优势也愈发突出。比如ProteinSequence(蛋白质序列库)序列库中的资料就是来自Genbank和其他的蛋白序列库如PIR、SWISS-PROT、PROSITE、PDB、SCOP等[5]。
NCBI首创了GenBank数据库,其后又于1991年开发了Entrez数据库检索系统。Entrez是NCBI为用户提供整合所有数据库的访问序列、定位、分类和结构数据的搜索和检索工具系统,同时也提供序列和染色体图谱的图形视图。Entrez提供了以下三种检索功能:(1)自由词检索功能。用户可以通过文本词、关键词、截词、期刊名或文献的作者来进行信息的检索。(2)索引词表(ListTerms)检索功能。(3)自动检索功能。对于检出文献,用户可以选择浏览格式进行浏览,也可以打印或存盘[6]。
NCBI数据库系统除提供GenBank所提供的各种服务外,还与设在美国国立卫生研究院(NIH)内的国家医学图书馆联合,提供近3800多种有关生物医学方面的文献检索服务,即Bookshelf、PubMed、PubMedCentral。它们涵盖了来自NCBI的其他生物医药文献资源,如:PubMed用于数据库的索引和抽取;PubMedCentral用于免费提供生物医学期刊上的全文本获取以及相关的学者著作,还有美国国家医学图书馆的目录,其内容的范围跨越基本生物学上的先进分子生物学,卫生保健结果报告和临床卫生保健指导标准、政策分析和报告,小分子的高通量筛选认证,阳离子的疾病防治药物对药物的指导发展等[7]。此外,NCBI数据库还包括有众多生物医学方面的专门数据库和工具软件,如:人类孟德尔遗传学数据库OMIM,布鲁克海文大分子模型数据库MMDB,开放阅读框查找软件ORF和同源查询工具软件BLAST等。
其中,人类孟德尔遗传学数据库OMIM包含对MEDINE的庞大资源以及Entrez系统的序列记录,还包括NCBI中其他有关资源的链接。布鲁克海文大分子模型数据库MMDB的数据包括了实验得出的10000多种大分子的三维结构。该数据库可以用蛋白名称、作者名、种属、发表日期等多种方式查询,还可以用布尔公式查询。查询结果可用软件C3nD来观察其三维结构[8]。开放阅读框寻觅器(ORFFinder)是NCBI提供的附加软件工具,而BLAST(基本局部比对搜索工具)则是一个由NCBI开发的序列相似搜索程序,它可作为鉴别基因和遗传特点的手段,并能够在小于15秒的时间内对整个DNA数据库执行序列搜索。如今BLAST已进行了升级,用户可以在程序选择中挑选不同的优化算法,这些算法可以通过Entrez查询搜索限制或由指定标题搜索来排除模型序列和未经培养的序列(天然样品)所带来的干扰[9]。
NCBI除了具有诸如GenBank这类的大型数据库外,还有象Genoma这样的基因组数据。Genoma借助了EntrezMapViewer(图形显示器软件),让用户观看数据库内特定有机体完整基因组的每一个染色体的集成图,以及染色体特定区域的序列数据。该数据库还具有图形功能强、检索系统全面、界面友好等特点,并且可以对特定染色体、染色体位点、图谱位置等方面进行信息检索[10],这对于研发生物药物,特别是基因组学的药物具有很好的参考与查询价值。
NCBI虽然具有如此多的数据库,但要如何合理的运用它们来检索自己所需要的内容,也是NCBI着手解决的问题,比如对于如何查找测试特定疾病或蛋白目标的生物鉴定这一问题,NCBI就给出了相应的三种方法。第一种方法是通过药物名称进行查找:首先在PubChem主页中对复合药物进行名称搜索,然后单击下一步到BioAssays:选择右侧面板中的生物活性试验下方的活性选项。第二种方法是通过分子式进行查找:首先进入PubChem结构搜索页,单击'分子式'标题,在搜索框中输入分子公式,然后单击搜索按钮。(分子公式是区分大小写的。例如C6H11O6Cl)然后单击下一步到BioAssays,再按照方法一的步骤进行。第三种方法是通过药物的SMILES(简化分子线性输入规范)字符串来进行查找,首先还是转到PubChem结构搜索页,单击Identity/Similarity标题,在输入框中输入SMILES字符串,单击搜索按钮,然后重复方法一中的步骤二[11]。
NCBI承载的庞大生物学信息,不仅是生物类药物研发立项的依据,也是决策活动的起点和前提。由于新药研发是一项周期长、投入大、不可预测因素多的系统性工程,具有高度风险。因此,在新药开发中,立项工作是直接影响新药开发成功与否的关键,也是每个医药企业研发前的工作重心。药物研发前期获得的药学信息越客观、越充分,对目标品种的分析就越准确[12]。因此,大量的信息支撑,是研究新型药物不可或缺的后盾。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。