欢迎大家来到IT世界,在知识的湖畔探索吧!
基因数据库汇总
今天要分享几个常见的基因研究数据库的基本使用方 法, 核酸数据是基因组与转录组研究的起点。Genecards、GenBank、Ensembl 是目前较常用的三大公共数据库~
无论是生信挖掘到的一些基因或者是导师钦点的指定基因都可以先去这几个数据库搜一搜~
Genecards
GeneCards 是一个全面、综合的收集所有已知注释的或者预测的人类基因全面信息网站。该数据库自动整合约 150 个以基因为核心的数据库,包括基因组、转录组、蛋白质组、遗传、临床和功能信息。
当研究一个基因时,应该首先知道这个基因的研究进展,如该基因是否是个与癌症相关基因,它在各种细胞系或者组织中的表达,它的产物能与哪些蛋白质相互作用,参与了哪些细胞通路,这些信息可以在 GeneCards 获得。
(下面以 MDM2 基因为例,演示第一次搜基因的具体操作流程)
1, 在搜索框中搜索 MDM2

欢迎大家来到IT世界,在知识的湖畔探索吧!
2,红框 Jump to section 可以选择不同的模块: 第一个模块重要的模块 【 Aliases 】 是基因的别名,很重要搜索基因相关文献的时候,有时候需要用别名试一试~

3, 第二个重要的模块 【Location】 是基因的表达位置,可以看基因在细胞中的相对表达量,重要的是点是观察在细胞核,细胞质还是细胞外等等,为后续实验设计提供一些参考~

4, 第三个重要的模块 【Function】 是基因的功能:这个位置提炼了基因的核心分子功能,非常值得留意

GeneBank
GenBank 是世界上最大的公共核酸序列数据库 , 存储了各种生物的 DNA 和 RNA 序列数据,提供详细的序列注释信息。

1, 原核生物基因检索结果解读
在搜索框搜索 X01714 后,我们来介绍一下显示条目


2, 原核生物基因信息下载

3, 真核生物基因信息检索、解读、下载
真核生物基因 DNA 的信息与原核生物差异不大,主要是多了 mRNA 和外显子的序列位置信息。通过 GenBank 检索获得 mRNA 的序列信息,在检索结果与原核生物差异不大,主要是多了信号肽和成熟肽链的碱基位置信息。真核生物基因的 DNA 和 mRNA 序列的下载方式与原核生物一致。
Ensembl
Ensembl 是由英国的 Sanger 研究所和欧洲生物信息学研究所共同协作开发的数据库。这是一个综合性的基因组浏览器 , 其最主要的功能是对真核生物基因组进行自动注释,注释内容包含调控区域、不同物种间的保守分析、对序列上多态性位点的分析。 Ensembl 的数据来源是基于 UniProtKB 提供的蛋白信息和 NCBI RefSeq databases 提供的 mRNA 信息,既包含人工数据部分,也包含基于计算机分析的自动数据部分。因此,该数据库可以通过代码编写对其中的数据信息进行获取。

1, Ensembl 检索(以人类 “BRCA2” 基因为例)
Ensembl 接受以 基因名称 / 染色体位置 / 疾病名称 作为检索词进行检索:在 关键词搜索框 中选定 物种 “Human” ,并填入 检索词 “BRCA2” 直接进行检索。
点击常用 物种快速导航栏 中的 “Human”
使用常用功能栏中的 “BLAST/BLAT” 功能进行检索

2, 结果解读

点击链接跳转到我们需要查找的序列结果,根据需要获取信息,其中 包括基因全称、别名、位置、正反链、版本信息、其余信息链接,以及蛋白信息、 CCDS 链接、老版本数据库跳转链接等。此外,点击页面下方的 “Region in Detail” 可见:

a:金色条带 表明该处基因为 可靠基因 ;
b:灰色条带 表明该处基因 具有基因结构但不一定有转录本 ;
c:蓝色条带 表明该处基因 具有转录本但不一定有完整的蛋白功能 ;
d:紫色条带 表明该处基因为 RNA 所对应 ;
e:蓝色空白框 表示此处 无蛋白编码 (如第四行前部),可由此判断可靠基因。

总结
做基因相关的研究这几个数据库都值得收藏研究一下,其中genecard是最重要 , 使用率最频繁的一个 。遇到一个无论是生信挖掘到一个基因或者老师给了一个基因都可以先用genecard先搜索一下,初步了解一下然后再结合pubmed等其他数据库去进一步的探索~
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/137808.html