如何挖掘HPA数据库中研究数据并生成结果表达图
页面,图谱,癌症,1HPA简介与检索方法,2图谱分类与数据下载,3讨论
苏永发,陈金图(福建医科大学附属泉州第一医院检验科,福建 泉州 362000)
蛋白质是人体一切器官、组织、细胞甚至亚细胞的重要组成成分。解决人类所有蛋白质在器官、组织、细胞和亚细胞水平上的空间分布,将进一步增加我们对人类健康和疾病生物学的理解。
随着众多公共数据库的建立和开放,越来越多的研究者可以从中直接获取大数据,方便研究者的后续工作。HPA数据库是一个用于癌症和正常基因表达谱分析和交互分析的web服务器,帮助临床科研爱好者更高效的利用公共数据资源。本文通过初步介绍HPA数据库公共网页各个模块的功能,让HPA网页式的交互界面使用更简单。
1 H P A简介与检索方法
1.1 简介 HPA数据库官方网站:www.proteinatlas.org利用各种组学技术致力于提供全部24000种人类蛋白质的组织和细胞分布信息。地图集被定义为提供全面信息的、可视化的地图或图表的集合。HPA采用该种方法,将人类蛋白质图谱分为六个独立的部分:组织图谱[1-2]显示了蛋白质在人体所有主要组织和器官中的分布,细胞图谱[3]显示了蛋白质在单细胞中的亚细胞定位,病理谱谱[4]显示了蛋白质水平对癌症患者生存的影响。HPA的第19个版本新增了三个模块:大脑图谱,血液图谱和代谢图谱(图1)。

图1 HPA首页界面及搜索结果界面
1.2 方法HPA提供两种不同的方式访问该页面。最直接的方法是直接搜索功能,可用于自由文本的搜索,比如通过基因名称、EnsEM BLe基因编号和抗体编号等进行查询。以CCNB1为例进行搜索(图1),我们获得3个搜索结果。HPA网站还可以提供更精确的搜索。Fields提供多项选择,我们可以按照需要目的性地进行搜索。比如通过蛋白质表达水平和蛋白质分类信息等进行高级查询。它不仅能够包含(或排除)定位于特定组织或细胞器的蛋白质,而且还可以通过结合多种标准(例如添加依赖于细胞周期的标准)来优化搜索亚细胞表达和RNA表达。搜索结果将会生成一个以基因为中心的结果列表并提供更全面的信息。通过在页面上相应的缩略图,我们可以在不同的子图谱上进行切换。
第二种方法是通过登录页面(图2A),其提供了蛋白质组的交互式知识章节。如图显示,组织图谱和细胞图谱的登入页面包含有许多可点击的图像和表格等 ......
您现在查看是摘要页,全文长 10461 字符。