作者: 来源:艾滋病研究实验室 发布时间:2022-10-21
新型冠状病毒肺炎(Corona Virus Disease 2019,COVID-19)现在已经被证实对人们的生活产生着持久的影响。随着新冠肺炎和其它病毒新变种的出现,新冠肺炎疫苗的突破性进展迫切的需要研究人员对新冠肺炎感染的致病机制进行充分的探索。
可变剪切(Alternative Splicing,AS)作为转录调控机制中的关键环节,在维持RNA和蛋白质表达的多样性方面起着至关重要的作用。AS与宿主基因调控有关,是病毒-宿主相互作用的一个关键方面,在宿主对微生物感染的免疫反应中发挥着重要作用,同时,AS介导了传染病尤其是新冠肺炎的免疫应答。然而,由于缺乏在不同新冠肺炎感染条件下AS图谱的资源,目前迫切的需要收集更多的数据以及进行更多的人类微生物感染的AS图谱的研究,进而增进对新冠肺炎及其相关传染病的了解。
2022年10月20日,实验室安三奇教授,四川大学华西医院李为民教授以及实验室梁浩教授作为共同通讯作者在转化医学领域期刊Journal of Translational Medicine(IF=8.5)上发表了题为“CASA: a comprehensive database resource for the COVID-19 Alternative Splicing Atlas”的研究成果,该研究通过手动收集、整合和重新分析了公开数据库中数千个具有RNA-seq数据和相关临床/表型信息的样本,最终开发出了一个以新冠肺炎可变剪切图谱为特色的综合数据库:CASA(http://www.splicedb.net/casa/)。CASA具有允许用户按微生物名称、组织、区域和特征(例如,项目ID、组织类别、AS类型)进行搜索的界面,提供感兴趣的AS事件的详细信息,并可在特定条件下在所包含的级别内进行可视化。
目前,CASA包括来自59个独立数据集的2163个人体样本,覆盖15个身体部位、12种微生物和15个国家/地区,这些数据将会在未来不断的更新。CASA的Home页面提供了完整的网站搜索功能,用户可以根据提示使用关键词搜索以访问感兴趣的可变剪切数据。
数据库CASA提供了四个主要模块:(i) 用于查询特定条件下的AS事件的检索模型;(ii) 显示CASA中所有数据集的统计结果的模块;(iii) 包含实用功能的模块,包括分析不同条件下不同调控的替代外显子;以及(iv) 文档,关于CASA的详细介绍和指导。
CASA中提供了用户友好的Web界面,用户可以通过自由组合不同的搜索条件来检索跨所有数据集的剪接事件,例如特定样本类型、样本名称、微生物、基因符号或数据集(图1)。此外,详细信息页面上提供了一系列智能辅助小部件,用于下游分析,如查询搜索栏和排序筛选功能。
图1. CASA 搜索界面。用户可以根据身体部位、样本类型、样本名称、微生物、项目ID 和基因名称进行搜索。
为了探索观察到的AS事件变化的潜在作用,将一系列分析结果整合到CASA中,例如对可变剪切外显子附近的RNA结合蛋白(RBP)进行基序分析,以探索RBP是否可以作为特殊条件下发生的AS事件的潜在调节因子(图2A)。此外,GO/KEGG途径分析的结果和AS事件在染色体上的分布也被整合到数据库中(图2B、C)。对于差异表达的基因或差异调控的替代外显子,我们提供了两个资源来确定潜在的药物和感兴趣基因的可操作靶点:基于KEGG途径的药物-靶-途径相互作用,以及嵌入CASA的DrugCentral。此外,还开发了一个药物发现工具(图2D)。有关如何搜索数据库和如何浏览搜索结果细节的更多详细信息,可在“文档”页面的“帮助”部分找到。
图2. CASA工具栏
为了更好地支持研究人员探索疾病中的AS,CASA还旨在帮助研究人员对他们自己的RNA-SEQ数据进行AS分析。研究人员只需上传他们的RNA-seq数据,并根据自己的数据情况设置参数值,该工具将自动进行系统分析,同时所有这些结果都可以下载。分析完成后,将弹出一个新的网页,允许调查人员私下对他们上传的数据进行14种不同的分析。它还包含GO和KEGG途径分析的功能丰富信息。此外,这些结果可以下载并直接保存为高分辨率的PDF文件。
当人类细胞感染SARS-COV-2、SARS-CoV、HIV、A型流感病毒、HCMV、HSV-1和2型登革病毒等微生物时,往往会诱导宿主基因的广泛AS程序[10]。我们建立了首个针对新冠肺炎和新冠相关传染病的综合性AS数据库,以提供关于新冠肺炎和其他九种传染病不同组织的全面AS信息。此外,还显示了潜在的RBP调节的以及富含AS的相应功能(图3)。
图3. 数据库开发概述。CASA中可变剪切事件的量化和鉴定是用标准管道对所有RNA-seq文库进行处理的。