学术预告

复杂疾病的多组学数据整合分析研究

发布日期:2017-06-07 发表者: 浏览次数:

报告题目:复杂疾病的多组学数据整合分析研究

报告人: 史倩倩 博士

报告时间:2017年6月8日(周四)17:00

报告地点:逸夫楼C座314会议室

摘要:

复杂疾病严重危害人类健康。这类疾病无论从遗传学还是临床表现上都体现出高度异质性,需要我们深入地对其展开研究。于此同时,单一的组学数据只能部分反映出某一分子层面上对复杂疾病的解析。为了能够系统地研究和理解高度异质的复杂疾病,面向复杂疾病研究的数据整合分析被提出来。本工作主要围绕着复杂疾病的表型异质性问题展开,利用多组学数据整合思想进行样本分型研究。该研究工作采用了自适应整合策略,能够根据各组学数据固有特性,自动地校正整合误差,将各分子层面支持的样本局部模式融合为最优的样本全局模式。该样本全局模式反映出了样本的整合分型信息。这种无特殊假设的分析策略,克服了组学数据大噪音的特性,量化了组学数据在样本分型上的贡献,真正实现了数据驱动的整合过程。本工作不仅在数值实验上验证了方法的有效性,还将其成功地应用到癌症研究中。对癌症细胞系CCLE(Cancer Cell Line Encyclopedia)数据进行的泛癌症分型分析和对临床病人TCGA(The Cancer Genome Atlas)数据进行的单个癌症分型分析,均揭示出癌症的整合分型具有更显著的生物学意义和临床重要性。该工作对应的开源算法包的下载网址如下:http://www.sysbio.ac.cn/cb/chenlab/images/PFApackage_0.1.rar。