计算工具揭开了基因组的秘密

2024-11-06 18:48来源:本站编辑

基因组研究与计算分子生物学研究国际会议(RECOMB)合作,出版了20种计算方法及其在基因组学中的应用,包括空间、单细胞和长读测序。其中包括基因组变异分析、隐私保护算法、DNA结构特性、癌症基因组学、转录组学研究、基因调控网络、生物分子表征学习和宏基因组数据分析方面的算法创新。下面将重点介绍其中的一些研究。

PRiMeR (Sens et al. 2024)是一种利用遗传信息来了解跨群体疾病风险预测因子的方法,避开了传统纵向研究的需要。通过对健康队列的风险因素和遗传数据的培训,以及全基因组关联研究(GWAS)的结果,PRiMeR可以评估新患者的风险。该方法在2型糖尿病、阿尔茨海默病和帕金森病发病的模拟中得到了验证。这种方法可以促进更及时和有针对性的预防战略。

在另一项研究中,Hong等人(2024)开发了SF-Relate,这是一种实用且安全的联邦算法,用于识别分布式基因组数据集的遗传亲缘关系。使用新颖的散列和桶策略,SF-Relate区分亲属和非亲属,并使用加密数据安全地估计亲属关系。这种方法可以排除可能在研究结果中引入偏见的近亲,同时提供隐私保护。

环状染色体外DNA (ecDNA)是一种在各种癌症类型中发现的致癌基因扩增形式,与患者预后不良有关。EcDNAs通过调节癌基因拷贝数和基因调控网络来驱动肿瘤的形成、进化和耐药性。两种方法CoRAL (Zue et al. 2024)和Decoil (Giurgiu et al. 2024)利用长读测序数据解析ecDNA结构,描绘肿瘤中病灶扩增的景观和演变。

另一种方法,DIISCO (Park et al. 2024),利用单细胞RNA测序数据表征复杂生物系统中细胞-细胞相互作用的时间动态,阐明正常生物过程和疾病进展的机制。这种方法在模拟和实验淋巴瘤-免疫相互作用数据上得到了证明,并揭示了细胞毒性T细胞亚型随着治疗而扩大的免疫相互作用。这种方法可以指导设计改进的治疗方法,以促进细胞状态和对治疗反应至关重要的串扰。

Schrod等人(2024)提出了SpaCeNet,这是一种分析空间转录组学数据相关模式的方法,有助于以单细胞空间分辨率重建细胞内和细胞间相互作用网络。SpaCeNet在多个数据集上进行了验证,包括小鼠视觉皮层、小鼠类器官和果蝇囊胚,揭示了细胞群体的空间组织,捕获了与细胞生长、发育和疾病相关的复杂相互作用模式。

最后,重复DNA对准确和高效的基因组组装和序列比对提出了重大挑战。对于宏基因组数据尤其如此,基因组动力学如水平基因转移、基因复制和基因损失/获得使微生物群落的精确基因组组装复杂化。检测重复是克服这些挑战的关键的第一步。Azizpour等人(2024)提出了GraSSRep,这是一种在宏基因组学数据中检测DNA序列并将其分为重复和非重复类别的新方法。

本特刊还介绍了基因组变异、基因组结构、癌症基因组学、转录组学、基因调控、数据隐私保护和宏基因组数据分析等领域的其他计算方法。

鸡鸣网声明:未经许可,不得转载。