谷歌研究团队与加州大学圣克鲁兹分校的研究人员联合推出了 DeepSomatic,这是一种创新的人工智能模型,旨在识别癌细胞中的基因变异。在与儿童医疗中心的合作研究中,DeepSomatic 成功发现了其他工具未能识别的10种小儿白血病细胞变异。
DeepSomatic 采用了一种针对癌症基因组的小型变异调用器,能够兼容 Illumina 短读段、PacBio HiFi 长读段和 Oxford Nanopore 长读段。这一方法在 DeepVariant 的基础上进行了扩展,能够检测单核苷酸变异(SNV)和小插入缺失(indels),支持肿瘤 – 正常和肿瘤单一工作流程,包括福尔马林固定石蜡包埋(FFPE)模型。
DeepSomatic 的工作原理是将对齐后的读段转换为图像般的张量,这些张量编码了堆叠情况、基础质量和对齐上下文。通过卷积神经网络,模型对候选位点进行分类,判定其为体细胞变异或非变异,最终生成 VCF 或 gVCF 文件。这种设计使得 DeepSomatic 在技术平台上具有高度的适应性,因为该张量能够总结不同技术间的局部单倍型和错误模式。
在数据集和基准测试方面,DeepSomatic 使用 CASTLE(癌症标准长读段评估)数据集进行训练和评估。该数据集包含6对匹配的肿瘤和正常细胞系,使用 Illumina、PacBio HiFi 和 Oxford Nanopore 进行了全基因组测序。研究团队发布了基准集和访问权限,以便其他研究者进行重用,这填补了多技术体细胞训练和测试资源的空白。
结果显示,DeepSomatic 在单核苷酸变异和小插入缺失的检测上都优于目前广泛使用的方法。例如,在 Illumina 测序的插入缺失方面,DeepSomatic 达到了约90% 的 F1分数,而其他方法仅为80%;在 PacBio 测序中,DeepSomatic 的 F1分数超过80%。研究团队还报告了329,011个体细胞变异的发现,进一步验证了 DeepSomatic 在插入缺失检测方面的强大能力。
研究:https://research.google/blog/using-ai-to-identify-genetic-variants-in-tumors-with-deepsomatic/
划重点:
🌟 DeepSomatic 能够识别多种癌细胞基因变异,涵盖多种测序平台。
🔍 该模型采用卷积神经网络,将读取信息转化为图像张量,确保准确性与一致性。
📊 在基准测试中,DeepSomatic 的检测精度明显优于现有主流方法,尤其是在插入缺失的检测上。
发评论,每天都得现金奖励!超多礼品等你来拿
登录 在评论区留言并审核通过后,即可获得现金奖励,奖励规则可见: 查看奖励规则