为了发现遗传性疾病的新疗法,科学家需要全面了解先前的文献,以确定最佳的基因/蛋白质靶标和最有希望测试的药物。然而,生物医学文献正在以爆炸性的速度增长,并且经常包含相互矛盾的信息,使得研究人员进行完整而彻底的审查变得越来越耗时。
为了应对这一挑战,医学博士/博士研究生 Cole Deisseroth 进行了研究。计划并由博士指导。德克萨斯儿童医院和贝勒医学院 Jan and Duncan 神经学研究所 (Duncan NRI) 的 Huda Zoghbi 和 Zhandong Liu 领导了一项研究,旨在生成一种名为 PARsing ModifiErS via Article aNnotations (PARMESAN) 的自然语言处理 (NLP)工具。
这个新工具可以搜索最新信息,将其组装成中央知识库,甚至预测可以纠正特定蛋白质失衡的可能药物。该工具及其功能的描述最近发表在《美国人类遗传学杂志》上。
“帕尔马干酪为科学家提供了一个绝佳的机会,可以加快他们的研究步伐,从而加速药物的发现和开发,”霍华德休斯医学研究所研究员、邓肯国家研究所的创始主任和杰出服务教授胡达·佐格比 (Huda Zoghbi) 博士说在贝勒学院,补充道。
这种人工智能(AI) 驱动的工具扫描公共生物医学文献数据库(PubMed 和 PubMed Central),以识别基因-基因和药物-基因调控关系的描述并对其进行排名。然而,PARMESAN 的特别突出之处在于它能够利用精选信息来预测未被发现的关系。
“PARMESAN 的独特之处在于,它不仅根据现有文献识别现有的基因-基因或药物-基因相互作用,而且还通过为每个预测分配基于证据的评分来预测假定的新型药物-基因关系,”詹东博士德克萨斯儿童医院计算科学主任、贝勒医学院副教授刘指出