首页 > 行业 > 正文

天天简讯:人工智能催化基因活化研究发现稀有DNA序列

机器学习的科学演示揭示了“极端”基因——具有定制活性的DNA序列。


(资料图)

人工智能在我们的新闻提要中爆炸式增长,ChatGPT 和相关人工智能技术成为公众广泛审查的焦点。除了流行的聊天机器人之外,生物学家正在寻找利用人工智能来探测我们基因核心功能的方法。

此前,加州大学圣地亚哥分校的研究人员研究开启基因的DNA序列,他们使用人工智能来识别与基因激活相关的神秘拼图,基因激活是涉及生长,发育和疾病的基本过程。

利用机器学习,一种人工智能,生物科学学院教授James T. Kadonaga和他的同事发现了下游核心启动子区域(DPR),这是一种“网关”DNA激活码,参与我们多达三分之一基因的操作。

基于这一发现,Kadonaga和研究人员Long Vo ngoc和Torrey E. Rhyne现在使用机器学习来识别具有专门设计的基因激活功能的“合成极端”DNA序列。研究人员发表在《基因与发展》杂志上,通过比较人类与果蝇(果蝇)的DPR基因激活元件,通过机器学习(AI)测试了数百万种不同的DNA序列。

通过使用人工智能,他们能够找到罕见的、定制的DPR序列,这些序列在人类中活跃,但对果蝇不活跃,反之亦然。更一般地说,这种方法现在可用于识别合成DNA序列,其活性可能在生物技术和医学中有用。

“在未来,这种策略可用于识别具有实际和有用应用的合成极端DNA序列。与其比较人类(条件X)与果蝇(条件Y),我们可以测试药物A(条件X)而不是药物B(条件Y)激活基因的能力,“分子生物学系杰出教授Kadonaga说。

“这种方法也可用于寻找定制的DNA序列,这些序列激活组织1(条件X)中的基因,但不激活组织2(条件Y)中的基因。这种基于人工智能的方法有无数的实际应用。合成的极端DNA序列可能非常罕见,也许是百万分之一 - 如果它们存在,可以通过使用AI找到它们。

机器学习是人工智能的一个分支,其中计算机系统根据数据和经验不断改进和学习。

在这项新研究中,Kadonaga,Vo ngoc(前加州大学圣地亚哥分校博士后研究员,现在在Velia Therapeutics工作)和Rhyne(一名工作人员研究助理)使用一种称为支持向量回归的方法,根据真实世界实验室实验的数据,用200万个已建立的DNA序列“训练”机器学习模型。

这些是作为机器学习系统示例提出的目标。然后,他们将50万个测试DNA序列“输入”到人类和果蝇的机器学习系统中,并要求他们比较序列并识别两个巨大数据集中的独特序列。

虽然机器学习系统显示人类和果蝇序列在很大程度上重叠,但研究人员专注于核心问题,即人工智能模型是否可以识别基因激活在人类中高度活跃但在果蝇中不高度活跃的罕见情况。

答案是响亮的“是”。机器学习模型成功地识别了人类特异性(和果蝇特异性)DNA序列。重要的是,Kadonaga的实验室通过使用传统的(湿实验室)测试方法验证了极端序列的AI预测功能。

“在开始这项工作之前,我们不知道人工智能模型是否足够"智能",可以预测50万个序列的活动,特别是具有异常活动的异常"极端"序列。因此,人工智能模型可以预测罕见的百万分之一极端序列的活动,这非常令人印象深刻,非常了不起,“Kadonaga说。

他补充说,基本上不可能进行机器学习技术分析的可比的100亿次湿实验室实验,因为每个湿实验室实验需要近三周才能完成。

机器学习系统识别的稀有序列是一个成功的演示,并为机器学习和其他人工智能技术在生物学中的其他应用奠定了基础。

“在日常生活中,人们正在为ChatGPT等人工智能工具寻找新的应用。在这里,我们已经演示了在基因激活中使用AI来设计定制的DNA元件。这种方法应该在生物技术和生物医学研究中具有实际应用,“Kadonaga说。

“更广泛地说,生物学家可能正处于利用人工智能技术力量的最初阶段。

关键词:


您可能也喜欢这些文章

Copyright   2015-2022 西方音箱网 版权所有  备案号:沪ICP备2020036824号-7   联系邮箱:5 626 629 @qq.com