壹生大学

壹生身份认证协议书

本项目是由壹生提供的专业性学术分享,仅面向医疗卫生专业人士。我们将收集您是否是医疗卫生专业人士的信息,仅用于资格认证,不会用于其他用途。壹生作为平台及平台数据的运营者和负责方,负责平台和本专区及用户相关信息搜集和使用的合规和保护。
本协议书仅为了向您说明个人相关信息处理目的,向您单独征求的同意,您已签署的壹生平台《壹生用户服务协议》和《壹生隐私政策》,详见链接:
壹生用户服务协议:
https://apps.medtrib.cn/html/serviceAgreement.html
壹生隐私政策:
https://apps.medtrib.cn/html/p.html
如果您是医疗卫生专业人士,且点击了“同意”,表明您作为壹生的注册用户已授权壹生平台收集您是否是医疗卫生专业人士的信息,可以使用本项服务。
如果您不是医疗卫生专业人士或不同意本说明,请勿点击“同意”,因为本项服务仅面向医疗卫生人士,以及专业性、合规性要求等因素,您将无法使用本项服务。

同意

拒绝

同意

拒绝

知情同意书

同意

不同意并跳过

工作人员正在审核中,
请您耐心等待
审核未通过
重新提交
完善信息
{{ item.question }}
确定
收集问题
{{ item.question }}
确定
您已通过HCP身份认证和信息审核
(
5
s)

DeepMind会令结构生物学家失去饭碗吗?已超高效率破解超过2亿种蛋白质结构

2022-11-18作者:医事法学法律
非原创

【儒亮时评】人工智能的卓越工作,已让结构生物学家“很难再通过’科研搬砖’获得奖项与职称晋级”。这,是结构生物学家的不幸,却是生命科学的大幸,意味着我们有了对蛋白质快速解剖式进行掌握工作抓手。毕竟,对蛋白质,虽说耳熟能详,但却一知半解,我们需要尽快的、全面的掌控它。


来源:南方周末    时间:2022-11-12


近期,Google旗下AI公司DeepMind取得里程碑式突破,其AlphaFold算法构建的数据库,如今已破解了几乎人类目前已知的、超过2亿种蛋白质结构。为研发新药物,应对饥荒、污染等全球性挑战提供了更多的解决之道。

数万名结构生物学家+几十年→破解19万个蛋白质结构

蛋白质是组成生物体一切细胞、组织的重要成分。人体平均质量约18%是蛋白质。作为生命基石,蛋白质是由氨基酸链组成的有机大分子,其折叠成复杂形状的3D结构,被欧洲生物信息研究所的Thornton教授称为“生物学上最大的谜团之一”。掌握了蛋白质的折叠结构,就能了解其工作原理。

在生命科学领域,我们已经知道DNA提供了制造氨基酸链的指令,但对氨基酸链如何相互作用形成蛋白质的复杂3D结构却知之不多。在运用AI参与到这一科研领域之前,全球数万名结构生物学家们通过人力研究、耗费了几十年时间,大致破解了已知2亿种蛋白质结构中的19万种。

在科技尚不发达的早些年,氨基酸和蛋白质研究可获大奖:1972年,美国生物学家Christian Anfinsen因对氨基酸序列与生物活性构象之间关联的研究而获得诺奖。其后,全球20多个国家几十个研究团队,平均每两年都会有氨基酸序列和蛋白质结构的研究成果获得约100种不同奖项。

人工智能正在取代结构生物学家

2021年,Google的DeepMind与欧洲分子生物学实验室(EMBL)开始合作,通过AlphaFold算法进行研究,目前其建立数据库公开发布的结果,已包括98%的人类已知蛋白质结构。

DeepMind创始人兼CEO Demis Hassabis称:“自从人工智能创造出这个强大的新工具之后,用户现在查找蛋白质的3D结构几乎就像在谷歌搜索关键字一样容易。这为AlphaFold开辟了巨大的空间,对重要科学问题产生深远影响,如可持续性、粮食安全和被忽视的疾病。我们现在正处于数字生物学新纪元的开端。”

除DeepMind之外,另一家科技巨头Meta(Facebook旗下品牌)的人工智能ESMFold(“宏基因组”数据库)也正在做类似的事。其预测精度不如AlphaFold,但是运算速度快60倍。

AlphaFold和ESMFold的巨大成就产生了“鲶鱼效应”,难为了大批结构生物学家:很难再通过“科研搬砖”获得奖项与职称晋级。必须进行更多原创性、高难度研究,以及参与实际产品研发。

复旦大学复杂体系多尺度研究院院长马剑鹏表示:目前得出结构生物学家将被淘汰的结论为时尚早。现在AI是预测蛋白质静态结构,“结构生物学研究的新方向应该是使用深度学习方法来实现真正的端对端高精度结构预测……以借此分析出蛋白质动态的结构变化。下一步还需要研究蛋白质的动态结构,这个研究领域叫分子动力学模拟……当这两个领域的研究都完成后,下一步才是药物设计。”可见,任重而道远,AI在后紧逼,人类的结构生物学家们,真的要上高度、上难度、快马加鞭了。

AlphaFold构建的数据库与新药物研发

科研界已开始使用AlphaFold构建的数据库进行新药物研发,2022年5月,英国牛津大学Matthew Higgins教授团队,已使用AlphaFold提供的3D模型来帮助研究疟原虫的关键蛋白结构,以确定阻断寄生虫传播的抗体可能结合位置。

英国朴茨茅斯大学酶创新中心的John McGeehan教授团队,也在使用AlphaFold的模型研发能降解和回收塑料的酶。McGeehan教授说:“我们花了相当长的时间来浏览这个庞大的结构数据库,发现了一系列我们从未见过的、能够真正分解塑料的新3D形状。这是一个巨大的成功。(AlphaFold的模型)可以加快我们的研究,有助于我们将这些宝贵的资源用于重要的研究。”

Thornton教授指出:这次最新的进展将在未来几个月和几年里引发大量新的、惊人的科学发现,这一切都归功于数据是公开的,供所有人使用。

在医药研发领域,AI凭借数据、算法、算力三方面突破,使其大规模进入药品研发领域。其辅助蛋白质结构预测,克服了传统技术高成本、低效率的缺点。有可能大幅缩短研发时间和成本,提高预测准确性、药物功效和安全性。目前,全球AI药物研发企业约343家,其中超过50%在美国,预计全球AI药物研发市场规模,在2025年将达到38.8亿美元。

DeepMind的算法与算力特征

通过与专业人士的访谈,我们得知:DeepMind的AI算法基本逻辑,是用复杂而精确的数学模型,来模仿人类思维的归纳和演绎、分析和综合、抽象与概括、对比、因果、递推等方法。

AI相较人脑的优势是:

起点高:AlphaFold算法的基础,就是人类最顶尖科学家的思维模型。

算力强:2022年全球最强超级计算机,美国橡树岭国家实验室超级计算机Frontier,占地372平方米,由74个Cray EX机柜组成,系统聚合了8730112个计算核心,9.2PB内存,37PB节点本地存储,并可访问716PB的中心范围存储。而如此先进昂贵的硬件系统,也仅能保持一两年首席位置,只要投资不断,计算机的硬件更新、迭代、淘汰等均无上限。

而人类大脑在硬件方面已不再进化,硬拼算力和记忆力,根本不可能是AI对手。

多路并行:有了如此强大的算力基础,DeepMind的AI可展开多任务同时并行运算,甚至同时展开上千万个程序,AI才能靠“硅基蛮力”在一年时间完成约2亿个项目。

而人类以前的科研方式,是一个科研团队申报一个项目,获取预算后,经过数年研发完成一个项目。与AI的“硅基蛮力”相比,人肉的效能相差上亿倍。

不知疲倦:在如此强大的“硅基蛮力”基础上,DeepMind的算法不知疲倦、不眠不休地采取365x24的工作模式。这更是人类科学家无法与之比肩的。

深度学习指数级积累:计算机没有生老病死,随着时间积累,AI的软件与硬件只会越来越先进,其学习和研究的成果,呈指数级积累。

而AI的弱点是:迄今为止,其尚无生命知觉。AlphaFold如此强悍的运算能力和科研成果,原因是人类指令它去计算蛋白质3D结构,而非它自己想去做这事,它也没有停下来的想法。而如上文所言,其算法的基础是人类最顶尖科学家的思维模型,如果没有人类无中生有、天马行动的凭空想象和求索欲望,AlphaFold并没有主动去做的念头。

未来人类科研模式:顶级科学家构思+AI执行

所以,近未来的人类科研模式,很可能像《钢铁侠》方式:托尼•斯塔克提出原创构思,超级AI“贾维斯(J.A.R.V.I.S.)”做具体运算,然后由AI控制的机器人“笨笨”辅助工程制造。

在蛋白质结构研究过程中,最新一轮预测结果(Casp-14)AlphaFold的预测数值有2/3与实验室完全一致,其余预测结果虽得分很高,但存在一些误差。这大大提升了研发效率,人类科学家以前面对浩如烟海的数亿样本几乎无从下手,现在在AI帮助下,则以极高准确率接近事物本源,并以极短时间检验、修正AI预测的误差即可。BBC科学事务记者Helen Briggs表示:AI的学习速度惊人,它用几天时间就能达到实验室几十年的研究水平。

即便如此,AI辅助人类从事科研之路,仍方兴未艾、任重道远。美国马里兰大学科学评审团主席Dr. John Moult博士说:其它物种的蛋白质更是多达几十亿,包括细菌和病毒的蛋白质。而宇宙的奥秘不仅只有蛋白质,可见,人类离掌握大自然的终极奥义还很遥远,科学家们和AI还有很多事要做。

• (本文仅为作者个人观点,不代表本报立场)

美逸君




200 评论

查看更多