圆海博客-探寻心灵的宁静

您现在的位置是:首页 > 博客 > 正文

博客

AlphaFold 3引不满,服务器被黑,全世界科学家竞相破解

2024-06-03 14:10:17博客
AlphaFold3的横空出世再次震撼了整个学术界,然谷歌DeepMind的「不开源」引起学界不满,AlphaFold服务器遭到黑客攻击,开源项目也开始发力。AlphaFold3横空出世,直接登上了……

AlphaFold3的横空出世再次震撼了整个学术界,然而谷歌DeepMind的「不开源」引起学界不满,AlphaFold服务器遭到黑客攻击开源项目也开始发力。

不久前,AlphaFold3横空出世,直接登上了Nature头版。

新的架构、前所未有的预测精度和准确率,再次震撼了整个学术界。

然而,与AlphaFold2不同,这个新一代的超强模型却没有开源。

取而代之的是,谷歌DeepMind推出了一个免费研究平台「AlphaFold Server」,供全球科学家使用。

服务地址:https://gdm-alphafold.corp.google.com/welcome

网站操作简单,只需点击几下,就可以利用AlphaFold3在10分钟内得到预测结果。

但是服务有每日的次数限制,且只能用于非商业研究。同时,相比于开源的AlphaFold2来说,这种使用方式缺失了很多自由度,让一些研究人员觉得差点意思。

——这么做其实无可厚非,毕竟DeepMind也是要盈利的,它的子公司Isomorphic Labs已经开始用AlphaFold3来开发药物了

谷歌DeepMind希望能在促进科学进步,以及保护自身商业利益上找到平衡。

科学家们感到失望

正所谓,由俭入奢易,由奢入俭难。

谷歌的AlphaFold3在5月9号登上Nature头版,而仅仅两天之后的5月11日,加州大学旧金山分校(University of California,San Francisco)的计算结构生物学家Stephanie Wankowicz,和其他九位科学家共同撰写了一封致Nature的公开信:

公开信地址:https://zenodo.org/records/11206103

信中指出:谷歌DeepMind的这种做法不符合科学进步的原则,科学进步依赖于社区评估、使用和建立现有工作的能力。

此后,有600多名研究人员签署了这封公开信。

公开信的合著者、计算结构生物学家Roland Dunbrack,曾对AlphaFold3的论文进行了同行评审,他对DeepMind没有发布代码感到失望。

「我想要可下载的代码,如果我们可以自由使用AlphaFold3,新的研究成果就会诞生。」

其他科学家怎么说:

绕过DeepMind,自己破解

在遭到公开信打脸的两天后,5月13日,DeepMind改头换面,宣布将在六个月内,开放AlphaFold3的代码和模型权重供学术使用。

并且,AlphaFold3服务的每日使用次数限制也上调为20次。

但科学家们似乎不太买账,毕竟有了商业竞争的考量,谁知道你拿出来的是不是阉割版,而且还要等上半年之久。

对于这个未来的版本,科学家们尤其质疑其预测蛋白质结构与潜在药物分子或配体的能力。

Dunbrack表示,「我不认为他们会给我们做任何配体的能力,而AlQuraishi团队正在开发的OpenFold3模型就不会做这种阉割,也不会对商业用途有任何限制。」

Mohammed AlQuraishi是哥伦比亚大学的计算生物学家,他的「OpenFold」团队已经开始编写AlphaFold3的开源版本,他们希望今年完成。

AlQuraishi团队此前开发了大名鼎鼎的OpenFold,作为AlphaFold2的开源重新实现,它的效率要高得多,并且得到的结果也差不多。

「如果这种对我们进行药物发现和关系到人类健康的重要能力封闭在少数人手里,那将是糟糕的。」

科学家们追求AlphaFold3的开源版本还有其他原因,其一就是能够重新训练模型,以更好地模拟蛋白质和潜在药物之间的相互作用。

AlQuraishi团队的OpenFold就使用了与DeepMind相同的公开数据集进行训练。

而对于许多制药公司来说,他们可以利用自己的专有数据重新训练,以提高模型的性能。

虽然但是,「Talk is cheap. Show me the code」。GitHub上的「开源AlphaFold3」早已经开搞了!

项目地址:https://github.com/lucidrains/alphafold3-pytorch

这是由旧金山的独立软件工程师Phil Wang发起的众包工作。

大家有兴趣还可以看看仓库中的其他项目,这位大佬已经开发了几十个AI模型的开源版本,包括著名的Dall-E2。

此外,西雅图华盛顿大学的计算生物物理学家David Baker,也带领团队开发了名为RoseTTAFold-All-Atom的开源蛋白质和化学预测模型,尽管暂时还打不过AlphaFold3。

尽管Wang表示自己的三人团队能在一个月内完成描述AlphaFold3模型的代码。

但最耗时也是最贵的步骤显然是模型的训练(AlQuraishi:「代码是5%的努力」)。

MIT的进化生物学家Sergey Ovchinnikov估计,像DeepMind那样训练AlphaFold3可能需要花费超过100万美元的云计算资源,尽管有可能在不影响性能的情况下偷工减料以降低成本。

AlphaFold3的完全开源版本,将使研究人员能够更好地了解模型的工作原理并扩展其功能。

——在等待的日子里,已经有一些科学家在尝试攻击AlphaFold3服务器来获取一些信息。

Ovchinnikov说,「网上已经有一些黑客攻击,为了获得嵌入细胞膜的蛋白质(与脂肪分子相互作用)的更准确的模型。另一次服务器黑客攻击揭示了一种蛋白质采用的另一种形状。」

AlQuraishi希望,开发AlphaFold3开源版本的推动力将成为一个「警示故事」,提醒学者们依赖DeepMind等科技公司开发和分发AlphaFold等工具的危险。

「他们这样做很好,但我们不应该依赖它,我们需要建立一个公共部门和自己的基础设施。」

网友怎么说?

有网友认为,安全问题是谷歌DeepMind选择不开源的一个重要考量,也许AlphaFold3能帮助制造针对特定人群的生物武器。

对此,有网友表示反对:「担心我们可以制造出一种将接管一切的超级微生物,这是狂妄自大。」

也有网友似乎玩起了「绝命毒师」:

——据说,有机化学是史上单人战斗力的巅峰,有了知识的力量,沃尔玛在你眼中就是武器库。

不过,人类对知识和未知的渴望是挡不住的,我们拭目以待即可。

参考资料:

https://www.nature.com/articles/d41586-024-01555-x