"); //-->
首页
每日头条
设计
嵌入式系统
元件/连接器
电源与新能源
安防与国防
汽车电子
EDA/PCB
消费电子
工业自动化
模拟技术
医疗电子
测试测量
通信技术
光电显示
网络与存储
智能计算
物联网与传感器
机器人
在线研讨会
资源
EETV
培训
电子方案
资料下载
技术汇
PI技术专区
ADI技术专区
美信技术专区
研华技术专区
贝能技术社区
Fluke技术社区
ZYNQ技术社区
世强专区技术社区
Microchip资源专区
Microchip视频专区
Quark技术社区
Xilinx社区
MultiSIM BLUE
Andes专区
TE金属混合保护专区
ADI视频专区
OpenVINO生态社区
金升阳电源技术专区
Led技术社区
DSP技术社区
FPGA技术社区
MCU技术社区
USB技术社区
CPLD技术社区
Zigbee技术社区
Labview技术社区
Arduino技术社区
示波器技术社区
步进电机技术社区
无线充电技术社区
人脸识别技术社区
指纹识别技术社区
互动社区
论坛
开发板试用
博客
活动中心
积分礼品
技术应用
汽车电子
嵌入式系统
模拟技术
电源与新能源
元件/连接器
手机与无线通信
网络与存储
光电显示
EDA/PCB
工控自动化
消费电子
医疗电子
物联网与传感器
测试测量
安全与国防
智能计算
机器人
EEPW
论坛
开发板试用
电子设计方案
博客
在线研讨会
EETV
白皮书
资料库
专栏中心
EEPW首页
>
专栏
> 照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症
照亮整个蛋白质宇宙:DeepMind“顺手”放的大招,要一举攻克渐冻人症
发布人:
硅星人
时间:2022-08-03
来源:工程师
加入技术交流群
扫码加入
和技术大咖面对面交流
海量资料库查询
发布文章
还有什么是 AlphaFold 做不到的?
——
文|杜晨 编辑|VickyXiao 题图来源 | DeepMind
渐冻人症,这个陪伴了传奇物理学家史蒂芬·霍金终生的罕见病,也已经困扰了医生和生物科学家数十年的时间。
而
答案
可能就在核孔蛋白
(neucleoporins
)
上。
具体来说,学者们认为
渐冻人症
和
核孔蛋白
组成的
核孔复合体
有着极强的关联,而这个复合体控制着细胞核与细胞质之间的物质传递。
如果能够进一步了解核孔蛋白,我们就有可能找到根治渐冻人症的答案。
然而想得到这个答案并不容易:核孔复合体由
超过1000条
30多种不同的核孔蛋白组成,这些蛋白质以极其复杂的方式相互交错在一起;更别提单条蛋白的大小可能只有数纳米,即便通过最先进的显微镜技术也很难进行有效的观察,给生物学者造成了极大的障碍。
2019年,刚加入哈佛大学吴皓实验室的 Pietro Fontana,就领到了核孔蛋白这个天文级难题。
他不是第一个尝试吃螃蟹的人
,前人在这件事上已经用尽了各种研究手段,付诸数十年的心血。
但是 Fo
ntana 有强援
在手:
AlphaFold
,由
英国
人工智能科研公司 DeepMind 开发的
蛋白
质
预测
模型。
没过多久,在 AlphaFold 的帮助下,Fontana 的研究就取得了关键性的进展:他们不仅成功预测出了之前没有被探究清楚的一批核孔蛋白的结构,还首次绘制出了核孔复合体的胞质环 (cytoplasmic ring) 的模型图。这一研究在今年刚刚获得《科学》期刊刊登。
AlphaFold 协助预测的核孔蛋白组成的胞质环 图片来源:DOI: 10.1126/science.abm9326
这一历史性的生物信息学突破,为攻克像渐冻人症等罕见、难治的神经退行性疾病疾病,重新点亮了希望。
“我认为 AlphaFold 已经完全改变了结构生物学,” Fontana 表示。
有意思的是,这么个如此重要的发现和研究,其实对于 AlphaFold 来说倒像是一件“顺手”的事。
| 蛋白质数据库实现千倍扩容,成为“蛋白质宇宙”
这么说是因为:截至目前地球上已知的所有生物总共2.14亿种蛋白质,其结构都已经被 AlphaFold 预测出来了。
值得一提的是,DeepMind 的研究
进展速度之快,AlphaFold 的效果之好,已经远超“令人震惊”的水平。
首先,去年该公司首次发布并开源了 AlphaFold 模型,当时它只预测出了人类的98%,以及其它大约1万种生物的部分蛋白质,条数只有100万左右——当时这一研究已经入选了《自然》年度十大科学事件。
仅
一年后,这个数据库就实现了200倍
扩容:
图片来源:
DeepMind
更厉害的是,现在这个数据库已经覆盖了动物、植物、细菌、真菌等几乎所有已经被科学记录的物种,总计大约100万种。其中80%的的预测结构结果的置信度已经足以支持研究实验的水平,更是有35%的结果置信度为高。
图片来源:
DeepMind
此次 AlphaFold 放出的“全量蛋白质结构预测数据库”,和之前人类手工测量的数据库相比,更是实现了1000倍的扩容。
在此之前通过标准实验方式测量出的蛋白质结构,都存放在“蛋白质数据****” (PDB) 计划的数据库里,今天这个数据库的条目只有19万条。
这简直是为结构生物学,生物信息学、医****开发等领域,送上了一份惊天大礼包——更别提数据库还是完全免费、开放、可搜索的:
这一最新版的 AlphaFold 数据库,可以说其中超过
99%的蛋白质结构在此之前都是未知的。
而现在人类对于蛋白质结构的知识
突然获得了
200倍的增长
,可想而知未来的更多生物学和医学进展将会更加频繁,许多肆虐几百年的疾病有望得到“根治",许多存在了几十年的生物学难题也将得到破解。
斯克里普斯研究所(世界顶级医学研究机构)创始人 Eric Topol 直言:
“AlphaFold 照亮了几乎
整个蛋白质宇宙。
”
| 几分钟破解世界级生物难题
很多细菌都能引发人类疾病,为了压制细菌人类发明了抗生素。然而作为一种微生物,细菌自己能通过自然选择进化的方式获得抵抗抗生素的能力。
结果就是一些人们以为“无害”的,已经被攻克的病原体,突然就重新成为了人类的大敌。比如麻风病,接种疫苗只有有限预防效果,现在仍然在全球传播,感染数十万人,且需要长期服****治疗。
而两位
来自美国科罗拉多大学博尔德分校的生物学家,希望通过最“治本”的方式试图解决抗生素抗****性。
该校生物化学系教授 Marcelo Sousa 透露,他们的研究目标是定位到那些促使产生抗****性的酶链,了解这些酶的蛋白质结构,然后进行“定点精确打击”。
然而分离和提纯这些酶已经非常艰难,就算提纯出来,研究者发现想要了解它们的结构更是难上加难。
由于预测蛋白质结构的工作,在过去需要通过X射线晶体衍射、冷冻电镜等实验室技术,基本上只能人工进行,Sousa 等人在这一研
究上已经花了十年的时间
,不知道还要多久
——如果不是因为 AlphaFold 的出现。
研究团队成员 Marcelo Sousa 和 Megan Mitchel 图片来源:DeepMind
通过 AlphaFold 提供的基准预测
模型,
结合团队已经从提纯的酶晶体上获得的数据,团队在这些
酶的序列和结构预
测上大获
成
功
。
在 AlphaFold 的帮助下,不仅预测速度有了极大提升,
预测
结果的准确程度更是十分准确。
“这个难题花了我们10年的时间都没有做到,现在居然只用30分钟就解决了,”Sousa 对 AlphaFold 赞叹不已。接下来,团队可以继续通过 AlphaFold 预测出的结果,进一步研究这条酶链在抗****性形成中所扮演的角色,并且找到突破口。
“我们已经了解了这个链条当中的各种酶,现在我们只要能够打破其中一环,就可以破解整个抗****性的难题,”研究人员 Megan Mitchel 表示。
Sousa 则表示,AlphaFold 将对新****发现带来巨大的积极效果。
Marcelo Sou
sa 展示 AlphaFold 预测出的目标酶蛋白质结构 图片来源:DeepMind
这只是 AlphaFold 将要帮助解决的一件“小事”。据 DeepMind 透露,目前全球已经有超过50万研究人员在使用 AlphaFold 数据库,这些前所未有的蛋白质结构预测数据,已经被用于寻找包括渐冻人等不治之症的治疗方案、彻底解决麻风病和血吸虫病的肆虐、发现新****、保护种植业、开发高效降解塑料垃圾的杀手锏等。
“我们希望这个数据库能够帮助无数更多的科学家,并且在科学探索上开启全新的道路,”DeepMind 创始人兼 CEO Demis Hassabis 表示,
“就像数学是物理学的完美解释语言一样,我们相信 AI 是应对生物学复杂动态问题的完美工具。
”
| 附录:AlphaFold 大事记
以下内容均来自于 DeepMind 网站:
2016年:一个队伍成为明星,另一个队伍开始组建
当年,DeepMind 的围棋 AI 程序 AlphaGo 在首尔的一场挑战赛中,击败了传奇的围棋选手李世乭。在 DeepMind 公司内部,这一关键性事件证明了该公司的 AI 技术已经足够先进,有可能应用到解决其它科学挑战当中,比如蛋白质折叠这一存在了50年的挑战当中。
不久之后,DeepMind 就在内部建立了一个小型团队,开始尝试使用深度神经网络技术进行蛋白质结构预测。
图片来源:
DeepMind
2018年:AlphaFold 性能的首次公开测试
AlphaFold 的性能在 CASP13 蛋白质结构预测比赛中排名第一,相关的方法随后发表在《自然》期刊上。DeepMind 在内部扩充了 AlphaFold 团队,正式开始了打造这个创新的新系统。
图片来源:
DeepMind
2020年:解决了生物学50年难题
AlphaFold 在 CASP14 蛋白质结构预测比赛中再次以三倍的巨大优势胜出,并且准确性已经接近于X射线晶体衍射、冷冻电镜等标准实验方法。更厉害的是,在这次比赛上,AlphaFold 得到 CASP 举办方认定,破解了50年都未曾解开的蛋白质折叠难题。《自然》期刊直接评价这一事件“改变了一切”。
同年12月,Demis Hassabis 和 AlphaFold 项目主管 John Jumper 公开承诺,将对外开放 AlphaFold。
图片来源:CASP
2021年:一边创造历史,一边全面开源
DeepMind 在去年兑现了开放 AlphaFold 的承诺。该公司在《自然》发表论文,公开了 AlphaFold 研发过程中采用的详细方法,并且开源了相关代码,提供了60页详细补充资料。
去年7月, DeepMind 再次发表论文,展示 AlphaFold 已经成功预测了整个人类蛋白质组。
这一
发表让
已知的
高置信度人类
蛋白质结构
数量翻了一倍。该公司
和欧洲分子生物学实验室 (EMBL-EBI) 合作公开了数据库,包括人类蛋白质组以及另外20种模式生物(受到广泛研究的生物)的蛋白质组,总共超过35万条。
图片来源:
DeepMind
去年10月,DeepMind 发布了一个修改版的子模型,名为“AlphaFold-Multimer”,专门用于蛋白质复合物的结构预测。随后在11月,该公司将相关子模型代码整合到 AlphaFold 二代代码当中,显著提高了多链蛋白质结构的预测准确度。
同年12月,DeepMind 向 AlphaFold数据库当中增加了超过40万条蛋白质结构。
2022年:数据库持续几何级增长
今年1月,DeepMind 宣布已经有超过30万研究者使用了 AlphaFold数据库,并且添加了超过27个蛋白质组,总计超过19万条蛋白质结构预测数据。这次添加的重要性在于其中17个蛋白质组都和被忽视热带疾病有关,影响全球十多亿人。
7月(本次),DeepMind 将 AlphaFold 数据库从近100万条扩展到2.14亿条,覆盖了人类已知的绝大多数蛋白质(也即 UniProt 蛋白质数据库的大部分内容)
专栏文章内容及配图由作者撰写发布,仅供工程师学习之用,如有侵权或者其他违规问题,请联系本站处理。
联系我们
关键词:
蛋白质宇宙
上一篇:从纽约街头餐车到网红汉堡再到上市公司,Shake Shack做对了什么?
下一篇:Meta迎来会讲中文的CFO:冲破天花板的亚裔女性,14年Meta“老兵”
更多
培训课堂
更多
焦点
更多
视频
技术专区
FPGA
DSP
MCU
示波器
步进电机
Zigbee
LabVIEW
Arduino
RFID
NFC
STM32
Protel
GPS
MSP430
Multisim
滤波器
CAN总线
开关电源
单片机
PCB
USB
ARM
CPLD
连接器
MEMS
CMOS
MIPS
EMC
EDA
ROM
陀螺仪
VHDL
比较器
Verilog
稳压电源
RAM
AVR
传感器
可控硅
IGBT
嵌入式开发
逆变器
Quartus
RS-232
Cyclone
电位器
电机控制
蓝牙
PLC
PWM
汽车电子
转换器
电源管理
信号放大器