人工智能助力医疗,精准找出(chū)治病物(wù)质(zhì)
在制药过程中,药物被淘(táo)汰的原(yuán)因众(zhòng)多,其中之一就在于其对细胞色(sè)素P450的消极(jí)抑制作用。细胞色素P450是(shì)一(yī)组主要在肝(gān)脏中产生的酶,通常被称为CYP450,参与分解化学物(wù)质,防止它们在(zài)血液中积(jī)累(lèi)到(dào)危险的水平。然而,事实(shí)证明,许多实验药物都能(néng)抑制CYP450的产生,这种的副作用会使药物(wù)对人体产生毒性。
制药公司一直依赖于传统医学工具来预测药物是否会(huì)抑制患(huàn)者体(tǐ)内的CYP450,比(bǐ)如在试管(guǎn)中进行化学分(fèn)析(xī),观(guān)察(chá)CYP450与具(jù)有化(huà)学相似性的药(yào)物之(zhī)间(jiān)的(de)相互(hù)作(zuò)用,以及在小白鼠身上进(jìn)行实验。但是这样的预测可能并不(bú)准确(què)。在(zài)某些情况下(xià),CYP450相关毒性(xìng)只有在人体试验(yàn)中才(cái)会被(bèi)发现,导(dǎo)致付诸的金钱多年(nián)的努力(lì)白费。就在(zài)这(zhè)个关键时刻,AI制药重新进入了大(dà)众(zhòng)视(shì)野(yě)。
弥补传统制(zhì)药弊端(duān),AI制药效率大(dà)幅提高
制药的低效率引出了一个更严肃的(de)问题:至少20年来(lái),价(jià)值1万亿(yì)美元的全球制药行业一直(zhí)处于药物开发(fā)低迷、生产率下滑的状态。制药公(gōng)司的(de)金钱投(tóu)入(rù)越来越多——10家(jiā)最大的(de)制药公司现在每年花费近800亿(yì)美元——研(yán)发出的有(yǒu)效药物却(què)越来越(yuè)少。十年前,若投入一美元来研发(fā)药(yào)物,就能收(shōu)到10美分的回报(bào);如今,收益(yì)率却不足2美(měi)分。某种程(chéng)度上(shàng),这是因为(wéi)用于(yú)治疗常(cháng)见疾病的(de)药物(wù)都已(yǐ)经找到了,只(zhī)剩下开发用(yòng)于解(jiě)决(jué)复(fù)杂疾病的药物,这些药物只能治疗一小部分人的疾病,因此能够获得的收益也要少得多。
根(gēn)据(jù)塔夫茨药物开发(fā)研究(jiū)中心的数据,近年来(lái),药物上市的平均成本几乎翻了一(yī)番(fān),达到26亿美元之(zhī)多。药物从在实验室中诞生到(dào)流入市场的时间线被(bèi)延(yán)长到了12年,而(ér)有90%的药(yào)物在人体试(shì)验的(de)阶段就被淘汰(tài)。
因此,研究人员对AI在(zài)药(yào)物研(yán)发方(fāng)面的高涨(zhǎng)热情也(yě)就不足为奇了。用户只需要给AI工(gōng)具提供样本(某种分子结构)和相(xiàng)应(yīng)的解决方案(分(fèn)子最终如何被制成药物(wù)),它们就(jiù)可以开发自(zì)己的计算方法来快速(sù)产生相似的制药方案。
AI(右)能更准确地(dì)找到(dào)致病肿(zhǒng)瘤
大多数(shù)机器学习程序可以(yǐ)处理(lǐ)小数据集,而深度(dù)学习程序可以处理大量原始的、非(fēi)结构化的数据。一个深度学习(xí)的版本可以从(cóng)未标记的细(xì)胞图像中进行(háng)分(fèn)子结构辨识,不过,它(tā)可(kě)能需(xū)要(yào)查看上(shàng)百万个细胞样本才能做到这一点(diǎn)。
最终,AI将在以下几个方面改善药物开发(fā):1.识(shí)别更(gèng)有效的候选药物;2.提高药物测试的“命中率”,即通过临床试验并获得监管批准的候选人的(de)百分比;3.加速(sù)整个制药过程。
百时美施贵宝(bǎo)(Bristol-Myers Squibb)最近部署(shǔ)了一个机器学习程(chéng)序,该程序经过训练(liàn),已(yǐ)能够在大量细胞样本中发现与CYP450抑(yì)制效用相(xiàng)关(guān)的分子结构。Saha说,该程序将测试准确(què)率提高到95%,与(yǔ)传统方(fāng)法相比,失败(bài)率(lǜ)降低近6倍(bèi)。这些结果帮助研究人员迅(xùn)速筛选出可能有毒的药物,转而关注那些有更大希望(wàng)通过多项人体试(shì)验、获得美国食品和药(yào)物管理局(jú)批准的候选(xuǎn)药物(wù)。礼(lǐ)来(Eli Lilly)首席数据和分析官维平•戈帕尔(Vipin Gopal)表示:“在我们进行投资之前,AI就能(néng)帮助我们在早期(qī)排除掉那(nà)些潜在的(de)无效(xiào)用药物。”
人工智能软件可以(yǐ)预测哪些化合物可能(néng)与(yǔ)目标蛋(dàn)白结合,以帮助缩小候选药物的范(fàn)围
生物医学(xué)研(yán)究人员认识到,像癌症和阿(ā)尔茨海默病等这般复杂的疾病所涉及的涉及蛋白(bái)质达数百种,如果研(yán)发(fā)的(de)药物只攻击其(qí)中一种蛋(dàn)白质,则不太可能对整个病毒本(běn)身(shēn)造成破坏。Kurji解释说(shuō),Cyclica正试图(tú)寻找(zhǎo)能(néng)与(yǔ)几(jǐ)十种目标蛋(dàn)白相互作用(yòng)的(de)单个化合物,同时避免与其他(tā)蛋白相(xiàng)互作用(yòng)。他(tā)补充说,目(mù)前正(zhèng)在开发的(de)AI 程(chéng)序(xù)旨在将大(dà)量关于蛋白质变异的遗(yí)传数据整合在一起,这样AI助(zhù)手就可以检测出哪些候选药(yào)物最有效。
苏格兰邓迪大学医学信息学教(jiāo)授安德鲁•霍普金斯(Andrew Hopkins)提出了ex唯科学(xué)算法,这(zhè)个算法只需(xū)分析10个蛋白质数据就能得到有效(xiào)信(xìn)息。它将(jiāng)目标蛋白的生物数据与大约10亿个蛋白(bái)质相互(hù)作用的数(shù)据库进行比较。生成的新数据(jù)被输入到(dào)程序(xù)中(zhōng),程序再次对列表进行精简(jiǎn),并分析(xī)另一轮所需的数据。这个过(guò)程重(chóng)复进行,直到(dào)程序准备(bèi)好(hǎo)生成一个易(yì)于管理的(de)化合物列(liè)表,而这些化合物正是目标药物的良(liáng)好(hǎo)候(hòu)选。
霍普金斯声称,ex唯科学的算法(fǎ)可(kě)以将药物的发现时间从4.5年缩短到(dào)1年,将发现(xiàn)成(chéng)本降(jiàng)低80%,合成化合物的数量也会减少到通常生(shēng)产一种成功药物所(suǒ)需的(de)五分(fèn)之一。目前(qián),他正与生物(wù)科技巨(jù)头Celgene合(hé)作,努力为三个目标(biāo)寻找(zhǎo)新(xīn)的潜在药物。
精确定位目(mù)标蛋白!
为了(le)发(fā)现可能致病的蛋(dàn)白质,生物制药公司Berg也利用(yòng)AI助手来筛选人(rén)体(tǐ)组织(zhī)样本(běn)的生物信息(xī)。Berg软件的(de)方法是(shì)把(bǎ)从病人的组织(zhī)样本(běn)、器官(guān)液体和(hé)血样中提(tí)取的每一(yī)份数据都输入(rù)程序。样(yàng)品(pǐn)中的活细胞被用(yòng)于各种实验,如测试其高葡萄糖水平。这种方法生成多种数据,涵盖细胞产生能量的能力和细胞膜的硬度。
然后,所有的数据都通过一系列深(shēn)度学习程序运(yùn)行,这些程(chéng)序寻找(zhǎo)非疾(jí)病状态和疾病(bìng)状(zhuàng)态(tài)之间的特征差异(yì),最终着眼于那些(xiē)含(hán)毒性的蛋白质。在(zài)某些(xiē)情况下(xià),这些蛋白质可能成(chéng)为靶标,这时Berg的AI软(ruǎn)件(jiàn)就可(kě)以寻找药物(wù)来攻击这些(xiē)靶标。更重要的(de)是,因为该(gāi)软件可(kě)以(yǐ)识别目标(biāo)似乎只在一小(xiǎo)部分患者身(shēn)上引起疾(jí)病(bìng),所以它可以识别这些患者的区(qū)别性特征。这(zhè)意味着患者可以(yǐ)在服用(yòng)药物之前进(jìn)行测试,以确定药物是否可(kě)能对他们有效。
目前,Berg正在与制药巨头阿斯利(lì)康(kāng)(AstraZeneca)合作,寻找治疗帕金(jīn)森氏症和其他神经系统疾(jí)病(bìng)的目标,并(bìng)与(yǔ)赛(sài)诺(nuò)菲巴斯德(Sanofi Pasteur)合作,以(yǐ)改良流感疫苗(miáo)。Berg软件已经确定了诊断测试的机制,可以(yǐ)区分前列腺癌和良性前列腺肥(féi)大症(zhèng),而(ér)这些病症(zhèng)如果不做手术(shù)则很难(nán)区分。