1. 创业头条
  2. 前沿领域
  3. 人工智能
  4. 正文

深度学习寻找肺炎病毒宿主:AI“进化”的“一小步”

 2020-01-29 20:30  来源:A5专栏  我来投稿 撤稿纠错

  【推荐】海外独服/站群服务器/高防

1月24日,北京大学工学院教授朱怀球团队在bioRxiv预印版平台发表《深度学习算法预测新型冠状病毒的宿主和感染性》一文中指出,蝙蝠和水貂可能是新型冠状病毒的两个潜在宿主,水貂可能是中间宿主。

据朱怀球团队的研究表明,新型冠状病毒与云南菊头蝠中存在的RaTG13冠状病毒一致性高达96%;另外,基于深度学习开发的VHP(病毒宿主预测)方法预测的结构化显示,水貂的病毒的传染性模式更接近新型冠状病毒。

据悉,在此次研究中,该团队使用了基于深度学习模型的AI技术寻找病毒宿主。这可能是国内首次在2019新型冠状病毒的研究中使用深度学习AI取得成果。

01

AI加入抗击疫情一线,深度学习寻找病毒宿主

一种前所未知的新型病毒出现后,确定病毒宿主是十分重要的。由于病毒复杂的多样性,目前人类已知的病毒和对病毒本身的了解还远远不够,大多数以人类为宿主的病毒,通常对人类造成生命安全威胁之后,才会进一步引起人们的重视。

对一些本不以人类为宿主的病毒来说,其本身也可能突发变异,或者通过中间宿主也可感染至人类。因此,快速寻找鉴别未知病毒的宿主,能够帮助人类了解病毒与宿主间的相互作用,以应对突发变异等潜在威胁,从而有针对性的对病毒进行预防和控制,具有重要意义。

为了检测新病毒的潜在宿主和致病性,传统的方法是基于通过建立病毒基因库,将新型病毒的DNA序列与已知病毒的基因序列做对比检索,通过比较病毒DNA局部的相似性,从而做出对新病毒宿主的模糊预测。

北京大学朱怀球团队在对2019新型冠状病毒的宿主研究和预测中,通过构建VHP算法模型,将已经提取的新型冠状病毒的基因组,与已有病毒基因数据库做数据检索和对比。在算力的支持下,通过深度学习模型对病毒基因数据的广域检索,实现新型冠状病毒自然宿主的寻找和预测。

02

VHP模型计算出新型冠状病毒的感染性

朱怀球团队在bioRxiv预印版平台发表的论文中称:“为了构建VHP模型,我们使用了一个双路卷积神经网络用于预测病毒序列宿主;我们把病毒的宿主分为五种类型,包括植物、细菌、无脊椎动物、脊椎动物和人类;输入病毒核苷酸序列,基于深度学习的VHP模型,将为每种宿主类型分别输出5类结果,分别反映出新型冠状病毒在每种类型中感染性。”

通过对VHP模型计算的结果分析,筛选的病毒宿主包括犬、猪、貂、龟和猫。研究人员经过分析比较后认为水貂的病毒的传染性模式更接近新型冠状病毒。

实际上,相比传统的AI机器学习方法,AI深度学习的方法训练出的模型可以适用于多种不同类型的数据,还可以结合多种来源的数据,共同完成一个任务。

在基因数据中,并不是所有的数据都有准确的高质量数据标签,而通过深度生成模型,即使没有高质量标签的数据也能得到充分使用,从而使得模型能够持续的提升性能。

因而,从AI深度学习的种类上来看,除了常见的有监督学习和无监督学习,半监督学习与强化学习更适合,也更需要医学界、生物界更多的关注。

03

深度学习AI+医疗:应用前景广阔但也有局限性

在AI的应用场景中,医疗行业是其应用前景最为广阔的行业之一。生物信息领域中,制药企业的药物研发、医疗设备收集的健康数据、病患者的诊断以及治疗方案的确定都有深度学习型AI的应用需求。

深度学习的本质,是一个复杂的AI学习算法。目前,深度学习应用最为广泛的是在计算机视觉以及语言识别领域。其中计算机视觉技术在医疗领域也有一定的应用,如医学影像的识别。

不过,深度学习在医疗领域的应用也面临现实应用的局限性,其中之一就是分析过程缺乏解释性。实际上,深度学习本质上也是统计学习的一种,通过对已知数据的汇总和检索,以算法的优化达到某种结果的预测。

也就是说,深度学习算法得出的结果是概率学上对现有数据条件下的结果预测,并不能给出“解题过程”只能给出结果。这也使得不可避免的出现一定的现实结果偏差。

以此次新型冠状病毒宿主研究为例,在VHP模型计算给出结果后,筛选的病毒宿主包括犬、猪、貂、龟和猫,仍需要研究人员对比分析后得出进一步的结论:水貂的病毒的传染性模式更接近新型冠状病毒。

04

技术之力亦需“跨越偏见”

此外,如果输入数据样本本身带有“大数据偏见”,那么模型计算则会放大这种“偏见”,从而影响结果在现实场景中的准确性。

对于基于深度学习的医疗AI而言,这样的情况也很难以能够说百分之百避免,特别是面对复杂庞大的医疗数据而言,这样的“偏见”带来的结果是人们难以接受的。

因而对于深度学习AI在医疗领域的落地,除了技术实现本身要解决的问题之外,由技术引发蝴蝶效应也更应该获得关注。

从好的一面来看,深度学习型AI在医疗领域的落地,不啻为补充优质医疗资源的“良方”,同时深度学习AI以及大数据等新技术的应用,也为人们在未来面对“新型冠状病毒”之类的突发性传染病给予技术的力量。

05

我们将生活在一个分析所有数据的时代

《大数据时代》作者维克托·迈尔-舍恩伯格前瞻性地预见到:“在大数据时代,我们可以分析更多的数据,有时候甚至可以处理和某个特别现象相关的所有数据,而不再依赖于随机采样。”

在数据时代,AI深度学习与算法、大数据的进步与发展将使得人类迎来一个全新的时代,在肆虐的病毒面前,人类并不会无动于衷。在当前新型冠状病毒暴发的艰难时刻,更需要人们充满信心,以更加顽强的勇气和智慧,以面对新型病毒的挑战!

科技自媒体刘志刚,订阅号:互联网江湖(ID:VIPIT),转载商务合作加微信:13124791216,转载保留作者版权信息违者必究。

申请创业报道,分享创业好点子。点击此处,共同探讨创业新机遇!

相关标签
医疗ai

相关文章

  • 开发者怎么拥抱智能化浪潮?昇腾AI给出了“通关指南”

    在大模型代表的新一轮技术浪潮下,智能化转型已然是毋庸置疑的趋势,科技大厂们纷纷给出了智能化的“道法术”,大大小小的企业也开始更新认知,想要从创新中挖掘出驱动增长的新质生产力。但现实和智能化的美好愿景之间,仍然横亘着一片鲜有人涉足的“荒海”,脚下还没有坚实的路。3月23日在天津举办的昇腾AI开发者创享

    标签:
    ai技术
    ai智能
  • 8款AI视频生成产品实测,谁将成为中国Sora?

    ©自象限原创作者丨罗辑、苏奕编辑丨程心2024年开年,科技圈没有什么比Sora的出现更让人兴奋。如同ChatGPT在2023年初带来的LLM创业潮,Sora的发布也同样将视频生成模型推到了风口浪尖。科技巨头猛推产品,创业公司则乘风而上。3月13日,AI视频大模型公司爱诗科技完成亿元级人民币A1轮融资

    标签:
    ai技术
    ai智能
  • AI业务收入盈利双增,但百融云没有止步

    当为科学技术巡游一方的神,行至人工智能的篇章,中国公司的2023年报里,写着AIGC的前世今生。翻开科技进步的编年史,每一次技术革命都有这样一条铁律:技术革命的最大受益者,通常不是率先做出突破的开疆派,而是率先将其发扬光大的技术流。靠着工业革命超越日不落的美利坚,把同样的故事,转载到了50年代的半导

  • AI手机需要新故事

    言必称AI的时代,已经来了,尤其是随着sora等的震撼发布,以及Google、微软和国内大厂等在AI研发、大模型等方面的日新月异。就手机行业而言,在存量时代出货量连年不及预期的情况下,如何刺激用户换机,成了一道摆在所有手机厂商面前的共同命题。从三星到国内的一些手机厂商,实际上已先行一步打出了“AI手

    标签:
    ai技术
  • 智能校对大模型文修2.0重磅发布:赋能“人工智能+办公”转型升级

    3月22日,由天津蜜度文修智能科技有限公司主办的智能校对大模型文修2.0智臻发布会在津举行。发布会以“大模型赋能‘人工智能+办公’体验升级”为主题,邀请语言智能领域专家,以及各大媒体机构和合作伙伴,围绕大模型技术、应用落地发展、标准化进程进行分享交流。发布会上还发布了智能校对大模型文修2.0。天津市

  • 阿里通义千问重磅升级:免费开放1000万字长文档处理功能

    3月22日消息,阿里通义千问重磅升级,向所有人免费开放1000万字的长文档处理功能,成为全球文档处理容量第一的AI应用。即日起,所有金融、法律、科研、医疗、教育等领域的专业人士,都可通过通义千问网站和APP快速读研报、分析财报、读科研论文、研判案情、读医疗报告、解读法律条文、分析考试成绩、总结深度文

    标签:
    通义千问

编辑推荐