聚焦unknome蛋白质加速研究:我们几乎一无所知的人类基因数据库

聚焦unknome蛋白质加速研究:我们几乎一无所知的人类基因数据库这个数据库被称为"unknome",是英国牛津大学邓恩病理学学院的马修-弗里曼(MatthewFreeman)和英国剑桥MRC分子生物学实验室的肖恩-芒罗(SeanMunro)及其同事的研究成果。他们对数据库中的部分蛋白质进行了研究,发现其中大部分蛋白质对重要的细胞功能做出了贡献,包括发育和抗压能力。人类基因组测序清楚地表明,人类基因组编码了数以千计的可能蛋白质序列,而这些蛋白质序列的身份和功能至今仍不为人知。造成这种情况的原因是多方面的,包括人们倾向于将稀缺的研究经费集中用于已知的目标,以及缺乏包括抗体在内的工具来研究细胞中这些蛋白质的功能。但作者认为,忽视这些蛋白质的风险很大,因为很可能有些蛋白质,也许是很多蛋白质,在关键的细胞过程中发挥着重要作用,既能提供洞察力,又能成为治疗干预的靶点。为了促进对这类蛋白质进行更快速的探索,作者创建了unknome数据库,为每种蛋白质分配一个"已知度"分数,反映科学文献中有关功能、跨物种保护、亚细胞区隔和其他要素的信息。根据这一系统,有数千种蛋白质的"已知度"接近于零。其中包括来自模式生物的蛋白质,以及来自人类基因组的蛋白质。该数据库对所有人开放,并可定制,允许用户为不同的元素提供自己的权重,从而生成自己的已知度分数集,以确定自己研究的优先次序。为了测试该数据库的实用性,作者选择了人类中的260个基因,这些基因在苍蝇中也有类似的基因,而且在两个物种中的已知度分数都是1或更低,这表明人们对它们几乎一无所知。其中许多基因的完全敲除与苍蝇的生活不相容;部分敲除或组织特异性敲除后发现,大部分基因对影响生育、发育、组织生长、蛋白质质量控制或抗逆性的重要功能做出了贡献。研究结果表明,尽管进行了数十年的详细研究,但仍有成千上万的苍蝇基因甚至在最基本的水平上仍有待了解,人类基因组的情况显然也是如此。芒罗说:"这些未被表征的基因不应该被忽视。"我们的数据库提供了一个功能强大、用途广泛的高效平台,可用于识别和选择功能未知的重要基因进行分析,从而加快缩小未知基因组所代表的生物学知识差距。"芒罗补充说:"成千上万种人类蛋白质的作用仍然不清楚,但研究往往集中在那些已经很清楚的蛋白质上。为了帮助解决这个问题,我们创建了一个'未知组'(Unknome)数据库,该数据库根据人们对蛋白质的了解程度对蛋白质进行排序,然后对这些神秘蛋白质中的一部分进行功能筛选,以展示无知是如何推动生物学发现的。"...PC版:https://www.cnbeta.com.tw/articles/soft/1384205.htm手机版:https://m.cnbeta.com.tw/view/1384205.htm

相关推荐

封面图片

科学家确定一个独特的恢复听力的蛋白质网络

科学家确定一个独特的恢复听力的蛋白质网络美国国立卫生研究院的研究人员已经确定了一个特殊的蛋白质网络,该网络对于细胞再生以恢复斑马鱼的听力是必要的。美国国家人类基因组研究所(NHGRI)的研究人员领导了这项研究,这可能有助于创建人类听力损失的治疗方法。该研究结果最近发表在《细胞基因组学》杂志上。PC版:https://www.cnbeta.com/articles/soft/1331037.htm手机版:https://m.cnbeta.com/view/1331037.htm

封面图片

“再见”基因:果蝇在细胞凋亡过程中使用的蛋白质与哺乳动物类似

“再见”基因:果蝇在细胞凋亡过程中使用的蛋白质与哺乳动物类似RIKEN遗传学家在果蝇中发现了一种许多教科书上说不存在的蛋白质。这种蛋白质检测细胞中的压力,并在它们承受过度压力时让它们走上自我毁灭的道路。我们体内受损的细胞通过启动称为细胞凋亡的程序性细胞死亡的自杀过程来自我消除。这个过程对我们的健康和确保细胞不会癌变至关重要。这一过程背后的分子级联反应非常复杂,但它是由属于BH3-only蛋白质家族的一种蛋白质触发的。这些蛋白质感知细胞中的压力,并且存在于包括哺乳动物和线虫在内的许多动物中。然而,在过去的二十年里,在实验室中以果蝇为代表的所有昆虫都被认为缺乏BH3-only蛋白。相反,他们被认为依赖于不同的细胞死亡程序。但是现在,RIKEN生物系统动力学研究中心的SaKanYoo及其同事有一个惊人的发现,他们发现果蝇确实含有一种仅含有BH3的蛋白质。他们以日语中的“告别”一词命名了为其编码的基因sayonara。SaKanYoo和YukoIkegawa。图片来源:2023RIKEN当该团队使sayonara基因在果蝇翅膀中表达时,他们观察到发生细胞凋亡,导致翅膀萎缩(图1)。根据Yoo的说法,该基因隐藏在众目睽睽之下。“我们没有做任何花哨的事情,仅仅是使用了人类BH3-only蛋白的基因序列,并核对了果蝇的基因组是否具有相似的序列——这是在果蝇中寻找与人类基因相对应的基因的一种非常常见的方法。”Yoo怀疑果蝇基因组的不完整测序可以解释为什么研究人员在20年前没有在果蝇中发现该基因。“当时基因组测序还不完整,所以科学家们可能无法找到该基因,过了一段时间他们就放弃了。”果蝇缺乏BH3-only蛋白随后被载入教科书。但对Yoo来说,这是一个有趣的挑战。“我认为检查它可能会很有趣,而仅仅几个小时后,我就发现了一些看起来很像BH3-only蛋白质的东西。”这一发现表明,果蝇,可能还有其他昆虫,在细胞凋亡方面和人类以及其它物种并没有太大不同。“这意味着果蝇并不例外或有点奇怪,”Yoo说。“相反,我们发现它们具有与人类和线虫相似的调节细胞凋亡的机制。”该团队现在正在探索BH3-only蛋白被激活后究竟会发生什么。他们还在研究其他昆虫是否含有BH3-only蛋白。...PC版:https://www.cnbeta.com.tw/articles/soft/1365787.htm手机版:https://m.cnbeta.com.tw/view/1365787.htm

封面图片

MIT最新研究:AlphaFold蛋白质预测能力太差 目前利用价值还很低

MIT最新研究:AlphaFold蛋白质预测能力太差目前利用价值还很低2018年,Deepmind首次发布基于深度神经网络的蛋白质结构预测数据库AlphaFold,在蛋白质预测中实现了最先进的性能;去年,AlphaFold2获得了98.5%的蛋白质预测率;前段时间,Deepmind又重磅发布了数据集更新,称目前的AlphaFold已经预测了几乎所有已知的蛋白质。PC版:https://www.cnbeta.com/articles/soft/1316665.htm手机版:https://m.cnbeta.com/view/1316665.htm

封面图片

微软开源新型蛋白质生成人工智能 EvoDiff

微软开源新型蛋白质生成人工智能EvoDiff但是,从计算和人力资源的角度来看,目前在实验室设计蛋白质的过程成本高昂。它需要提出一种能在体内执行特定任务的蛋白质结构,然后找到一种可能"折叠"到该结构中的蛋白质序列(组成蛋白质的氨基酸序列)。(蛋白质必须正确折叠成三维形状,才能实现其预期功能)。其实不一定非要这么复杂。本周,微软公司推出了一个通用框架EvoDiff,该公司声称可以根据蛋白质序列生成"高保真"、"多样化"的蛋白质。与其他蛋白质生成框架不同的是,EvoDiff不需要目标蛋白质的任何结构信息,省去了通常最费力的步骤。微软高级研究员凯文-杨(KevinYang)说,EvoDiff开源后,可用于创建新疗法和给药方法的酶,以及用于工业化学反应的新酶。"我们的设想是,EvoDiff将扩展蛋白质工程的能力,使其超越结构-功能范式,走向可编程、序列优先的设计,"EvoDiff的共同创建者之一杨在接受TechCrunch电子邮件采访时说。"通过EvoDiff,我们证明了我们可能实际上并不需要结构,而是'蛋白质序列就是你所需要的一切',从而可控地设计出新的蛋白质"。EvoDiff框架的核心是一个640参数模型,该模型是根据所有不同物种和功能类别蛋白质的数据训练而成的。(参数"是人工智能模型从训练数据中学到的部分,基本上定义了模型处理问题的技能--在本例中就是生成蛋白质)。训练模型的数据来自序列比对的OpenFold数据集和UniRef50,后者是UniProt数据集的一个子集,UniProt是由UniProt联盟维护的蛋白质序列和功能信息数据库。EvoDiff是一种扩散模型,其结构类似于稳定扩散和DALL-E2等许多现代图像生成模型。EvoDiff可以学习如何从几乎完全由噪声组成的起始蛋白质中逐渐减去噪声,从而使其缓慢地、一步一步地接近蛋白质序列。EvoDiff生成蛋白质的过程。扩散模型已越来越多地应用于图像生成以外的领域,从设计新颖的蛋白质(如EvoDiff),到创作音乐,甚至合成语音。"如果说[从EvoDiff]中能得到什么启发的话,我认为那就是我们可以--也应该--通过序列来生成蛋白质,因为我们能够实现通用性、规模和模块化,"EvoDiff的另一位共同贡献者、微软高级研究员阿瓦-阿米尼(AvaAmini)通过电子邮件说。"我们的扩散框架让我们有能力做到这一点,也让我们能够控制如何设计这些蛋白质,以实现特定的功能目标。"对于阿米尼的观点,EvoDiff不仅能创造新蛋白质,还能填补现有蛋白质设计中的"空白"。例如,如果蛋白质的某一部分与另一种蛋白质结合,该模型就能围绕这一部分生成符合一系列标准的蛋白质氨基酸序列。由于EvoDiff是在"序列空间"而非蛋白质结构中设计蛋白质,因此它还能合成最终无法折叠成最终三维结构的"无序蛋白质"。与正常功能的蛋白质一样,无序蛋白质在生物学和疾病中发挥着重要作用,比如增强或降低其他蛋白质的活性。需要指出的是,EvoDiff背后的研究还没有经过同行评审--至少目前还没有。参与该项目的微软数据科学家萨拉-阿拉姆达里(SarahAlAMDari)承认,在该框架投入商业应用之前,"还有很多扩展工作要做"。阿拉姆达里通过电子邮件说:"这只是一个6.4亿参数的模型,如果我们将其扩展到数十亿参数,我们可能会看到生成质量的提高。虽然我们展示了一些粗粒度策略,但要实现更精细的控制,我们希望EvoDiff以文本、化学信息或其他方式为条件,指定所需的功能。"下一步,EvoDiff团队计划测试该模型在实验室中生成的蛋白质,以确定它们是否可行。如果可行,他们将开始下一代框架的工作。...PC版:https://www.cnbeta.com.tw/articles/soft/1384011.htm手机版:https://m.cnbeta.com.tw/view/1384011.htm

封面图片

科学家揭示蛋白质如何驱动癌症生长

科学家揭示蛋白质如何驱动癌症生长在圣路易斯华盛顿大学医学院、麻省理工学院和哈佛大学布罗德研究所、杨百翰大学以及世界各地其他机构的领导下,临床蛋白质组肿瘤分析联合会对驱动癌症的关键蛋白质及其调控方式进行了研究。研究结果于8月14日发表在《细胞》(Cell)和《癌细胞》(CancerCell)杂志上的一组论文中。临床肿瘤蛋白质组学分析联合会由美国国立卫生研究院(NIH)国家癌症研究所资助。资深作者、华盛顿大学戴维-英格利希-史密斯医学特聘教授丁力博士说:"在我们开发更好的癌症疗法的努力中,这种对驱动肿瘤生长的蛋白质的新分析是继癌症基因组测序之后的下一步。通过过去的癌细胞基因组测序工作,我们确定了近300个驱动癌症的基因。现在,我们正在研究这些癌基因所启动的机器的细节--实际导致细胞分裂失控的蛋白质及其调控网络。我们希望这项分析能成为癌症研究人员开发多种肿瘤类型新疗法的重要资源。"研究人员分析了涉及10种不同类型癌症的约1万个蛋白质,他们强调了大量数据在这类分析中的重要性;其中许多重要的癌症驱动蛋白在任何一种癌症中都很罕见,如果对肿瘤类型进行单独研究,就不可能发现这些蛋白。这项分析包括两种不同类型的肺癌以及结直肠癌、卵巢癌、肾癌、头颈癌、子宫癌、胰腺癌、乳腺癌和脑癌。丁力也是巴恩斯犹太医院和华盛顿大学医学院西特曼癌症中心的研究成员。他介绍谁哦"当我们对多种癌症类型进行综合分析时,我们就能提高检测导致癌症生长和扩散的重要蛋白质的能力。综合分析还能让我们找出驱动不同类型癌症的主要共同机制。"除了单个蛋白质的功能外,这些数据还能让研究人员了解蛋白质之间是如何相互作用来促进癌症生长的。如果两种蛋白质的水平相互关联--例如,当其中一种蛋白质的水平较高时,另一种蛋白质的水平也总是较高--这就表明这两种蛋白质是作为伙伴作用的。破坏这种相互作用可能是阻止肿瘤生长的一种有效方法。这些研究(包括丁和布罗德研究所的加德-格茨博士共同领导的一项研究)还揭示了通过化学改变蛋白质以改变其功能的不同方法。研究人员记录了这种化学变化--称为乙酰化和磷酸化的过程--如何改变DNA修复、改变免疫反应、改变DNA的折叠和包装方式,以及其他可能在癌症发生过程中发挥作用的重要分子变化。这项研究还揭示了免疫疗法的有效性。检查点抑制剂等免疫疗法通常对突变较多的癌症最有效,但即便如此,它们也并非对所有患者都有效。研究人员发现,大量突变并不总是导致异常蛋白质的大量存在,而异常蛋白质正是免疫系统攻击肿瘤的目标。丁说:"对某些癌症来说,即使突变有可能产生肿瘤抗原,但如果没有异常蛋白表达或表达很少,这种突变就可能不是治疗的靶点。这可以解释为什么有些病人对免疫疗法没有反应,即使他们似乎应该对免疫疗法有反应。因此,我们的蛋白质组学调查涵盖了肿瘤抗原的表达谱,对于设计针对选定突变的新免疫疗法特别有用。"在另一项研究中,丁的团队确定了DNA甲基化模式,这是另一种能影响基因表达方式的化学变化。这种模式可能是癌症的关键驱动因素。在一项重要发现中,研究小组确定了在某些肿瘤类型中抑制免疫系统的分子开关。这组四项研究的最后一篇论文向更广泛的研究界提供了联盟使用的数据和分析资源。她说:"总的来说,这种对多种癌症类型进行的彻底蛋白质组学和化学修饰分析--与我们长期积累的癌症基因组学知识相结合--提供了另一层信息,我们希望这些信息能帮助解答癌症是如何生长并设法躲避我们的许多最佳治疗方法的许多持续存在的问题。"...PC版:https://www.cnbeta.com.tw/articles/soft/1377313.htm手机版:https://m.cnbeta.com.tw/view/1377313.htm

封面图片

科学家用尖端人工智能揭开蛋白质的秘密

科学家用尖端人工智能揭开蛋白质的秘密该工具由KAUST生物信息学研究员MaxatKulmanov及其同事开发,在预测蛋白质功能方面优于现有的分析方法,甚至能够分析现有数据集中没有明确匹配的蛋白质。该模型被称为DeepGO-SE,它利用了类似于Chat-GPT等生成式人工智能工具所使用的大型语言模型。然后,它根据蛋白质工作方式的一般生物学原理,利用逻辑蕴含得出关于分子功能的有意义的结论。从本质上讲,它通过构建部分世界模型(在本例中为蛋白质功能),并根据常识和推理推断出在这些世界模型中应该发生的事情,从而赋予计算机逻辑处理结果的能力。一种新的人工智能(AI)工具能对未知蛋白质的功能进行逻辑推理,有望帮助科学家揭开细胞内部的奥秘。图片来源:©2024KAUST;IvanGromicho他补充说:"这种方法有很多应用前景,"KAUST生物本体论研究小组负责人罗伯特-霍恩多夫(RobertHoehndorf)说,"特别是当需要对神经网络或其他机器学习模型生成的数据和假设进行推理时。"库尔曼诺夫和霍恩多夫与KAUST的斯特凡-阿罗德(StefanArold)以及瑞士生物信息学研究所的研究人员合作,评估了该模型破译那些在体内作用未知的蛋白质功能的能力。该工具成功地利用了一种鲜为人知的蛋白质的氨基酸序列数据及其与其他蛋白质的已知相互作用,并精确地预测了其分子功能。该模型非常精确,在一次国际功能预测工具竞赛中,DeepGO-SE在1600多种算法中名列前20位。KAUST团队目前正在利用这一工具研究在沙特阿拉伯沙漠极端环境中生长的植物中发现的神秘蛋白质的功能。他们希望这些发现将有助于确定生物技术应用中的新型蛋白质,并希望其他研究人员也能使用这一工具。库尔曼诺夫解释说:"DeepGO-SE分析未表征蛋白质的能力可以促进药物发现、代谢通路分析、疾病关联、蛋白质工程、筛选感兴趣的特定蛋白质等任务。"编译来源:ScitechDaily...PC版:https://www.cnbeta.com.tw/articles/soft/1418103.htm手机版:https://m.cnbeta.com.tw/view/1418103.htm

🔍 发送关键词来寻找群组、频道或视频。

启动SOSO机器人