来源:雪球App,作者: 鑫博制造,(https://xueqiu.com/1573961572/143063479)
本文简单总结了大神们的工作,给自己做个笔记,也给大家简单做一下科普。了解从DNA,RNA的组成到新型冠状病毒测序,基因比对的基本概念。
首先从DNA的组成说起:
核酸包括脱氧核糖核酸DNA, 核糖核酸RNA,是由核苷酸聚合成的生物大分子化合物,包含生命的遗传密码。
组成核酸的基本单位是核苷酸, 包括脱氧核苷酸,核糖核苷酸。
核苷酸以一个含氮碱基为核心。氮碱基有五种,分别为腺嘌呤(A)、胸腺嘧啶(T)、鸟嘌呤(G)、胞嘧啶(C)、尿嘧啶(U)。
DNA是一个个核苷酸组成的双螺旋结构。单链结构令RNA更不稳定,更容易变异。
DNA里包含的碱基类型包括A、G、C、T。RNA中由尿嘧啶U被胸腺嘧啶T取代,使其更易被水解。
双链的DNA上的碱基都会与另一条链上的碱基产生键结,称为碱基配对(bp)。这种配对是固定的,A只与T相连,而C只与G相连。DNA的遗传特性就是由碱基序列的排列顺序决定的。
我们通常所说的基因,一般是指一段可以决定特定遗传信息的DNA片段。比如你找出决定你的头发颜色的基因,替换掉,也许就能改变你的头发颜色。
而所谓的基因测序,就是分析DNA片段的碱基序列,确定他们的排列方式。@华大基因 @illumina。
生命在成长过程中,要不断合成新的细胞,新细胞的合成就需要通过读取这个遗传密码,读取密码的过程称为转录,是根据DNA序列复制出一段称为RNA的核酸分子,RNA就像车间主任,具体指导蛋白质的合成工作。
就像磁盘拷贝一样,在复制DNA的过程中,会出错。DNA受到化学物质,辐射或者病毒影响的时候,也会造成损伤。如果这种损伤和出错是可遗传的,就被称为突变。
顺便提一下,DNA的编码机制令其存有大量的重复信息,而且DNA有修复机制来使基因组免受损伤和突变。但是当细胞累积大量的DNA损伤老化时,DNA修复的速度下降,直至赶不上正在进行的DNA损伤的速度。细胞就可能衰老。如果DNA突变形成了不受机体控制的、连续进行分裂的恶性增殖细胞,就称之为癌变。
这也是人类衰老和得癌症的根源。
新型冠状病毒简介:
病毒是最简单的一种生命形式之一。
病毒的结构往往也很简单,就是一个蛋白质外壳包裹着内部的遗传物质。
病毒没有通常细菌具有的细胞膜,这也令病毒无法在离开寄生细胞体后单独存活。
遗传物质位于病毒的内部,组成病毒的核心。并按其中遗传物质的类型分为DNA病毒和RNA病毒。
而蛋白质则围绕在遗传物质的外侧,形成称为壳体。
病毒的大小通常只有细菌的百分之一。新型冠状病毒直径约60-220nm。
病毒具有包膜结构,上面有三种蛋白:刺突糖蛋白(S,Spike Protein)、小包膜糖蛋白(E,Envelope Protein)和膜糖蛋白(M,Membrane Protein),少数种类还有血凝素糖蛋白(HE蛋白,Haemaglutinin-esterase)
在冠状病毒的结构中,像皇冠一样的刺突称为刺突糖蛋白(Spike Glycoprotein,简称 S 蛋白)。S蛋白进入人体和人体细胞上的血管紧张素转化酶2(ACE2)结合,就可以感染人体。
冠状病毒的核酸为正链单链RNA,进入人体后,可以以自身为模板,指导合成病毒相关蛋白质。不停的复制自己。继而感染更多的人体细胞。
病毒基因分析和溯源:
新冠病毒我们已经完成了对它的全基因组测序,它的RNA大概有3万个碱基组成,如果我们对它进行测序,那就有3万个atcg这样的字母在计算机上表示它的序列:
如果把它的RNA的组成按基因来表示,则可以画出下图。
新冠病毒的基因组
比起稳定的双链 DNA 结构,单链的遗传物质使得冠状病毒具有更强的变异性。
对比新冠病毒SARS-CoV-2和其他已知新冠病毒的区别,是对新冠病毒溯源的主要方法之一。这就需要用到基因序列的比对。序列比对技术是生物信息学对人类社会最为重要的贡献之一。无论是亲缘鉴定、新物种识别还是潜在遗传病分析,都离不开序列比对。
冠状病毒家族已知的至少有几十个成员,其中的大多数与我们人类相安无事,而经过多次变异产生的 SARS-CoV,MERS-CoV 等7种冠状病毒可以感染人类。
近期的研究表明,与 SARS-CoV 和 MERS-CoV 病毒类似,新冠病毒SARS-CoV-2(2019-nCoV)的基因组也分为非结构基因和结构基因两个部分。
其中约占新冠病毒SARS-CoV-2 全基因组总长度三分之二的非结构基因含有两段编码蛋白质的序列,称为 ORF1a 和 ORF1b。而紧随其后的结构基因区域则编码 S 蛋白、E 蛋白等结构蛋白。
几种冠状病毒基因组的序列比较
德国GISAID(网页链接)提供了一个共享的病毒数据库,全世界各国都可以把已知的病毒序列上传,共大家分析研究。同时也提供了自动化的分析工具,帮助对照目前已知的蝙蝠基因组数据库,进行序列比对。
目前该网站有全世界上传的160个新型冠状基因样本。
从全基因组结构上分析,新冠病毒SARS-CoV-2 的基因组结构与其它冠状病毒比较相似。
GISAID上几种冠状病毒基因组的序列自动比对
它与发现自蝙蝠的两种冠状病毒(Bat-SL-CoVZC45 和 Bat-SL-CoVZXC21)的相似度分别为87.5%和87.6%;与 SARS 病毒的序列相似度约为79%;而与 MERS 病毒的序列相似度仅有50%。
值得注意的是,新冠SARS-CoV-2 与 SARS-CoV 在基因组的不同区域的序列相似性不尽相同:在编码病毒与宿主受体结合的 S 蛋白区域,新冠SARS-CoV-2 与 SARS-CoV 的序列相似性显著降低。有研究表明新冠SARS-CoV-2与人体ACE2的结合度是SARS的10倍,因此具备比SARS强大的多的感染性。
而相似度最高的是与云南的蝙蝠的RaTG13冠状病毒,相似度高达96.2%。
最后希望本文的科普会有助于你看懂最近不断爆出的各种论文,分清谣言和真相
参考文献:
中科院科普解读:《新型冠状病毒:结构简单、成分简单,但破坏力绝不简》网页链接
机器学习组:《从病毒到免疫, “科学地”揭开新冠病毒的神秘面纱》网页链接
@今日话题
$格力电器(SZ000651)$ $万科A(SZ000002)$ $恒瑞医药(SH600276)$