CRISPR的全称为:成簇的规律间隔的短回文重复序列(clustered regularly interspaced short palindromic repeats); Cas是CRISPR连接蛋白(CRISPR associated protein)。CRISPR序列构成了决定切割位点特异性的非编码RNA,Cas 基因编码的Cas 蛋白具有核酸酶活性

CRISPR序列转录产生两个非编码RNA分子, 依靠重复序列互补形成异二聚体,再与Cas蛋白结合。Cas蛋白能够将异二聚体RNA剪切加工成为一端为有20个碱基向导序列的成熟RNA分子(gRNA)。这段向导序列能够特异识别基因组DNA分子的互补序列,而Cas蛋白再次利用核酸酶活性将DNA分子切断。

成熟的crRNA通过碱基互补配对与tracrRNA形成特殊的双链RNA结构,指导cas9蛋白在目标DNA上引起双链断裂。在与crRNA指导序列互补的位点,cas9蛋白的HNH核酸酶结构域切割crRNA的互补链,而cas9蛋白RuvC样结构域切割非互补链。当双tracrRNA:crRNA被嵌合到一条RNA时,同样可以指导cas9切割双链DNA

Untitled

图中是细菌天然免疫系统。我们可以看到,CRISPR locus是构成:

①前导序列(leader):富含AT碱基,位于CRISPR基因上游,被认为是CRISPR序列的启动子

②重复序列(repeat):长度约20–50 bp碱基且包含5–7 bp回文序列,转录产物可以形成发卡结构,稳定RNA的整体二级结构

③间隔序列(spacer)是被细菌俘获的外源DNA序列。这就相当于细菌免疫系统的“黑名单”,当这些外源遗传物质再次入侵时,CRISPR/Cas系统就会予以精确打击。

当噬菌体感染细菌,细菌激活相关的cas基因——Cas1,Cas2,和Csn2,将其中新的间隔序列整合到自身的CRISPR arry中。一旦获得以后,新的spacer就会出现在pre-crRNA中,此时tracrRNA与不同的SPACER互补,在RNaseIII的作用下,产生crRNA,进一步在其他未知的核酸酶的作用,剪切crRNA的5'端,使得引导序列长为20nt。如果噬菌体注入DNA,那么这个免疫系统将被激活,来干扰噬菌体DNA。

在向导序列的3'端, Cas识别的DNA位点还必须有一个PAM (protospacer adjacent motif)区域。在酿脓链球菌的CRISPR系统里,紧跟于靶序列后的PAM序列是5'-NGG 。而Cas识别位点的特异性就由20个碱基的向导序列和3个碱基的PAM序列共同决定。现在商家已经直接将异二聚体RNA构建成一个有向导序列和与Cas蛋白结合序列的融合RNA(single-guide RNA, sgRNA), 从而将CRSIPR/ Cas系统简化成Cas蛋白和sgRNA两个组分。切割后对DNA断点附近的序列进行编辑,同样是非同源末端连接修复机制和同源重组的方式进行。目前,已发现了三种类型的CRISPR/Cas系统,Ⅱ型CRISPR/Cas系统在发挥功能时仅需要一种蛋白,即Cas9核酸酶参与。因此,CRISPR/Cas9系统得到了广泛应用。

CRISPR/Cas9技术是近年来出现的一种革命性技术,被广泛用于基因的敲除、点突变和外源性基因的插入等。

此外, 在动物和人类细胞中过表达特定基因编码蛋白的部分功能域缺失或基因突变体,也是研究基因功能的常用方法。