<aside> 🍁 背景

用途:可以反应出转录因子对DNA序列的偏好性、保守性

序列基序在基因调控分析中越来越重要。Motif并不局限于基因组DNA序列还是RNA序列,甚至蛋白质序列也可以提取出相应的motif.通过序列信息的解析,我们可以解析生物学过程中的密码。当某一个大类的序列中,大量重复出现相同的序列结构的时候,就可能存在探索它意义的价值。基于motif序列的提取,我们可以预测潜在的结合位点等等,有助于我们进一步理解各生物学过程中涉及的生物学意义。比如转录因子的结合位点,其motif往往意味着某蛋白结构域与DNA碱基序列的相互作用。

logo展示图

通常用 位置权重矩阵 表示


这样的logo经常用于描述序列特征,如DNA中的蛋白质结合位点等。motif logo由每个位置的一堆字母组成。字母的相对大小表示它们在序列中的频率。

Untitled

Untitled

一致性序列

一致性序列:用一段序列来描述所有序列的碱基组成。当一个位置涉及到多个碱基出现的时候,涉及简并碱基的使用。【简并性:用ATCG之外的字母去代表其他碱基】

Untitled



Untitled