基因组学复习大全

发布时间 : 星期六 文章基因组学复习大全更新完毕开始阅读

用不同长度文库原因:⑴保留文库中可能丢失的克隆片段。任何一种载体都会因为插入某些片段发生不兼容不能扩增发生丢失。⑵扩大覆盖面。⑶校正由重复序列产生的差错。 优点:⑴测序速度快,无需提供相关遗传图物理图⑵覆盖面较大

缺点:⑴基因组太大,结构复杂,会使组装的起始工作量大。⑵短重复序列及数量分布在基因组中使组装可能出现错误。⑶可能存在大量无法填补的间隙。 4.基因测序的其他路线:①重要区域优先测(人类主要组织相容性复合体MHC)②EST测序:mRNA经反转录可合成cDNA,其不包括内含子,可直接测序重要信息。优点:⑴容易构建文库⑵只需一次cDNA测序即可获得EST序列⑶准确性高

5.人类基因组测序:物理图+鸟枪,2个路线:全基因组组装、区间化组装。

第五章基因组序列注释 一、搜寻基因

方法:①根据已知序列分析寻找与基因相关的②实验研究其产物和表型影响

1.开放读框ORF:一系列指令氨基酸的密码子,包括起始和终止密码子。意义:搜寻及读框找出序列,根据已知规则来推测可能基因。高等真核生物ORF阅读困难:⑴基因间存在大量非编码序列⑵绝大多数基因含有非编码的内含子⑶外显子长度不确定,不能根据长度判断。 影响读码:⑴密码子偏爱:编码同一氨基酸的密码子在不同种属间使用频率有差异。⑵外显子内含子边界常有例外:内含子5’端称供体位,3端受体位。⑶上游控制序列:上游调控序列可与DNA结合蛋白作用控制基因表达。但常有变动。

2.同源基因查询:利用数据库中的基因序列与待查的进行比较,找出可匹配的碱基蛋白质序列来识别基因。查找依据:⑴存在某些完全相同序列⑵ORF读框排列类似⑶ORF指令的氨基酸序列相同⑷模拟的多肽高级结构相似。孤独基因:缺少同源序列的ORF。

同源性:源于同一祖先但序列已经发生变异的序列的关联性。氨基酸一致性或相似性25%以上则为同源基因。一致性:同源DNA序列的同一碱基位置上相同的碱基成员或蛋白质中同一氨基酸位置相同的氨基酸成员比例。百分比表示。相似性:指同源蛋白质的氨基酸序列中一致性氨基酸的可取代氨基酸所占比例。百分比表示。 3.实验确认基因

①分子杂交科确定DNA片段是否含表达序列。

Northern印迹法:分子杂交时从样品中纯化的RNA经琼脂糖凝胶电泳分离,然后转移到杂交膜上,再将待测DNA标记后与RNA杂交,如果RNA中含有DNA的转录产物,则会有信号。问题:⑴基因转录产物可变剪接或是多基因家族成员,也会出现多个信号⑵基因的表达具有组织专一性和发育阶段的差别而使RNA样品不一定含有基因产物⑶不同基因表达产物丰度差大,对低拷贝产物应提高上样量。如用拟Northern分析法。

动物园杂交法:一些亲缘关系近的物种,编码区相似度高,非编码区低,如果与亲缘物种DNA片段杂交产生阳性信号,说明该段有编码基因。

②EST和cDNA指认基因:可以发现漏注基因,还可以找内含子外显子边界。 不利影响:⑴目标cDNA在文库中占比很低。解决:将文库分为若干亚群,进行初筛。或cDNA均一化,抑制高拷贝cDNA数量,增加低拷贝数量。⑵mRNA分子有时会产生二级结构,逆转录酶遇到二级结构就终止,从而产生残缺cDNA。解决:高温减少二级结构生成。

③全长cDNA边界序列文库构建=基因鉴别信号GIS:以SAGE技术为基础,结合全长cDNA克隆,专门分离其5端3端各20个碱基序列,建立所有末端多连体CIS文库。过程:⑴合成全长cDNA,连首尾接头,纯化后连接载体,扩增,凝胶分离50bp二连体DNA,混合插入载体克隆,测序比对确定边界。

④基因命名:座位:不是基因的同义词,而由遗传标记指定的染色体连锁图上的某位置。 二、基因注释

计算机注释用同源性比较。同源包括:直系同源基因:不同物种间同源基因。共生同源基因(平行同源):同一物种基因因倍增产生。倍增基因:基因组加倍产生。 三、基因功能检测

1.遗传分析路线和基因功能研究的不同:前者反求遗传学,从基因出发,有目的改变靶基因来观察表型。后者正向遗传学,从表型到基因。

2.基因失活是主要手段。但表型效应有时不易观察。基因剔除:将无关DNA片段取代某一特定基因。原理:在无关片段两侧连接与代换基因两端相同序列,导入目的细胞,同源重组后整合到了目标染色体上。 3.基因过量表达(功能增益):⑴增加拷贝⑵采用强启动子 四、高通量基因功能研究方法

1.构建突变库:要求:⑴突变体可以稳定遗传⑵可以有效快速地分离突变基因⑶可反复不断产生突变

基因标签法:利用转座子构建插入突变库,系统地分离与克隆功能基因和调控序列。依据:⑴植物细胞全能型,外源基因可表达⑵转座子的随机插入可获得大量突变,根据插入来合成探针,可分离被破坏位点来分析组成⑶可发生回复突变。

Ac-Ds转座子系统原理:Ac因子转座酶基因构建嵌合载体;外显子捕获载体构建;植株AB杂交;增强子捕获载体。

2.蛋白质互作:互作的两个蛋白,一个已鉴定,则可分离分析另一蛋白。

噬菌体外显:检测基因和噬菌体外壳蛋白基因融合,当遇到互作蛋白会发生聚合,纯化后检测。酵母双杂交系统。 五、组学

转录物组:某一条件下单个或一组细胞具有的mRNA总和,可由SAGE基因表达系列分析 六、基因本体:通用词汇体系。分为三方面,细胞组分,生物学过程,分子功能,其编排是以树形图方式展开来对基因和基因功能进行描述的。

第六章基因组解剖 一、原核基因组解剖

操纵子、最小基因组、完美基因组 二、真核

染色体数目:一种蚂蚁最短;染色体组型(核型);染色体核型分析; 染色体显带:有些染料可以和中期染色体特异性结合产生独特带型;

常染色质和异染色质区别:异:分布在细胞核周缘,染色深,结构紧密,使控制基因表达的蛋白无法接近DNA、常:染色浅,基因松散有活性,调控因子可以接触。异染色质:组成型:不含任何基因,持久保持致密,例如着丝粒和端粒。兼性:周期性处于活性状态。 异常染色体:小染色体:体积小,但富含基因。B染色体:正常染色体的断片,存在时会影响生物表型。

DNA环:中期染色体除去结合蛋白剩下的从致密蛋白骨架向外伸展的DNA环。 核基质:类似支架的网状结构,分布在整个细胞核中 结构区域:被核基质分隔成的相对独立的区域 骨架附着区:染色体骨架结合着的DNA序列 基质附着区:核基质结合的DNA序列

等高线:连续分布的具有相似碱基组成的DNA区段,在基因组中成片镶嵌排列。

CpG岛:指基因组中富含双碱基CpG的序列,GC含量60%-70%。分布:人染色体的R带区;管家基因和大部分组织专一性表达基因的5’侧翼区以及第一个外显子区。特点:分布、CpG岛中CpG双碱基均为甲基化。作用:CpG岛总与基因相连,可作为寻找基因依据。 遗传图和物理图比较启示:⑴重组率随染色体长度增加而递减⑵近着丝粒区重组受影响⑶染色体连锁不平衡区的碱基组成和基因组成有明显特征,表明其受到自然选择的影响。 操纵子与原核比较:⑴没有操纵基因序列⑵内部多顺反子之间间隔序列更长⑶多顺反子具有外显子和内含子结构,转录产物首先通过反式剪接产生单个顺反子前体mRNA,再进行内含子切除外显子连接。

细胞器基因组:半自主性细胞器,⑴基因组为多拷贝⑵大小与生物复杂性无关⑶具有编码rRNA基因,呼吸链基因,部分含tRNA基因

线粒体基因组和叶绿体基因组比较:⑴线粒体:结构非均一;不同种属间大小差距较大;含有大量短序列正向或反向重复,产生很多分子内重组。⑵叶绿体:结构紧凑;不同种属基因组大小较恒定;具有两段很长的反向重复序列,阻止分子内重组。 细胞器基因组起源:内共生学说:曾是游离细菌,与远古真核细胞结合,并最终定居。依据:基因表达过程与细菌非常相似。

细胞器基因可以进入核基因而相反则不能,由于基因必须获得一段转移信号肽序列才能使其编码蛋白质再进入细胞器。 三、、转座子和分散重复序列

DNA转座子:DNA直接转座;包括:复合转座子、Tn3型转座子、可转座噬菌体。 RNA转座子:以RNA为中介进行转座。包括:LTR因子(含有负责转座的长末端重复序列):真核生物逆转座子、内源逆转录病毒、逆转座子。非LTR因子:LINE长散在原件(含转座酶基因)、SINE短散在原件(无转座酶基因,需用寄主转座酶) 四、串联重复序列

卫星DNA、小卫星序列、微卫星序列

五、人类基因组:小的原因:人类基因的mRNA具有更多的可变剪切方式。人类蛋白质组含有的域构建类型多。

第十章表观遗传

一、表观遗传:与DNA序列组成,基因空间位置,染色质构型变化,DNA碱基修饰有关 定义:染色体区域的一种适应性结构,可使改变的活性状态注册、传导或持续。表观遗传特点:⑴主体是染色质活性可变性⑵核心是染色质结构改变⑶染色质结构变化可以是持续的或非持续的⑷染色质活性和结构改变由程序控制。表观遗传学特点:⑴研究基因如何发挥功能及互作关系⑵研究范畴只涉及DNA序列之外使基因表达模式改变并可稳定遗传的因素 副突变:不涉及基因突变,通过等位基因互作改变基因表达模式并遗传。包括:副突变基因(诱导)、可副突变基因、已副突变基因。

位置效应:基因由于染色体位置变化而使表达改变 基因组印记(亲代印记):等位基因来自不同性别亲本而在发育过程中经专一性(甲基化)加工使表达模式发生可遗传变化。

表观遗传机制:染色质重建:染色质由收缩状态向伸展开放状态的转变;DNA甲基化 二、位置效应 类型:①因染色质的物理状态处于极度收缩而使活化因子无法接触内部基因而关闭②有座位控制区LCR在5端上游对下游进行调控。座位控制区与下游基因组成功能域。

绝缘子:可以制止临近位置激活或失火的序列,作用仅限于隔绝相邻染色质区域影响,对其本身表达活性无关。定向控制:绝缘子效应具方向性。

单等位基因表达:2个等位基因成员只有一个选择性表达。 三、DNA甲基化

原理:将S-腺苷甲硫氨酸的甲基基团转移到DNA的碱基结构中。低等真核:腺嘌呤甲基转移酶,高等:胞嘧啶~

特点⑴确定细胞命运⑵决定基因表达模式的重要因素⑶在上下代间传递⑷只修饰影响表型和遗传而不改变碱基

方式:⑴局部影响染色质结构组织转录因子与启动子/增强子结合控制基因表达。 ⑵大范围影响染色体基因表达 四、染色质重建和核小体 1.核小体相位(定位):指一段序列确定的DNA与核小体核心八聚体的结合方式。方法:内在要求,合适的DNA序列优先定位;外在影响,第一个定位随后加入的以第一个为基准按限定长度重复组装。

平移定位:移动10bp时缠绕核小体的序列会改变位置,但不改变DNA序列朝向 旋转定位:移动小于整圈螺旋碱基对数(10.2bp)原有序列朝向发生变化。 均通过影响蛋白质和DNA的接触来调控基因表达。

转录时核小体移位:RNA酶接近核小体时停止移动,热力学校应使其继续位移,聚合酶侵入缠绕在核小体上的DNA内部,并使其暂离核小体,转录后复位结合,重复发生DNA依次环突直到转录完成。

2.先入模型:转录起始复合物取代启动子区核小体核心组蛋白位置,争夺DNA

爪蟾:卵母细胞5S rRNA基因+体细胞5S rRNA基因,仅在ICR5端有3到6个碱基差别,囊胚期前前者主导,囊胚期后优势转变,原肠胚到体细胞使其后者主导。 动态模型:蛋白质之间互作和蛋白质DNA间接触需要ATP参与 五、表观遗传通路:表观遗传是由程序严格控制的。分子机制:⑴产生表观遗传的初始原因:表观源,诱导发生;⑵信号,指导确立染色质重建的范围和模式:表观起始子;⑶代际间维持和传递:表观维持子。

组蛋白修饰:甲基化乙酰化磷酸化泛素化。使染色质松弛原因:减少位于NH4+的正电荷,降低组蛋白与DNA亲和性,减弱核小体间相互作用。

表观遗传密码假说:每个真核细胞具有的修饰总和,由组蛋白密码和DNA甲基化组成 组蛋白密码假说:组蛋白的化学修饰可部分调控储存在DNA中的信息表达。

第十三章基因组进化模式 一、遗传系统的起源

最初的生命:自我复制、积累变异保持遗传。核酶:⑴自我剪接⑵催化切断其他RNA⑶催化肽键形成⑷催化核苷酸合成 类膜结构:⑴使生化反应更集中⑵为过滤和选择周围环境的化学分子提供了可能⑶催化功能的蛋白质出现后,定位在脂膜上的蛋白质可以组成有序的反应链,为建立细胞结构奠定基础。 氧化还原反应是生命利用化学能构建有序物质形态的生化基础。

蛋白质的催化优点:多肽链有更大可塑性,RNA分子长度有限且配对区物理刚性较大。RNA催化活性转移到蛋白质是RNA原始基因组功能的根本性改变,使RNA与蛋白质分工明确,进而提高整个系统的效率。此后RNA和蛋白质联手以RNA为模板合成DNA。

古细菌的转录和翻译相关基因的起源与真核生物更接近,而代谢基因与真细菌接近。 二、新基因

两次扩张:第一次:14亿年前真核生物出现,10000基因。第二次寒武纪脊椎动物出现。 新基因产生方式:⑴基因加倍后趋异⑵外显子或结构域洗牌⑶逆转录及其后的趋异或重排⑷

联系合同范文客服:xxxxx#qq.com(#替换为@)