610 likes | 890 Views
已知基因序列的获取策略 —— 兼谈引物设计与序列分析. 黄 钢 第三军医大学遗传教研室 2006.11.1. 获取序列信息,设计合适的引物. 选取 相应的组织或细胞 ,提取 RNA 并 RT. RNase H 消化(可选). PCR 扩增获得全长 cDNA. 装入合适的克隆或表达载体, 菌落 PCR 、酶切与测序证实. 根据需要进一步进行亚克隆. 一、如何获取已知目的基因的序列信息. 先查找其蛋白相关信息 , 了解该基因编码产物的基本情况与功能( www.expasy.org )
E N D
已知基因序列的获取策略——兼谈引物设计与序列分析已知基因序列的获取策略——兼谈引物设计与序列分析 黄 钢 第三军医大学遗传教研室 2006.11.1.
获取序列信息,设计合适的引物 选取相应的组织或细胞,提取RNA并RT RNase H消化(可选) PCR扩增获得全长cDNA 装入合适的克隆或表达载体,菌落PCR、酶切与测序证实 根据需要进一步进行亚克隆
一、如何获取已知目的基因的序列信息 • 先查找其蛋白相关信息,了解该基因编码产物的基本情况与功能(www.expasy.org) • 进一步查找其核酸相关序列信息,常用数据库:Genebank、EBI、DDBJ
二、目的基因cDNA序列的获取方法 • cDNA文库扫描 • RT-PCR • 人工合成
组织RNA的提取 • 在匀浆器中加工冷冻的组织 • 通过注射器加工冷冻的组织 • 在液氮中将组织研磨成粉末 • 在液氮中研磨组织至粉末状,细胞裂解更完全,产量比前二者多一倍。 • 合适的RNA提取方法加上合适的组织处理方法,才能够获得最佳的提取效果
RNA提取两要素 • 忌讳贪多:不能指望1ml Trizol 提取100mg以上组织,一般50mg用1mlTrizol较合适 • 速战速决:尽量缩短提取时间,不要完全照搬Protocol,比如匀浆后如果没有很多组织碎片的话,可以立即加入氯仿,立即离心,14000rpm离心10min,取完上清加入0.6~1体积的异丙醇,立即高速离心(14,000rpm,5min),..... 总之尽量快速!
尽量减少RNAase污染 • RNase的危害主要集中在将RNA pellet溶解在水中之后,防止RNA降解的重点应当放在组织样本的保存和RNA水溶液的保存上。 • 注意实验前的准备工作:各种器材的去RNAase处理与无RNAase的准备。 • 长期保存RNA时建议用去离子甲酰胺溶解总RNA沉淀
如何确认RNA的质量 • RNA的电泳图谱 • 检测RNA溶液的吸光度 • 保温试验 • 荧光染色、毛细管电泳和Agilent2100生物分析仪分析
28S 18S 5S
RT引物的选用 • GSP:适合序列肯定的模板,常用于一步法RT-PCR。但是引物设计质量影响RT的结果。在扩增低丰度的转录本时是最好的。 • Oligo dT引物:真核生物的mRNA适用,建议用于高质量RNA及全长转录本的逆转录; • 随机引物:适合各种RNA的RT,可用于mRNA片段的逆转录。
RT中提高合成全长cDNA的效率 • 消除mRNA 二级结构:逆转录之前将RT引物与RNA 模板进行短暂的热变性, 可破坏mRNA 二级结构, 促进锚定引物与模板的正确配对。 • 选用RNase H灭活改造的新型耐高温逆转录酶: Thermoscript、Superscript Ⅲ等,RT后建议进行RNase H消化处理。 • 锚定RT引物的选用:5'–(T)25V N–3‘ • 热启动RT • 有条件者选用Tricine-EDTA Buffer溶解cDNA 10 mM Tricine-KOH (pH 8.5) 1.0 mM EDTA
小于5微克 可自己找公司合成 建议用热盖PCR仪或空气浴孵箱保温 建议选用RNase H消化
高保真DNA 多聚酶的选用 • 常用高保真DNA 多聚酶:如Pfu、Deep Vent、Vent、Pwo、KOD、Pyrobest、PrimerStar等 • PCR过程中HotStart与Touchdown的使用 • 高保真DNA 多聚酶与普通rTaq的混合使用 • PCR产物加A尾进行T-A克隆:循环即将结束时加入rTaq 5U 72 ℃保温20~30 min • 两步变温法PCR
载体构建中的常见问题 • 利用单酶切位点将片段插入载体 • 双酶切中的问题 • 对过长cDNA片段:可分段扩增,再利用RE位点或重叠延伸融合成全长cDNA • 酶切位点甲基化的问题 Cla I G6mATCGAT Xba I TCTAG6mATC
真核表达载体的选择 • Promoter Conventional/Tissue-Specific/Inducible • Poly (A) tail • Kozak序列:-9GCCGCCA/GCCAUGG+4
一个载体内的多基因表达 • IRES系统 • 加linker直接融合表达 • 多个独立的表达 cassettes:优于共转染表达
SOE技术与基因人工合成及多基因融合 • 基因设计与人工合成中的密码子优化 • DNAWorks 2.4 (Hoover, D. and Lubkowski, J., 2002) http://mcl1.ncifcrf.gov/dnaworks/
三、引物设计 引物设计的3条基本原则: • 引物与模板的序列要紧密互补 • 引物与引物之间避免形成稳定的二聚体或发夹结构, • 引物不能在模板的非目的位点引发DNA聚合反应(即错配)。
引物设计注意事项 • 引物的长度一般为15-30 bp,常用的是18-27 bp,但不应大于38bp。 • 引物序列在模板内应当没有相似性较高,尤其是3’端相似性较高的序列,否则容易导致错配。 • 引物3’端的末位碱基对Taq酶的DNA合成效率有较大的影响。
5’端序列的修饰与标记:可在引物设计时加上限制酶位点、核糖体结合位点、起始密码子、缺失或插入突变位点以及标记生物素、荧光素、地高辛等. 通常应在5‘端限制酶位点外再加1-3个保护碱基。 • 简并引物:应选用简并程度低的密码子, 例如选用只有一种密码子的Met, 3’端应不存在简并性。否则可能由于产量低而看不见扩增产物。 • 同源性或互补性:两引物间最好不存在4个连续碱基的同源性或互补性。 • GC含量:一般为40-60%。另外,上下游引物的GC含量不能相差太大。
Tm值:引物所对应模板位置序列的Tm值在72℃左右可使复性条件最佳。有多种计算方法,如按公式Tm=4(G+C)+2(A+T),在软件中常使用的是最邻近法(the nearest neighbor method) 。 • △G值:指DNA双链形成所需的自由能,该值反映了双链结构内部碱基对的相对稳定性。应当选用3’端△G值较低(绝对值不超过9),而5’端和中间△G值相对较高的引物。引物的3’端的△G值过高,容易在错配位点形成双链结构并引发DNA聚合反应。引物二聚体及发夹结构的能值过高(超过4.5kcal/mol)易导致产生引物二聚体带,并且降低引物有效浓度而使PCR反应不能正常进行。
Primer Premier 5.0 • 引物设计 • 限制性内切酶位点分析 • DNA基元(motif)查找 • 同源性分析
四、测序图比对、拼接与虚拟克隆(in silico cloning) • 常用本地软件:Clone manager、Vector NTI、DNAstar和ds-Gene等 • 在线工具:BLAST等
常用序列拼接软件 • DNAstar 的SeqMan模块 • VectorNTI程序的Contig Express模块 • Sequencher
新的拼接任务 开始→所有程序→DNAstar →SeqMan
添加序列 打开保存序列的文件夹 选择序列 导入
用鼠标拖动手动更改末端 用鼠标点击更改序列方向和形式 整理一下末端 选择载体
自动查找 看看结果 拼接
6种阅读框 选择的序列的位置 点开测序图 NCBI查询所选择的序列
保存结果 打印成PDF文件也是一个不错的选择