1.19k likes | 1.43k Views
GenBank 数据库检索及其应用 ——Entrez 检索功能. 重庆医科大学图书馆 李 轶. 简介. GenBank 数据库是由美国国立生物技术信息中心( NCBI )维护的一级核酸序列数据库。. GenBank 数据库的数据来源有三种: 1 、直接来源于测序工作者提交的序列; 2 、与其它数据机构协作交换的数据; 3 、美国专利局提供的专利数据。. NCBI 网站网址: http://www.ncbi.nlm.nih.gov. GenBank 和 PubMed( 序列数据 ) 检索的比较 :. 1 、 GenBank 的检索结果是序列及其注释信息;
E N D
GenBank数据库检索及其应用——Entrez检索功能 重庆医科大学图书馆 李 轶
简介 GenBank数据库是由美国国立生物技术信息中心(NCBI)维护的一级核酸序列数据库。 GenBank数据库的数据来源有三种: 1、直接来源于测序工作者提交的序列; 2、与其它数据机构协作交换的数据; 3、美国专利局提供的专利数据。
NCBI网站网址: http://www.ncbi.nlm.nih.gov
GenBank和PubMed(序列数据)检索的比较: 1、GenBank的检索结果是序列及其注释信息; PubMed的检索结果是与序列数据相关的文献信息。 2、GenBank数据更新早于PubMed,GenBank数据库的检全率高于PubMed。 3、 GenBank可对序列数据进行限制检索,而PubMed只能对文献、杂志、作者等进行限制检索,因而GenBank数据库的检准率也高于PubMed。
简介 检索界面
基本检索界面: 基本检索输入框
基本检索界面: 执行检索按钮 ras[GENE] 基本检索输入框
跨库检索界面: 执行检索按钮 ras[GENE]
GenBank数据库界面: 点击进入核苷酸序列数据库检索界面
核苷酸序列数据库检索界面: 特征栏提供 辅助检索功能
简介 检索界面 基本检索功能 (一)名称、作者姓名、截词检索、布尔逻辑运算 (二)特殊标志符检索 (三)序列长度检索 (四)分子重量检索 (五)范围检索
简介 检索界面 基本检索功能 (一)名称、作者姓名、截词检索、布尔逻辑运算
检索限定词: 1、基因名称的检索限定词:[GENE] 2、生物体名称的检索限定词:[ORGN] 3、作者姓名的检索限定词:[AUTH]
简介 检索界面 基本检索功能 (一)名称、作者姓名、截词检索、布尔逻辑运算 (二)特殊标志符检索
特殊标志符的格式(核酸序列): • 1、序列辨认号(GI):一串阿拉伯数字 • e.g.:6995995 • 2、GenBank/EMBL/DDBJ序列接受号: • (1)1个字母+5个阿拉伯数字 • e.g.:U12345 • (2)2个字母+6个阿拉伯数字 • e.g.:AY123456,Af123456
特殊标志符的格式(核酸序列): 3、RefSeq(Reference Sequence)序列接受号: (1)mRNA 记录(NM_*): e.g.:NM_000492 (2)基因组DNA重叠群(NT_*): e.g.:NT_000347 (3)完整的基因组或染色体(NC_*): e.g.:NC_000907 (4)基因组的局部区域(NG_*): e.g.:NG_000019 (5)从人类基因组序列注释、加工得到的序列模型记录(XM,XP,or XR_*): e.g.:XM_000483
特殊标志符的格式(核酸序列): 4 、PDB序列接受号:1个阿拉伯数字+3个字母 e.g.:1TUP 序列接受号的检索限定词为[ ACCN]or[ACCESSION]
简介 检索界面 基本检索功能 (一)名称、作者姓名、截词检索、布尔逻辑运算 (二)特殊标志符检索 (三)序列长度检索
序列长度的检索限定词:[SLEN] 1510[SLEN]
简介 检索界面 基本检索功能 (一)名称、作者姓名、截词检索、布尔逻辑运算 (二)特殊标志符检索 (三)序列长度检索 (四)分子重量检索
分子重量的检索限定词:[MOLWT] 2009[MOLWT]
简介 检索界面 基本检索功能 (一)名称、作者姓名、截词检索、布尔逻辑运算 (二)特殊标志符检索 (三)序列长度检索 (四)分子重量检索 (五)范围检索
范围检索:中间用冒号连接 • 1、序列接受号范围检索: • AF114696:AF114714[ACCN] • 2、序列长度范围检索: • 3000:4000[SLEN] • 3、分子重量范围检索: • 2002:2009[MOLWT] • 4、日期范围检索: • 2005/01:2006/09/26[MDAT]or[PDAT]
简介 检索界面 基本检索功能 特征栏辅助检索 限制检索(Limits) 预检索/索引检索(Preview/Index) 检索史管理(History) 剪贴板管理(Clipboard) 详细匹配过程(Details)
详细匹配过程 预检索/索引检索 检索史管理 限制检索 剪贴板管理
简介 检索界面 基本检索功能 特征栏辅助检索 限制检索(Limits)
核苷酸序列数据库分为三个子数据库: • EST :表达序列标记数据库 • GSS :基因组测序序列数据库 • CoreNucleotide :包含所有未被以上两个子数据库收录的核苷酸序列
限制检索(Limits): 限制检索范围
ras 限制检索范围