210 likes | 755 Views
ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA SINH HỌC. THỰC TẬP BIOINFORMATICS ĐẠI CƯƠNG. NGÀNH CÔNG NGHỆ SINH HỌC BÀI 2 - Khai thác cơ sở dữ liệu PubMed, Nucleotide, Protein trong NCBI. Chọn cơ sở dữ liệu. Chọn từ khóa. Nhập từ khóa. Chọn cơ sở dữ liệu. Dạng hiển thị.
E N D
ĐẠI HỌC QUỐC GIA TP.HCM TRƯỜNG ĐẠI HỌC KHOA HỌC TỰ NHIÊN KHOA SINH HỌC THỰC TẬP BIOINFORMATICS ĐẠI CƯƠNG NGÀNH CÔNG NGHỆ SINH HỌC BÀI 2 - Khai thác cơ sở dữ liệu PubMed, Nucleotide, Protein trong NCBI Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Chọn cơ sở dữ liệu Chọn từ khóa Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Nhập từ khóa Chọn cơ sở dữ liệu Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Dạng hiển thị Nhập từ khóa Số mục bài tìm được Tên tác giả Tên tạp chí, năm xuất bản, tập, số trang Số PMID Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Nơi công tác của tác giả (Viện, Trường) Tóm tắt nội dung bài báo Liên kết đến tạp chí gốc Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Ví dụ: tìm các bài báo của tác giả Pandey viết về H5N1 đăng tải trong năm 2012 Hãy xác định từ khóa cho yêu cầu tìm kiếm trên Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Tìm kiếm nâng cao Kết hợp từ khóa và thẻ Số mục bài trong 1 trang Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
MỘT SỐ THẺ THƯỜNG DÙNG Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Bài tập 1. Cho biết có bao nhiêu bài báo của tác giả Peter được đăng tải năm 2006, có bao nhiêu bài báo của tác giả trên viết về enzyme trong năm 2006? 2. Trong CSDL PubMed, cho biết có bao nhiêu bài báo được đăng trên tạp chí Bioinformatics được đăng tải? Có bao nhiêu bài từ đầu năm 2010 đến nay? có bao nhiêu bài được đăng trong năm 2008 VÀ năm 2009? Hiển thị kết quả dưới dạng có tóm tắt (abstract) và lưu về máy. Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
TÌM KIẾM CÁC TRÌNH TỰ SINH HỌC • Trình tự sinh học: acid nucleic và protein • Dùng trong nghiên cứu: SHPT, di truyền, sinh hóa, phân loại sinh vật, đa dạng tài nguyên… • Các cơ sở dữ liệu trình tự lớn trên thế giới: Genbank, EMBL, DDBJ • Trong NCBI: • Entrez Nucleotide: trình tự acid nucleic • Entrez Protein: trình tự protein Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Entrez Nucleotide Nhập từ khóa Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Giới hạn phạm vi tìm kiếm Số mục bài tìm được Mô tả đặc điểm (tên) trình tự acid nucleic Mã số truy cập (accession) Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Dạng hiển thị Mã số accession Chiều dài Dang trình tự Ngày cập nhật Tên trình tự Số lần cập nhật Nguồn gốc trình tự Tên tác giả tạp chí, đăng tải trình tự Mô tả đặc điểm trình tự Trình tự DNA Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Click vào để lưu trình tự vào máy Mã số Accession Trình tự dưới dạng FASTA Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Entrez Protein Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Số aa Trình tự các aa Coding sequence Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Sử dụng công cụ Entrez, tìm hiểu thông tin của trình tự AY626143, AAV34204, XP_780558, NM_001035410, NM_002666, P19835 • Trình tự này có tên gì? • Nguồn gốc từ loài nào? • PMID của bài báo công bố trình tự trong cơ sở dữ liệu PubMed? • Trình tự này được cập nhật mấy lần? Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI
Có bao nhiêu trình tự enzyme neuraminidase của virus cúm A có chiều dài 449 amino acid? Download những trình tự này về máy dưới dạng FASTA, GI list và GenPept Bài 2 - Khai thác PubMed, Nucleotide, Protein trong NCBI