540 likes | 725 Views
La banque de données Swiss-Prot. Swiss-Prot@expasy.org. http://beta.uniprot.org. MALWMRLLPLLALLALWGPDPA AAFVNQHLCGSHLVEALYLVCG ERGFFYTPKTRREAEDLQVGQV ELGGGPGAGSLQPLALEGSLQK RGIVEQCCTSICSLYQLENYCN. C’est quoi ? Swiss-Prot est une banque de connaissances sur les protéines créée en 1986.
E N D
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org MALWMRLLPLLALLALWGPDPA AAFVNQHLCGSHLVEALYLVCG ERGFFYTPKTRREAEDLQVGQV ELGGGPGAGSLQPLALEGSLQK RGIVEQCCTSICSLYQLENYCN C’est quoi ? Swiss-Prot est une banque de connaissances sur les protéines créée en 1986. Elle compte actuellement plus de 290’000 fiches (1 fiche par protéine) et est disponible sur internet. Le contenu de chaque fiche est la synthèse des informations extraites de la littérature scientifique et de l’utilisation d’outils bioinformatiques. Le tout est validé et régulièrement réactualisé par des biologistes. Nom de la protéine Swiss-Prot contient des protéines provenant de environ 10’000 espèces, de l’homme à la bactérie en passant par le mammouth et les plantes. Une protéine peut avoir plusieurs noms… et parfois des noms rigolos: Zinedine, Bigbrain, Timeless, Prospero, Ken and Barbie… Informations taxonomiques Liste de publications scientifiques Informations biologiques Swiss-Prot possède des liens vers environ 100 banques de données spécialisées. Plaque tournante de l’information biologique Liens vers des banques de données spécialisées Mots-clés Modélisation de la structure tridimensionnelle Séquence en acides aminés Les protéines connues actuellement sont composées de 2 à 34’350 acides aminés. L’insuline humaine… Ça sert à quoi ? …à aider le chercheur en laboratoire ou le bioinformaticien en mettant à leur disposition une encyclopédie informatisée de ce qui est connu sur les protéines …pour identifier des protéines dans des échantillons biologiques (chercher des marqueurs de maladies, « drug design », etc…) …pour trouver des ressemblances entre les séquences de protéines (étudier l’évolution des espèces, etc…) …pour entraîner des programmes informatiques capables de reconnaître des régions biologiquement importantes dans des séquences de protéines non caractérisées (utiliser ce qui est connu pour orienter la recherche sur des protéines inconnues) Qui peut l’utiliser ? Tous ceux qui ont accès à internet (accès libre) http://www.expasy.org/sprot/ Les bioinformaciens qui créent des programmes de visualisation, d’analyse et comparaison de séquences, de prédiction, etc… Les chercheurs en laboratoire (académique et industriel) Collaboration UniProt Suisse Grande-Bretagne USA Qui s’en occupe ? Une équipe de près de 100 biologistes et informaticiens au service de la communauté scientifique… Pour nous contacter: Swiss-Prot@expasy.org
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org 1986-2007 Quelques exemples (extraits) de fiches (parmi les 290’000 existantes…)
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org 1986-2007 Encyclopédie informatisée des protéines http://beta.uniprot.org
La banque de données Swiss-Prot http://www.expasy.org/ http://www.expasy.org/ Swiss-Prot@expasy.org Swiss-Prot@expasy.org http://beta.uniprot.org Nous sommes à votre service Pour nous contacter: Swiss-Prot@expasy.org Pour consulter Swiss-Prot: http://beta.uniprot.org/
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P83570 2 acides aminés Nom de la protéine: Neuropeptide GWa Informations taxonomiques Common cuttlefish (Seiche) Informations biologiques Régule les contractions de l’oviducte. Il s’agit de la plus petite protéine connue Séquence GW
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Neuropeptide GWa
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P69043 9 acides aminés Nom de la protéine: Ocytocine Informations taxonomiques Lapin …existe aussi dans d’autres espèces Informations biologiques Favorise les contractions de l’utérus, stimule l’expulsion du lait pendant la tétée, impliquée dans la régulation des rapports sociaux Stimule les contractions de l’utérus au moment de l’accouchement Séquence CYIQNCPLG
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Ocytocine
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P01308 110 acides aminés Nom de la protéine: Insuline Informations taxonomiques Homo sapiens (homme) …existe aussi dans d’autres espèces… Informations biologiques Régule le taux sanguin de sucre, en permetant l’entrée et le stockage du glucose (sucre) dans les cellules L’insuline est la première protéine à avoir été entièrement séquencée (Frederick Sanger en 1955, prix Nobel en 1958) Séquence MALWMRLLPLLALLALWGPDPA AAFVNQHLCGSHLVEALYLVCG ERGFFYTPKTRREAEDLQVGQV ELGGGPGAGSLQPLALEGSLQK RGIVEQCCTSICSLYQLENYCN
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Insuline
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org MGVHECPAWLWLLLSLLSLP LGLPVLGAPPRLICDSRVLE RYLLEAKEAENITTGCAEHC SLNENITVPDTKVNFYAWKR MEVGQQAVEVWQGLALLSEA VLRGQALLVNSSQPWEPLQL HVDKAVSGLRSLTTLLRALG AQKEAISPPDAASAAPLRTI TADTFRKLFRVYSNFLRGKL KLYTGEACRTGDR Fiche no P01588 193 acides aminés Nom de la protéine: Erythropoiétine (EPO) Informations taxonomiques Homo sapiens (homme) …existe aussi dans d’autres espèces… Informations biologiques Hormone impliquée dans la régulation de la synthèse des globules rouges… …certains l’utilisent pour se doper Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org EPO
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q05066 204 acides aminés Nom de la protéine: Sex-determining region Y protein (SRY) Informations taxonomiques Homo sapiens (homme) …existe aussi dans d’autres espèces… Informations biologiques Responsable de l’initiation de la différenciation sexuelle ‘mâle’: …sans elle, il n’y aurait que des femmes…. MQSYASAMLSVFNSDDYSPAVQENIPALRRSSSFLCTESCNSKYQCETGENSKGNVQDRVKRPMNAFIVWSRDQRRKMALENPRMRNSEISKQLGYQWKMLTEAEKWPFFQEAQKLQAMHREKYPNYKYRPRRKAKMLPKNCSLLPADPASVLCSEVQLDNRLYRDDCTKATHSRMEHQLGHLPPINAASSPQQRDRYSHWTKL Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org SRY
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P92658 378 acides aminés Nom de la protéine: Cytochrome Informations taxonomiques Mammouth …la séquence de cette protéine est connue dans beaucoup d’espèces (~1250). Elle est souvent utilisée pour construire des arbres phylogénétiques (étude de l’évolution des espèces) Informations biologiques Impliquée dans la production d’énergie MTHIRKSHPLLKILNKSFIDLPTPSNISTWWNFGSLLGACLITQILTGLFLAMHYTPDTMTAFSSMSHICRDVNYGWIIRQLHSNGASIFFLCLYTHIGRNIYYGSYLYSETWNTGIMLLLITMATAFMGYVLPWGQMSFWGATVITNLFSAIPYIGTDLVEWIWGGFSVDKATLNRFFALHFILPFTMIALAGVHLTFLHETGSNNPLGLTSDSDKIPFHPYYTIKDFLGLLILILFLLLLALLSPDMLGDPDNYMPADPLNTPLHIKPEWYFLFAYAILRSVPNKLGGVLALLLSILILGIMPLLHTSKHRSMMLRPLSQVLFWTLATDLLMLTWIGSQPVEYPYIIIGQMASILYFSIILAFLPIAGMIENYLIK Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Cytochrome
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P00875 475 acides aminés Nom de la protéine: RubisCO Informations taxonomiques Epinard …existe aussi dans d’autres espèces de plantes… Informations biologiques Impliquée dans la fabrication de l’oxygène à partir de la lumière (photosynthèse). …. C’est la protéine la plus abondante sur notre planète MSPQTETKAS VEFKAGVKDY KLTYYTPEYE TLDTDILAAF RVSPQPGVPP EEAGAAVAAE SSTGTWTTVW TDGLTNLDRY KGRCYHIEPV AGEENQYICY VAYPLDLFEE GSVTNMFTSI VGNVFGFKAL RALRLEDLRI PVAYVKTFQG PPHGIQVERD KLNKYGRPLL GCTIKPKLGL SAKNYGRAVY ECLRGGLDFT KDDENVNSQP FMRWRDRFLF CAEALYKAQA ETGEIKGHYL NATAGTCEDM MKRAVFAREL GVPIVMHDYL TGGFTANTTL SHYCRDNGLL LHIHRAMHAV IDRQKNHGMH FRVLAKALRL SGGDHIHSGT VVGKLEGERD ITLGFVDLLR DDYTEKDRSR GIYFTQSWVS TPGVLPVASG GIHVWHMPAL TEIFGDDSVL QFGGGTLGHP WGNAPGAVAN RVALEACVQA RNEGRDLARE GNTIIREATK WSPELAAACE VWKEIKFEFP AMDTV Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org RubisCO
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P10845 1'295 acides aminés Nom de la protéine: Toxine botulinique (BOTOX) Informations taxonomiques Clostridium botulinum (Bactérie) Informations biologiques Inhibiteur de la libération d’un neurotransmetteur (acétylcholine). Utilisée en cosmétique pour paralyser les muscles de l’expression (lifting). PFVNKQFNYK DPVNGVDIAY IKIPNVGQMQ PVKAFKIHNK IWVIPERDTF TNPEEGDLNP PPEAKQVPVS YYDSTYLSTD NEKDNYLKGV TKLFERIYST DLGRMLLTSI VRGIPFWGGS TIDTELKVID TNCINVIQPD GSYRSEELNL VIIGPSADII QFECKSFGHE VLNLTRNGYG STQYIRFSPD FTFGFEESLE VDTNPLLGAG KFATDPAVTL AHELIHAGHR LYGIAINPNR VFKVNTNAYY EMSGLEVSFE ELRTFGGHDA KFIDSLQENE FRLYYYNKFK DIASTLNKAK SIVGTTASLQ YMKNVFKEKY LLSEDTSGKF SVDKLKFDKL YKMLTEIYTE DNFVKFFKVL NRKTYLNFDK AVFKINIVPK VNYTIYDGFN LRNTNLAANF NGQNTEINNM NFTKLKNFTG LFEFYKLLCV RGIITSKTKS LDKGYNKALN DLCIKVNNWD LFFSPSEDNF TNDLNKGEEI TSDTNIEAAE ENISLDLIQQ YYLTFNFDNE PENISIENLS SDIIGQLELM PNIERFPNGK KYELDKYTMF HYLRAQEFEH GKSRIALTNS VNEALLNPSR VYTFFSSDYV KKVNKATEAA MFLGWVEQLV YDFTDETSEV STTDKIADIT IIIPYIGPAL NIGNMLYKDD FVGALIFSGA VILLEFIPEI AIPVLGTFAL VSYIANKVLT VQTIDNALSK RNEKWDEVYK YIVTNWLAKV NTQIDLIRKK MKEALENQAE ATKAIINYQY NQYTEEEKNN INFNIDDLSS KLNESINKAM ININKFLNQC SVSYLMNSMI PYGVKRLEDF DASLKDALLK YIYDNRGTLI GQVDRLKDKV NNTLSTDIPF QLSKYVDNQR LLSTFTEYIK NIINTSILNL RYESNHLIDL SRYASKINIG SKVNFDPIDK NQIQLFNLES SKIEVILKNA IVYNSMYENF STSFWIRIPK YFNSISLNNE YTIINCMENN SGWKVSLNYG EIIWTLQDTQ EIKQRVVFKY SQMINISDYI NRWIFVTITN NRLNNSKIYI NGRLIDQKPI SNLGNIHASN NIMFKLDGCR DTHRYIWIKY FNLFDKELNE KEIKDLYDNQ SNSGILKDFW GDYLQYDKPY YMLNLYDPNK YVDVNNVGIR GYMYLKGPRG SVMTTNIYLN SSLYRGTKFI IKKYASGNKD NIVRNNDRVY INVVVKNKEY RLATNASQAG VEKILSALEI PDVGNLSQVV VMKSKNDQGI TNKCKMNLQD NNGNDIGFIG FHQFNNIAKL VASNWYNRQI ERSSRTLGCS WEFIPVDDGW GERPL Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org BOTOX
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P87498 1'912 acides aminés Nom de la protéine: Vitellogénine Informations taxonomiques Poulet …existe aussi dans d’autres espèces d’oiseaux… Informations biologiques Principal constituant du blanc d’oeuf MRGLISALVL TLVGSQHLNY QPDFGENKVY TYNYESILFS GIPEKGLART GIRIRSEVEI SGIGPKLCLI RIHSIEAAEY NGIWPTSSFS RSLKLTQALT GQLSIPIKFE YSNGHVGNLM APDSVSDDGL NIYRGILNIL ELSLKKMQHS YSIQEAGIGG ICNTTYAIQE NKKANLVDVT KSKDLNSCEE KVQVVTGSAY TQPCQTCQQR NKNSRATATY NYKIKYTHNE AVITQAEVEE VHQFTPFHEI TGGNAIVEAR QKLALIEVQK QVAEVPPKEF QKRGSLQYQF GSELLQLPVH LFKIKDVERQ IEERLQDLVE TTYEQLPSDA PAKALKLMHL LRAANEENYE SVWKQFSSRP AYRRYLLDLL PAAASHRSLR FLRHKMERQE LTNWEIAQTV LVALHSSSPT QEVMEEATLI VKKHCPRSSS VLRKVCLLSY ASLCHKRCSS PYSCSECLQV FHVFAGEALG KSNIEEVLLA LKALGNVGHP ASIKHIKKFL PGYAAGASEL PLKVHETAVM ALKSIGMRDP QMVQAITLEI FLNHKIHPRI RMLAAVVLLE TKPGLPILMI LVDAVLKEPS MQVASFIYSH LRALGRSTAP DLQMMASACR MAVRALSPKF DRSGYQFSKV FRFSMFKEFL MSGLAAKYFV LNNAGSLIPT MAVSQLRTHF LGRVADPIEV GIAAEGLQEM FVRGYSPDKD WETNYDFREI LKKLSDWKAL PRDKPFASGY LKMFGQELLF GRLDKDTLQN VLQVWYGPDE KIPSIRRLIS SLQTGIGRQW TKALLLSEIR CIVPTCVGFP METSFYYSSV TKVAGNVQAQ ITPSPRSDFR LTELLNSNVR LRSKMSLSMA KHMTFVIGIN TNMIQAGLEA HTKVNAHVPV NVVATIQMKE KSIKAEIPPC KEETNLIIVS SKTFAVTRNI EDLAASKMTP VLLPEAVPDI MKMSFDSDSA SGETDNIRDR QSVEDVSSGN SFSFGHPSSG KEPFIQSMCS NASTFGVQVC IEKKSVHAAF IRNVPLYNAI GEHALRMSFK PVYSDVPIEK IQVTIQAGDQ APTKMVRLVT FEDPERQESS RKEVMKRVKK ILDDTDNQAT RNSRSSSSSA SSISESSEST TSTPSSSDSD NRASQGDPQI NLKSRQSKAN EKKFYPFGDS SSSGSSSSSS SSSSSSSDSS SSSRSSSSSD SSSSSSSSSS SSSSKSKSSS RSSKSNRSSS SSNSKDSSSS SSKSNSKGSS SSSSKASGTR QKAKKQSKTT SFPHASAAEG ERSVHEQKQE TQSSSSSSSR ASSNSRSTSS STSSSSESSG VSHRQWKQDR EAETKRVKSQ FNSHSSYDIP NEWETYLPKV YRLRFRSAHT HWHSGHRTSS SSSSSSSESG SSHSNSSSSD SSSRRSHMSD SSSSSSSHRH GEKAAHSSRR SPTSRAASAH HRPGSSLTRE RNFLGDVIPP GITIVAQAVR SDNRNQGYQA TAYVRSDAAK VDVQLVVVQL AETNWKACAD AVILPLKAQA RMRWGKECRD YRIAALATTG QMARKLAVQL KVQWGIIPSW IKKTSTALMR YVPGVALVLG FSEAHQRNPS RELIVRAVAT SPRSIDTVIK VPGVTLYYQG LRVPFTLALG ASSSSYETRD ITAWNFLPEI ASQIAQEDQS TCEVSKGDFK TFDRMSFTCS FNKSCNVVVA QDCTEHPKFI ITTRKVDHQS LSREVHINTS SANITICPAA DSSLLVTCNK ESVLSDSGVS EYEKDNIKIY KNGKTVIVEA PIHGLKNVNF DGEILKVTVA SWMRGKTCGV CGNNDREKHN ELLMPNHKLA HSCSAFVHSW VLLEETCSGG CKLQRRYVKL NRNPTIDGEE STCYSVDPVL KCMKDCTPIE KTSVKVGFHC FPKATAVSLL EWQRSSDKKS ASEDVVESVD ADIDCTCTGD CS Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Vitellogénine
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P07663 1'224 acides aminés Nom de la protéine: ‘Period circadian’ Informations taxonomiques Drosophila (mouche) Informations biologiques Impliquée dans le rythme sommeil-veille et le rythme du chant nuptial (qui permet la reconnaissance entre espèces) MEGGESTEST HNTKVSDSAY SNSCSNSQSQ RSGSSKSRLS GSHSSGSSGY GGKPSTQASS SDMIIKRNKD KSRKKKKNKG AGQGAGQAQT LISASTSLEG RDEEKPRPSG TGCVEQQICR ELQDQQHGED HSEPQAIEQL QQEEEEDQSG SESEADRVEG VAKSEAAQSF PIPSPLSVTI VPPSMGGCGG VGHAAGLDSG LAKFDKTWEA GPGKLESMTG VGAAAAGTGQ RGERVKEDSF CCVISMHDGI VLYTTPSITD VLGYPRDMWL GRSFIDFVHL KDRATFASQI TTGIPIAESR GSVPKDAKST FCVMLRRYRG LKSGGFGVIG RPVSYEPFRL GLTFREAPEE ARPDNYMVSN GTNMLLVICA TPIKSSYKVP DEILSQKSPK FAIRHTATGI ISHVDSAAVS ALGYLPQDLI GRSIMDFYHH EDLSVMKETY ETVMKKGQTA GASFCSKPYR FLIQNGCYVL LETEWTSFVN PWSRKLEFVV GHHRVFQGPK QCNVFEAAPT CKLKISEEAQ SRNTRIKEDI VKRLAETVSR PSDTVKQEVS RRCQALASFM ETLMDEVSRA DLKLELPHEN ELTVSERDSV MLGEISPHHD YYDSKSSTET PPSYNQLNYN ENLLRFFNSK PVTAPAELDP PKTEPPEPRG TCVSGASGPM SPVHEGSGGS GSSGNFTTAS NIHMSSVTNT SIAGTGGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGTGTGTGT GTGNGTNSGT GTGTASSSKG GTAAIPPVTL TESLLNKHND EMEKFMLKKH RESRGRTGEK SKKSANDTLK MLEYSGPGHG IKRGGSHSWE GEANKPKQQL TLGTDAIKGA AGSAGGAVGT GGVGSGGAGV AGGGGSGTGV AGTPEGRATT TSGTGTPGGA GGGGGAGAAA AAGASSSVGS STPGPSSYPT CTQNINLWPP FSVGITPPVH STHTAMAQSS FSSAGLFPTF YYIPASLTPT SPTRSPRMHK HPHKGGTDMP TTSQQAAAAA AQAMPLQYMA GVMYPHPSLF YTHPAAAAAT AMMYQPMPFP GMANALQIPE RPLGSQSAYN KSVYTTTPAS MTKKVPGAFH SVTTPAQVQR PSSQSASVKT EPGSSAAVSD PCKKEVPDSS PIPSVMGDYN SDPPCSSSNP ANNKKYTDSN GNSDDMDGSS FSSFYSSFIK TTDGSESPPD TEKDPKHRKL KSMSTSESKI MEHPEEDQTQ HGDG Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Period circadian
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P02458 1'418 acides aminés Nom de la protéine: Collagène Informations taxonomiques Homo sapiens (homme et …femme) …existe aussi dans d’autres espèces Informations biologiques Protéine de soutien de la peau, de l’os, du cartilage… Perd de son élasticité avec l’âge… C’est la protéine la plus abondante des vertébrés… Séquence MIRLGAPQSL VLLTLLVAAV LRCQGQDVRQ PGPKGQKGEP GDIKDIVGPK GPPGPQGPAG EQGPRGDRGD KGEKGAPGPR GRDGEPGTLG NPGPPGPPGP PGPPGLGGNF AAQMAGGFDE KAGGAQLGVM QGPMGPMGPR GPPGPAGAPG PQGFQGNPGE PGEPGVSGPM GPRGPPGPPG KPGDDGEAGK PGKAGERGPP GPQGARGFPG TPGLPGVKGH RGYPGLDGAK GEAGAPGVKG ESGSPGENGS PGPMGPRGLP GERGRTGPAG AAGARGNDGQ PGPAGPPGPV GPAGGPGFPG APGAKGEAGP TGARGPEGAQ GPRGEPGTPG SPGPAGASGN PGTDGIPGAK GSAGAPGIAG APGFPGPRGP PDPQGATGPL GPKGQTGKPG IAGFKGEQGP KGEPGPAGPQ GAPGPAGEEG KRGARGEPGG VGPIGPPGER GAPGNRGFPG QDGLAGPKGA PGERGPSGLA GPKGANGDPG RPGEPGLPGA RGLTGRPGDA GPQGKVGPSG APGEDGRPGP PGPQGARGQP GVMGFPGPKG ANGEPGKAGE KGLPGAPGLR GLPGKDGETG AEGPPGPAGP AGERGEQGAP GPSGFQGLPG PPGPPGEGGK PGDQGVPGEA GAPGLVGPRG ERGFPGERGS PGAQGLQGPR GLPGTPGTDG PKGASGPAGP PGAQGPPGLQ GMPGERGAAG IAGPKGDRGD VGEKGPEGAP GKDGGRGLTG PIGPPGPAGA NGEKGEVGPP GPAGSAGARG APGERGETGP PGTSGIAGPP GADGQPGAKG EQGEAGQKGD AGAPGPQGPS GAPGPQGPTG VTGPKGARGA QGPPGATGFP GAAGRVGPPG SNGNPGPPGP PGPSGKDGPK GARGDSGPPG RAGEPGLQGP AGPPGEKGEP GDDGPSGAEG PPGPQGLAGQ RGIVGLPGQR GERGFPGLPG PSGEPGQQGA PGASGDRGPP GPVGPPGLTG PAGEPGREGS PGADGPPGRD GAAGVKGDRG ETGAVGAPGA PGPPGSPGPA GPTGKQGDRG EAGAQGPMGP SGPAGARGIQ GPQGPRGDKG EAGEPGERGL KGHRGFTGLQ GLPGPPGPSG DQGASGPAGP SGPRGPPGPV GPSGKDGANG IPGPIGPPGP RGRSGETGPA GPPGNPGPPG PPGPPGPGID MSAFAGLGPR EKGPDPLQYM RADQAAGGLR QHDAEVDATL KSLNNQIESI RSPEGSRKNP ARTCRDLKLC HPEWKSGDYW IDPNQGCTLD AMKVFCNMET GETCVYPNPA NVPKKNWWSS KSKEKKHIWF GETINGGFHF SYGDDNLAPN TANVQMTFLR LLSTEGSQNI TYHCKNSIAY LDEAAGNLKK ALLIQGSNDV EIRAEGNSRF TYTALKDGCT KHTGKWGKTV IEYRSQKTSR LPIIDIAPMD IGGPEQEFGV DIGPVCFL
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Collagène
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q8WZ42 34'350 acides aminés Nom de la protéine: Titine Informations taxonomiques Homo sapiens (homme et …femme) …existe aussi dans d’autres espèces… Informations biologiques Protéine responsable de l’élasticité des muscles …C’est la plus grande protéine connue MTTQAPTFTQ PLQSVVVLEG STATFEAHIS GFPVPEVSWF RDGQVISTST LPGVQISFSD GRAKLTIPAV TKANSGRYSL KATNGSGQAT STAELLVKAE TAPPNFVQRL QSMTVRQGSQ VRLQVRVTGI PTPVVKFYRD GAEIQSSLDF QISQEGDLYS LLIAEAYPED SGTYSVNATN SVGRATSTAE LLVQGEEEVP AKKTKTIVST AQISESRQTR IEKKIEAHFD ARSIATVEMV IDGAAGQQLP HKTPHRIPPK PKSRSPTPPS IAAKAQLARQ QSPSPIRHSP SPVRHVRAPT PSPVRSVSPA ARISTSPIRS VRSPLLMRKT QASTVATGPE VPPPWKQEGY VASSSEAEMR ETTLTTSTQI RTEERWEGRY GVQEQVTISG AAGAAASVSA SASYAAEAVA TGAKEVKQDA DKSAAVATVV AAVDMARVRE PVISAVEQTA QRTTTTAVHI QPAQEQVRKE AEKTAVTKVV VAADKAKEQE LKSRTKEVIT TKQEQMHVTH EQIRKETEKT FVPKVVISAA KAKEQETRIS EEITKKQKQV TQEAIRQETE ITAASMVVVA TAKSTKLETV PGAQEETTTQ QDQMHLSYEK IMKETRKTVV PKVIVATPKV KEQDLVSRGR EGITTKREQV QITQEKMRKE AEKTALSTIA VATAKAKEQE TILRTRETMA TRQEQIQVTH GKVDVGKKAE AVATVVAAVD QARVREPREP GHLEESYAQQ TTLEYGYKER ISAAKVAEPP QRPASEPHVV PKAVKPRVIQ APSETHIKTT DQKGMHISSQ IKKTTDLTTE RLVHVDKRPR TASPHFTVSK ISVPKTEHGY EASIAGSAIA TLQKELSATS SAQKITKSVK APTVKPSETR VRAEPTPLPQ FPFADTPDTY KSEAGVEVKK EVGVSITGTT VREERFEVLH GREAKVTETA RVPAPVEIPV TPPTLVSGLK NVTVIEGESV TLECHISGYP SPTVTWYRED YQIESSIDFQ ITFQSGIARL MIREAFAEDS GRFTCSAVNE AGTVSTSCYL AVQVSEEFEK ETTAVTEKFT TEEKRFVESR DVVMTDTSLT EEQAGPGEPA APYFITKPVV QKLVEGGSVV FGCQVGGNPK PHVYWKKSGV PLTTGYRYKV SYNKQTGECK LVISMTFADD AGEYTIVVRN KHGETSASAS LLEEADYELL MKSQQEMLYQ TQVTAFVQEP KVGETAPGFV YSEYEKEYEK EQALIRKKMA KDTVVVRTYV EDQEFHISSF EERLIKEIEY RIIKTTLEEL LEEDGEEKMA VDISESEAVE SGFDLRIKNY RILEGMGVTF HCKMSGYPLP KIAWYKDGKR IKHGERYQMD FLQDGRASLR IPVVLPEDEG IYTAFASNIK GNAICSGKLY VEPAAPLGAP TYIPTLEPVS RIRSLSPRSV SRSPIRMSPA RMSPARMSPA RMSPARMSPG RRLEETDESQ LERLYKPVFV LKPVSFKCLE GQTARFDLKV VGRPMPETFW FHDGQQIVND YTHKVVIKED GTQSLIIVPA TPSDSGEWTV VAQNRAGRSS ISVILTVEAV EHQVKPMFVE Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Titine
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P12863 252 acides aminés Nom de la protéine: TPIS (Triosephosphate isomérase) Informations taxonomiques Maïs …existe aussi dans d’autres espèces… Informations biologiques Protéine impliquée dans le métabolisme du sucre …C’est une protéine essentielle à tous les organismes vivants MAPSRKFFVGGNWKMNGRKQSLGELIGTLNAAKVPADT EVVCAPPTAYIDFARQKLDPKIA VAAQNCYKVTNGAF TGEISPGMIKDCGATWVVLGHSERRHVFGESDELIGQK VAHALAEGLGVIACIGEKLDEREAGITEKVVFEQTKVI ADNVKDWSKVVLAYEPVWAIGTGKTATPQQAQEVHEKL RGWLKSNVSDAVAQSTRIIYGGSVTGATCKELASQPDV DGFLVGGASLKPEF VDIINAKQ Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org TPIS
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P01241 217 acides aminés Nom de la protéine: Hormone de croissance Informations taxonomiques Homo sapiens …existe aussi dans d’autres espèces… Informations biologiques …fait grandir les enfants… …les 7 nains de Blanche-Neige n’en ont certainement pas eu assez…. MATGSRTSLL LAFGLLCLPW LQEGSAFPTI PLSRLFDNAM LRAHRLHQLA FDTYQEFEEA YIPKEQKYSF LQNPQTSLCF SESIPTPSNR EETQQKSNLE LLRISLLLIQ SWLEPVQFLR SVFANSLVYG ASDSNVYDLL KDLEEGIQTL MGRLEDGSPR TGQIFKQTYS KFDTNSHNDD ALLKNYGLLY CFRKDMDKVE TFLRIVQCRS VEGSCGF Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Hormone de croissance (Somatotropine)
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q6PF21 905 acides aminés Nom de la protéine: MetRS (Methionyl-tRNA synthetase) Informations taxonomiques Grenouille …existe aussi dans d’autres espèces… Informations biologiques Impliquée dans la biosynthèse des autres protéines. …indispensable à la Vie, présente chez tous les organismes vivants…. MKLFVGEGNP QGVKVLAAAA LWAQHVQIDR LQQEEKIVPF MSQPRLPVLD LENGNYLFLS NAICRYFYLS SGHDMCDLSN QWLEWEAAEL QPALSAALYA HVVQGKKKED VMATISASLK HLDQSLAGKS SPYLIKDALT VVDIVVWGSI YPLIVDASNL PEEMASLKRW FQNVSQLEQC QKAASSLLKD KGSSVFKPFL QKQPAPITPP GKSVCKEQEG EDMPSLSEED IQAAAEAWAK EPWKCIKGNQ QEQKRAGTVT GVAVNMAALL SIMLHPYMPT ISSVIQEQLL MPQESKVLTT DFCCCLQSGH QIGNVSPLFQ KLENDQIESL RKRFGGGQVK TESKVSPSQE APEQQAPKAS GPERVKELMQ ELEKQGNHVR ELKGKKAEKS VIDPEVQKLL ALKKELALAE GKSPDPPTQK GKKKK Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org MetRS
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P62803 103 acides aminés Nom de la protéine: Histone H4 Informations taxonomiques Boeuf …existe aussi dans d’autres espèces… Informations biologiques …importante pour la structure des chromosomes… MSGRGKGGKGL GKGGAKRHRK VLRDNIQGIT KPAIRRLARR GGVKRISGLI YEETRGVLKV FLENVIRDAV TYTEHAKRKT VTAMDVVYAL KRQGRTLYGF GG Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Histone H4
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q9XXK1 538 acides aminés Nom de la protéine: ATPA (ATP synthase alpha chain) Informations taxonomiques Ver (petit ver composé d’environ 1000 cellules) …existe aussi dans d’autres espèces… Informations biologiques Impliquée dans la production d’énergie dans les mitochondries… Séquence MLSKRIVTAL NTAVKVQNAG IATTARGMAG ASGSEVSKIL EERILGTETG INLEETGKVL SIGDGIARVY GLKNIQAEEM VEFDSGIKGM AMNLDVDNVG VVVFGNDKVI REGDIVKRTG AIVDVPVGDG LLGRVVDALG NPIDGKGPIA NARRSRVEVK APGIIPRLSV REPMVTGVKA VDSLVPIGRG QRELIIGDRQ TGKTAIAIDT IINQKRFNDA GDDKKKLFCI YVAVGQKRST VAQIVKRLTD AGAMDYTIVV SATASDAAPL QFLAPYSGCA MGEHFRDNGK HALIIFDDLS KQAVAYRQMS LLLRRPPGRE AYPGDVFYLH SRLLERAAKM NNSLGGGSLT ALPVIETQAG DVSAYIPTNV ISITDGQIFL ETELFYKGVR PAINVGLSVS RVGSAAQTKA MKQVAGSMKL ELAQYREVAA FAQFGSDLDA STQQLLNRGV RLTELLKQGQ YVPMGIEEQV GVIYAGVKGY LDKVDPSAIT KFEKEFLAHL RSSQQALLKT IREEGQISPQ TDAQLKDVVV NFLATFKP
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org ATPA
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P68871 147 acides aminés Nom de la protéine: Hémoglobine (HBB) Informations taxonomiques Homo sapiens …existe aussi dans d’autres espèces… Informations biologiques Transporte l’oxygène dans le sang… Le changement E -> V à cette position conduit à l’anémie falciforme, à des globules rouges en forme de faucille Séquence MVHLTPEEKSA VTALWGKVNV DEVGGEALGR LLVVYPWTQR FFESFGDLST PDAVMGNPKV KAHGKKVLGA FSDGLAHLDN LKGTFATLSE LHCDKLHVDP ENFRLLGNVL VCVLAHHFGK EFTPPVQAAY QKVVAGVANA LAHKYH
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Hémoglobine
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q96J66 1382 acides aminés Nom de la protéine: MRP8 (ATP-binding cassette transporter sub-family C member 11 de son petit nom !) Informations taxonomiques Homo sapiens …existe aussi dans d’autres espèces… Informations biologiques Impliquée dans la qualité (grasse ou sèche) de la cire d’oreille, entre autres… MTRKRTYWVP NSSGGLVNRG IDIGDDMVSG LIYKTYTLQD GPWSQQERNP EAPGRAAVPP WGKYDAALRT MIPFRPKPRF PAPQPLDNAG LFSYLTVSWL TPLMIQSLRS RLDENTIPPL SVHDASDKNV QRLHRLWEEE VSRRGIEKAS VLLVMLRFQR TRLIFDALLG ICFCIASVLG PILIIPKILE YSEEQLGNVV HGVGLCFALF LSECVKSLSF SSSWIINQRT AIRFRAAVSS FAFEKLIQFK SVIHITSGEA ISFFTGDVNY LFEGVCYGPL VLITCASLVI CSISSYFIIG YTAFIAILCY LLVFPLAVFM TRMAVKAQHH TSEVSDQRIR VTSEVLTCIK LIKMYTWEKP FAKIIEDLRR KERKLLEKCG LVQSLTSITL FIIPTVATAV WVLIHTSLKL KLTASMAFSM LASLNLLRLS VFFVPIAVKG LTNSKSAVMR FKKFFLQESP VFYVQTLQDP SKALVFEEAT LSWQQTCPGI VNGALELERN GHASEGMTRP RDALGPEEEG NSLGPELHKI NLVVSKGMML GVCGNTGSGK SSLLSAILEE MHLLEGSVGV QGSLAYVPQQ AWIVSGNIRE NILMGGAYDK ARYLQVLHCC SLNRDLELLP FGDMTEIGER GLNLSGGQKQ RISLARAVYS DRQIYLLDDP LSAVDAHVGK HIFEECIKKT LRGKTVVLVT HQLQYLEFCG QIILLENGKI CENGTHSELM QKKGKYAQLI QKMHKEATSD MLQDTAKIAE KPKVESQALA TSLEESLNGN AVPEHQLTQE EEMEEGSLSW RVYHHYIQAA GGYMVSCIIF FFVVLIVFLT IFSFWWLSYW LEQGSGTNSS RESNGTMADL GNIADNPQLS FYQLVYGLNA LLLICVGVCS SGIFTKVTRK ASTALHNKLF NKVFRCPMSF FDTIPIGRLL NCFAGDLEQL DQLLPIFSEQ FLVLSLMVIA VLLIVSVLSP YILLMGAIIM VICFIYYMMF KKAIGVFKRL ENYSRSPLFS HILNSLQGLS SIHVYGKTED FISQFKRLTD AQNNYLLLFL SSTRWMALRL EIMTNLVTLA VALFVAFGIS STPYSFKVMA VNIVLQLASS FQATARIGLE TEAQFTAVER ILQYMKMCVS EAPLHMEGTS CPQGWPQHGE IIFQDYHMKY RDNTPTVLHG INLTIRGHEV VGIVGRTGSG KSSLGMALFR LVEPMAGRIL IDGVDICSIG LEDLRSKLSV IPQDPVLLSG TIRFNLDPFD RHTDQQIWDA LERTFLTKAI SKFPKKLHTD VVENGGNFSV GERQLLCIAR AVLRNSKIIL IDEATASIDM ETDTLIQRTI REAFQGCTVL VIAHRVTTVL NCDHILVMGN GKVVEFDRPE VLRKKPGSLF AALMATATSS LR Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org MRP8
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q14532 448 acides aminés Nom de la protéine: Kératine Informations taxonomiques Homo sapiens …existe aussi dans d’autres espèces… Informations biologiques Constituant principal des cheveux et des ongles… MTSSCCVTNN LQASLKSCPR PASVCSSGVN CRPELCLGYV CQPMACLPSV CLPTTFRPAS CLSKTYLSSS CQAASGISGS MGPGSWYSEG AFNGNEKETM QFLNDRLASY LTRVRQLEQE NAELESRIQE ASHSQVLTMT PDYQSHFRTI DQLQQKILCT KAENARMVVN IDNAKLAADD FRAKYEAELA MRQLVEADIN GLRRILDDLT LCKADLEAQV ESLKEELMCL KKNHEEEVGS LRCQLGDRLN IEVDAAPPVD LTRVLEEMRC QYEAMVEANR RDVEEWFNMQ MEELNQQVAT SSEQLQNYQS DIIDLRRTVN TLEIELQAQH SLRDSLENTL TESEARYSSQ LAQMQCMITN VEAQLAEIRA ELERQNQEYQ VLLDVRARLE GEINTYRSLL ESEDCKLPCN PCSTPSCTTC VPSPCVTRTV CVPRTVGMPC SPCPQGRY Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Kératine
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P01868 324 acides aminés Nom de la protéine: Anticorps (IgG) Informations taxonomiques Souris …existe aussi dans d’autres espèces… Informations biologiques Protéine du système immunitaire que participe à la défense de l’organisme…Cette protéine est contituée de plusieurs chaînes. …AKTTPPSVYP LAPGSAAQTN SMVTLGCLVK GYFPEPVTVT WNSGSLSSGV HTFPAVLQSD LYTLSSSVTV PSSPRPSETV TCNVAHPASS TKVDKKIVPR DCGCKPCICT VPEVSSVFIF PPKPKDVLTI TLTPKVTCVV VDISKDDPEV QFSWFVDDVE VHTAQTQPRE EQFNSTFRSV SELPIMHQDW LNGKEFKCRV NSAAFPAPIE KTISKTKGRP KAPQVYTIPP PKEQMAKDKV SLTCMITDFF PEDITVEWQW NGQPAENYKN TQPIMNTNGS YFVYSKLNVQ KSNWEAGNTF TCSVLHEGLH NHHTEKSLSH SPGK Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org IgG
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no P62399 179 acides aminés Nom de la protéine: Protéine ribosomale L5 Informations taxonomiques Bactérie (E.coli) …existe aussi dans d’autres espèces… Protéine en cours de fabrication par un ribosome... Informations biologiques Protéine qui fait partie d’un assemblage de protéines appelé ribosome, impliqué dans la fabrication des protéines un ribosome... MAKLHDYYKDE VVKKLMTEFN YNSVMQVPRV EKITLNMGVG EAIADKKLLD NAAADLAAIS GQKPLITKAR KSVAGFKIRQ GYPIGCKVTL RGERMWEFFE RLITIAVPRI RDFRGLSAKS FDGRGNYSMG VREQIIFPEI DYDKVDRVRG LDITITTTAK SDEEGRALLA AFDFPFRK Séquence
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Protéine ribosomale L5
La banque de données Swiss-Prot Swiss-Prot@expasy.org http://beta.uniprot.org Fiche no Q9NRL3 753 acides aminés Nom de la protéine: Zinedine Informations taxonomiques Homo Sapiens …existe aussi dans d’autres espèces… Informations biologiques Protéine-relais pour le passage des signaux dans la cellule… Séquence MMEERAAAAV AAAASSCRPL GSGAGPGPTG AAPVSAPAPG PGPAGKGGGG GGSPGPTAGP EPLSLPGILH FIQHEWARFE AEKARWEAER AELQAQVAFL QGERKGQENL KTDLVRRIKM LEYALKQERA KYHKLKFGTD LNQGEKKADV SEQVSNGPVE SVTLENSPLV WKEGRQLLRQ YLEEVGYTDT ILDMRSKRVR SLLGRSLELN GAVEPSEGAP RAPPGPAGLS GGESLLVKQI EEQIKRNAAG KDGKERLGGS VLGQIPFLQN CEDEDSDEDD ELDSVQHKKQ RVKLPSKALV PEMEDEDEED DSEDAINEFD FLGSGEDGEG APDPRRCTVD GSPHELESRR VKLQGVLADL RDVDGLPPKV TGPPPGTPQP RPHEDVFIMD TIGGGEVSLG DLADLTVTND NDLSCDLSDS KDAFKKTWNP KFTLRSHYDG IRSLAFHHSQ SALLTASEDG TLKLWNLQKA VTAKKNAALD VEPIHAFRAH RGPVLAVAMG SNSEYCYSGG ADACIHSWKI PDLSMDPYDG YDPSVLSHVL EGHGDAVWGL AFSPTSQRLA SCSADGTVRI WDPSSSSPAC LCTFPTASEH GVPTSVAFTS TEPAHIVASF RSGDTVLYDM EVGSALLTLE SRGSSGPTQI NQVVSHPNQP LTITAHDDRG IRFLDNRTGK PVHSMVAHLD AVTCLAVDPN GAFLMSGSHD CSLRLWSLDN KTCVQEITAH RKKHEEAIHA VACHPSKALI ASAGADALAK VFV