570 likes | 784 Views
FUNDAMENTE DE SISTEME BIOLOGICE ŞI INFORMATICĂ MEDICALĂ BIOINFORMATIC Ă STRUCTURALĂ. Con ţinut. Relaţia dintre inteligenţa artificială şi medicină Sisteme decizionale (prima parte) sisteme suport pentru decizii sisteme bazate pe cunoştinţe (inferenţa logică)
E N D
FUNDAMENTE DE SISTEME BIOLOGICE ŞI INFORMATICĂ MEDICALĂBIOINFORMATICĂ STRUCTURALĂ
Conţinut • Relaţia dintre inteligenţa artificială şi medicină • Sisteme decizionale (prima parte) • sisteme suport pentru decizii • sisteme bazate pe cunoştinţe (inferenţa logică) • folosirea metodelor statistice pentru implementarea sistemelor suport pentru decizii (inferenţa statistică)
Relaţia IA – medicină • A apărut în domeniul diagnozei medicale • S-a căutat un răspuns la întrebarea: Cum poate un program să asiste un doctor să interpreteze constatările sale clinice ajutându-l să producă un diagnostic? • Luarea unei decizii – important şi dificil • Medicul trebuie să aibă abilitatea de a decide, în orice circumstanţă, legat de • starea de sănătate a pacientului • tratamentul adecvat • evoluţia pacientului
Relaţia IA – medicină • Tehnologia poate fi folosită pentru • a evita rezultate negative • a reduce riscul apariţiei erorilor • Avantajele tehnologiei: • pragmatism • repetabilitate • eficienţă • imunitate faţă de factori perturbatori specific umani (oboseală, stres, atenţie diminuată) • IMPORTANT: Decizia finală este luată de medic
Cea mai plauzibilă alternativă • Uneori, la stabilirea unui diagnostic, apar mai multe alternative • Se poate construi un program care să sugereze care este cea mai plauzibilă alternativă • Această soluţie se bazează pe sistemul lui Nash şi este foarte simplu de implementat • Structurile de date necesare sunt: • o matrice K • un vector R
Cea mai plauzibilă alternativă SIMPTOME 1 2 . . . . m R K 1 2 . . . . m B O L I 1 2 . . . n
Cea mai plauzibilă alternativă • În vectorul R • fiecare poziţie are asociată o boală • iniţial se setează pe zero • În matricea K • rândurile – boli • coloanele – simptome • completarea se face la construirea sistemului • valorile sunt propuse de medic (0-100) • reprezintă plauzibilitatea ca un anumit simptom să apară la o anumită boală
Cea mai plauzibilă alternativă • Algoritmul: • R=0 • se parcurg de la 1 la n simptomele • dacă simptomul apare la pacient, coloana corespunzătoare acestuia se adună la R • se afişează toate bolile asociate poziţiilor din R în ordinea descrescătoare a valorilor finale • Valorile obţinute pentru fiecare boală sunt interpretate ca scoruri de plauzibilitate
Cea mai plauzibilă alternativă • Acest tip de programe este numit sistem suport pentru decizii (DSS – decision support system) • Domeniul de aplicabilitate nu este doar medicina; oriunde există, în anumite condiţii date, posibilitatea de a lua mai multe decizii se pot utiliza astfel de sisteme (în domeniile economic, militar etc.)
Cea mai plauzibilă alternativă • Avantajul – simplitatea • Dezavantajul – lipsa unui fundament matematic • Totuşi, pornind de la acest model, se pot dezvolta noi variante, cu funcţionalitate mai ridicată şi mai bine aprofundate teoretic
Simularea raţionamentului uman • Se construieşte un program care pe baza unor premise, prin mecanisme de inferenţă logică, deduce diagnosticul • Programul trebuie să încorporeze piese de cunoaştere necesare efectuării raţiona-mentului • Acest tip de programe se numeşte sistem bazat pe cunoştinţe (KBS – knowledge based system)
Simularea raţionamentului uman • Structura de date folosită – un graf orientat • Peste graf se aplică un mecanism de evaluare logică în lanţ • Pentru a realiza sistemul e nevoie de un set de reguli create din premise şi operaţii logice • În diagnoza medicală premisele sunt reprezentate prin simptome şi rezultate ale testelor care se realizează când un pacient se prezintă la medic
Simularea raţionamentului uman • Exemplu – diagnoză pentru hepatită • Considerăm tipurile de hepatită B, C şi B+D • Se realizează pe baza analizării unor marker-i: • AgHBs • anti-VHD • anti-VHC • Valorile acestor marker-i formează premisele (vezi tabelul următor)
Simularea raţionamentului uman • Premisele pentru diagnosticarea hepatitei
Simularea raţionamentului uman • Pe baza premiselor (utilizând operatori logici) se alcătuiesc regulile: R1: dacă P1 ŞI P3 atunci “hepatită B” R2: dacă P1 ŞI P4 atunci “hepatită B+D” R3: dacă P2 ŞI P5 atunci “hepatită C”
Simularea raţionamentului uman • Graful rezultat: P1 AND B P2 AND B+D P3 P4 AND C P5
Simularea raţionamentului uman • Avantaj: uşor de implementat pentru reguli simple de genul premise logice concluzii • Dezavantaje: • dacă se lucrează cu cantităţi mari de date graful devine prea complex • uneori e dificil să se definească regulile sistemului • transformarea cunoştinţelor explicite în reguli implicite poate duce la pierderea sau distorsionarea informaţiilor
Problema modelului DSS • Modelul DSS (decision support system) nu are un suport matematic • înglobează empiric într-o matrice cunoştinţe medicale provenite din • cărţi • articole • experienţă personală
Problema modelului KBS • Inferenţa logică nu este o soluţie dacă • sunt analizaţi mulţi parametrii • există numeroase combinaţii între aceşti parametrii • deoarece regulile se definesc greu şi există riscul apariţiei inexactităţilor
Soluţia • Soluţia ar fi stocarea într-o bază de date a unui număr mare de pacienţi • Informaţiile reţinute sunt: • toate premisele standardizate (un set de simptome şi analize clinice unitare) • diagnosticul final (se presupune a fi corect) o sursă viabilă de informaţii (oarecum diferită de experienţa personală) • asupra acestor informaţii se pot folosi elemente din teoria probabilităţilor
Definiţii şi notaţii utile • – mulţimea tuturor rezultatelor posibile ale unui eveniment (se consideră finită) • ex. pentru aruncarea unui zar ={1,2,3,4,5,6} • E, F, … – evenimente (submulţimi ale lui ) • Evenimentul se numeşte evenimentul cert • Evenimentul {} (notat şi I) se numeşte evenimentul imposibil
Definiţii şi notaţii utile • p(E) – probabilitatea unui eveniment E • este un număr real • are următoarele proprietăţi axiomatice: • 0 p(E) 1; • p() = 1; • p(I) = 0.
Definiţii şi notaţii utile • Dacă două evenimente E şi F sunt mutual exclusive (mulţimi disjuncte), probabilitatea ca măcar unul să apară este suma probabilităţilor lor individuale: E F = {} p(EF) = p(E) + p(F). • Probabilitatea p(EF) semnifică faptul că şi evenimentul E şi evenimentul F trebuie obligatoriu să apară împreună şi se numeşte probabilitate compusă. Se notează: p(EF) = p(E,F)
Definiţii şi notaţii utile • Probabilitatea condiţionată a evenimentului E în cazul apariţiei obligatorii a lui F este notată p(E|F) • Când p(F) 0, p(E|F) se defineşte ca raportul dintre probabilitatea compusă p(E,F) şi probabilitatea de apariţie a lui F:
Exemplu • Care este probabilitatea să apară la aruncarea zarului un număr par când se consideră că este cert că numărul va fi mai mic decât 4? • E={2,4,6} – numere pare • p(E)=p({2})+ p({4})+ p({6})=1/6+1/6+1/6=1/2 • F={1,2,3} – numere mai mici decât 4 • p(F)=p({1})+ p({2})+ p({3})=1/6+1/6+1/6=1/2 • EF={2} – numerele pare mai mici decât 4 • p(E,F)=p({2})=1/6
Utilizarea teoriei probabilităţilor în diagnoza medicală • – mulţime de pacienţi (numită şi populaţie statistică) • j –variabilă asociată unei boli (diagnosticul) • Dj – mulţimea tuturor pacienţilor care au acea boală • S = { 1, 2, … , n } – mulţimea tuturor simptomelor considerate standard • De exemplu: • 2 = 0 înseamnă că pacienţii nu au temperatură • 2 = 1 înseamnă că pacienţii au temperatură
Utilizarea teoriei probabilităţilor în diagnoza medicală • Baza de date considerată (investigată), conţine pentru fiecare pacient: • un vector de simptome s = ( s1, s2, … , sn ) reprezentând valorile asociate variabilelor din S • boală j ( j = 1,m unde m este numărul de boli luate în considerare)
Utilizarea teoriei probabilităţilor în diagnoza medicală • Pentru un nou pacient: • se cunoaşte vectorul s asociat (toate simptomele şi analizele sale) • scopul: sugerarea unui diagnostic • În acest sens, se calculează pentru fiecare boală k probabilitatea asociată, adică valoarea p(Dk|S=s)
Teorema lui Bayes • Thomas BAYES • 1702 – 1761 • matematician englez • a studiat logica şi teologia • cel mai important lucru care a rămas de la el este teorema care-i poartă numele
Teorema lui Bayes • Este una din formulele de calcul cu probabilităţi condiţionate care arată că: • Cu ajutorul ei se poate calcula p(Dk|S=s) • Teorema lui Bayes aplicată în diagnoza medicală:
Teorema lui Bayes • p(Dk) este simplu de calculat, cunoscând frecvenţa cu care k=1 apare în populaţia :
Teorema lui Bayes • p(S|Dk) necesită mai multe calcule şi trebuie presupus că simptomele sunt independente condiţionat în prezenţa bolii k • unde: • şi:
Teorema lui Bayes • p(S) este, de asemenea, destul de greu de calculat; dacă se presupune că toate bolile sunt mutual exclusive, adică fiecare pacient trebuie să aibă la un moment dat doar o singură boală (şi nu este întotdeauna aşa) se poate folosi următoarea formulă: • unde j este un indice al tuturor bolilor investigate 1, 2, …, m, iar termenii sumei se calculează folosind relaţiile anterioare
Teorema lui Bayes • În final rezultă, pentru teorema lui Bayes, relaţia de calcul: • k=1,m
Teorema lui Bayes • Aplicarea formulei date de teorema lui Bayes asupra unei baze de date care reprezintă o populaţie statistică cu scopul de a determina un diagnostic pentru un nou pacient se numeşte inferenţă prin regula bayes-iană. • Pentru rezultate cât mai bune: • populaţie statistică mare • număr ridicat de simptome • omogenitatea bolilor
Exemplu – hepatita B • Hepatita B este o boală gravă, ea ucigând anual între 1 şi 2 milioane de persoane • Simptomele şi analizele sunt în general suficient de evidente pentru a putea determina medicul să declare că o anumită persoană este infectată cu virusul hepatic B • Problema este că nu toţi pacienţii evoluează la fel şi că în momentul internării, pe baza simptomelor şi a analizelor, e greu de prevăzut cum se vor comporta aceştia
Exemplu – hepatita B • Există trei tipuri evolutive ale hepatitei B • obişnuit, • cu recăderi şi • cu decompensări • şi şase forme ale bolii • uşoară, • medie, • gravă, • prelungită, • colestatică şi • comatoasă
Exemplu – hepatita B • Ar fi foarte interesant şi util dacă, la internarea unui pacient despre care se ştie că este infectat cu virusul hepatitei B, s-ar putea preciza, cu o oarecare probabilitate, care va fi tipul evolutiv şi forma bolii, astfel încât el să poată fi tratat corespunzător şi să se evite riscurile agravării stării lui de sănătate
Baza de date • Informaţiile prelucrate de teorema lui Bayes trebuie să fie sub formă booleană (există sau nu există un anumit simptom/valoare) • Din acest motiv rezultatele analizelor de laborator de exemplu trebuie prelucrate şi împărţite pe intervale cu o anumită semnificaţie din punct de vedere medical (vezi tabelul următor)
Acurateţe • Procentul de pacienţi diagnosticaţi corect • Depinde foarte mult de populaţia statistică • În exemplul descris anterior teorema lui Bayes are acurateţea 73.33%
Formula lui Aitken • În cazul unor populaţii statistice mari, teorema lui Bayes duce la un timp excesiv de calcul pentru probabilitatea p(S|Dk) • Se poate folosi formula lui Aitken: în care:
Formula lui Aitken • T = numărul total de pacienţi • n = numărul de simptome • = factor de “netezire” pentru boala • 0.5 1 • stabilit empiric • valoare mică pentru boli mai răspândite • valoare apropiată de 1 pentru boli mai rare • st = distanţa Hamming între valoarea S=(S1, S2, …, Sn) a pacientului diagnosticat şi St=(S1t, S2t , …, Snt) a pacientului t din baza de date