170 likes | 291 Views
Wykorzystanie informacji rodowodowej lub podobieństwa molekularnego do określenia postaci dyspersji efektów genetycznych w liniowym modelu mieszanym z dwoma komponentami. Marta Molińska- Glura , Krzysztof Moliński Wisła, grudzień 2010. Tworzenie macierzy spokrewnień w oparciu o rodowód
E N D
Wykorzystanie informacji rodowodowej lub podobieństwa molekularnego do określenia postaci dyspersji efektów genetycznych w liniowym modelu mieszanym z dwoma komponentami Marta Molińska-Glura, Krzysztof Moliński Wisła, grudzień 2010
Tworzenie macierzy spokrewnień w oparciu o rodowód • Tworzenie macierzy podobieństw molekularnych w oparciu o różne miary podobieństwa • Model liniowy z dwoma komponentami • Estymacja komponentów metodą REML • Kryterium wyboru modelu
Predykcja efektów genetycznych nazywanych wartościami hodowlanymi roślin lub zwierząt ma istotne znaczenie w selekcji osobników. • Efekty genetyczne w naukach medycznych najczęściej skojarzone są z odziedziczalnością pewnych cech (chorób).
I. Tworzenie macierzy spokrewnień w oparciu o rodowód Konstrukcja klasycznego rodowodu w postaci tabelarycznej rozpoczyna się od uporządkowania posiadanych obiektów oraz przypisaniu im rodziców. Możliwe jest również umieszczenie w tabeli rodowodowej osobników o nieokreślonych przodkach. Poniżej zamieszczono fragment przykładowej tabeli rodowodowej: Odmiany kukurydzy o nieznanym pochodzeniu Odmiany kukurydzy z pełną informacją rodowodową
Informacje zawarte w tabelarycznej postaci rodowodu mogą posłużyć do wyznaczenia macierzy spokrewnień. Na podstawie prac Wright`a (1922) i późniejszych Henderson`a (1988) możemy przedstawić wzory definiujące elementy tej macierzy: gdzie oraz oznaczają wyznaczoną informację rodowodową, odpowiednio ojca i matki, dla i-tego osobnika, oznacza stopień spokrewnienia ojca i matki i-tego osobnika.
Korzystając z tabelarycznej postaci rodowodu i wcześniejszych wzorów na określanie współczynników pokrewieństwa rodowodowego, odpowiednia macierz spokrewnień przyjmuje postać:
II. Tworzenie macierzy podobieństw molekularnych w oparciu o różne miary podobieństwa 1. Przetworzenie obrazu na tablicę zawierającą odpowiednie wartości mas molekularnych charakteryzujące strukturę każdego z obiektów. 2. Zastosowanie znanych miar podobieństwa molekularnego bazujących na zestawie mas molekularnych . 3. Wartości podobieństw molekularnych jako składowe macierzy podobieństw molekularnych.
Przykładowy obraz widma uzyskany dzięki elektroforezie metodą PCR
Najpopularniejszymi miarami oznaczania podobieństwa molekularnego są: Miara Nei-Li Miara Kulczyńskiego Miara Jaccarda to liczba „prążków” dla i-tego obiektu, to liczba „prążków” dla j-tego obiektu, to liczba „prążków” dla i-tego i j-tego obiektu występujących na tych samych pozycjach.
Korzystając z wyników analiz molekularnych metodą RAPD i wzoru Nei`a-Li określających podobieństwo molekularne odpowiednia macierz podobieństw molekularnych przyjmuje postać:
III. Model liniowy z dwoma komponentami wektor obserwowanych zmiennych losowych macierz dla parametrów stałych, pełnego rzędu kolumnowego wektor parametrów stałych macierz dla efektów losowych wektor losowych efektów obiektowych wektor błędów losowych
Założenia: Dla wektora błędów losowych zakładamy: . Dla wektora zmiennych losowych , gdzie oznacza dyspersję wektora losowego . Ponadto, wektory losowe i są niezależne, oraz i są tzw. komponentami wariancji, reprezentującymi odpowiednio wariancję błędów eksperymentalnych oraz wariancję losowych efektów obiektowych.
Przy wcześniejszych założeniach możemy zapisać: jest ilorazem komponentów wariancji
IV. Estymacja komponentów metodą REML Spośród wielu metod estymacji komponentów wariancji wybrano znaną metodę REML. Stąd uzasadnione jest przyjęcie we wstępie założenia o normalności rozkładu zmiennej losowej . Zasada metody REML polega na wydzieleniu w funkcji gęstości wielowymiarowego rozkładu normalnego dwóch czynników, z których pierwszy wystarcza do estymacji komponentów wariancji (nie zależy od wektora parametrów stałych), drugi zaś zależy zarówno od wektora parametrów stałych jak i komponentów wariancji. W rozważanym modelu podział ten daje się zapisać: , , oznaczają odpowiednie funkcje gęstości wielowymiarowego rozkładu normalnego oraz wymienionych wyżej czynników. Macierz jest podmacierzą pełnego rzędu wierszowego macierzy: oraz ,
Dalsze postępowanie polega na niezależnej maksymalizacji funkcji Postępowanie to sprowadza się rozwiązania układu równań nieliniowych: , w którym elementy macierzy oraz wektora mają następującą postać ogólną (zależną od nieznanych , : , gdzie
V. Kryterium wyboru modelu Predyktor dla wektora efektów losowych gdzie oraz
1. W miejsce macierzy przyjmujemy macierz nieznana struktury zależności między obiektami 2. W miejsce macierzy przyjmujemy macierz zawiera wartości współczynników pokrewieństwa rodowodowego (animal model-model zwierzęcia) 3. W miejsce macierzy przyjmujemy macierz zawiera wartości współczynników podobieństwa molekularnego