Pokazywanie postów oznaczonych etykietą genetyka. Pokaż wszystkie posty
Pokazywanie postów oznaczonych etykietą genetyka. Pokaż wszystkie posty

wtorek, 8 sierpnia 2017

DLGAP2

Dzisiejszy, krótki post będzie dotyczył genu DLGAP2 (zwanego też czasem SAPAP2). Białko kodowane przez ten gen jest ważnym elementem tzw. zagęszczenia postsynaptycznego (ang. post-synaptic density, PSD). Szacuje się, że na zagęszczenie postsynaptyczne składa się z przynajmniej kilkaset białek[1], a niektóre z nich pełnią funkcję rusztowania. Proszę spojrzeć na poniższy obrazek.


Rusztowanie

Uważa się, że wiele z białek wymienionych na powyższym obrazku jest zakonserwowanych genetycznie i nie są charakterystyczne jedynie dla naszego gatunku. Co więcej, przypuszcza się, że zamiany dotyczące tych białek skutkują różnymi zaburzeniami neurologicznymi, w tym ASD. Zaburzenia w funkcjonowaniu synaps są postulowane w autyzmie. Uważa się, że takie białka jak PSD-95, białka z rodziny SAPAP oraz SHANK i jeszcze kilka innych tworzą specyficzne rusztowanie, które organizuje obszar postsynaptyczny i służy jako fundament dla receptorów takich jak NMDAR, AMPAR czy mGluR. Na powyższej ilustracji białko DLGAP2 jest oznaczone jako SAPAP (cała rodzina).

As elegant structures designed for neural communication, synapses are the building bricks of our mental functions. Recently, many studies have pointed out that synaptic protein-associated mutations may lead to dysfunctions of social cognition. Dlgap2, which encodes one of the main components of scaffold proteins in postsynaptic density (PSD), has been addressed as a candidate gene in autism spectrum disorders.

https://openi.nlm.nih.gov/detailedresult.php?img=PMC4113140_2040-2392-5-32-7&req=4


Zaburzenia

O tym w jaki sposób deficyt DLGAP2 może wpływać na zagęszczenie postsynaptyczne mieliśmy okazję wspomnieć przy okazji poprzedniego posta. Pozwolimy sobie ponownie przytoczyć odpowiedni obrazek pokazujący jak wygląda obszar postsynaptyczny u myszek z całkowicie wyłączonym genem DGLAP2. To może nie odpowiadać dokładnie temu co jest widoczne u ludzi z delecją genu DGLGAP2 tylko na jednym chromosomie. Być może w przypadku delecji na jednym chromosomie obserwowana rozbieżność nie jest aż taka wyrazista.

Okazuje się, że zarówno delecje jak i duplikacje w rejonie prążka 8p23 mogą skutkować poważnymi zaburzeniami. I tak, delecja w tym rejonie łączona jest z upośledzeniem umysłowym, autyzmem, mikrocefalią o problemami kardiologicznymi. Z drugiej strony, duplikacja w tym rejonie także wiąże się z ASD i innymi zachowaniami ze spektrum.

8p23 deletions have been associated with mild mental retardation, cardiac abnormalities, microcephaly, and autism (Giglio et al., 2000; Hutchinson, Wilson,&Voullaire, 1992; Tranebjaerg et al., 1984). A duplication at 8p23.2 that intersected and likely disrupted DLGAP2 has been associated with a male with ASD, repetitive behaviors, and moderate receptive/expressive language delay−discussed by both Marshall in 2008 and, after analysis on a higher-resolution array, reported by Pinto and colleagues (Marshall et al., 2008; Pinto et al., 2010).

https://www.ncbi.nlm.nih.gov/pubmed/28407363

Okazuje się, że zaburzenia w genach z rodziny DLGAP/SAPAP widywane są też u osób ze schizofrenią, Zespołem Tauretta czy OCD.

Notably in the present study, we identified several patient-only variants with enhanced promoter activity, suggesting increased DLGAP2 gene expression may contribute to the pathogenesis of schizophrenia.

Our results indicate that DLGAP2 is a susceptible gene of schizophrenia.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3885712/

For example, serial studies supported that the DLGAP3 gene is a promising functional candidate for Tourette syndrome and obsessive compulsive disorder [9], [10], [11], [12]. Pinto et al. discovered the DLGAP2 gene as a novel gene associated with autism spectrum disorders [13]. Recently, our team has identified a private rare mutation (c.1922A>G) of the DLGAP1 gene, which changes lysine to arginine at codon 641 (K641R) in one out of 121 schizophrenia, but not in 275 non-psychotic control subjects [14].

http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0085373


Model mysi

Badań dotyczących genu DLGAP2 jest, niestety, mniej niż by się chciało. Część z nich dotyczy modelu mysiego. Chyba żadna z publikacji nie opisuje potencjalnych interwencji w przypadku delecji genu DLGAP2. Mimo wszystko przyjrzyjmy się temu jakie zachowanie jest widać u myszek z wyłączonym tym genem. Ponieważ badanie dotyczy myszek to trzeba zachowań należytą ostrożność w interpretacji. Okazuje się, że myszki z wyłączonym genem DLGAP2 były przesadnie impulsywne i reagowały nadaktywnością w kontakcie z czymś nowym (zwłaszcza w pierwszych pięciu minutach).

To assess their basic locomotion ability, we used the open-field test (Figure 1E) and found that Dlgap2 −/− mice demonstrated intact locomotion ability since their performances were quite comparable to the WT mice. However, Dlgap2 −/− mice displayed novelty-induced hyperactivity (Figure 1E) in the first 5 minutes of the test specifically, which was likely due to impulsivity [38].

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4113140/

Myszki z wyłączonym genem DLGAP2 były także bardziej agresywne i gorzej się uczyły.

We thus used the resident–intruder task to evaluate the aggressiveness of the Dlgap2 −/− mice. Briefly, mice were single-housed in their home cage for 3 weeks to establish their territory. On the test day, intruders were put in to induce aggressive behaviors in the resident mice. As the results show, Dlgap2 −/− mice displayed an obviously shorter attack latency (Figure 2C). Additionally, the duration and frequency of aggressive behaviors also dramatically increased compared to the WT mice (Figure 2D,E).

We used performance in the water T-maze to determine the repetitive behaviors of Dlgap2 −/− mice. As shown in Figure 3A, there was no significant difference in the number of days to reach the 80% right position criterion between WT and Dlgap2 −/− mice (5.5 and 5.4 days, respectively). All mice reached the criterion on Day 6 and were moved into training session of reversal learning test (Figure 3B). In the learning session of reversal learning test, we found that Dlgap2 −/− mice made a significantly greater number of errors on the first day of learning session in comparison with WT mice (P < 0.05) (Figure 3C). Figure 3D shows the number of errors on each day throughout the 4-day reversal learning session. During reversal learning, both strains improved across days.

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4113140/



Szpilki dendrytyczne

Okazuje się, że anomalie z zagęszczeniem postsynaptycznym to nie jedynie anomalie widoczne po wyłączeniu genu DLGAP2. Kolejna anomalia dotyczy tzw. szpilek dendrytycznych. To co jest widoczne w przypadku delecji DLGAP2 jest przeciwieństwem tego co jest obserwowane w Zespole łamliwego chromosomu X. Proszę spojrzeć na poniższy obrazek. Widać, że gęstość szpilek dendrytycznych jest niższa u myszek z wyłączonym tym genem w porównaniu ze zdrowymi myszkami.

The DLGAP2-encoded SAPAP2 specifically interacts with PSD-95/SAP90 and its related proteins through the guanylate kinase domain. The protein is specifically expressed in neuronal cells, and enriched in the post-synaptic density fraction [8], [16], and plays a pivotal role in the molecular organization of synapses and in neuronal cell signaling. In the case of fragile X syndrome, which is a hereditary form of mental retardation caused by functional absence of Fragile X mental retardation protein (FMRP), Schütt et al. reported that mRNA of SAPAP1, 2 and 3 were part of the targets of the FMRP and increased postsynaptic SAPAP2 levels was observed in the hippocampus of FMRP knock-out mice [29], The increased SAPAP2 level may contribute to the aberrant synaptic function in patients with Fragile X syndrome.

http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0085373

Czy w związku z powyższym, interwencje proponowane w Zespole łamliwego chromosomu X okażą się nieskuteczne u osób z delecją genu DLGAP2? Nie jest to przesądzone. W każdym razie istnieją pewne interwencje modulujące morfologię szpilek dendrytycznych.


Substancja biała

Istnieją pewne poszlaki sugerujące, że delecja genu DLGAP2 może wiązać się z nietypowym rozmiarem substancji białej w mózgu. Zdaje się, że nie ma na to bezpośrednich dowodów, ale anomalie związane z substancją białą widoczne są w przypadku niektórych polimorfizmów tego genu.


Interwencja

Niestety, wydaje się, że delecja genu DLGAP2 jest bardzo rzadka, w związku z czym nie ma finansowej zachęty do pracy nad lekami. Wydaje się, że z uwagi na podobne anomalie występujące zarówno w delecji DLGAP2 jak i delecji SHANK3, pewne interwencje skuteczne dla SHANK3 mogą być także skuteczne dla DLGAP2. Jak jest naprawdę, na ten moment nikt nie wie na pewno. Były już pierwsze próby kliniczne u pacjentów z delecją SHANK3 (https://clinicaltrials.gov/ct2/results?term=Phelan-McDermid&Search=Search) i wspomniano o nich w poprzednim poście. Oprócz wspomnianych tam interwencji być może warto też wspomnieć o podawaniu Rysperydonu, ale w odpowiednio dobranych dawkach.

Another case study examined the effect of risperidone in an 18 year-old woman with PMS. Risperidone was administered daily, and the results showed that 6 mg/day actually worsened behavioral symptoms, including psychomotor agitation, aggression, anxiety, and insomnia, while 1 mg/day of risperidone produced significant improvements using the Clinical Global Impression Improvement Scale [80, 81]. The authors hypothesized that by blocking dopamine 2 receptors, risperidone promotes NMDA transmission and reverses the glutamatergic dysregulation due to loss of SHANK3. Further, the authors argue that the differential effect of high- and low-dose risperidone is consistent with results from animal models, which suggest that risperidone has dose-dependent effects on glutamate receptor subtypes [82].

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4489957/


Konkluzja

Delecje w rejonie prążka 8p23 często skutkują delecją genu DLGAP2. Zebrane dane dotyczące ludzi i badania na modelu zwierzęcym sugerują, że aberacje związane z tym genem mogą mieć znaczący wpływ na funkcjonowanie mózgu i skutkować zaburzeniami ze spektrum autyzmu, schizofrenią, OCD czy Zespołem Tauretta. Wykazano też pewne anomalie związane z zagęszczeniem postsynaptycznym i szpilkami dendrytycznymi. Niestety, na ten moment nie ma w tym przypadku ma zaakceptowanego postępowania medycznego. Istnieją obiecujące próby kliniczne (ale dopiero w pierwszej fazie), które sugerują pewne rozwiązania dla delecji SHANK3. Być może pacjencji z delecją DLGAP2 również pozytywnie zareagują na interwencje stosowane w delecja SHANK3. Czas pokarze (miejmy nadzieję.)



[1] https://en.wikipedia.org/wiki/Postsynaptic_density
[2] https://openi.nlm.nih.gov/detailedresult.php?img=PMC4113140_2040-2392-5-32-7&req=4
[3] https://www.ncbi.nlm.nih.gov/pubmed/28407363
[4] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3885712/
[5] http://journals.plos.org/plosone/article?id=10.1371/journal.pone.0085373
[6] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4113140/
[7] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4552325/
[8] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC4489957/

piątek, 19 maja 2017

Delecje

Na rysunku powyżej widać fragment programu do wyszukiwania dużych delecji w wynikach z 23andMe. Wyniki z 23andMe nie są stworzone do tego aby szukać w nich delecji. Jeśli szukasz dużych delecji (~100 tyś. bp) to dobrym sposobem wydają się mikromacierze, jeśli szukasz krótkich delecji (~100 bp) to badania WES/WGS będą pomocne. Do wyniku wyszukiwania dużych delecji w wynikach z 23andMe należy podchodzić ostrożnie. Wyszukiwanie opiera się na kilku założeniach. Po pierwsze zakładam, że delecja na dwóch bliźniaczych chromosomach skutkuje wartością '--' w wyniku. Taka wartość może się też pojawić, niestety z innych powodów. Druga sprawa to taka, że w dużym fragmencie kolejnych wariantów z wartością '--' nie dopuszczam innych wartości, żeby uznać dany fragment za delecję. Takie pojedyncze warianty z innymi oznaczeniami mogłyby się pojawić za sprawą homologów/ortologów/paralogów czy pseudogenów. Jeśli tak będzie to taki fragment nie zostanie uznany za delecję (być może przydałoby się wprowadzić do programu pewną tolerancję na tego typu rzeczy). O ile delecja na parze chromosomów wydaje się, że skutkuje oznaczeniem '--' (w wynikach są też oznaczenia 'DD' oznaczające delecje, ale nie o takie delecje chodzi) to delecja na pojedynczym chromosomie jest bardziej problematyczna. Prawdopodobnie skutkuje ona tym, że pewien spory fragment kolejnych wyników dla wariantów składa się wyłącznie z genotypów o dwóch takich samych allelach. Ta sytuacja wcale nie musi być patologiczna i nie musi oznaczać delecji. Żeby błędnie nie zakwalifikować takiego czegoś jako delecji należało ustawić duże wartości w parametrach dla wykrywania delecji na pojedynczym chromosomie.

Obsługa programu jest bardzo prosta. Po naciśnięciu przycisku "przeglądaj" wybiera się plik z surowymi danymi. Program rozpoczyna pracę automatycznie najpierw pobierając plik, następnie go odczytując. W kolejnej fazie zaznacza na obrazku z chromosomami odpowiednie obszary, które podlegały genotypowaniu, na podstawie wczytanego pliku. W tym samym czasie próbuje wykryć delecje i jeśli tak się stanie rysuje odpowiednie informacje i dodaje info o tym co zostało znalezione (na spodzie strony). Oznaczone w wyniku warianty rysowane są kolorem zielonym, znalezione delecje na obu chromosomach kolorem czerwonym a na jednym chromosomie kolorem pomarańczowym. Można zmienić parametry wyszukiwania i/lub skalę obrazka i nacisnąć przycisk rysuj. Wykres zostanie ponownie narysowany dla zmienionych danych.


Jakie delecje można wykryć

Wykrycie delecji zależy od gęstości wariantów w danym zakresie i od ustawień programu. Jeśli ustawimy, że interesują nas duże delecje to jeśli program coś wykryje to jest większa szansa, że to co zrobił jest poprawne. Jeśli zmniejszymy parametry programu tak, żeby wykrywać mniejsze delecje to program stanie się bardziej "czuły", ale zaczynają wkradać się nieprawidłowości (wyniki fałszywie pozytywne). Poniżej przedstawionych zostało kilka przykładów wyszukiwania delecji w (spreparowanych) wynikach z 23andMe. Przykłady zostały przygotowane na podstawie dostępnej literatury medycznej opisującej wykryte delecje.


Delecja 22q11

Na rysunku obok widzimy delecję na 22 chromosomie w okolicach locus q12. Obrazek przedstawie delecje dla trzech różnych pacjentów powiększone w programie do wielkości x8. Kolorem czerwonym zaznaczono co prezentowałby program gdyby delecja dotyczyła obu chromosomów, kolorem pomarańczowym gdyby delecja dotyczyła tylko jednego chromosomu. Delecja tego regionu występuje z częstotliwością 1/4000 i skutkuje opóźnieniem rozwoju, opóźnieniem mowy, problemami z nauką, zachowaniami ze spektrum autyzmu i ADHD. Czasami symptomy mogą być na tyle łagodne, że opóźniają właściwą diagnozę.


Delecja 22q13

Delecja 22q13.3 nosi też nazwę zespołu Phelan-McDermida. Częstotliwość występowania nie jest znana, ale podejrzewa się, że jest bardzo niska. W rejonie 22q13 występuje gen SHANK3, silnie powiązany z autyzmem. Dlatego też delecje w rejonie 22q13 skutkują objawami ze spektrum autyzmu. Na rysunku obok widać rzeczywistych 5 przypadków delecji w tym rejonie zaczerpniętych z literatury. To co się rzuca w oczy to to, że rozmiary tych delecji są radykalnie różne. W przypadku drugiego pacjenta widać, że doszło do delecji całego locus q13.31, podczas gdy u trzeciego pacjenta widać, że brakuje tylko krótkiego fragmentu w locus q13.33. Co więcej, ta delecja nie zostanie znaleziona przez opisywany program na standardowych ustawieniach, trzeba zmniejszyć do 10 ilość kolejnych wariantów z '--' w parametryzacji.


Delecja 1p36

Po lewej widzimy delecję na pierwszym chromosomie. Występuje z częstotliwością około 1/5000. Osoby z tą delecją dotknięte są często różnymi dymorfizmami. Ich rozwój umysłowy jest także nieprawidłowy.


Konkluzja

Wiele osób wykonuje badania w 23andMe. Nie są to drogie badania, ale nie niosą tyle informacji co np.: WES czy NGS. Wydaje się, że dziecko dotknięte różnymi dymorfizmami, cierpiące na padaczkę czy z ciężkim upośledzeniem umysłowym powinno mieć pogłębioną diagnostykę genetyczną. W praktyce okazuje się, że badania kariotypu czy MLPA niczego nie wykrywają a z uwagi na to, że za mikromacierze czy WES muszą zapłacić rodzice to badania te nie są wykonywane. Opisywany tutaj program stara się wykryć duże delecje w wynikach z 23andMe. Oczywiście, wszystkiego co wykryje ten program nie należy brać za "dobrą" monetę i trzeba potwierdzić znalezisko w odpowiednim badaniu genetycznym (mikromacierze, WES). Być może istnieją osoby, które nie zdecydowały się na mikromacierze czy WES a wykonały badanie w 23andMe i może są rzeczywiście posiadaczami jakiejś dużej delecji. Opisywane na tej stronie przykłady kilku delecji nie wyczerpują możliwości opisywanego programu. Stanowią jedynie przykład. Jeśli ktoś ma ochotę to zapraszam do korzystania z programu. Należy się wyczulić na to, że program prawdopodobnie pokaże problem w rejonie chromosomów X i/lub Y. Dla kobiet będzie zgłaszał błąd, że nie ma dużej ilości danych na chromosomie Y (hmmm, właściwie całego chromosomu). W przypadku chromosomu X wydaje się, że 23andMe ma jakiś problem z genotypowaniem i czasem brakuje dużych fragmentów tego genu. Nie sądzę, że tak jest w rzeczywistości, raczej to błąd po stronie 23andMe. Wydaje się, że można spokojnie zignorować wskazywane delecje na chromosomie X i Y.

Program znajduje się pod adresem: http://agdziedrugijez.pl/hg19/cytobands/cytobands.html

środa, 29 marca 2017

Kolorowe szlaki KEGG

Podobno jeden obraz jest wart więcej niż 1000 słów.

Dzisiejszy post będzie dotyczył genetyki ale w trochę inny sposób. Będą obrazki. Obrazki zapożyczyłem z KEGG. KEGG to akronim od Kyoto Encyclopedia of Genes and Genomes i ja osobiście najbardziej kojarzę tę bazę z ręcznie rysowanych map szlaków reprezentujących naszą wiedzę na temat interakcji pomiędzy molekułami.

Post ten jest najbardziej użyteczny dla tych osób, które wykonywały badania w 23andMe lub MTHFR Genetics i posiadają tzw. surowe dane (ang. raw data). Osoby, które wykonały WES lub WGS i posiadają plik wariantów (VCF) nie będą mogły skorzystać z opisanego narzędzia, ale jeśli byłaby taka potrzeba to mogę te narzędzie odpowiednio zaadoptować. Mając plik z surowymi danymi możemy wczytać go do programu i pooglądać trochę obrazków. Zanim jednak do tego przejdziemy to trochę wspomniemy o ograniczeniach opisywanego programu.

Najpoważniejsze ograniczenie wiąże się z badaniem genetycznym w 23andMe lub MTHFR Genetics, które dostarcza opisywanemu narzędziu danych wejściowych. Badanie to określa tylko pewne, wybrane polimorfizmy, w żaden sposób nie można go traktować jako pełne sprawdzenie genomu lub eksomu. Istnieją ogromne ilości wariantów, które uznawane są za patologiczne a nie będzie ich w wynikach z 23andMe i MTHFR Genetics. Nawet dysponując wynikami WES lub WGS skazani jesteśmy na pewne ograniczenia - badania te nie sprawdzają się w wielu mutacjach dynamicznych oraz CNV. Z CNV możemy sobie częściowo poradzić za pomocą tzw. mikromacierzy, ale niektóre rzeczy i tak im umkną i trzeba zrobić dedykowane badanie (łamliwy chromosom X).

Kolejne ograniczenie to obrazy z bazy danych KEGG. W wynikach genetycznych może być jakiś bardzo poważnych, patologiczny wariant (np.: mutacja w genie POR powodująca objawy podobne do zespółu Antleya-Bixlera) ale nie dowiemy się o tym, bo na żadnym z obrazów nie będzie pokazany gen, w którym byłby ten wariant. Do poszukiwania rzadkich, patologicznych wariantów lepiej używać innych narzędzi.

Ostatnie ograniczenie dotyczy wybranego rozwiązania. Ponieważ zdecydowałem się, żeby program był na stronie internetowej (łatwiejsza dostępność dla większości użytkowników, brak konieczności instalowania i uruchamiania czegoś na lokalnym komputerze użytkownika, itd.) to program nie wyświetla tylu informacji ile być może warto byłoby wyświetlić.


Krótko o KEGG

Na stronie http://www.genome.jp/kegg/pathway.html znajdziemy setki ręcznie rysowanych map pogrupowanych w różne kategorie. Spośród wymienionych powyżej kategorii opisywany program obsługuje w chwili obecnej dwie: "Metabolism" oraz "Organismal Systems". W zależności od potrzeb mogę dość łatwo dorobić pozostałe. Te dwie wybrałem bo chciałem zobaczyć na wykresach metabolizm witamin oraz system nerwowy, choć zapewne są też inne ciekawe rzeczy do zobaczenia.

Przykładowa, ręcznie rysowania mapa szlaku biotyny (witaminy B7) poniżej.


Opis programu

Program można znaleźć pod adresami: http://agdziedrugijez.pl/hg19/kegg/metabolism.html i http://agdziedrugijez.pl/hg19/kegg/organismalsystems.html (niestety dla osobnych grup map zrobiłem osobne strony). Wejście na powyższe strony spowoduje, że naszym oczom ukaże się następujący obraz (na obrazie poniżej widać tylko fragment strony). Uwaga! Strona ładuje się dość długu (może nawet z minutę) z uwagi na ściąganie wielu danych.

To co trzeba teraz zrobić to wczytać plik z surowymi danymi i przeglądać wybrane mapy. Poniżej można zobaczyć jak wygląda mapa "Steroid biosynthesis" po wczytaniu pliku z moimi danymi. Na szaro oznaczyłem te enzymy, które wydają się nie istnieć u ludzi (ale inne organizmy mogą je mieć, stąd znajdują się na rysunku). W każdy enzym obrysowany niebieską ramką można kliknąć i zaprezentują się informacje z wyniku genetycznego powiązane z tym enzymem.

Na obrazku powyżej widać, że kliknąłem w enzym 2.5.1.21 (czyli squalene synthase) i w moich wynikach zostało znalezione, że mam pewne warianty związane z genem FDFT1, który koduje ten enzym. Wszystkie warianty połączone z tym enzymem, a które znajdują się w pliku z wynikami, zostaną zaprezentowane po lewej stronie. Dla każdego wariantu wyświetlane są pewne informacje z wczytywanego pliku: rsid (identyfikator wariantu), chrom (oznaczenie chromosomu), pos (pozycja na chromosomie) oraz genotype (genotyp). Dodatkowo, jeśli tylko istnieją, to prezentowane są też inne informacje. I tak, na przykład, z załączonego powyżej obrazka możemy się dowiedzieć, że wariant rs11549147 występuje u około 13% ludzi (jeśli bierzemy pod uwagę to co jest na opensnp.org). W bazie ExAC allel G dla tego wariantu występuje u około 6% osób, a w bazie 1000 Genomes u około 3% osób. Algorytmy do predykcji wpływu tego wariantu na wynikowe białko sugerują, że jest on mały (SIFT oznaczył go jako tolerated a PolyPhen2 jako bening).

Oczywiście, jeśli w naszych wynikach byłby jakiś wariant który np.: powoduje SLOS to byłoby to widać w następujący sposób:

To co się rzuca w oczy na powyższym obrazku to to, że enzym 1.3.1.21 został pokolorowany na czerwono. Dlaczego tak się stało? Nie, nie dlatego, że program jakoś specjalnie obsługuje ten wariant. Stało się tak dlatego, że program wyliczył dla niego wysoką punktację. Dla każdego z enzymów program wylicza punktację biorąc pod uwagę wczytane polimorfizmy oraz zadaną parametryzację. Ponieważ wariant i5012821 praktycznie nie występuję w bazie opensnp.org (wartość 0 dla pola 23andMe), baza clinvar określa, że ten wariant jest patogeniczny a także ontologia sekwencji wskazuje, że wpływ tego wariantu na kodowane białko jest wysoki to mamy taki wynik a nie inny. Punktacja jest podawana w nawiasach okrągłych. Im wyższa tym gorzej. Oczywiście, tutaj od razu ostrzeżenie, że to kolorowanie ma jedynie charakter eksperymentalny i służy jako wabik, żeby kliknąć w to czerwone i zobaczyć co się za tym kryje.

Kolejne dwa obrazy dotyczą danych jednej z osób z ASD. Z zaprezentowanych obrazów widać, że osoba jest posiadaczem kilku bardzo rzadko występujących wariantów. Żaden z tych wariantów nie znajduje się jednak na eksomie jakiegoś transkryptu (wartość 0 przy etykiecie exoms) i w związku z tym trudno tutaj wyciągać wniosku co do tego jaki to ma wpływ (na kodowanie białka nie ma raczej wpływu, ale może na ekspresję). W każdym razie jest tutaj pięć rzadkich wariantów i dlatego czerwony kolor.

Na stronie programu znajduje się legenda, która dotyczy parametryzacji programu (można ustawiać wagi, gdzie waga domyślna to 1 i jeśli coś jest poniżej 1 to jest mniej istotne niż kiedy jest powyżej 1) oraz kolorowania. Generalnie użyte są 3 kolory: zielony, żółty i czerwony. Jeśli coś się świeci na żółto lub czerwono to warto w to kliknąć. Przypomnijmy jeszcze raz, że kolorowanie jest tutaj eksperymentalne i nie należy jakoś specjalnie na nim polegać. To taki wabik mający na celu skuszenie użytkownika żeby spojrzał w daną stronę.

Trzeba czasami też brać pod uwagę, że w wynikach z 23andMe lub MTHFR Genetics są błędy. Generalnie należy być bardzo podejrzliwym w stosunku do wariantów oznaczonych za pomocą literki i na początku. Poniżej obrazek, który będzie się często pojawiał wielu ludziom i charakterystyczny dla choroby Gauchera. Nie ma się jednak co przejmować, poniższa sytuacja jest wynikiem (prawdopodobnie) błędnych wpisów w wynikach z 23andMe lub MTHFR Genetics oraz tego, że mój program nie "odsiewa" wpisów bez nadanych numerów rsid (łatwo mógłbym zrobić takie "odsiewanie", ale nie chce tracić żadnej informacji, nawet jeśli czasem narażam się na ryzyko, że będzie nieprawidłowa).


Pozostaje jeszcze na koniec pytanie: czy takie mapy są potrzebne, żeby dociekać problemów wykazywanych w badaniach genetycznych? Oczywiście, że nie. Pomijając fakt, że genetycy nie pracują na wynikach z 23andMe lub MTHFR Genetics (w zasadzie trudno się dziwić) to potrafią sobie łatwo sprawdzić (jest do tego trochę narzędzi) do jakiej układanki pasuje znaleziony wariant w jakiś genie. Takie mapy to raczej coś dla amatorów z wynikami z 3andMe lub MTHFR Genetics.

Jeśli ktoś ma pomysł jak usprawnić powyższe narzędzie to wszelkie konstruktywne uwagi mile widziane.

Miłego użytkowania.

wtorek, 13 grudnia 2016

Badanie genetyczne

Dzisiejszy post będzie dotyczył badań genetycznych wykonywanych za pośrednictwem firm 23andMe oraz MTHFR Genetics (która zleca badania firmie 23andMe). Znam kilka osób, które wykonały takie badania swoim dzieciom i to co tutaj opiszę być może się im przyda. Wydaje mi się, że badaniami genetycznymi, które powinno się wykonać u dzieci z diagnozą autyzmu są FraX, mikromacierze aCGH i WES. Badania genetyczne wykonywane za pośrednictwem firmy 23andMe są w porównaniu z wcześniej wymienionymi, w mojej opinii, dużo mniej użyteczne. Niemniej jednak jeśli ktoś już je wykonał to może pokusić się "poszperanie" w otrzymanych wynikach.

Wiele osób interesują jedynie wybrane polimorfizmy (np.: dla genów MTHFR, CBS, itd.) a ja chciałbym zaproponować alternatywne podejście. To podejście trochę przypomina szukanie podejrzanych wariantów w wynikach WES. Różnica jest taka, że mamy tutaj do czynienia jedynie z wybranymi wariantami (a nie materiałem genetycznym dla całego eksomu) i nie korzystamy z uznanych narzędzi do analizy/annotowania wariantów (np.: VEP, SnpEff, Annovar). Można byłoby wynik otrzymany z 23andMe przekonwertować do formatu VCF i wtedy użyć wspomnianych wcześniej narzędzi, niemniej jednak korzystanie z tych narzędzi może nastręczać początkującym pewne problemy. Z tego powodu zdecydowałem się stworzyć proste narzędzie, które wczyta wynik z 23andMe i w rezultacie zwróci plik w formacie csv, który będzie można otworzyć w arkuszu kalkulacyjnym. Dodatkowe dane (annotacje) pojawią się w dedykowanych kolumnach. Ten sposób wydaje mi się prostszy dla większości osób. Niestety, dalszą analizę (czyli np.: grzebanie w publikacjach naukowych) trzeba wykonać samemu. Stworzony przeze mnie program ma jedynie ułatwić wybranie zdecydowanie mniejszego podzbioru wariantów do analizy. Na stronie programu umieściłem instrukcję.

Program znajduje się pod adresem: http://agdziedrugijez.pl/hg19/23andme/annotate.html.

Zachęcam do korzystania.