Zadanie 1.5. (dr hab. M. Boczkowska)
Ocena i identyfikacja molekularna obiektów w banku genów.
Osoba odpowiedzialna (w instytucie badawczym): Dr hab. M. Boczkowska
Celem zadania jest wykorzystanie oceny zmienności molekularnej zebranych obiektów ze szczególnym uwzględnieniem populacji miejscowych do analizy pod kątem identyfikacji obiektów, identyfikacji duplikatów i sprawdzenia taksonów wątpliwych.
Identyfikacja gatunkowa i odmianowa opierała się na analizie morfologicznej. Obecnie coraz częściej stosowane są techniki molekularne, jako bardziej precyzyjne niż metody fenologiczne do rozpoznawania odmian i taksonów botanicznych.
- W zadaniu zostaną wykorzystane, jako techniki ewaluacji obiektów, analizy molekularne.
- Sprawdzenie poprawności oznaczenia gatunków dla 20 obiektów kolekcji pszenicy banku genów.
- identyfikacja DNA obiektów. Porównanie otrzymanego materiału DNA dla obiektów banku genów, z sekwencjami pozwalającymi na identyfikację gatunków, zamieszczonymi w ogólnodostępnych bazach.
- umieszczenie uzyskanej sekwencji DNA w bazie EGISET (plik tekstowy w standardowym formacie fasta składający się z pojedynczej linii tekstu zawierającej opis sekwencji oraz z kolejnych linii zawierających samą sekwencję DNA. W opisie sekwencji zostaną umieszczone informacje takie jak gatunek, numer akcesyjny obiektu, nazwa badanego regionu DNA).
- komentarz do uzyskanego wyniku analizy zostanie umieszczony w bazie danych EGISET w postaci pliku w formacie pdf powiązanego z badanym obiektem W komentarzu zostaną podane pełne dane taksonomiczne obiektu, autorzy, data uzyskania sekwencji, miejsce uzyskania sekwencji, liczbowo wyrażona długość odczytu, informacja czy fragment zawiera sekwencję kodującą, sekwencje starterów wykorzystanych w analizie, informację czy nastąpiła korekta nazwy botanicznej w centralnej bazie danych, jeśli tak to jej treść. Dane bibliograficzne publikacji po jej ukazaniu się.
- Ocena stopnia podobieństwa genetycznego 90 obiektów z kolekcji owsa banku genów (populacje miejscowe i stare odmiany).
- wykonanie analizy DNA przy użyciu technologii DArTseq
- umieszczenie uzyskanej sekwencji DNA w ogólnodostępnych bazach danych. Ze względu na rozmiar, surowe dane DArTseq zostaną zdeponowane w światowych bazach danych o otwartym dostępie (np. NCBI, Open Science Framework) oraz w Repozytorium Centrum Otwartej Nauki CEON. Ponadto do bazy danych EGISET dołączony zostanie plik zawierający komentarz do uzyskanego wyniku analizy. W bazie danych EGISET zostanie załączony link umożliwiający pobranie danych (Plik tekstowy (csv)) rozdzielany przecinkami zawierający informacje o numerze akcesyjnym obiektu, gatunek, unikatowe ID dla każdego zsekwencjonowanego locus, jego lokalizację w genomie jeżeli możliwe jest jej ustalenie tj. chromosom i dokładną pozycję początku sekwencji, wykryty typ polimorfizmu i jego położenie we fragmencie, współczynnik powtarzalności wyniku, oraz informację czy badany obiekt jest homo czy heterozygotyczny w konkretnym locus. Plik będzie zawierał wszystkie odczyty dla badanego obiektu.
- komentarz do uzyskanego wyniku analizy zostanie umieszczony w bazie danych EGISET w postaci pliku w formacie pdf powiązanego z badanym obiektem (W komentarzu zostaną podane następujące informacje: numer akcesyjny obiektu, gatunek, data uzyskania wyniku, autorzy, miejsce uzyskania wyniku, wyjaśnienie skrótów występujących w pliku zawierającym surowe wyniki, wyniki po obróbce statystycznej tj. współczynniki heterozygotyczności, współczynnik wsobności, liczba loci/chromosom, dane bibliograficzne publikacji po jej ukazaniu się i jej cząstkowe wyniki tj. np. dystans genetyczny w stosunku do innych badanych obiektów, współczynnik polimorfizmu PIC.)
- Ocena stopnia podobieństwa genetycznego 90 obiektów z kolekcji żyta banku genów (populacje miejscowe i stare odmiany).
- wykonanie analizy DNA przy użyciu technologii DArTseq ,
- umieszczenie uzyskanej sekwencji DNA w ogólnodostępnych bazach danych. Ze względu na rozmiar, surowe dane DArTseq zostaną zdeponowane w światowych bazach danych o otwartym dostępie (np. NCBI, Open Science Framework) oraz w Repozytorium Centrum Otwartej Nauki CEON. W bazie danych EGISET zostanie załączony link umożliwiający pobranie danych (Plik tekstowy rozdzielany przecinkami zawierający informacje o numerze akcesyjnym obiektu, gatunek, unikatowe ID dla każdego zsekwencjonowanego locus, jego lokalizację w genomie jeżeli możliwe jest jej ustalenie tj. chromosom i dokładną pozycję początku sekwencji, wykryty typ polimorfizmu i jego położenie we fragmencie, współczynnik powtarzalności wyniku, oraz informację czy badany obiekt jest homo czy heterozygotyczny w konkretnym locus. Plik będzie zawierał wszystkie odczyty dla badanego obiektu.
- komentarz do uzyskanego wyniku analizy zostanie umieszczony w bazie danych EGISET w postaci pliku w formacie pdf powiązanego z badanym obiektem (W komentarzu zostaną podane następujące informacje: numer akcesyjny obiektu, gatunek, data uzyskania wyniku, autorzy, miejsce uzyskania wyniku, wyjaśnienie skrótów występujących w pliku zawierającym surowe wyniki, wyniki po obróbce statystycznej tj. współczynniki heterozygotyczności, współczynnik wsobności, liczba loci/chromosom, dane bibliograficzne publikacji po jej ukazaniu się i jej cząstkowe wyniki tj. np. dystans genetyczny w stosunku do innych badanych obiektów, współczynnik polimorfizmu PIC.)
Planowany na 2021 r. miernik dla zadania 1.5:
- Liczba publikacji - 2
- Liczba gatunków/obiektów oznaczonych – 20
- Liczba obiektów opisanych molekularnie na rzecz hodowli – 180