Seminarium Magisterskie – Semestr Zimowy 2015/2016

Opracowanie pytań egzaminacyjnych.

  1. Mapowanie diagramu klas na model relacyjny. P01-RafałDrozd
  2. Rodzaje asocjacji w diagramie klas i ich implementacje. P02-RafałDrozd
  3. Modelowanie dynamiki systemu informatycznego. P03-RafałDrozd
  4. Fragmenty w diagramie sekwencji. P04-RafałDrozd
  5. Rodzaje bloków w PL/SQL. P05-LukaszBalicki
  6. Kolekcje w PL/SQL. P06-LukaszBalicki
  7. Definicja zbioru rozmytego, rodzaje funkcji przynależności i stopień przynależności. P07-LukaszBalicki
  8. Charakterystyczne parametry zbioru rozmytego, pozioma i pionowa reprezentacja zbioru rozmytego. P08-LukaszBalicki
  9. Podstawowe rodzaje modeli rozmytych. P09-PawełChitruszko
  10. Etapy procesu sterowania rozmytego. P10-PawełChitruszko
  11. Sieci przepływowe: algorytmy i ich zastosowania. P11-PawełChitruszko
  12. Złożone struktury danych: B-drzewa i kopce.
  13. Algorytmy dla maszyny PRAM. P13-DanielGolubiewski
  14. Porównanie algorytmów wyszukiwania najkrótszych ścieżek między wierzchołkami grafu. P14-DanielGolubiewski
  15. Struktura systemu ekspertowego. P15-DanielGolubiewski
  16. Reprezentacje wiedzy w systemach ekspertowych. P16-DanielGolubiewski
  17. Geometryczny (macierzowy) opis łańcuchów Markowa. P17-AdamDługoborski
  18. Odległości nieeuklidesowe na przestrzeniach rzutowych. P18-AdamDługoborski
  19. Wielomiany Bernsteina: interpretacja probabilistyczna, graficzne zastosowania. P19-AdamDługoborski
  20. Fourierowska analiza sygnałów: podstawowe definicje, własności, zastosowania. P20-AdamDługoborski
  21. Co to jest uwierzytelnianie i jakie metody się do tego stosuje. P21-JakubKudrycki
  22. Omówić cechy informacji: poufność, nienaruszalność, autentyczność, niezaprzeczalność. P22-JakubKudrycki
  23. Zarządzanie ryzykiem i jakością w projekcie informatycznym. P23-JakubKudrycki
  24. Uruchomienie projektu informatycznego. P24-JakubKudrycki
  25. Programowanie refleksyjne. P25-JustynaKorycińska
  26. Dziedziczenie wielobazowe – zalety i wady. P26-JustynaKorycińska
  27. Klasyfikacja i zastosowania systemów wielomodalnych. P27-JustynaKorycińska
  28. Kompresja danych – kompresja stratna i bezstratna (charakterystyka). P28-JustynaKorycińska
  29. Poprawność składniowa i strukturalna dokumentu XML. P29-DawidGałecki
  30. Język XML i jego wybrane aplikacje. P30-DawidGałecki
  31. Podstawowe wytyczne Web Usability. P31-DawidGałecki
  32. Metody badania użyteczności stron WWW. P32-DawidGałecki
  33. Omówić budowę i zasadę działania nawigacji satelitarnej na przykładzie NAVSTAR-GPS. Pytanie_33-RafalGolc
  34. Omówić architekturę oraz strukturę przestrzenną sieci komórkowej na przykładzie GSM. Pytanie_34-RafalGolc
  35. Przykładowe zastosowania algorytmów optymalizacji globalnej. Pytania_35_36-RafalGolc
  36. Schemat działania algorytmów ewolucyjnych wraz z rodzajami kodowania, selekcji, krzyżowania i mutacji. Pytania_35_36-RafalGolc
  37. Omówić podstawowe informacje o technologii Web Service.
  38. Omówić podstawy eksploracji sieci WWW. P38-PiotrLulewicz
  39. Struktura platformy e-learningowej. P39-PiotrLulewicz
  40. Zasady tworzenia kursu e-learningowego. P40-PiotrLulewicz
  41. Omówić istotę i przeznaczenie frameworków internetowych na wybranym przykładzie.
  42. Architektoniczny wzorzec projektowy MVC.
  43. Standardy i technologie wykorzystywane w mobilnych aplikacjach hybrydowych. P43-PawełKamieński
  44. Funkcje systemu mobilnego. P44-PawełKamieński
  45. Interfejs użytkownika w systemie Android na podstawie wybranych kontrolek. P45-46-PawełKamieński
  46. Formaty danych wykorzystywane w aplikacjach mobilnych. P45-46-PawełKamieński
  47. Struktura Adaptacyjnego Internetowego Systemu Multimedialnego. P47-AdrianFiedorowicz
  48. Style uczenia się i strategie nauczania wykorzystywane w Adaptacyjnych Internetowych Systemach Multimedialnych. P48-AdrianFiedorowicz
  49. Omówić sposoby zbierania danych i wybrane analizy jakościowe danych internetowych. P49-AdrianFiedorowicz
  50. Kluczowe elementy skutecznej strategii analizy danych internetowych. P50-AdrianFiedorowicz

 

Bioinformatyka – zima 2015

Informacja o zaliczeniu.

Będzie przeprowadzone w formie testu pisemnego. Wszystkie rodzaje pytań, które mogą się pojawić na teście są podane tutaj – w wykazie pytań zaliczeniowych . Uwaga – niektóre pytania w teście mogą być nieco inaczej sformułowane, ale dla ich rozwiązania trzeba będzie wykazać się dokładnie tą samą znajomością zagadnień.  Uczenie się odpowiedzi na pamięć nie jest wskazane.

Materiały do wykładu

Wykład 1: Wstęp do biologii molekularnej i analizy sekwencji

Bryk z biologii molekularnej

Wstęp do analizy sekwencji

Wykład 2: Algorytm Smitha Watermana – implementacja w Pythonie

Prezentacja

Implementacja – moduł SW_clean.py

Wykład 3: R – Język Programowania – Środowisko Modelowania Statystycznego

Prezentacja

Wykład 4: R – Elementy języka programowania

Prezentacja

Wykład 5: Bioconductor

Prezentacja

Wykład 6: Bioconductor – wykorzystanie w analizie sekwencji RNA

Prezentacja

Wykład 7: Uczenie maszynowe w bioinformatyce

Prezentacja

Pytania egzaminacyjne – wielkie zbiory danych (plus wyjaśnienia)

  1. Opisz krótko w jaki sposób odbywa się sekwencjonowanie genomów.
  2. Na czym polega metoda sekwencjonowania Sangera?
  3. Na czym polegają główne różnice między metodami sekwencjonowania Sangera i Iluminy
  4. Jaki są biologiczne ograniczenia metod sekwencjonowania
  5. Czym się różni od strony algorytmicznej sekwencjonowanie de novo od sekwencjonowania powtórnego znanego genomu?

Uwaga:

Przedstawione pytania (z trzech list) to wyczerpująca lista wszystkich możliwych pytań jakie mogą paść na egzaminie. Są oparte wyłącznie o wiedzę z materiałów dostępnych na stronie lub uzupełnioną na ćwiczeniach. W pytaniu egzaminacyjnym mogą pojawić się inne wartości liczbowe, inne stałe tekstowe lub inny zbiór danych (np. zbiór iris będzie zastąpiony zbiorem tulips, gdzie wystąpią inne odmiany i inne nazwy zmiennych), natomiast istota pytania będzie ta sama.

Na teście zaliczeniowym będzie 15 pytań. Odpowiedzi mają być zwięzłe i krótkie – jedno lub dwa zdania, ewentualnie podanie właściwego polecenia w R. Dobrze przygotowany student powinien być w stanie odpowiedzieć na wszystkie pytania w 15 minut, ale damy cały dostępny czas.

Przykład pytania i odpowiedzi:

  1. Na czym polega różnica między klasami POSIXct i POSIXlt

Klasa POSIXct przedstawia czas w postaci liczby sekund jakie minęły od umownego początku czasu w systemie UNIX, czyli 1.01.1970. Klasa POSIXlt przedstawia czas w sposób wygodny dla człowieka w postaci listy nazwanych wektorów przechowujacych czas  sekundy, minuty, godziny, dzień miesiaca, rok oraz dodatkowo, dzień tygodnia, dzień roku itd.

Pytania zaliczeniowe – część druga – R

    1. Co to znaczy, że R jest językiem funkcyjnym.
    2. Co to znaczy, że R jest językiem wektorowym
    3. Co to znaczy, że R jest językiem obiektowym
    4. Wymień zalety języka i środowiska R jako narzędzia do analizy danych
    5. Wymień i opisz działanie wszystkich operatorów przypisania w języku R
    6. Zaproponuj sposób utworzenia trzyelementowego wektora składającego się z napisów ”Ala”,”ma”,”kota”
    7. Zaproponuj sposób utworzenia wektora składającego się z liczb 1, 3, 11
    8. Zaproponuj sposób utworzenia wektora składającego się ze wszystkich liczb całkowitych od -22 do 33.
    9. Zaproponuj sposób utworzenia wektora składającego się z 22 liczb zaczynających się od 1.17, takich że każda następna jest większa od poprzedniej o 0.41.
    10. Zaproponuj sposób utworzenia trzyelementowej listy składającej się z napisów ”Ala”,”ma”,”kota”
    11. Masz tablicę zdefiniowaną jako> Team2Imie Nazwisko PrzedmiotOcenaKolokwiumOcenaEgzamin

      student1 „Adam” „Abacki” „Bioinformatyka” „5” „5”

      student2 „Bogdan” „Babacki” „Bioinformatyka” „4” „4”

      student3 „Cezary” „Ceowiak” „Bioinformatyka” „3” „5″

      Podaj dwa sposoby na przypisanie zawartości kolumny OcenaKolokwium na zmienną OK (Wskazówka użyj różnych sposobów odwoływania się do kolumny).

    12. Masz tablicę zdefiniowaną powyżej. Policz średnią z kolumny OcenaEgzamin.
    13. Masz tablicę zdefiniowaną powyżej. Wybierz nazwiska studentów, którzy mają ocenę wyższą niż 4.
    14. Utwórz próbę losową z liczb naturalnych z przedziału <1, 1000>, liczba elementów próbyZnany zbiór iris składa się ze 150 obiektów z trzech klas {setosa,versicolor,virginica} opisanych czterema zmiennymi { Sepal.Length, Sepal.Width, Petal.Length, Petal.Width}. Zbiór jest dostępny w języku R jako ramka danych (data.frame).> str(iris)

      ‚data.frame': 150 obs. of  5 variables:

      $ Sepal.Length: num  5.1 4.9 4.7 4.6 5 5.4 4.6 5 4.4 4.9 …

      $ Sepal.Width : num  3.5 3 3.2 3.1 3.6 3.9 3.4 3.4 2.9 3.1 …

      $ Petal.Length: num  1.4 1.4 1.3 1.5 1.4 1.7 1.4 1.5 1.4 1.5 …

      $ Petal.Width : num  0.2 0.2 0.2 0.2 0.2 0.4 0.3 0.2 0.2 0.1 …

      $ Species     : Factor w/ 3 levels „setosa”,”versicolor”,..: 1 1 1 1 1 1 1 1 1 1 …

      Klasy są równoliczne i umieszczone w zbiorze w sposób uporządkowany:

      > iris[c(1,50,51,100,101,150),]

      Sepal.Length Sepal.Width Petal.Length Petal.Width    Species

      1            5.1         3.5          1.4         0.2     setosa

      50           5.0         3.3          1.4         0.2     setosa

      51           7.0         3.2          4.7         1.4 versicolor

      100          5.7         2.8          4.1         1.3 versicolor

      101          6.3         3.3          6.0         2.5  virginica

      150          5.9         3.0          5.1         1.8  virginica

    15. Podaj komendę R, która wyświetli co drugi wiersz w zakresie od 33 do 66, pierwszym wierszem ma być wiersz 33.
    16. Podaj komendę R, która poda średnią wartość zmiennej Sepal.Width dla wszystkich klas.
    17. Podaj dwie komendy R, która zwrócą średnią wartość dla klasy setosa.
    18. Podaj komendę R, która spowoduje utworzenie w zbiorze iris nowej kolumny, zawierającej średnią ze zmiennych  Sepal.Length i Sepal.Width.
    19. Podaj komendę R, która wyświetli zawartość zbioru w postaci graficznej, jako wykres punktowy dla każdej pary zmiennych.
    20. Podaj komendę R, która wyświetli wykres punktowy dla pary zmiennych Sepal.Length i Sepal.Width.
    21. Podaj komendę R, która wyświetli wykres punktowy dla pary zmiennych Petal.Length i Petal.Width. Ustaw parametr col, tak aby obiety różnych klas były narysowane różnymi kolorami.
    22. Podaj komendę R, która wyswietli wykres pudełkowy dla 4 zmiennych opisowych w obiekcie iris.
    23. Podaj komendę R, która wyświetli wykres pudełkowy dla zmiennej Petal.Length, dla każdej klasy oddzielnie, tak jak na poniższym rysunku:
    24. PytEgz_ryc01Podaj komendę R, która wyświetli histogram dla zmiennej Petal.Width
    25. Podaj komendę R, która przeprowadzi test hipotezy, że wartości zmiennej Petal.Width dla klasy setosa są różne od wartości tej zmiennej dla klasy virginica.
    26. Podaj komendę R, która zbudoje model liniowy, w którym zmienną niezależną będzie Petal.Width a zmienną zależną Petal.Length. Model ma być zapisany w zmiennej LinMode.result
    27. Wektor myVec został utworzony następującym poleceniem:
      myVec<-1:30.
      Podaj polecenie, które utworzy z wektora myVec macierz dwuwymiarową, z pięcioma wierszami i sześcioma kolumnami.
    28. Jakie będą wartości w pierwszej kolumnie, a jakie w pierwszym wierszu.
    29. Wektor myVec został utworzony następującym poleceniem:myVec<-1:30.

      Podaj polecenie, które utworzy z wektora myVec macierz trójwymiarową, z trzema warstwami, pięcioma wierszami i dwiema kolumnami.

      Jakie będą wartości w pierwszej kolumnie, a jakie w pierwszym wierszu, w pierwszej warstwie

    30. Zaproponuj sekwencję poleceń w R, które zmierzą czas wykonywania funkcji whatever w poniższym kodzie:MyArgs<-prepareArgs()

      whatever(MyArgs)->Result

      summary(Result)

    31. Na czym polega różnica między klasami POSIXct i POSIXlt

Pytania zaliczeniowe – część pierwsza – podstawy biologiczne

Podaję listę pytań obowiązujących na zaliczeniu egzaminu z bioinformatyki.

W części pierwszej podstawowe pojęcia z dziedziny biologii, którymi operuje bioinformatyka

    1. Co to jest DNA
    2. Co to jest RNA
    3. Co to jest białko
    4. Opisz zwiężle strukturę DNA
    5. Opisz zwięźle strukturę RNA
    6. Co to jest Centralny Dogmat Biologii Molekularnej
    7. Co to jest kod genetyczny
    8. Ile jest standardowych aminokwasów
    9. Co to jest kodon i ile ich jest
    10. Podaj przynajjmniej jeden podział aminokwasów na różne grupy
    11. Co to jest
      • pierwszorzędowa struktura białek
      • drugorzędowa struktura białek
      • trzeciorzędowa struktura białek
      • czwartorzędowa struktura białek
    12. Wyjaśnij pojęcia
      • transkrypcja
      • translacja
    13. Co to jest przyrównanie (alignment) dwóch sekwencji
    14. Jakie są wersje przyrównania (alignment)
    15. Podaj algorytm Needlemana-Wunscha
    16. Podaj algorytm Smitha-Watermana
    17. Naszkicuj schemat algorytmu BLAST
    18. Czym różni się algorytm Needlemana-Wunscha od algorytmu Smitha-Watermana
    19. Do czego przede wszystkim używamy algorytmów Smitha-Watermana i BLAST
    20. Jak robimy ocenę jakości wyników algorytmu BLAST
    21. Jakie są warianty programu BLAST i z czego to wynika
    22. Czemu należy w miarę możliwości tłumaczyć sekwencje nukleotydowe na białkowe
    23. Jakie są rodzaje struktur drugorzędowych w białkach
    24. Ile (rząd wielkości) struktur przestrzennych białek jest zdeponowanych w bazie PDB
    25. Ile (rząd wielkości) różnych sekwencji białek jest zdeponowanych w bazie Uniprot/Trembl
    26. Dlaczego modelowanie struktury przestrzennej białek jest ważne
    27. Podaj trzy główne klasy metod przewidywania struktury przestrzennej białek.
    28. Co to jest ekspresja genów
    29. Jak eksperymentalnie mierzymy poziom ekspresji genów

Bioinformatyka

Semestr letni rok akademicki 2014/2015

Materiały pomocnicze:

Wykład 1:  Bioinformatyka_wyk01_biologia

Wykład 2, część 1:  Bioinformatyka_wyk02a_sekwencje

Wykład 2, część 2:  Bioinformatyka_wyk02b_blast

Wykład 3:  Bioinformatyka_wyk03_bialka

Wykład 4:  Bioinformatyka_wyk04_RNA

Wykład 5:  Bioinformatyka_wyk05_R

Wykład 6: Wykład 6

Wykład 7: Bioinformatyka_wyk07_R

Materiały doćwiczeń 19 maja 2015

Zadania

Seria CO2

Seria Sea Ice

Seria TempAnomalies

Zadania z 2 czerwca 2015:

Zadania_2_06

seq1.fasta

seq2.fasta

Zadania z 9 czerwca 2015:

Zadania_9_06

seq1.fasta

seq2.fasta

Zadania treningowe do zaliczenia:

Zadania_koncowe