Kolokwium

Author

Dariusz Majerek

Published

May 13, 2026

Important

W rozwiązaniach należy uzasadniać wybory metodyczne, interpretować wyniki oraz dbać o powtarzalność analiz. Polecenia opisują wymagany efekt analizy, ale nie wskazują szczegółowej ścieżki implementacyjnej.

Prześlij skompilowany plik .html przez Teams. Oceniane będą zarówno poprawność merytoryczna, jak i jakość prezentacji wyników.

Maksymalnie można uzyskać 100 punktów.

Zadanie 1. Testowanie hipotez metodami bootstrapowymi i permutacyjnymi

Zbiór danych: cat_adoption z pakietu modeldata.

Problem badawczy: sprawdź, czy koty o czarnym umaszczeniu różnią się czasem oczekiwania na adopcję od pozostałych kotów. Analizę oprzyj na zmiennej time, zmiennej black oraz informacji o zaobserwowaniu adopcji w event.

Wykonaj:

  • Sformułuj precyzyjne pytanie badawcze, hipotezę zerową i alternatywną oraz określ, jaka cecha rozkładu czasu adopcji będzie porównywana (4 pkt).
  • Przygotuj dane do analizy, wyjaśniając sposób potraktowania obserwacji bez zaobserwowanej adopcji oraz uzasadniając ewentualne filtrowanie lub transformacje zmiennych (4 pkt).
  • Wyznacz estymatę obserwowanej różnicy między grupami i przedstaw ją w czytelnej postaci liczbowej oraz graficznej (4 pkt).
  • Zbuduj bootstrapowy przedział ufności dla wybranej miary różnicy i zinterpretuj go w kontekście pytania badawczego (5 pkt).
  • Przeprowadź test permutacyjny dla tej samej hipotezy i zinterpretuj otrzymaną wartość p-value (5 pkt).
  • Porównaj wniosek z procedury bootstrapowej i permutacyjnej, wskazując ograniczenia przyjętego podejścia (3 pkt).

Razem: 25 pkt

Zadanie 2. Rozbudowany preprocessing, porównanie workflowów i testy jakości

Zbiór danych: hotel_rates z pakietu modeldata.

Problem modelowania: przewiduj średnią cenę pokoju (avg_price_per_room) na podstawie pozostałych informacji o rezerwacji hotelowej.

Wymagania ogólne:

  • Porównaj 3 różne modele: model drzewiasty (drzewo decyzyjne lub ensemble), model oparty na splajnach oraz model SVM.
  • Dla każdego modelu zastosuj 3 różne reguły preprocessingu, prowadzące do dziewięciu workflow (krosujemy każdy z każdym).
  • Każda reguła preprocessingu ma reprezentować inny pomysł analityczny, np. konserwatywne czyszczenie danych, agresywną inżynierię cech lub redukcję wymiaru.
  • Najlepsze dopasowanie ma zostać wybrane nie tylko na podstawie średniej metryki, ale także z użyciem formalnego porównania wyników z resamplingu.

Wykonaj:

  • Zaprojektuj podział danych i schemat resamplingu odpowiedni dla problemu predykcji ceny, uzasadniając sposób kontroli optymizmu oceny (4 pkt).
  • Zdefiniuj trzy konkurencyjne reguły preprocessingu; każda musi zawierać obróbkę braków danych, zmiennych nominalnych, zmiennych liczbowych, predyktorów rzadkich lub problematycznych oraz co najmniej jeden krok inżynierii cech (8 pkt).
  • Zbuduj komplet dziewięciu workflowów powstałych z połączenia trzech modeli i trzech reguł preprocessingu (6 pkt).
  • Oceń wszystkie workflowy w tym samym schemacie resamplingu, wykorzystując co najmniej trzy metryki jakości właściwe dla regresji (5 pkt).
  • Przedstaw ranking workflowów oraz wizualizację pokazującą stabilność wyników między resamplami (5 pkt).
  • Przeprowadź formalne testy różnic jakości między najlepszym workflowem a najważniejszymi konkurentami, uwzględniając sparowany charakter wyników z resamplingu (6 pkt).
  • Wybierz model końcowy, oceń go na danych odłożonych i opisz, czy wyniki testów z resamplingu są spójne z oceną końcową (6 pkt).

Razem: 40 pkt

Zadanie 3. Tuning, metoda wyścigów i wybór konfiguracji na podstawie testów

Zbiór danych: hepatic_injury_qsar z pakietu modeldata.

Problem modelowania: przewiduj poziom uszkodzenia wątroby (class) na podstawie predyktorów z badań biologicznych. Dane mają wiele predyktorów, a klasy nie są równoliczne, dlatego wybór metryk i procedury walidacji musi być uzasadniony.

Wymagania ogólne:

  • Użyj dwóch interesujących rodzin modeli klasyfikacyjnych, z których jedna będzie dostrajana przez regularną siatkę, a druga przez metodę wyścigów.
  • W obu rodzinach modeli dostrajaj więcej niż jeden hiperparametr.
  • Ostateczny wybór konfiguracji ma uwzględniać formalne porównanie wyników z resamplingu, a nie wyłącznie najwyższą średnią metrykę.

Wykonaj:

  • Przygotuj dane do wieloklasowego problemu klasyfikacyjnego, uzasadniając sposób potraktowania nierównowagi klas, predyktorów o małej zmienności i silnie zależnych predyktorów (5 pkt).
  • Zaprojektuj schemat resamplingu i zestaw metryk, które pozwolą ocenić jakość klasyfikacji wieloklasowej w warunkach nierównych liczebności klas (5 pkt).
  • Dla pierwszej rodziny modeli przygotuj regularną siatkę hiperparametrów, przeprowadź tuning i przedstaw wpływ najważniejszych hiperparametrów na jakość modelu (6 pkt).
  • Dla drugiej rodziny modeli przeprowadź tuning metodą wyścigów, pokazując, które konfiguracje zostały utrzymane do końca procedury i jak zmieniała się liczba kandydatów (6 pkt).
  • Porównaj najlepsze konfiguracje z obu procedur za pomocą formalnych testów na wynikach resamplingu, wskazując zwycięzcę i konfiguracje praktycznie nierozróżnialne statystycznie (7 pkt).
  • Sfinalizuj wybraną konfigurację, oceń ją na danych odłożonych i przedstaw macierz pomyłek wraz z interpretacją najważniejszych błędów klasyfikacji (4 pkt).
  • Podsumuj, czy metoda wyścigów dała korzyść praktyczną względem pełnego przeszukiwania siatki w tym zadaniu (2 pkt).

Razem: 35 pkt