Zadanie 1

Na podstawie zbioru jedzenie.txt dokonaj analizy skupień krajów europejskich pod kątem stylu żywienia.

Przeprowadź najpierw analizę hierarchiczną aby ocenić właściwą liczbę skupień, wyrysuj dendrogram podziału, przedstaw wyniki kryteriów liczby skupień (silhouette, wss i gap_stat). Sprawdź na ile pokrywa się to z Twoim wyborem liczby skupień.

Następnie przeprowadź analizę skupień niehierarchiczną (k-medoid).

Wykreśl podział państw w przestrzeni PCA (2 lub 3 składowe - do 3 będzie potrzebny pakiet plotly, na wykresie ma być widać nazwy państw). Oceń czy można na podstawie powstałych grup powiedzieć coś o specyfice diety stosowanej przez państwa danego skupienia.

Zadanie 2

W zbiorze Congressional_Voting.xlsx znajdują się informacje na temat głosowań poszczególnych senatorów. Czy na podstawie zajętego stanowiska w tych sprwach da się zaklasyfikować kongresmena do właściwej partii (Class)?. Przeprowadź analizę dyskryminacji z podziałem na próbę uczącą i testową (jądro generatora 2025 i proporcja 2/3). Oceń jakość klasyfikacji oraz przeprowadź część kanoniczną analizy dyskryminacji. Na jej podstawie oceń, które zmienne mają największy wkład w decyzję o przynależności partyjnej.