STATYSTYCZNE METODY PRZETWARZANIA DANYCH

Tomasz Wieczorkowski indeks: 159981

  • Zadanie 1
    Napisz program realizujący klasyfikator minimalno-odległościowy. Oblicz liczbę błędów dla zbioru testującego zakładając, że zbiór konstrukcyjny stanowi pierwsze 50% obiektów, wybranych z każdej klasy z zadanego zbioru. Pozostałe obiekty tworzą zbiór testujący.

  • Zadanie 2
    Napisz program do klasycznej i medianowej standaryzacji zbioru

  • Zadanie 3
    Napisz program do losowego podziału zadanego zbioru uczącego na dwa podzbiory: zbiór konstrukcyjny i zbiór testujący. Liczebności klas zbioru uczącego powinny być policzone i wyświetlone na ekranie. Liczebności las zbioru konstrukcyjnego powinny być zadawane, a liczebności klas zbioru testującego tylko wyświetlane na ekranie.

  • Zadanie 5
    Zaimplementuj algorytm 1-NN z wykorzystaniem metryki euklidesowej.
    Program powinien przyjmować jako parametry (wymagane zadanie 3): oraz dokonywać pomiaru czasowego fazy klasyfikacji i wyświetlać wynik klasyfikacji w postaci procentowej wartości poprawnie rozpoznanych obiektów ze zbioru testującego.

  • Zadanie 6
    Napisz procedurę testowania "minus jednego elementu". Procedura ta umożliwia ocenę zastosowanej metody bez użycia zbioru walidacyjnego. W tym zadaniu oceniać będziemy dwa klasyfikatory 1-NN, pierwszy z metryką euklidesową, drugi z metryką miejską. Po wyborze lepszego klasyfikatora, proszę o końcowe przetestowanie go zbiorem testującym.


    Politechnika Łódzka
    Łódź 2010