Pojęcie tensora występujące często w dziedzinie uczenia głębokiego oznacza
wektor wskazujący kierunek najszybszego spadku błędu sieci
wyspecjalizowany rodzaj neuronów przetwarzających obraz
uogólnienie pojęcia macierzy na wiele wymiarów
warstwę wejściową rozprowadzającą sygnały do sieci
uogólnienie pojęcia macierzy na wiele wymiarów
Metoda K najbliższych sąsiadów wybiera sąsiadów analizowanego punktu
najbliższych pod względem cech wejściowych
najbliższych pod względem prognozowanej wartości
leżących w tym samym wymiarze przestrzeni
należących do tego samego klastra
najbliższych pod względem prognozowanej wartości
Która z poniższych metod NIE służy do wyznaczania odległości pomiędzy skupieniami:
metoda pojedynczego wiązania
metoda k-średnich
metoda średnich połączeń
metoda najdalszego sąsiedztwa
metoda k-średnich
Problem klasyfikacyjny można zamienić na problem regresyjny poprzez:
zmniejszenie liczby wymiarów do dwóch
prognozowanie stopnia przynależności do klasy
zredukowanie liczby klas do jednej
zamianę zmiennych kategorycznych na ciągłe
zamianę zmiennych kategorycznych na ciągłe
.Algorytm aglomeracyjny rozpoczyna proces analizy od stanu, w którym:
każdy obiekt tworzy osobne skupienie
obiekty podzielone są wstępnie przy użyciu innej metody grupowania
wszystkie obiekty tworzą jedno skupienie
obiekty są losowo przydzielone do skupień, a liczba skupień jest z góry określana
każdy obiekt tworzy osobne skupienie
Aby wyeliminować tzw. efekt przeuczenia sieci neuronowej (uczenie nadzorowane), należy uznać za optymalny (ostateczny) zbiór wartości wag, otrzymany w momencie:
zidentyfikowania minimum lokalnego funkcji błędu uczącego
minimum błędu dla ciągu walidacyjnego
minimum błędu dla ciągu uczącego
zakończenia działania algorytmu uczącego
minimum błędu dla ciągu walidacyjnego
Istotną WADĄ sieci neuronowych jako modeli eksploracji danych jest
brak zdolności do modelowania zjawisk nieliniowych
bardzo długi czas reakcji (odpowiedzi) nauczonej sieci
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
nieparametryczność
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
W pewnym problemie eksploracji danych zmienna wyjściowa (zależna) przyjmuje 3 możliwe wartości: “biały”, “czerwony”, “niebieski”. Dany problem zaliczamy do zadań:
klasyfikacji bezwzorcowej (grupowania)
regresyjnych (szacowanie, predykcja)
poszukiwania reguł asocjacyjnych
klasyfikacji wzorcowej
klasyfikacji wzorcowej
Hiperparametrami modelu nazywa się parametry, które:
mogą zmieniać się w bardzo szerokim zakresie wartości
opisują wagi połączeń pomiędzy całymi warstwami sieci
sterują przebiegiem procesu uczenia modelu
są dopasowywane podczas uczenia do danych wejściowych
sterują przebiegiem procesu uczenia modelu
Typowy zbiór danych używany do trenowania modeli uczenia maszynowego składa się z:
obiektów posiadających atrybuty
instancji zgrupowanych w kategorie
obserwacji obejmujących cechy
klas zawierających instancje
obserwacji obejmujących cechy
Problem regresyjny polega na:
prognozowaniu wartości na podstawie obserwowanych cech
znajdowaniu prostej najlepiej dopasowanej do obserwacji
poszukiwaniu korelacji między zmiennymi wejściowymi
dopasowaniu współczynników modelu do obserwacji uczących
prognozowaniu wartości na podstawie obserwowanych cech