Pojęcie tensora występujące często w dziedzinie uczenia głębokiego oznacza
warstwę wejściową rozprowadzającą sygnały do sieci
uogólnienie pojęcia macierzy na wiele wymiarów
wyspecjalizowany rodzaj neuronów przetwarzających obraz
wektor wskazujący kierunek najszybszego spadku błędu sieci
uogólnienie pojęcia macierzy na wiele wymiarów
Metoda K najbliższych sąsiadów wybiera sąsiadów analizowanego punktu
leżących w tym samym wymiarze przestrzeni
najbliższych pod względem prognozowanej wartości
najbliższych pod względem cech wejściowych
należących do tego samego klastra
najbliższych pod względem prognozowanej wartości
Która z poniższych metod NIE służy do wyznaczania odległości pomiędzy skupieniami:
metoda k-średnich
metoda średnich połączeń
metoda najdalszego sąsiedztwa
metoda pojedynczego wiązania
metoda k-średnich
Problem klasyfikacyjny można zamienić na problem regresyjny poprzez:
prognozowanie stopnia przynależności do klasy
zamianę zmiennych kategorycznych na ciągłe
zmniejszenie liczby wymiarów do dwóch
zredukowanie liczby klas do jednej
zamianę zmiennych kategorycznych na ciągłe
.Algorytm aglomeracyjny rozpoczyna proces analizy od stanu, w którym:
obiekty są losowo przydzielone do skupień, a liczba skupień jest z góry określana
wszystkie obiekty tworzą jedno skupienie
obiekty podzielone są wstępnie przy użyciu innej metody grupowania
każdy obiekt tworzy osobne skupienie
każdy obiekt tworzy osobne skupienie
Aby wyeliminować tzw. efekt przeuczenia sieci neuronowej (uczenie nadzorowane), należy uznać za optymalny (ostateczny) zbiór wartości wag, otrzymany w momencie:
zidentyfikowania minimum lokalnego funkcji błędu uczącego
minimum błędu dla ciągu walidacyjnego
minimum błędu dla ciągu uczącego
zakończenia działania algorytmu uczącego
minimum błędu dla ciągu walidacyjnego
Istotną WADĄ sieci neuronowych jako modeli eksploracji danych jest
brak zdolności do modelowania zjawisk nieliniowych
bardzo długi czas reakcji (odpowiedzi) nauczonej sieci
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
nieparametryczność
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
W pewnym problemie eksploracji danych zmienna wyjściowa (zależna) przyjmuje 3 możliwe wartości: “biały”, “czerwony”, “niebieski”. Dany problem zaliczamy do zadań:
klasyfikacji bezwzorcowej (grupowania)
klasyfikacji wzorcowej
poszukiwania reguł asocjacyjnych
regresyjnych (szacowanie, predykcja)
klasyfikacji wzorcowej
Hiperparametrami modelu nazywa się parametry, które:
mogą zmieniać się w bardzo szerokim zakresie wartości
sterują przebiegiem procesu uczenia modelu
opisują wagi połączeń pomiędzy całymi warstwami sieci
są dopasowywane podczas uczenia do danych wejściowych
sterują przebiegiem procesu uczenia modelu
Typowy zbiór danych używany do trenowania modeli uczenia maszynowego składa się z:
obserwacji obejmujących cechy
obiektów posiadających atrybuty
klas zawierających instancje
instancji zgrupowanych w kategorie
obserwacji obejmujących cechy
Problem regresyjny polega na:
dopasowaniu współczynników modelu do obserwacji uczących
poszukiwaniu korelacji między zmiennymi wejściowymi
znajdowaniu prostej najlepiej dopasowanej do obserwacji
prognozowaniu wartości na podstawie obserwowanych cech
prognozowaniu wartości na podstawie obserwowanych cech