Proces uczenia sieci neuronowej wiąże się (w kolejnych iteracjach algorytmu uczenia) z modyfikacją:
współczynników funkcji błędu
wag neuronów
wzorców (przykładów) w zbiorze uczącym
współczynników funkcji aktywacji
wag neuronów
MLP to skrót nazwy następującego narzędzia eksploracji danych
sieć neuronowa typu perceptron wielowarstwowy
multiple linear prediction
metoda liniowej prognozy
liniowa regresja wieloraka
sieć neuronowa typu perceptron wielowarstwowy
Liczba warstw UKRYTYCH w sieci neuronowej typu RBF wynosi?
dokładnie 1
dokładnie 4
dokładnie 5
dokładnie 3
dokładnie 1
Typowy zbiór danych używany do trenowania modeli uczenia maszynowego składa się z:
instancji zgrupowanych w kategorie
klas zawierających instancje
obiektów posiadających atrybuty
obserwacji obejmujących cechy
obserwacji obejmujących cechy
Problem regresyjny polega na:
prognozowaniu wartości na podstawie obserwowanych cech
dopasowaniu współczynników modelu do obserwacji uczących
poszukiwaniu korelacji między zmiennymi wejściowymi
znajdowaniu prostej najlepiej dopasowanej do obserwacji
prognozowaniu wartości na podstawie obserwowanych cech
Przycinanie drzew decyzyjnych stosuje się w celu:
redukcji liczby klas
eliminacji zmiennych nieistotnych
uniknięcia przeuczenia i skomplikowania modelu
ponownego przeprowadzenia podziału w miejscu cięcia
uniknięcia przeuczenia i skomplikowania modelu
Przyjęcie metryki L1 (metryki Manhattan) sprawia, że okręgi przyjmują kształt:
kardioid
elips
rombów
Trójkątów
rombów
Rolą pojedynczego neuronu w warstwie perceptronu użytego do klasyfikacji jest:
klasyfikacja pojedynczej cechy wejściowej
podział przestrzeni wejść na dwie półprzestrzenie
rozpoznawanie jednej ze znanych klas w zbiorze
rozpoznawanie jednego przypadku w zbiorze
podział przestrzeni wejść na dwie półprzestrzenie
Problem klasyfikacyjny polega na:
prognozowaniu kategorii obserwacji na podstawie jej cech
rozróżnianiu obserwowanych cech na wejściowe i wyjściowe
ustaleniu optymalnej liczby klas, do których należą obserwacje
poszukiwaniu przypadków najbardziej reprezentacyjnych dla klas
prognozowaniu kategorii obserwacji na podstawie jej cech
Oryginalna zmienna x przyjmuje trzy wartości: -2, 1, 4. Po przeprowadzeniu normalizacji tej zmiennej wg metody min-max do przedziału [0, 1], oryginalnej wartości 1 odpowiada znormalizowana wartość:
0,5
0,75
0,25
1
0,5
Przeuczenie modelu (overfitting) można rozpoznać po tym, że:
szybkość uczenia się modelu zaczyna spadać w kolejnych iteracjach
liczba błędnie zaklasyfikowanych przypadków spada do 0
w procesie uczenia zaczyna rosnąć błąd dla próby testowej - chyba? [ale przeuczenie można rozpoznać po zakończonym uczeniu]
trafność predykcji modelu przekracza poziom 99.73%
w procesie uczenia zaczyna rosnąć błąd dla próby testowej - chyba? [ale przeuczenie można rozpoznać po zakończonym uczeniu]
Problem klasteryzacyjny polega na:
predykcji przynależności danej obserwacji do różnych klas
poszukiwaniu granic oddzielających obserwacje różnych klas
grupowaniu cech obserwacji w skorelowane ze sobą zespoły
algorytmu wstecznej propagacji błędów
identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa
identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa
Metoda K najbliższych sąsiadów wybiera sąsiadów analizowanego punktu:
najbliższych pod względem prognozowanej wartości
należących do tego samego klastra
leżących w tym samym wymiarze przestrzeni
najbliższych pod względem cech wejściowych
najbliższych pod względem cech wejściowych
Która z poniższych metod NIE służy do wyznaczania odległości pomiędzy skupieniami:
metoda najdalszego sąsiedztwa - chyba
metoda k-średnich
metoda pojedynczego wiązania
metoda średnich połączeń
metoda k-średnich
Poszukiwanie zbiorów częstych jest pierwszym etapem:
algorytmu k-najbliższych sąsiadów
algorytmu wstecznej propagacji błędów
algorytmu k-średnich
algorytmu A priori
algorytmu A priori
Problem klasyfikacyjny można zamienić na problem regresyjny poprzez:
zmniejszenie liczby wymiarów do dwóch
prognozowanie stopnia przynależności do klasy
zamianę zmiennych kategorycznych na ciągłe
zredukowanie liczby klas do jednej
zamianę zmiennych kategorycznych na ciągłe
Sieć neuronowa Kohonena (SOM) generalnie jest przeznaczona do realizacji:
klasyfikacji bezwzorcowej (grupowania)
prognozowania lub szacowania wartości
klasyfikacji wzorcowej
analizy szeregów czasowych
klasyfikacji bezwzorcowej (grupowania)
Wskaż drugi algorytm (metodę), który służy do rozwiązywania tego samego typu problemów eksploracji danych, co algorytm k-najbliższych sąsiadów:
algorytm Kohonena (sieć neuronowa typu
algorytm PCA (analiza głównych składowych)
algorytm k-średnich
algorytm CART (drzewa klasyfikacyjne i regresyjne)
algorytm CART (drzewa klasyfikacyjne i regresyjne)
Na etapie wstępnej eksploracyjnej analizy danych najmniej przydatne jest:
wizualne porównanie współzależności par zmiennych
zliczenie wystąpień wartości zmiennych nominalnych
użycie metod nienadzorowanej klasteryzacji
wygenerowanie histogramów zmiennych ciągłych
użycie metod nienadzorowanej klasteryzacji
Klasyczny (perceptronowy) model neuronu posiada dwa wejścia o wagach w1=1, w2=2, na które podano odpowiednio sygnały x1=−1, x2=+1. Funkcja aktywacji jest funkcją liniową postaci y=2x. Sygnał wyjściowy neuronu wynosi: