Podsumowanie testu

Programowanie systemów rozproszonych

Podsumowanie testu

Programowanie systemów rozproszonych

Twój wynik

Rozwiąż ponownie
Moja historia
Pytanie 1
Przycinanie drzew decyzyjnych stosuje się w celu:
eliminacji zmiennych nieistotnych
ponownego przeprowadzenia podziału w miejscu cięcia
redukcji liczby klas
uniknięcia przeuczenia i skomplikowania modelu
Pytanie 2
Przyjęcie metryki L1 (metryki Manhattan) sprawia, że okręgi przyjmują kształt:
kardioid
elips
rombów
trójkątów
Pytanie 3
Algorytmy genetyczne (ewolucyjne) służa generalnie do realizacji zadań:
optymalizacji
eksploracji danych zapisanych w chromosomach roślin i zwierząt
poszukiwania reguł asocjacyjnych
regresji
Pytanie 4
Rolą pojedynczego neuronu w warstwie perceptronu użytego do klasyfikacji jest:
klasyfikacja pojedynczej cechy wejściowej
podział przestrzeni wejść na dwie półprzestrzenie
ozpoznawanie jednej ze znanych klas w zbiorze
rozpoznawanie jednego przypadku w zbiorze
Pytanie 5
Technika k-krotnej walidacji krzyżowej służy do:
ustalenia optymalnego momentu przerwania uczenia modelu
uniknięcia tendencyjności w ocenie jakości modelu
klasteryzacji zbioru na k maksymalnie odległych skupień
wyeliminowania wzajemnych zależności między zmiennymi
Pytanie 6
Problem klasyfikacyjny polega na:
ustaleniu optymalnej liczby klas, do których należą obserwacje
poszukiwaniu przypadków najbardziej reprezentacyjnych dla klas
rozróżnianiu obserwowanych cech na wejściowe i wyjściowe
prognozowaniu kategorii obserwacji na podstawie jej cech
Pytanie 7
Klasyczny (perceptronowy) model neuronu posiada dwa wejścia o wagach w1=1, w2=2, na które podano odpowiednio sygnały x1=−1, x2=+1. Funkcja aktywacji jest funkcją liniową postaci y=2x. Sygnał wyjściowy neuronu wynosi:
2
-1
1
0
Pytanie 8
Oryginalna zmienna x przyjmuje trzy wartości: -2, 1, 4. Po przeprowadzeniu normalizacji tej zmiennej wg metody min-max do przedziału [0, 1], oryginalnej wartości 1 odpowiada znormalizowana wartość:
0,5
0,75
1
0,25
Pytanie 9
.Argumentem funkcji aktywacji neuronu typu RBF jest
suma sygnałów x1 + x2 + ... wektora wejściowego x
ważona liczba wejść danego neuronu
iloczyn skalarny wektorów: wejściowego x i wag w
odległość wektorów: wejściowego x i wag w
Pytanie 10
Przeuczenie modelu (overfitting) można rozpoznać po tym, że
liczba błędnie zaklasyfikowanych przypadków spada do 0
trafność predykcji modelu przekracza poziom 99.73%
szybkość uczenia się modelu zaczyna spadać w kolejnych iteracjach
w procesie uczenia zaczyna rosnąć błąd dla próby testowej
Pytanie 11
Na etapie wstępnej eksploracyjnej analizy danych najmniej przydatne jest
wygenerowanie histogramów zmiennych ciągłych
użycie metod nienadzorowanej klasteryzacji
zliczenie wystąpień wartości zmiennych nominalnych
wizualne porównanie współzależności par zmiennych
Pytanie 12
.Iloczyn skalarny wektora cech z pewnym wektorem wag można traktować jako formę
redukcji wymiarowości
obrotu w przestrzeni cech
ekstrakcji cech
regresji liniowej
Pytanie 13
Metoda wzmacniania gradientowego (gradient boosting) służy do
generowania dodatkowych sztucznych próbek w zbiorach uczących
budowania mocnego modelu złożonego z wielu słabszych modeli
zwiększania kontrastu pomiędzy blisko leżącymi klastrami
przyspieszania procesu uczenia głębokich sieci neuronowych
Pytanie 14
Problem klasteryzacyjny polega na
grupowaniu cech obserwacji w skorelowane ze sobą zespoły
predykcji przynależności danej obserwacji do różnych klas
poszukiwaniu granic oddzielających obserwacje różnych klas
algorytmu wstecznej propagacji błędów
identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa
Pytanie 15
Wskaż drugi algorytm (metodę), który służy do rozwiązywania tego samego typu problemów eksploracji danych, co algorytm k-najbliższych sąsiadów
algorytm CART (drzewa klasyfikacyjne i regresyjne)
algorytm Kohonena (sieć neuronowa typu SOM)
algorytm k-średnich
algorytm PCA (analiza głównych składowych)
Pytanie 16
Poszukiwanie zbiorów częstych jest pierwszym etapem
algorytmu k-średnich
algorytmu k-najbliższych sąsiadów
algorytmu A priori
algorytmu wstecznej propagacji błędów
Pytanie 17
Wskaż metodę NIEPRZYDATNĄ w rozwiązywaniu zadań predykcyjnych
sieć neuronowa typu RBF
algorytm k-średnich
liniowa regresja wieloraka
sieć neuronowa typu PERCEPTRON WIELOWARSTWOWY
Pytanie 18
Aglomeracyjne metody klasteryzacji polegają na
stopniowym ograniczaniu klastrów poprzez usuwanie outlierów
przyrostowym budowaniu klastrów poprzez dodawanie sąsiednich punktów
krokowym dodawaniu linii dzielących klastry w optymalnym miejscu
iteracyjnym dzieleniu klastrów na najbardziej odległe połowy
Pytanie 19
Sieć neuronowa Kohonena (SOM) generalnie jest przeznaczona do realizacji
klasyfikacji bezwzorcowej (grupowania)
klasyfikacji wzorcowej
analizy szeregów czasowych
prognozowania lub szacowania wartości
Pytanie 20
Końcowe trzy etapy eksploracji danych w metodologii CRISP-DM to KOLEJNO:
Modelowanie - Wdrożenie - Ewaluacja
Wdrożenie - Ewaluacja - Modelowanie
Modelowanie - Ewaluacja - Wdrożenie
Ewaluacja - Modelowanie - Wdrożenie
Pytanie 21
Pojęcie tensora występujące często w dziedzinie uczenia głębokiego oznacza
wyspecjalizowany rodzaj neuronów przetwarzających obraz
wektor wskazujący kierunek najszybszego spadku błędu sieci
warstwę wejściową rozprowadzającą sygnały do sieci
uogólnienie pojęcia macierzy na wiele wymiarów
Pytanie 22
Metoda K najbliższych sąsiadów wybiera sąsiadów analizowanego punktu
leżących w tym samym wymiarze przestrzeni
należących do tego samego klastra
najbliższych pod względem prognozowanej wartości
najbliższych pod względem cech wejściowych
Pytanie 23
Która z poniższych metod NIE służy do wyznaczania odległości pomiędzy skupieniami:
metoda najdalszego sąsiedztwa
metoda średnich połączeń
metoda pojedynczego wiązania
metoda k-średnich
Pytanie 24
Problem klasyfikacyjny można zamienić na problem regresyjny poprzez:
zmniejszenie liczby wymiarów do dwóch
zamianę zmiennych kategorycznych na ciągłe
prognozowanie stopnia przynależności do klasy
zredukowanie liczby klas do jednej
Pytanie 25
.Algorytm aglomeracyjny rozpoczyna proces analizy od stanu, w którym:
każdy obiekt tworzy osobne skupienie
obiekty są losowo przydzielone do skupień, a liczba skupień jest z góry określana
obiekty podzielone są wstępnie przy użyciu innej metody grupowania
wszystkie obiekty tworzą jedno skupienie
Pytanie 26
Aby wyeliminować tzw. efekt przeuczenia sieci neuronowej (uczenie nadzorowane), należy uznać za optymalny (ostateczny) zbiór wartości wag, otrzymany w momencie:
minimum błędu dla ciągu walidacyjnego
zidentyfikowania minimum lokalnego funkcji błędu uczącego
minimum błędu dla ciągu uczącego
zakończenia działania algorytmu uczącego
Pytanie 27
Istotną WADĄ sieci neuronowych jako modeli eksploracji danych jest
brak zdolności do modelowania zjawisk nieliniowych
nieparametryczność
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
bardzo długi czas reakcji (odpowiedzi) nauczonej sieci
Pytanie 28
W pewnym problemie eksploracji danych zmienna wyjściowa (zależna) przyjmuje 3 możliwe wartości: “biały”, “czerwony”, “niebieski”. Dany problem zaliczamy do zadań:
klasyfikacji bezwzorcowej (grupowania)
klasyfikacji wzorcowej
poszukiwania reguł asocjacyjnych
regresyjnych (szacowanie, predykcja)
Pytanie 29
Hiperparametrami modelu nazywa się parametry, które:
są dopasowywane podczas uczenia do danych wejściowych
opisują wagi połączeń pomiędzy całymi warstwami sieci
mogą zmieniać się w bardzo szerokim zakresie wartości
sterują przebiegiem procesu uczenia modelu
Pytanie 30
Typowy zbiór danych używany do trenowania modeli uczenia maszynowego składa się z:
klas zawierających instancje
obiektów posiadających atrybuty
obserwacji obejmujących cechy
instancji zgrupowanych w kategorie
Pytanie 31
Problem regresyjny polega na:
prognozowaniu wartości na podstawie obserwowanych cech
znajdowaniu prostej najlepiej dopasowanej do obserwacji
dopasowaniu współczynników modelu do obserwacji uczących
poszukiwaniu korelacji między zmiennymi wejściowymi