Podsumowanie

Egzamin uek 2022 PSI

Podsumowanie

Egzamin uek 2022 PSI

Twój wynik

Rozwiąż ponownie
Moja historia
Pytanie 1
Proces uczenia sieci neuronowej wiąże się (w kolejnych iteracjach algorytmu uczenia) z modyfikacją:
wzorców (przykładów) w zbiorze uczącym
wag neuronów
współczynników funkcji błędu
współczynników funkcji aktywacji
Pytanie 2
MLP to skrót nazwy następującego narzędzia eksploracji danych
metoda liniowej prognozy
multiple linear prediction
sieć neuronowa typu perceptron wielowarstwowy
liniowa regresja wieloraka
Pytanie 3
Liczba warstw UKRYTYCH w sieci neuronowej typu RBF wynosi?
dokładnie 4
dokładnie 3
dokładnie 5
dokładnie 1
Pytanie 4
Typowy zbiór danych używany do trenowania modeli uczenia maszynowego składa się z:
klas zawierających instancje
instancji zgrupowanych w kategorie
obiektów posiadających atrybuty
obserwacji obejmujących cechy
Pytanie 5
Problem regresyjny polega na:
znajdowaniu prostej najlepiej dopasowanej do obserwacji
prognozowaniu wartości na podstawie obserwowanych cech
poszukiwaniu korelacji między zmiennymi wejściowymi
dopasowaniu współczynników modelu do obserwacji uczących
Pytanie 6
Przycinanie drzew decyzyjnych stosuje się w celu:
ponownego przeprowadzenia podziału w miejscu cięcia
redukcji liczby klas
eliminacji zmiennych nieistotnych
uniknięcia przeuczenia i skomplikowania modelu
Pytanie 7
Przyjęcie metryki L1 (metryki Manhattan) sprawia, że okręgi przyjmują kształt:
rombów
kardioid
elips
Trójkątów
Pytanie 8
Rolą pojedynczego neuronu w warstwie perceptronu użytego do klasyfikacji jest:
podział przestrzeni wejść na dwie półprzestrzenie
rozpoznawanie jednego przypadku w zbiorze
klasyfikacja pojedynczej cechy wejściowej
rozpoznawanie jednej ze znanych klas w zbiorze
Pytanie 9
Problem klasyfikacyjny polega na:
rozróżnianiu obserwowanych cech na wejściowe i wyjściowe
poszukiwaniu przypadków najbardziej reprezentacyjnych dla klas
ustaleniu optymalnej liczby klas, do których należą obserwacje
prognozowaniu kategorii obserwacji na podstawie jej cech
Pytanie 10
Oryginalna zmienna x przyjmuje trzy wartości: -2, 1, 4. Po przeprowadzeniu normalizacji tej zmiennej wg metody min-max do przedziału [0, 1], oryginalnej wartości 1 odpowiada znormalizowana wartość:
1
0,5
0,25
0,75
Pytanie 11
Przeuczenie modelu (overfitting) można rozpoznać po tym, że:
trafność predykcji modelu przekracza poziom 99.73%
w procesie uczenia zaczyna rosnąć błąd dla próby testowej - chyba? [ale przeuczenie można rozpoznać po zakończonym uczeniu]
szybkość uczenia się modelu zaczyna spadać w kolejnych iteracjach
liczba błędnie zaklasyfikowanych przypadków spada do 0
Pytanie 12
Problem klasteryzacyjny polega na:
grupowaniu cech obserwacji w skorelowane ze sobą zespoły
predykcji przynależności danej obserwacji do różnych klas
poszukiwaniu granic oddzielających obserwacje różnych klas
identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa
algorytmu wstecznej propagacji błędów
Pytanie 13
Metoda K najbliższych sąsiadów wybiera sąsiadów analizowanego punktu:
należących do tego samego klastra
leżących w tym samym wymiarze przestrzeni
najbliższych pod względem cech wejściowych
najbliższych pod względem prognozowanej wartości
Pytanie 14
Która z poniższych metod NIE służy do wyznaczania odległości pomiędzy skupieniami:
metoda pojedynczego wiązania
metoda średnich połączeń
metoda k-średnich
metoda najdalszego sąsiedztwa - chyba
Pytanie 15
Poszukiwanie zbiorów częstych jest pierwszym etapem:
algorytmu A priori
algorytmu k-średnich
algorytmu wstecznej propagacji błędów
algorytmu k-najbliższych sąsiadów
Pytanie 16
Problem klasyfikacyjny można zamienić na problem regresyjny poprzez:
zamianę zmiennych kategorycznych na ciągłe
prognozowanie stopnia przynależności do klasy
zmniejszenie liczby wymiarów do dwóch
zredukowanie liczby klas do jednej
Pytanie 17
Sieć neuronowa Kohonena (SOM) generalnie jest przeznaczona do realizacji:
analizy szeregów czasowych
klasyfikacji wzorcowej
prognozowania lub szacowania wartości
klasyfikacji bezwzorcowej (grupowania)
Pytanie 18
Wskaż drugi algorytm (metodę), który służy do rozwiązywania tego samego typu problemów eksploracji danych, co algorytm k-najbliższych sąsiadów:
algorytm PCA (analiza głównych składowych)
algorytm k-średnich
algorytm CART (drzewa klasyfikacyjne i regresyjne)
algorytm Kohonena (sieć neuronowa typu
Pytanie 19
Na etapie wstępnej eksploracyjnej analizy danych najmniej przydatne jest:
użycie metod nienadzorowanej klasteryzacji
zliczenie wystąpień wartości zmiennych nominalnych
wizualne porównanie współzależności par zmiennych
wygenerowanie histogramów zmiennych ciągłych
Pytanie 20
Klasyczny (perceptronowy) model neuronu posiada dwa wejścia o wagach w1=1, w2=2, na które podano odpowiednio sygnały x1=−1, x2=+1. Funkcja aktywacji jest funkcją liniową postaci y=2x. Sygnał wyjściowy neuronu wynosi:
-1
0
2
1
Pytanie 21
Aby wyeliminować tzw. efekt przeuczenia sieci neuronowej (uczenie nadzorowane), należy uznać za optymalny (ostateczny) zbiór wartości wag, otrzymany w momencie:
zidentyfikowania minimum lokalnego funkcji błędu uczącego
minimum błędu dla ciągu walidacyjnego
zakończenia działania algorytmu uczącego
minimum błędu dla ciągu uczącego
Pytanie 22
Metoda wzmacniania gradientowego (gradient boosting) służy do:
zwiększania kontrastu pomiędzy blisko leżącymi klastrami
generowania dodatkowych sztucznych próbek w zbiorach uczących
budowania mocnego modelu złożonego z wielu słabszych modeli
przyspieszania procesu uczenia głębokich sieci neuronowych
Pytanie 23
Hiperparametrami modelu nazywa się parametry, które:
są dopasowywane podczas uczenia do danych wejściowych
mogą zmieniać się w bardzo szerokim zakresie wartości
opisują wagi połączeń pomiędzy całymi warstwami sieci
sterują przebiegiem procesu uczenia modelu
Pytanie 24
Istotną WADĄ sieci neuronowych jako modeli eksploracji danych jest:
bardzo długi czas reakcji (odpowiedzi) nauczonej sieci
brak zdolności do modelowania zjawisk nieliniowych
brak zdolności wyjaśniania (uzasadniania) wygenerowanych odpowiedzi
nieparametryczność
Pytanie 25
Końcowe trzy etapy eksploracji danych w metodologii CRISP-DM to KOLEJNO:
Modelowanie - Wdrożenie - Ewaluacja
Ewaluacja - Modelowanie - Wdrożenie
Modelowanie - Ewaluacja - Wdrożenie
Wdrożenie - Ewaluacja - Modelowanie
Pytanie 26
Iloczyn skalarny wektora cech z pewnym wektorem wag można traktować jako formę:
obrotu w przestrzeni cech
regresji liniowej
ekstrakcji cech
redukcji wymiarowości
Pytanie 27
W pewnym problemie eksploracji danych zmienna wyjściowa (zależna) przyjmuje 3 możliwe wartości: "biały","czerwony", "niebieski". Dany problem zaliczamy do zadań:
klasyfikacji wzorcowej
regresyjnych (szacowanie, predykcja)
klasyfikacji bezwzorcowej (grupowania)
poszukiwania reguł asocjacyjnych
Pytanie 28
Argumentem funkcji aktywacji neuronu typu RBF jest
ważona liczba wejść danego neuronu
iloczyn skalarny wektorów: wejściowego x i wag w
suma sygnałów x1 + x2 + ... wektora wejściowego x
odległość wektorów: wejściowego x i wag w
Pytanie 29
Algorytm aglomeracyjny rozpoczyna proces analizy od stanu, w którym:
obiekty podzielone są wstępnie przy użyciu innej metody grupowania
wszystkie obiekty tworzą jedno skupenie
obiekty są losowo przydzielone do skupień, a liczba skupień jest z góry określana
każdy obiekt tworzy osobne skupienie
Pytanie 30
Technika k-krotnej walidacji krzyżowej służy do:
klasteryzacji zbioru na k maksymalnie odległych skupień
ustalenia optymalnego momentu przerwania uczenia modelu
uniknięcia tendencyjności w ocenie jakości modelu
wyeliminowania wzajemnych zależności między zmiennymi
Pytanie 31
Wskaż metodę NIEPRZYDATNĄ w rozwiązywaniu zadań predykcyjnych:
sieć neuronowa typu PERCEPTRON WIELOWARSTWOWY
liniowa regresja wieloraka
sieć neuronowa typu RBF
algorytm k-średnich
Pytanie 32
Algorytmy genetyczne (ewolucyjne) służą generalnie do realizacji zadań:
regresji
eksploracji danych zapisanych w chromosomach roślin i zwierząt
poszukiwania reguł asocjacyjnych
optymalizacji
Pytanie 33
Pojęcie tensora występujące często w dziedzinie uczenia głębokiego oznacza:
uogólnienie pojęcia macierzy na wiele wymiarów
warstwę wejściową rozprowadzającą sygnały do sieci
wyspecjalizowany rodzaj neuronów przetwarzających obraz
wektor wskazujący kierunek najszybszego spadku błędu sieci
Pytanie 34
Aglomeracyjne metody klasteryzacji polegają na
przyrostowym budowaniu klastrów poprzez dodawanie sąsiednich punktów
krokowym dodawaniu linii dzielących klastry w optymalnym miejscu
stopniowym ograniczaniu klastrów poprzez usuwanie outlierów
iteracyjnym dzieleniu klastrów na najbardziej odległe połowy
Pytanie 35
Argumentem funkcji aktywacji neuronu typu MLP (w sieci perceptronowej) jest :
ważona liczba wejść danego neuronu
iloczyn skalarny wektorów: wejściowego x i wag w
odległość wektorów: wejściowego x i wag w
suma sygnałów x1 + x2 + ... wektora wejściowego x
Pytanie 36
Która z wymienionych metod NIE jest stosowana w procesie analizy skupień (grupowania)
sieć neuronowa Kohonena (Typu SOM)
algorytm k-najbliższych sąsiadów
algorytm k-średnich
metody aglomeracyjne (generujące dendrogram)
Pytanie 37
Wskaż metodę NIEPRZYDATNĄ w rozwiązywaniu zadań predykcyjnych
liniowa regresja wieloraka
sieć neuronowa typu RBF
sieć neuronowa tupu PERCEPTRON WIELOWARSTWOWY
algorytm A-priori