Fiszki

Programowanie systemów rozproszonych

Test w formie fiszek
Ilość pytań: 31 Rozwiązywany: 1539 razy
Przycinanie drzew decyzyjnych stosuje się w celu:
eliminacji zmiennych nieistotnych
redukcji liczby klas
ponownego przeprowadzenia podziału w miejscu cięcia
uniknięcia przeuczenia i skomplikowania modelu
uniknięcia przeuczenia i skomplikowania modelu
Przyjęcie metryki L1 (metryki Manhattan) sprawia, że okręgi przyjmują kształt:
kardioid
trójkątów
elips
rombów
rombów
Algorytmy genetyczne (ewolucyjne) służa generalnie do realizacji zadań:
regresji
optymalizacji
poszukiwania reguł asocjacyjnych
eksploracji danych zapisanych w chromosomach roślin i zwierząt
optymalizacji
Rolą pojedynczego neuronu w warstwie perceptronu użytego do klasyfikacji jest:
klasyfikacja pojedynczej cechy wejściowej
ozpoznawanie jednej ze znanych klas w zbiorze
podział przestrzeni wejść na dwie półprzestrzenie
rozpoznawanie jednego przypadku w zbiorze
podział przestrzeni wejść na dwie półprzestrzenie
Technika k-krotnej walidacji krzyżowej służy do:
klasteryzacji zbioru na k maksymalnie odległych skupień
ustalenia optymalnego momentu przerwania uczenia modelu
wyeliminowania wzajemnych zależności między zmiennymi
uniknięcia tendencyjności w ocenie jakości modelu
uniknięcia tendencyjności w ocenie jakości modelu
Problem klasyfikacyjny polega na:
ustaleniu optymalnej liczby klas, do których należą obserwacje
prognozowaniu kategorii obserwacji na podstawie jej cech
poszukiwaniu przypadków najbardziej reprezentacyjnych dla klas
rozróżnianiu obserwowanych cech na wejściowe i wyjściowe
prognozowaniu kategorii obserwacji na podstawie jej cech
Klasyczny (perceptronowy) model neuronu posiada dwa wejścia o wagach w1=1, w2=2, na które podano odpowiednio sygnały x1=−1, x2=+1. Funkcja aktywacji jest funkcją liniową postaci y=2x. Sygnał wyjściowy neuronu wynosi:
1
0
2
-1
2
Oryginalna zmienna x przyjmuje trzy wartości: -2, 1, 4. Po przeprowadzeniu normalizacji tej zmiennej wg metody min-max do przedziału [0, 1], oryginalnej wartości 1 odpowiada znormalizowana wartość:
0,25
0,5
1
0,75
0,5
.Argumentem funkcji aktywacji neuronu typu RBF jest
ważona liczba wejść danego neuronu
suma sygnałów x1 + x2 + ... wektora wejściowego x
odległość wektorów: wejściowego x i wag w
iloczyn skalarny wektorów: wejściowego x i wag w
odległość wektorów: wejściowego x i wag w
Przeuczenie modelu (overfitting) można rozpoznać po tym, że
w procesie uczenia zaczyna rosnąć błąd dla próby testowej
szybkość uczenia się modelu zaczyna spadać w kolejnych iteracjach
trafność predykcji modelu przekracza poziom 99.73%
liczba błędnie zaklasyfikowanych przypadków spada do 0
w procesie uczenia zaczyna rosnąć błąd dla próby testowej
Na etapie wstępnej eksploracyjnej analizy danych najmniej przydatne jest
użycie metod nienadzorowanej klasteryzacji
wizualne porównanie współzależności par zmiennych
wygenerowanie histogramów zmiennych ciągłych
zliczenie wystąpień wartości zmiennych nominalnych
wygenerowanie histogramów zmiennych ciągłych
.Iloczyn skalarny wektora cech z pewnym wektorem wag można traktować jako formę
regresji liniowej
redukcji wymiarowości
obrotu w przestrzeni cech
ekstrakcji cech
regresji liniowej
Metoda wzmacniania gradientowego (gradient boosting) służy do
generowania dodatkowych sztucznych próbek w zbiorach uczących
przyspieszania procesu uczenia głębokich sieci neuronowych
zwiększania kontrastu pomiędzy blisko leżącymi klastrami
budowania mocnego modelu złożonego z wielu słabszych modeli
budowania mocnego modelu złożonego z wielu słabszych modeli
Problem klasteryzacyjny polega na
grupowaniu cech obserwacji w skorelowane ze sobą zespoły
predykcji przynależności danej obserwacji do różnych klas
poszukiwaniu granic oddzielających obserwacje różnych klas
algorytmu wstecznej propagacji błędów
identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa
identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa
Wskaż drugi algorytm (metodę), który służy do rozwiązywania tego samego typu problemów eksploracji danych, co algorytm k-najbliższych sąsiadów
algorytm k-średnich
algorytm Kohonena (sieć neuronowa typu SOM)
algorytm CART (drzewa klasyfikacyjne i regresyjne)
algorytm PCA (analiza głównych składowych)
algorytm CART (drzewa klasyfikacyjne i regresyjne)
Poszukiwanie zbiorów częstych jest pierwszym etapem
algorytmu A priori
algorytmu wstecznej propagacji błędów
algorytmu k-najbliższych sąsiadów
algorytmu k-średnich
algorytmu A priori
Wskaż metodę NIEPRZYDATNĄ w rozwiązywaniu zadań predykcyjnych
sieć neuronowa typu RBF
algorytm k-średnich
sieć neuronowa typu PERCEPTRON WIELOWARSTWOWY
liniowa regresja wieloraka
algorytm k-średnich
Aglomeracyjne metody klasteryzacji polegają na
krokowym dodawaniu linii dzielących klastry w optymalnym miejscu
przyrostowym budowaniu klastrów poprzez dodawanie sąsiednich punktów
iteracyjnym dzieleniu klastrów na najbardziej odległe połowy
stopniowym ograniczaniu klastrów poprzez usuwanie outlierów
przyrostowym budowaniu klastrów poprzez dodawanie sąsiednich punktów
Sieć neuronowa Kohonena (SOM) generalnie jest przeznaczona do realizacji
analizy szeregów czasowych
klasyfikacji wzorcowej
prognozowania lub szacowania wartości
klasyfikacji bezwzorcowej (grupowania)
klasyfikacji bezwzorcowej (grupowania)
Końcowe trzy etapy eksploracji danych w metodologii CRISP-DM to KOLEJNO:
Modelowanie - Ewaluacja - Wdrożenie
Ewaluacja - Modelowanie - Wdrożenie
Wdrożenie - Ewaluacja - Modelowanie
Modelowanie - Wdrożenie - Ewaluacja
Modelowanie - Ewaluacja - Wdrożenie

Powiązane tematy

#informatyka

Inne tryby