Zaloguj

Przeglądaj

Fiszki

Programowanie systemów rozproszonych

Test w formie fiszek

Ilość pytań: 31 Rozwiązywany: 1080 razy

Przycinanie drzew decyzyjnych stosuje się w celu:

eliminacji zmiennych nieistotnych

ponownego przeprowadzenia podziału w miejscu cięcia

redukcji liczby klas

uniknięcia przeuczenia i skomplikowania modelu

Przyjęcie metryki L1 (metryki Manhattan) sprawia, że okręgi przyjmują kształt:

kardioid

trójkątów

elips

rombów

Algorytmy genetyczne (ewolucyjne) służa generalnie do realizacji zadań:

regresji

poszukiwania reguł asocjacyjnych

eksploracji danych zapisanych w chromosomach roślin i zwierząt

optymalizacji

Rolą pojedynczego neuronu w warstwie perceptronu użytego do klasyfikacji jest:

podział przestrzeni wejść na dwie półprzestrzenie

rozpoznawanie jednego przypadku w zbiorze

klasyfikacja pojedynczej cechy wejściowej

ozpoznawanie jednej ze znanych klas w zbiorze

podział przestrzeni wejść na dwie półprzestrzenie

Technika k-krotnej walidacji krzyżowej służy do:

klasteryzacji zbioru na k maksymalnie odległych skupień

uniknięcia tendencyjności w ocenie jakości modelu

ustalenia optymalnego momentu przerwania uczenia modelu

wyeliminowania wzajemnych zależności między zmiennymi

uniknięcia tendencyjności w ocenie jakości modelu

Problem klasyfikacyjny polega na:

rozróżnianiu obserwowanych cech na wejściowe i wyjściowe

ustaleniu optymalnej liczby klas, do których należą obserwacje

poszukiwaniu przypadków najbardziej reprezentacyjnych dla klas

prognozowaniu kategorii obserwacji na podstawie jej cech

Klasyczny (perceptronowy) model neuronu posiada dwa wejścia o wagach w1=1, w2=2, na które podano odpowiednio sygnały x1=−1, x2=+1. Funkcja aktywacji jest funkcją liniową postaci y=2x. Sygnał wyjściowy neuronu wynosi:

-1

Oryginalna zmienna x przyjmuje trzy wartości: -2, 1, 4. Po przeprowadzeniu normalizacji tej zmiennej wg metody min-max do przedziału [0, 1], oryginalnej wartości 1 odpowiada znormalizowana wartość:

0,5

0,75

0,25

0,5

.Argumentem funkcji aktywacji neuronu typu RBF jest

ważona liczba wejść danego neuronu

odległość wektorów: wejściowego x i wag w

iloczyn skalarny wektorów: wejściowego x i wag w

suma sygnałów x1 + x2 + ... wektora wejściowego x

odległość wektorów: wejściowego x i wag w

Przeuczenie modelu (overfitting) można rozpoznać po tym, że

liczba błędnie zaklasyfikowanych przypadków spada do 0

szybkość uczenia się modelu zaczyna spadać w kolejnych iteracjach

trafność predykcji modelu przekracza poziom 99.73%

w procesie uczenia zaczyna rosnąć błąd dla próby testowej

Na etapie wstępnej eksploracyjnej analizy danych najmniej przydatne jest

zliczenie wystąpień wartości zmiennych nominalnych

użycie metod nienadzorowanej klasteryzacji

wygenerowanie histogramów zmiennych ciągłych

wizualne porównanie współzależności par zmiennych

wygenerowanie histogramów zmiennych ciągłych

.Iloczyn skalarny wektora cech z pewnym wektorem wag można traktować jako formę

ekstrakcji cech

redukcji wymiarowości

obrotu w przestrzeni cech

regresji liniowej

Metoda wzmacniania gradientowego (gradient boosting) służy do

zwiększania kontrastu pomiędzy blisko leżącymi klastrami

generowania dodatkowych sztucznych próbek w zbiorach uczących

budowania mocnego modelu złożonego z wielu słabszych modeli

przyspieszania procesu uczenia głębokich sieci neuronowych

budowania mocnego modelu złożonego z wielu słabszych modeli

Problem klasteryzacyjny polega na

identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa

predykcji przynależności danej obserwacji do różnych klas

poszukiwaniu granic oddzielających obserwacje różnych klas

algorytmu wstecznej propagacji błędów

grupowaniu cech obserwacji w skorelowane ze sobą zespoły

identyfikacji skupisk zgodnie z pewnym kryterium podobieństwa

Wskaż drugi algorytm (metodę), który służy do rozwiązywania tego samego typu problemów eksploracji danych, co algorytm k-najbliższych sąsiadów

algorytm CART (drzewa klasyfikacyjne i regresyjne)

algorytm Kohonena (sieć neuronowa typu SOM)

algorytm k-średnich

algorytm PCA (analiza głównych składowych)

algorytm CART (drzewa klasyfikacyjne i regresyjne)

Poszukiwanie zbiorów częstych jest pierwszym etapem

algorytmu wstecznej propagacji błędów

algorytmu A priori

algorytmu k-średnich

algorytmu k-najbliższych sąsiadów

algorytmu A priori

Wskaż metodę NIEPRZYDATNĄ w rozwiązywaniu zadań predykcyjnych

sieć neuronowa typu PERCEPTRON WIELOWARSTWOWY

sieć neuronowa typu RBF

algorytm k-średnich

liniowa regresja wieloraka

algorytm k-średnich

Aglomeracyjne metody klasteryzacji polegają na

iteracyjnym dzieleniu klastrów na najbardziej odległe połowy

krokowym dodawaniu linii dzielących klastry w optymalnym miejscu

stopniowym ograniczaniu klastrów poprzez usuwanie outlierów

przyrostowym budowaniu klastrów poprzez dodawanie sąsiednich punktów

Sieć neuronowa Kohonena (SOM) generalnie jest przeznaczona do realizacji

klasyfikacji wzorcowej

klasyfikacji bezwzorcowej (grupowania)

prognozowania lub szacowania wartości

analizy szeregów czasowych

klasyfikacji bezwzorcowej (grupowania)

Końcowe trzy etapy eksploracji danych w metodologii CRISP-DM to KOLEJNO:

Modelowanie - Wdrożenie - Ewaluacja

Wdrożenie - Ewaluacja - Modelowanie

Modelowanie - Ewaluacja - Wdrożenie

Ewaluacja - Modelowanie - Wdrożenie

Modelowanie - Ewaluacja - Wdrożenie

Pokaż kolejne pytania

Powiązane tematy

#informatyka

Inne tryby

Nauka Test Powtórzenie