Podsumowanie: Wanat Egzaminy I

Pytanie 1

. Statystyka 𝐶𝑝 Mallowsa wykorzystywana jest:

w celu badania istotności obserwacji wpływowych

w celu określania obserwacji wpływowych

w celu wyboru modelu o dobrych własnościach predykcyjnych

Pytanie 2

W modelu regresji liniowej

zmienna zależna musi mieć rozkład normalny

wszystkie zmienne objaśniające muszą być ilościowe

reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji

Pytanie 3

Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od prognoz jest to:

miernik dopasowania modelu do danych rzeczywistych

miernik ex post błędu prognoz

ocena ex ante błędu prognoz

Pytanie 4

Narzędzia wykrycia zależności pomiędzy interesującą nas zmienną objaśnianą (kilkoma zmiennymi objaśnianymi) opisującą badane obiekty (jednostki) a zbiorem innych zmiennych objaśniających (niezależnych, predyktorów) też opisujących te obiekty

uczenie bez nadzoru

modelowanie predykcyjne

uczenie z nadzorem

Pytanie 5

. Odkrywania nietrywialnych zależności, schematów, wzorców, reguł w zbiorach danych to

modelowanie predykcyjne

uczenie z nadzorem

uczenie bez nadzoru

Pytanie 6

Zapoznanie się z istniejącą teorią dotyczącą modelowanego zjawisk oraz z poświęconymi mu dotychczasowymi badaniami to czynności realizowane na następującym etapie budowy modelu predykcyjnego:

sformułowanie zadania prognostycznego

analityczne przygotowanie danych

określenie kontekstu modelowania

Pytanie 7

 Reszty w poprawnie oszacowanego modelu liniowego powinny:

 mieć rozkład normalny  być jednorodne  i niezależne.

 i niezależne.

 mieć rozkład normalny

Pytanie 8

Uogólnione modele liniowe (ang. generalized linear models – GLMs) są rozszerzeniem zwykłych modeli regresji

Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)

Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).

Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).

Pytanie 9

⦁ Krzywą ROC można wykorzystać:

do oceny współliniowości zmiennych objaśniających

do ceny i porównywania między sobą modeli klasyfikacyjnych

do ustalenia optymalnego punkt odcięcia

Pytanie 10

⦁ W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:

predyktor liniowy z wektorem parametrów modelu , ,...,

predyktor liniowy z średnią zmiennej zależne

predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych

Pytanie 11

⦁ Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:

zwiększeniem dewiancji

zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową

zmniejszeniem dewiancji

Pytanie 12

⦁ Istotność parametrów modelu liniowego (każdego z osobna) sprawdzamy testem:

Breuscha-Pagana

Durbina-Watsona

Studenta

Pytanie 13

⦁ Sumę kwadratów reszt (RSS) nazywamy:

zmiennością wyjaśnioną przez model

całkowitą zmiennością

zmiennością niewyjaśnioną przez model

Pytanie 14

⦁ Element diagonalny macierzy daszkowej nazywamy:

standaryzowaną resztą modelu

miarą Cooka

wskaźnikiem wpływu (dźwignią

Pytanie 15

⦁ Średni błąd predykcji ex post (root mean square error, RMSE):

mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz

wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą

mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie

Pytanie 16

⦁ Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od obliczonych prognoz jest to:

ocena ex ante błędu prognoz

miernik dopasowania modelu do danych rzeczywistych

miernik ex post błędu prognoz

Pytanie 17

⦁ Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:

sformułowania zadania prognostycznego

określenia kontekstu modelowania

analitycznego przygotowania danych

Pytanie 18

⦁ Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:

modelem zerowym

modelem nasyconym

modelem Poissona

Pytanie 19

k-krotna walidacja krzyżowa służy do:

wyboru zmiennych objaśniających

badania normalności reszt modelu

określenia jakości modelu w trakcie jego uczenia

Pytanie 20

Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy

logitem

szansą wystąpienia A ()

modelem logitowym

Pytanie 21

⦁ Do elementów konstrukcyjnych uogólnionego modelu liniowego zaliczamy:

funkcję wiążącą

liniowy predyktor

wykładniczą rodzinę rozkładów

Pytanie 22

⦁ Modelem logitowym (regresją logistyczną) nazywamy uogólniony model liniowy (GLM), w którym zmienna objaśniana ma rozkład:

Bernoulliego

normalny

Poissona

Pytanie 23

⦁ Do mierników pomocnych w wyborze zmiennych objaśniających (predyktorów) zaliczamy:

wskaźnik WoE

moc informacyjną zmiennej IV

wskaźnik wpływu

Pytanie 24

Jednorodność wariancji modelu liniowego sprawdzamy testem:

Studenta

Durbina-Watsona

Breuscha-Pagana

Pytanie 25

Sumę kwadratów reszt (RSS) nazywamy:

zmiennością niewyjaśnioną przez model

zmiennością wyjaśnioną przez model

całkowitą zmiennością

Pytanie 26

Średni błąd predykcji ex post (root mean square error, RMSE):

mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie

wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą

mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz

Pytanie 27

Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:

sformułowania zadania prognostycznego

analitycznego przygotowania danych

określenia kontekstu modelowania

Pytanie 28

Modelem logitowym (regresją logistyczną) nazywamy uogólniony model liniowy (GLM), w którym zmienna objaśniana ma rozkład:

Poissona

Bernoulliego

normalny

Pytanie 29

W ubezpieczeniach uogólnione modele liniowe można wykorzystać w modelowaniu:

liczby szkód

wysokości pojedynczej szkody

w taryfikacji

Pytanie 30

k-krotna walidacja krzyżowa służy do:

określenia jakości modelu w trakcie jego uczenia

badania normalności reszt modelu

wyboru zmiennych objaśniających

Pytanie 31

Krzywą ROC można wykorzystać:

o ceny i porównywania między sobą modeli klasyfikacyjnych

do ustalenia optymalnego punkt odcięcia

do oceny współliniowości zmiennych objaśniających

Pytanie 32

Logarytm stosunku prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia.

logit

modelem logitowym

szansą wystąpienia A ()

Pytanie 33

Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy

modelem logitowym

logitem

szansą wystąpienia A ()

Pytanie 34

Wskaźnik ten określa siłę związku między zmienną niezależną a zmienną zależną poprzez obliczenie logarytmu stosunku prawdopodobieństw (iloraz szans) dla każdej kategorii zmiennej niezależnej w odniesieniu do bazowej kategorii.

wskaźnik wpływu

moc informacyjną zmiennej IV

Wskaznik WoE

Pytanie 35

Za pomocą tego miernika można dokonać rankingu zmiennych objaśniających.

Wskaznik WoE

wskaźnik wpływu

moc informacyjną zmiennej IV

Pytanie 36

Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:

modelem zerowym

modelem Poissona

modelem nasyconym

Pytanie 37

Element diagonalny macierzy daszkowej nazywamy:

miarą Cooka

wskaźnikiem wpływu (dźwignią)

standaryzowaną resztą modelu

Pytanie 38

Przykładowe testy normalności:

Jarque–Bera

Shapiro-Wilka

Breuscha-Godfreya

Pytanie 39

Niezależności reszt modelu liniowego sprawdzamy testem:

Durbina-Watsona

Harrisona-McCabe

Breuscha-Godfreya

Pytanie 40

Jednorodność wariancji modelu liniowego sprawdzamy testem:

studenta

Harrisona-McCabe

Goldfelda-Quandta

Breuscha-Pagana

Pytanie 41

Sumę kwadratów reszt (RSS) nazywamy:

zmiennością wyjaśnioną przez model

całkowitą zmiennością

zmiennością niewyjaśnioną przez model

Pytanie 42

Średni błąd predykcji ex post (root mean square error, RMSE):

wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą

mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz

mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie

Pytanie 43

Liniowy modelu regresji może być estymowany za pomocą:

metody największej wiarygodności

metody eksperckiej

metoda najmniejszych kwadratów

Pytanie 44

Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:

właściwości różnych narzędzi modelowania predykcyjnego

rodzaj i zakres dostępnych danych statystycznych

specyfikę zadania predykcyjnego

Pytanie 45

Narzędzia wykrycia zależności pomiędzy zmiennymi opisującymi badane obiekty a prawdopodobieństwem zaistnienia lub poziomem pewnej zmiennej służą do:

uczenia bez nadzoru

eksploracji danych

modelowania predykcyjnego

Pytanie 46

Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:

sformułowania zadania prognostycznego

określenia kontekstu modelowania

analitycznego przygotowania danych

Pytanie 47

Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:

zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową)

zmniejszeniem dewiancji

większeniem dewiancji

Pytanie 48

. Krzywą ROC można wykorzystać:

do ceny i porównywania między sobą modeli klasyfikacyjnych

do oceny współliniowości zmiennych objaśniających

do ustalenia optymalnego punkt odcięcia

Pytanie 49

W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:

predyktor liniowy z wektorem parametrów modelu 𝜷 = (𝛽0, 𝛽1,..., 𝛽𝑘)

predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych

predyktor liniowy z średnią zmiennej zależnej

Pytanie 50

Modelem zerowym nazywamy uogólniony model liniowy (GLM),

o liczbie parametrów równej liczbie obserwacji

o największej dewiancji

w którym nie uwzględnia się zmiennych objaśniających (regresorów)

Pytanie 51

W uogólnionym modelu liniowym (GLM)

wariancja zmiennej zależnej musi być stała

wariancja zmiennej zależnej może być dowolna

wariancja zmiennej zależnej może być funkcją jej średniej

Pytanie 52

Sumę kwadratów reszt (RSS) nazywamy:

zmiennością wyjaśnioną przez model

zmiennością niewyjaśnioną przez model

całkowitą zmiennością

Pytanie 53

Jakościowa zmienna objaśniająca przyjmująca wartości ze zbioru pięciu kategorii w liniowym modelu regresji jest kodowana za pomocą:

pięciu zmiennych zero-jedynkowych

liczba zmiennych kodujących zleży od liczby obserwacji

czterech zmiennych zero-jedynkowych

Pytanie 54

⦁ Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:

rodzaj i zakres dostępnych danych statystycznych

specyfikę zadania predykcyjnego

właściwości różnych narzędzi modelowania predykcyjnego

Podsumowanie

Wanat Egzaminy I

Podsumowanie

Wanat Egzaminy I

Twój wynik