Podsumowanie

Wanat Egzaminy I

Podsumowanie

Wanat Egzaminy I

Twój wynik

Rozwiąż ponownie
Moja historia
Pytanie 1
. Statystyka 𝐶𝑝 Mallowsa wykorzystywana jest:
w celu badania istotności obserwacji wpływowych
w celu określania obserwacji wpływowych
w celu wyboru modelu o dobrych własnościach predykcyjnych
Pytanie 2
W modelu regresji liniowej
zmienna zależna musi mieć rozkład normalny
wszystkie zmienne objaśniające muszą być ilościowe
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
Pytanie 3
Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od prognoz jest to:
miernik dopasowania modelu do danych rzeczywistych
miernik ex post błędu prognoz
ocena ex ante błędu prognoz
Pytanie 4
Narzędzia wykrycia zależności pomiędzy interesującą nas zmienną objaśnianą (kilkoma zmiennymi objaśnianymi) opisującą badane obiekty (jednostki) a zbiorem innych zmiennych objaśniających (niezależnych, predyktorów) też opisujących te obiekty
uczenie bez nadzoru
modelowanie predykcyjne
uczenie z nadzorem
Pytanie 5
. Odkrywania nietrywialnych zależności, schematów, wzorców, reguł w zbiorach danych to
modelowanie predykcyjne
uczenie z nadzorem
uczenie bez nadzoru
Pytanie 6
Zapoznanie się z istniejącą teorią dotyczącą modelowanego zjawisk oraz z poświęconymi mu dotychczasowymi badaniami to czynności realizowane na następującym etapie budowy modelu predykcyjnego:
sformułowanie zadania prognostycznego
analityczne przygotowanie danych
określenie kontekstu modelowania
Pytanie 7
 Reszty w poprawnie oszacowanego modelu liniowego powinny:
 mieć rozkład normalny  być jednorodne  i niezależne.
 i niezależne.
 mieć rozkład normalny
Pytanie 8
Uogólnione modele liniowe (ang. generalized linear models – GLMs) są rozszerzeniem zwykłych modeli regresji
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
Pytanie 9
⦁ Krzywą ROC można wykorzystać:
do oceny współliniowości zmiennych objaśniających
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
Pytanie 10
⦁ W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z wektorem parametrów modelu , ,...,
predyktor liniowy z średnią zmiennej zależne
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
Pytanie 11
⦁ Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
zwiększeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
zmniejszeniem dewiancji
Pytanie 12
⦁ Istotność parametrów modelu liniowego (każdego z osobna) sprawdzamy testem:
Breuscha-Pagana
Durbina-Watsona
Studenta
Pytanie 13
⦁ Sumę kwadratów reszt (RSS) nazywamy:
zmiennością wyjaśnioną przez model
całkowitą zmiennością
zmiennością niewyjaśnioną przez model
Pytanie 14
⦁ Element diagonalny macierzy daszkowej nazywamy:
standaryzowaną resztą modelu
miarą Cooka
wskaźnikiem wpływu (dźwignią
Pytanie 15
⦁ Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
Pytanie 16
⦁ Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od obliczonych prognoz jest to:
ocena ex ante błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
miernik ex post błędu prognoz
Pytanie 17
⦁ Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
sformułowania zadania prognostycznego
określenia kontekstu modelowania
analitycznego przygotowania danych
Pytanie 18
⦁ Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:
modelem zerowym
modelem nasyconym
modelem Poissona
Pytanie 19
k-krotna walidacja krzyżowa służy do:
wyboru zmiennych objaśniających
badania normalności reszt modelu
określenia jakości modelu w trakcie jego uczenia
Pytanie 20
Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy
logitem
szansą wystąpienia A ()
modelem logitowym
Pytanie 21
⦁ Do elementów konstrukcyjnych uogólnionego modelu liniowego zaliczamy:
funkcję wiążącą
liniowy predyktor
wykładniczą rodzinę rozkładów
Pytanie 22
⦁ Modelem logitowym (regresją logistyczną) nazywamy uogólniony model liniowy (GLM), w którym zmienna objaśniana ma rozkład:
Bernoulliego
normalny
Poissona
Pytanie 23
⦁ Do mierników pomocnych w wyborze zmiennych objaśniających (predyktorów) zaliczamy:
wskaźnik WoE
moc informacyjną zmiennej IV
wskaźnik wpływu
Pytanie 24
Jednorodność wariancji modelu liniowego sprawdzamy testem:
Studenta
Durbina-Watsona
Breuscha-Pagana
Pytanie 25
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością niewyjaśnioną przez model
zmiennością wyjaśnioną przez model
całkowitą zmiennością
Pytanie 26
Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
Pytanie 27
Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
sformułowania zadania prognostycznego
analitycznego przygotowania danych
określenia kontekstu modelowania
Pytanie 28
Modelem logitowym (regresją logistyczną) nazywamy uogólniony model liniowy (GLM), w którym zmienna objaśniana ma rozkład:
Poissona
Bernoulliego
normalny
Pytanie 29
W ubezpieczeniach uogólnione modele liniowe można wykorzystać w modelowaniu:
liczby szkód
wysokości pojedynczej szkody
w taryfikacji
Pytanie 30
k-krotna walidacja krzyżowa służy do:
określenia jakości modelu w trakcie jego uczenia
badania normalności reszt modelu
wyboru zmiennych objaśniających
Pytanie 31
Krzywą ROC można wykorzystać:
o ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
do oceny współliniowości zmiennych objaśniających
Pytanie 32
Logarytm stosunku prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia.
logit
modelem logitowym
szansą wystąpienia A ()
Pytanie 33
Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy
modelem logitowym
logitem
szansą wystąpienia A ()
Pytanie 34
Wskaźnik ten określa siłę związku między zmienną niezależną a zmienną zależną poprzez obliczenie logarytmu stosunku prawdopodobieństw (iloraz szans) dla każdej kategorii zmiennej niezależnej w odniesieniu do bazowej kategorii.
wskaźnik wpływu
moc informacyjną zmiennej IV
Wskaznik WoE
Pytanie 35
Za pomocą tego miernika można dokonać rankingu zmiennych objaśniających.
Wskaznik WoE
wskaźnik wpływu
moc informacyjną zmiennej IV
Pytanie 36
Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:
modelem zerowym
modelem Poissona
modelem nasyconym
Pytanie 37
Element diagonalny macierzy daszkowej nazywamy:
miarą Cooka
wskaźnikiem wpływu (dźwignią)
standaryzowaną resztą modelu
Pytanie 38
Przykładowe testy normalności:
Jarque–Bera
Shapiro-Wilka
Breuscha-Godfreya
Pytanie 39
Niezależności reszt modelu liniowego sprawdzamy testem:
Durbina-Watsona
Harrisona-McCabe
Breuscha-Godfreya
Pytanie 40
Jednorodność wariancji modelu liniowego sprawdzamy testem:
studenta
Harrisona-McCabe
Goldfelda-Quandta
Breuscha-Pagana
Pytanie 41
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością wyjaśnioną przez model
całkowitą zmiennością
zmiennością niewyjaśnioną przez model
Pytanie 42
Średni błąd predykcji ex post (root mean square error, RMSE):
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
Pytanie 43
Liniowy modelu regresji może być estymowany za pomocą:
metody największej wiarygodności
metody eksperckiej
metoda najmniejszych kwadratów
Pytanie 44
Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:
właściwości różnych narzędzi modelowania predykcyjnego
rodzaj i zakres dostępnych danych statystycznych
specyfikę zadania predykcyjnego
Pytanie 45
Narzędzia wykrycia zależności pomiędzy zmiennymi opisującymi badane obiekty a prawdopodobieństwem zaistnienia lub poziomem pewnej zmiennej służą do:
uczenia bez nadzoru
eksploracji danych
modelowania predykcyjnego
Pytanie 46
Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
sformułowania zadania prognostycznego
określenia kontekstu modelowania
analitycznego przygotowania danych
Pytanie 47
Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową)
zmniejszeniem dewiancji
większeniem dewiancji
Pytanie 48
. Krzywą ROC można wykorzystać:
do ceny i porównywania między sobą modeli klasyfikacyjnych
do oceny współliniowości zmiennych objaśniających
do ustalenia optymalnego punkt odcięcia
Pytanie 49
W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z wektorem parametrów modelu 𝜷 = (𝛽0, 𝛽1,..., 𝛽𝑘)
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
predyktor liniowy z średnią zmiennej zależnej
Pytanie 50
Modelem zerowym nazywamy uogólniony model liniowy (GLM),
o liczbie parametrów równej liczbie obserwacji
o największej dewiancji
w którym nie uwzględnia się zmiennych objaśniających (regresorów)
Pytanie 51
W uogólnionym modelu liniowym (GLM)
wariancja zmiennej zależnej musi być stała
wariancja zmiennej zależnej może być dowolna
wariancja zmiennej zależnej może być funkcją jej średniej
Pytanie 52
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością wyjaśnioną przez model
zmiennością niewyjaśnioną przez model
całkowitą zmiennością
Pytanie 53
Jakościowa zmienna objaśniająca przyjmująca wartości ze zbioru pięciu kategorii w liniowym modelu regresji jest kodowana za pomocą:
pięciu zmiennych zero-jedynkowych
liczba zmiennych kodujących zleży od liczby obserwacji
czterech zmiennych zero-jedynkowych
Pytanie 54
⦁ Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:
rodzaj i zakres dostępnych danych statystycznych
specyfikę zadania predykcyjnego
właściwości różnych narzędzi modelowania predykcyjnego