Fiszki

Wanat Egzaminy I

Test w formie fiszek Modelowanie II
Ilość pytań: 54 Rozwiązywany: 551 razy
. Statystyka 𝐶𝑝 Mallowsa wykorzystywana jest:
w celu wyboru modelu o dobrych własnościach predykcyjnych
w celu badania istotności obserwacji wpływowych
w celu określania obserwacji wpływowych
w celu wyboru modelu o dobrych własnościach predykcyjnych
W modelu regresji liniowej
wszystkie zmienne objaśniające muszą być ilościowe
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
zmienna zależna musi mieć rozkład normalny
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od prognoz jest to:
miernik ex post błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
ocena ex ante błędu prognoz
ocena ex ante błędu prognoz
Narzędzia wykrycia zależności pomiędzy interesującą nas zmienną objaśnianą (kilkoma zmiennymi objaśnianymi) opisującą badane obiekty (jednostki) a zbiorem innych zmiennych objaśniających (niezależnych, predyktorów) też opisujących te obiekty
uczenie z nadzorem
modelowanie predykcyjne
uczenie bez nadzoru
uczenie z nadzorem
. Odkrywania nietrywialnych zależności, schematów, wzorców, reguł w zbiorach danych to
modelowanie predykcyjne
uczenie bez nadzoru
uczenie z nadzorem
uczenie bez nadzoru
Zapoznanie się z istniejącą teorią dotyczącą modelowanego zjawisk oraz z poświęconymi mu dotychczasowymi badaniami to czynności realizowane na następującym etapie budowy modelu predykcyjnego:
określenie kontekstu modelowania
sformułowanie zadania prognostycznego
analityczne przygotowanie danych
określenie kontekstu modelowania
 Reszty w poprawnie oszacowanego modelu liniowego powinny:
 mieć rozkład normalny  być jednorodne  i niezależne.
 mieć rozkład normalny
 i niezależne.
 mieć rozkład normalny  być jednorodne  i niezależne.
Uogólnione modele liniowe (ang. generalized linear models – GLMs) są rozszerzeniem zwykłych modeli regresji
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
⦁ Krzywą ROC można wykorzystać:
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
do oceny współliniowości zmiennych objaśniających
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
⦁ W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z średnią zmiennej zależne
predyktor liniowy z wektorem parametrów modelu , ,...,
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
predyktor liniowy z średnią zmiennej zależne
⦁ Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
zwiększeniem dewiancji
zmniejszeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
⦁ Istotność parametrów modelu liniowego (każdego z osobna) sprawdzamy testem:
Durbina-Watsona
Studenta
Breuscha-Pagana
Studenta
⦁ Sumę kwadratów reszt (RSS) nazywamy:
całkowitą zmiennością
zmiennością wyjaśnioną przez model
zmiennością niewyjaśnioną przez model
zmiennością niewyjaśnioną przez model
⦁ Element diagonalny macierzy daszkowej nazywamy:
wskaźnikiem wpływu (dźwignią
miarą Cooka
standaryzowaną resztą modelu
wskaźnikiem wpływu (dźwignią
⦁ Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
⦁ Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od obliczonych prognoz jest to:
ocena ex ante błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
miernik ex post błędu prognoz
miernik ex post błędu prognoz
⦁ Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
określenia kontekstu modelowania
analitycznego przygotowania danych
sformułowania zadania prognostycznego
sformułowania zadania prognostycznego
⦁ Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:
modelem Poissona
modelem zerowym
modelem nasyconym
modelem nasyconym
k-krotna walidacja krzyżowa służy do:
wyboru zmiennych objaśniających
badania normalności reszt modelu
określenia jakości modelu w trakcie jego uczenia
określenia jakości modelu w trakcie jego uczenia
Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy
modelem logitowym
logitem
szansą wystąpienia A ()
szansą wystąpienia A ()

Powiązane tematy

#modelowanieii

Inne tryby