w celu wyboru modelu o dobrych własnościach predykcyjnych
w celu określania obserwacji wpływowych
w celu wyboru modelu o dobrych własnościach predykcyjnych
. Statystyka 𝐶𝑝 Mallowsa wykorzystywana jest:
w celu badania istotności obserwacji wpływowych
w celu wyboru modelu o dobrych własnościach predykcyjnych
w celu określania obserwacji wpływowych
w celu wyboru modelu o dobrych własnościach predykcyjnych
W modelu regresji liniowej
zmienna zależna musi mieć rozkład normalny
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
wszystkie zmienne objaśniające muszą być ilościowe
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
W modelu regresji liniowej
zmienna zależna musi mieć rozkład normalny
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
wszystkie zmienne objaśniające muszą być ilościowe
reszty muszą mieć rozkład normalny o średniej zero i takiej samej wariancji
Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od prognoz jest to:
ocena ex ante błędu prognoz
miernik ex post błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
ocena ex ante błędu prognoz
Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od prognoz jest to:
ocena ex ante błędu prognoz
miernik ex post błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
ocena ex ante błędu prognoz
Narzędzia wykrycia zależności pomiędzy interesującą nas zmienną objaśnianą (kilkoma zmiennymi objaśnianymi) opisującą badane obiekty (jednostki) a zbiorem innych zmiennych objaśniających (niezależnych, predyktorów) też opisujących te obiekty
uczenie bez nadzoru
uczenie z nadzorem
modelowanie predykcyjne
uczenie z nadzorem
Narzędzia wykrycia zależności pomiędzy interesującą nas zmienną objaśnianą (kilkoma zmiennymi objaśnianymi) opisującą badane obiekty (jednostki) a zbiorem innych zmiennych objaśniających (niezależnych, predyktorów) też opisujących te obiekty
uczenie bez nadzoru
uczenie z nadzorem
modelowanie predykcyjne
uczenie z nadzorem
. Odkrywania nietrywialnych zależności, schematów, wzorców, reguł w zbiorach danych to
uczenie z nadzorem
uczenie bez nadzoru
modelowanie predykcyjne
uczenie bez nadzoru
. Odkrywania nietrywialnych zależności, schematów, wzorców, reguł w zbiorach danych to
uczenie z nadzorem
uczenie bez nadzoru
modelowanie predykcyjne
uczenie bez nadzoru
Zapoznanie się z istniejącą teorią dotyczącą modelowanego zjawisk oraz z poświęconymi mu dotychczasowymi badaniami to czynności realizowane na następującym etapie budowy modelu predykcyjnego:
określenie kontekstu modelowania
sformułowanie zadania prognostycznego
analityczne przygotowanie danych
określenie kontekstu modelowania
Zapoznanie się z istniejącą teorią dotyczącą modelowanego zjawisk oraz z poświęconymi mu dotychczasowymi badaniami to czynności realizowane na następującym etapie budowy modelu predykcyjnego:
określenie kontekstu modelowania
sformułowanie zadania prognostycznego
analityczne przygotowanie danych
określenie kontekstu modelowania
Reszty w poprawnie oszacowanego modelu liniowego powinny:
mieć rozkład normalny
mieć rozkład normalny być jednorodne i niezależne.
i niezależne.
mieć rozkład normalny być jednorodne i niezależne.
Reszty w poprawnie oszacowanego modelu liniowego powinny:
mieć rozkład normalny
mieć rozkład normalny być jednorodne i niezależne.
i niezależne.
mieć rozkład normalny być jednorodne i niezależne.
Uogólnione modele liniowe (ang. generalized linear models – GLMs) są rozszerzeniem zwykłych modeli regresji
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
Uogólnione modele liniowe (ang. generalized linear models – GLMs) są rozszerzeniem zwykłych modeli regresji
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
Wariancja zmiennej zależnej może być funkcją jej średniej (nie musi być stała).
Zmienna objaśniana może być połączona z liniową kombinacją zmiennych objaśniających za pomocą funkcji nieliniowych (funkcji wiążących).
Zmienna objaśniana może mieć rozkład należący do wykładniczej rodziny rozkładów (np. normalny, gamma, Poissona, dwumianowy, Tweedie)
⦁ Krzywą ROC można wykorzystać:
do oceny współliniowości zmiennych objaśniających
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
⦁ Krzywą ROC można wykorzystać:
do oceny współliniowości zmiennych objaśniających
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
⦁ W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z wektorem parametrów modelu , ,...,
predyktor liniowy z średnią zmiennej zależne
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
predyktor liniowy z średnią zmiennej zależne
⦁ W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z wektorem parametrów modelu , ,...,
predyktor liniowy z średnią zmiennej zależne
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
predyktor liniowy z średnią zmiennej zależne
⦁ Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
zwiększeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
zmniejszeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
⦁ Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
zwiększeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
zmniejszeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową
⦁ Istotność parametrów modelu liniowego (każdego z osobna) sprawdzamy testem:
Breuscha-Pagana
Studenta
Durbina-Watsona
Studenta
⦁ Istotność parametrów modelu liniowego (każdego z osobna) sprawdzamy testem:
Breuscha-Pagana
Studenta
Durbina-Watsona
Studenta
⦁ Sumę kwadratów reszt (RSS) nazywamy:
całkowitą zmiennością
zmiennością wyjaśnioną przez model
zmiennością niewyjaśnioną przez model
zmiennością niewyjaśnioną przez model
⦁ Sumę kwadratów reszt (RSS) nazywamy:
całkowitą zmiennością
zmiennością wyjaśnioną przez model
zmiennością niewyjaśnioną przez model
zmiennością niewyjaśnioną przez model
⦁ Element diagonalny macierzy daszkowej nazywamy:
wskaźnikiem wpływu (dźwignią
standaryzowaną resztą modelu
miarą Cooka
wskaźnikiem wpływu (dźwignią
⦁ Element diagonalny macierzy daszkowej nazywamy:
wskaźnikiem wpływu (dźwignią
standaryzowaną resztą modelu
miarą Cooka
wskaźnikiem wpływu (dźwignią
⦁ Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
⦁ Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
⦁ Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od obliczonych prognoz jest to:
miernik ex post błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
ocena ex ante błędu prognoz
miernik ex post błędu prognoz
⦁ Wartość odchylenia rzeczywistych realizacji zmiennej prognozowanej od obliczonych prognoz jest to:
miernik ex post błędu prognoz
miernik dopasowania modelu do danych rzeczywistych
ocena ex ante błędu prognoz
miernik ex post błędu prognoz
⦁ Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
sformułowania zadania prognostycznego
określenia kontekstu modelowania
analitycznego przygotowania danych
sformułowania zadania prognostycznego
⦁ Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
sformułowania zadania prognostycznego
określenia kontekstu modelowania
analitycznego przygotowania danych
sformułowania zadania prognostycznego
⦁ Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:
modelem Poissona
modelem zerowym
modelem nasyconym
modelem nasyconym
⦁ Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:
modelem Poissona
modelem zerowym
modelem nasyconym
modelem nasyconym
k-krotna walidacja krzyżowa służy do:
określenia jakości modelu w trakcie jego uczenia
wyboru zmiennych objaśniających
badania normalności reszt modelu
określenia jakości modelu w trakcie jego uczenia
k-krotna walidacja krzyżowa służy do:
określenia jakości modelu w trakcie jego uczenia
wyboru zmiennych objaśniających
badania normalności reszt modelu
określenia jakości modelu w trakcie jego uczenia
Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy
modelem logitowym
szansą wystąpienia A ()
logitem
szansą wystąpienia A ()
Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy