⦁ Do elementów konstrukcyjnych uogólnionego modelu liniowego zaliczamy:
liniowy predyktor
wykładniczą rodzinę rozkładów
funkcję wiążącą
liniowy predyktor
wykładniczą rodzinę rozkładów
funkcję wiążącą
⦁ Modelem logitowym (regresją logistyczną) nazywamy uogólniony model liniowy (GLM), w którym zmienna objaśniana ma rozkład:
Poissona
normalny
Bernoulliego
Bernoulliego
⦁ Do mierników pomocnych w wyborze zmiennych objaśniających (predyktorów) zaliczamy:
moc informacyjną zmiennej IV
wskaźnik WoE
wskaźnik wpływu
moc informacyjną zmiennej IV
Jednorodność wariancji modelu liniowego sprawdzamy testem:
Breuscha-Pagana
Studenta
Durbina-Watsona
Breuscha-Pagana
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością niewyjaśnioną przez model
zmiennością wyjaśnioną przez model
całkowitą zmiennością
zmiennością niewyjaśnioną przez model
Średni błąd predykcji ex post (root mean square error, RMSE):
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
określenia kontekstu modelowania
sformułowania zadania prognostycznego
analitycznego przygotowania danych
sformułowania zadania prognostycznego
Modelem logitowym (regresją logistyczną) nazywamy uogólniony model liniowy (GLM), w którym zmienna objaśniana ma rozkład:
Poissona
Bernoulliego
normalny
Bernoulliego
W ubezpieczeniach uogólnione modele liniowe można wykorzystać w modelowaniu:
w taryfikacji
wysokości pojedynczej szkody
liczby szkód
liczby szkód
k-krotna walidacja krzyżowa służy do:
określenia jakości modelu w trakcie jego uczenia
wyboru zmiennych objaśniających
badania normalności reszt modelu
określenia jakości modelu w trakcie jego uczenia
Krzywą ROC można wykorzystać:
do oceny współliniowości zmiennych objaśniających
o ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
do ustalenia optymalnego punkt odcięcia
Logarytm stosunku prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia.
szansą wystąpienia A ()
modelem logitowym
logit
logit
Iloraz prawdopodobieństwa wystąpienia zdarzenia do prawdopodobieństwa jego niewystąpienia nazywamy
szansą wystąpienia A ()
modelem logitowym
logitem
szansą wystąpienia A ()
Wskaźnik ten określa siłę związku między zmienną niezależną a zmienną zależną poprzez obliczenie logarytmu stosunku prawdopodobieństw (iloraz szans) dla każdej kategorii zmiennej niezależnej w odniesieniu do bazowej kategorii.
moc informacyjną zmiennej IV
Wskaznik WoE
wskaźnik wpływu
Wskaznik WoE
Za pomocą tego miernika można dokonać rankingu zmiennych
objaśniających.
wskaźnik wpływu
Wskaznik WoE
moc informacyjną zmiennej IV
moc informacyjną zmiennej IV
Uogólniony model liniowy o liczbie parametrów równej liczbie obserwacji nazywamy:
modelem Poissona
modelem zerowym
modelem nasyconym
modelem nasyconym
Element diagonalny macierzy daszkowej nazywamy:
wskaźnikiem wpływu (dźwignią)
miarą Cooka
standaryzowaną resztą modelu
wskaźnikiem wpływu (dźwignią)
Przykładowe testy normalności:
Shapiro-Wilka
Breuscha-Godfreya
Jarque–Bera
Shapiro-Wilka
Jarque–Bera
Niezależności reszt modelu liniowego sprawdzamy testem:
Breuscha-Godfreya
Durbina-Watsona
Harrisona-McCabe
Durbina-Watsona
Jednorodność wariancji modelu liniowego sprawdzamy testem: