Fiszki

Wanat Egzaminy I

Test w formie fiszek Modelowanie II
Ilość pytań: 54 Rozwiązywany: 551 razy
Sumę kwadratów reszt (RSS) nazywamy:
zmiennością wyjaśnioną przez model
całkowitą zmiennością
zmiennością niewyjaśnioną przez model
zmiennością niewyjaśnioną przez model
Średni błąd predykcji ex post (root mean square error, RMSE):
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
mierzy, w jakim stopniu model wyjaśnia zmiany zmiennej prognozowanej w czasie
wskazuje, o ile przeciętnie wzrasta wartość zmiennej prognozowanej w porównaniu z "ostatnią" wartością rzeczywistą
mierzy, o ile średnio odchylają się rzeczywiste realizacje zmiennej prognozowanej od obliczonych prognoz
Liniowy modelu regresji może być estymowany za pomocą:
metoda najmniejszych kwadratów
metody największej wiarygodności
metody eksperckiej
metoda najmniejszych kwadratów
Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:
specyfikę zadania predykcyjnego
właściwości różnych narzędzi modelowania predykcyjnego
rodzaj i zakres dostępnych danych statystycznych
specyfikę zadania predykcyjnego
Narzędzia wykrycia zależności pomiędzy zmiennymi opisującymi badane obiekty a prawdopodobieństwem zaistnienia lub poziomem pewnej zmiennej służą do:
modelowania predykcyjnego
eksploracji danych
uczenia bez nadzoru
modelowania predykcyjnego
Określenie wymagania co do dopuszczalności i horyzontu prognozy zaliczamy do następującego etapu budowy modelu predykcyjnego:
sformułowania zadania prognostycznego
analitycznego przygotowania danych
określenia kontekstu modelowania
sformułowania zadania prognostycznego
Dodanie do uogólnionego modelu liniowego (GLM) kolejnej zmiennej zależnej (regresora) skutkuje:
większeniem dewiancji
zmniejszeniem dewiancji
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową)
zmniejszeniem lub zwiększeniem dewiancji (w zależności od tego, czy dodajemy zmienną jakościową, czy ilościową)
. Krzywą ROC można wykorzystać:
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia
do oceny współliniowości zmiennych objaśniających
do ceny i porównywania między sobą modeli klasyfikacyjnych
do ustalenia optymalnego punkt odcięcia

Na podstawie krzywej ROC można ustalić optymalny

punkt odcięcia. Przyjmując równe koszty błędnych

klasyfikacji, optymalnym punktem odcięcia jest punkt na

krzywej ROC znajdujący się najbliżej punktu o

współrzędnych (0.1).

 Krzywą ROC wykorzystuje się także do oceny i

porównywania między sobą modeli klasyfikacyjnych. Jako

miarę dobroci i trafności danego modelu przyjmuje się

pole pod wykresem krzywej ROC, oznaczane jako AUC.

Miernik AUC przyjmuje wartości z przedziału 0, 1 . Im

wartość tego miernika jest większy, tym model jest lepszy.

W uogólnionym modelu liniowym (GLM) funkcja wiążąca łączy:
predyktor liniowy z wektorem parametrów modelu 𝜷 = (𝛽0, 𝛽1,..., 𝛽𝑘)
predyktor liniowy z średnią zmiennej zależnej
predyktor liniowy z kombinacją liniową średnich zmiennych niezależnych
predyktor liniowy z średnią zmiennej zależnej
Modelem zerowym nazywamy uogólniony model liniowy (GLM),
w którym nie uwzględnia się zmiennych objaśniających (regresorów)
o liczbie parametrów równej liczbie obserwacji
o największej dewiancji
w którym nie uwzględnia się zmiennych objaśniających (regresorów)
W uogólnionym modelu liniowym (GLM)
wariancja zmiennej zależnej może być funkcją jej średniej
wariancja zmiennej zależnej musi być stała
wariancja zmiennej zależnej może być dowolna
wariancja zmiennej zależnej może być funkcją jej średniej
Sumę kwadratów reszt (RSS) nazywamy:
całkowitą zmiennością
zmiennością niewyjaśnioną przez model
zmiennością wyjaśnioną przez model
zmiennością niewyjaśnioną przez model
Jakościowa zmienna objaśniająca przyjmująca wartości ze zbioru pięciu kategorii w liniowym modelu regresji jest kodowana za pomocą:
czterech zmiennych zero-jedynkowych
pięciu zmiennych zero-jedynkowych
liczba zmiennych kodujących zleży od liczby obserwacji
czterech zmiennych zero-jedynkowych
⦁ Dokonując wstępnego wyboru narzędzi modelowania predykcyjnego należy uwzględnić (między innymi) następujące czynniki:
rodzaj i zakres dostępnych danych statystycznych
specyfikę zadania predykcyjnego
właściwości różnych narzędzi modelowania predykcyjnego
rodzaj i zakres dostępnych danych statystycznych
specyfikę zadania predykcyjnego
właściwości różnych narzędzi modelowania predykcyjnego

Wybór klasy modelu. Na podstawie wiedzy zebranej

we wcześniejszych etapach analityk musi wybrać

odpowiednią klasę modelu, która jest w stanie rozwiązać

postawiony problem. Wybór zależy m.in. od:

 specyfiki zadania predykcyjnego,

 charakteru modelowanej zmiennej,

 właściwości różnych narzędzi modelowania predykcyjnego,

 rodzaju i zakresu dostępnych danych statystycznych,

 kosztów zastosowania określonych metod,

 rodzaju konstruowanych prognoz

Powiązane tematy

#modelowanieii

Inne tryby