Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k




Pobierz 92.09 Kb.
NazwaΜ – niezmienna I stała wielkość równa dla wszystkich poziomów k
Data konwersji20.12.2012
Rozmiar92.09 Kb.
TypDokumentacja



  1. Dwuczynnikowa analiza wariancji (anova)

  2. Wygładzenie wykładnicze

  3. Szeregi czasowe

  4. Jednoczynnikowa analiza wariancji (anova)

  5. Estymacja jądrowa i jądro – estymacja nieparametryczna

  6. Indeksy sezonowe (model multiplikatywny, addytywny) – sezonowość

  7. Karty kontrolne (granica i odchylenie, jak są tworzone)

  8. Jednoetapowe wyznaczanie kart

  9. Metoda najmniejszych kwadratów - wyprowadzić wzór

  10. Metoda sumy kwadratów odchyleń – wyprowadzić wzór

  11. Jednostopniowy test kontroli jakości

  12. Współczynnik R^2 (współczynnik determinacji)

  13. Obliczyć średnią wycentrowana

  14. Średnia Winsorowska

  15. Regresja wieloraka

  16. Regresja liniowa

  17. Plan badań wg. oceny alternatywnej

  18. Wygładzanie szeregu czasowego metodą średniej ruchomej

  19. Problem decyzyjny i kryteria podejmowania decyzji

  20. Średnia ucięta

  21. Średnia ruchoma



Ad. 1


Badamy czy czynniki α, β wpływa na zmienną objaśnianą X, czy zachodzi miedzy nimi interakcja, czy wpływa tylko jeden czynnik.


Hipotezy:







H – czynnik α nie wpływa

K – wpływa

H – czynnik β nie wpływa

K – wpływa

H – nie ma interakcji

K – są interakcje


Jeśli założenia nie są spełnione to stosujemy test rangowy Kruskala-Wallisa, dla nieparametrycznej ANOVY.



µ – niezmienna i stała wielkość równa dla wszystkich poziomów

k – nr. obserwacji

αi – wpływ i tego poziomu czynnika α

β j – wpływ j tego poziomu czynnika β

γij – wpływ interakcji czynnika α z i-tego poziomu, i czynnika β z j-tego poziomu.

εijk – składnik losowy (błąd)



Źródło zmienności

Suma kwadratów odchyleń

Liczba stopni swobody

Średni kwadrat odchyleń

Statystyka testowa

p-value

A

SSA

r-1

MSA=SSA/(r-1)

T1=MSA/MSE

T2=MSB/MSE

T3=MSAB/MSE




B

SSB

s-1

MSB=SSB/(s-1)

Interakcje

SSAB

(r-1)(s-1)

MSAB=SSAB/(r-1)(s-1)

błąd

SSE

r * s * (n-r)

MSE=SSE/rs(n-r)

ogółem

SST

r * s *(n-1)






SST = SSA + SSB +SSAB + SSE







sum-squere-total – całkowita suma kwadratów odchyleń. Czyli suma różnic wszystkich wartości Xij od oczekiwanej wartości X



sum-squere-error –suma kwadratów odchyleń odpowiadająca efektom losowym



sum-squere-A –suma kwadratów odchyleń wartości średnich grupowych cechy A od średniej ogólnej.



sum-squere-B –suma kwadratów odchyleń wartości średnich grupowych cechy B od średniej ogólnej.



Suma kwadratów odchyleń wynikająca z interakcji


Wzory:

Średnia ogólna:



Średnia dla i-tego poziomu czynnika



Średnia dla j-tego poziomu czynnika



Średnia w kratce i,j



Ad. 2


Wygładzenie wykładnicze – przydatne do prognozowania szeregów nie mających wyraźnego trendu i wahań sezonowych - gdy są tylko wahania losowe. Wygładzamy przez wpływ ostatnich wartości szeregu na prognozę, w stosunku do wpływu bardziej odległych obseracji.


Jest to metoda, w której prognoza oparta jest na średniej ważonej aktualnych i historycznych wartości szeregu. Największą waga nadana jest bieżącej obserwacji i mniejsza waga poprzedniej. Wagi zmniejszają się geometrycznie w miarę cofania się w czasie.


Stosuje się gdy nie ma wyraźnie zarysowanego trendu i sezonowości.


Prognoza:

gdzie to level


Im większa wartość tym szybciej szereg prognoz reaguje na zmiany wartości szeregu oryginalnego. Im mniejsza wartość tym mniej prognoza jest wrażliwa na zmiany wartości zmiennej Zt


Gdy szereg jest gladki to bierzemy małe, a gdy nieregularny to bierzemy duże. Sposób wyboru podyktowany przez błedy. Najważniejzy błąd średniokwadratowy.


Gdy =1 to (patrzy na ostatni)

Gdy =0 to (patrzy na to co się zdażyło dalej w historii)

Ad. 3


Dana jest zmienna losowa i jej wartości: Y1 , Y2 , ... , Yn

Niech Yt = E(Yt) + t dla t = 1,2,...,n

Zbiór punktów dla {t, Yt } dla t = 1,2,..,n nazywamy szeregiem czasowym


Opis szeregu:

Jeżeli E(Yt) = f(t)*a(t) to model multiplikatywny

Jeżeli E(Yt) = f(t)+a(t) to szereg czasowy jest addytywny

f(t) – funkcja trendu

a(t) – funkcję wahań sezonowych(sezonowość)


Składniki szeregu czasowego:

1 – trend – stała tendencja rozwojowa – Tt

2 – wahania sezonowe – miesięczne, kwartalne, roczne - Si

3 – wahania cykliczne – duży okres, trudno określić - Ci

4 – wahania przypadkowe – składnik nieregularny (błąd) - Et


Badania szeregu czasowego:

  • Dekompozycja szeregu czasowego (rozłożenie go)

modele:

multiplikatywny: Yi = Ti *Si*Ci*Et (zmienna amplituda)

addytywny: Yi = Ti + Si + Ci+Et (stała amplituda i trend)

  • Analiza trendów – metodą najmniejszych kwadratów estymujemy współczynniki

Aby móc przeprowadzić badanie szeregu czasowego należy najpierw wygładzić szereg czasowy za pomocą średnich ruchomych:

    • dla nieparzystego okresu m – okres wygładzenia (2q+1)

    • dla parzystych m- okr.wygładzenia (2q)

Przy czym w wygładzonym szeregu pomijamy pierwszze i ostatnie q obserwacji.


Wygładzenie szeregu czasowego metodą w ykladniczą

Eliminacja przypadkowych wahań. Analiza trendu w modelu nie zmieniającym wahań okresowych. Stosujemy tutaj (najczęściej) prostą lub krzywą regresji. Metodą najmniejszych kwadratów estymujemy współczynniki i wyznaczamy trend



Estymujemy a0 i a1

Trend liniowy:

Trend potęgowy:

Trend wykładniczy: .

Ad. 4


Analiza wariancji to technika postępowania przy badaniu wpływu jakiegoś czynnika na przypadkowe wyniki (Badamy czy czynnik α wpływa na zmienną objaśnianą X). Jenoczynnikowa analiza wariancji zajmuje się testowaniem równości średnich


Hipoteza:



Jeśli średnio rzecz biorąc średnie są równe to czynnik A nie ma wpływu na zmienną objaśnioną X.


Założenia Analizy Wariancji:

  1. Próbki są niezależne

  2. Próbki pochodzą z populacji o rozkładzie normalnym

  3. Wariancje od rozkładów odpowiadających poszczególnym poziomom są sobie równe.


Jeśli założenia nie są spełnione to stosujemy test rangowy Kruskala-Wallisa, dla nieparametrycznej ANOVY.



Xijj-ta obserwacja na i-tym poziomie

µ – niezmienna i stała wielkość równa dla wszystkich poziomów

αi – wpływ i tego poziomu

εij – składnik losowy (błąd)


Jeśli założenie są spełnione to ANOVA:

  • jeśli H przyjmuje to koniec obserwacji,

  • jeśli odrzucamy H to porównanie wielokrotne.

Tablica Anovy

Źródło zmienności

Suma kwadratów odchyleń

Liczba stopni swobody

Średni kwadrat odchyleń

Statystyka testowa

p-value

Różnice międzygrupowe

SSA

r-1

MSA=SSA/(r-1)

F=MSA/MSE




Różnice wewnątrz grupowe

SSE

n-r

MSE=SSE/(n-r)

ogółem

SST=SSA+SSE

n-1









sum-squere-total – całkowita suma kwadratów odchyleń. Czyli suma różnic wszystkich wartości Xij od oczekiwanej wartości X



sum-squere-error –suma kwadratów odchyleń wartości cechy od średnich grupowych. Czyli suma różnic wszystkich Xij od oczekiwanej wartości z grupy Xi



sum-squere-A –suma kwadratów odchyleń wartości średnich grupowych cechy A od średniej ogólnej. Czyli suma różnic wszystkich średnich z grupy i Xi od oczekiwanej wartości ze wszystkich obserwacji



Estymator nieobciążony wariancji ogólnej.



Estymator nieobciążony wariancji ogólnej. Nie musi być nieobciążony, jednak jeśli H – jest prawdziwe, to jest nieobciążony.



Ad. 5


Estymacja nieparametryczna:

  • estymacja gęstości rozkładu – powszechnie stosowanym kryterium jest scałkowany błąd średniokwadratowy



- badany estymator

f – estymowana gęstość

  • Najprostszym estymatorem gęstości jest HISTOGRAM

(Jeśli X1 ,...., Xn jest próbą losową, to estymator zapisujemy

(x) =

- szerokość klasy

Gdy histogram jest estymatorem gęstości to zawsze jest to funkcja nieciągła.

Inny sposób estymowania gęstości rozkładu to estymatory jądrowe:

Jądrem nazywamy funkcję KR => R spełniające warunki:

  1. K(x) > 0





  2. K – symetryczne względem zera

Estymatorem jądrowym nazywamy funkcję postaci:



gdzie:

h – stała (zwana szerokością pasma, parametrem wygładzającym)

K – jądro

X1 , ... , Xn – próba

ma takie same własności analityczne (różniczkowość , całkowitość) jak funkcja K.

Ad. 6

Indexy sezonowe – kryteria


Niech : zi – wahania sezonowe w i-tej obserwacji, ilość sezonów k , n – ilość pomiarów danego sezonu.

średnia wartość wahań sezonowych w i-tym sezonie - Si’ = ( zi + zi+k +…+ zi+(n-1)*k) * 1/n

suma średnich wahań sezonowych Si’ (dla i od 1 do k) , ss = (Si + Si+1’+…+Sk )

index sezonowy dla i tego sezonu, Si = Si’* ( k / ss )

(czyli jego średnia sezonowa pomnożona przez, liczbę sezonów dzielonych przez sumę średnich sezonowych )

zi – w modelu multiplikatywnym to (Ŷi / Yi) gdzie Ŷi – średnia ruchoma o okresie k

zi – w modelu addytywnym to (Yi - Ti)


Indexy sezonowe w modelu multiplikatywnym: Yi = Ti *Si*Ci
Index Si mówi o ile poziom zjawiska (wydobycie węgla itp.) jest w i-tym obrazie wyższy bądź niższy od poziomu zjawiska opisanego przez trend.

(Si – 1)*100% - wyraża nam stosunek procentowy, zwiększenia lub zmniejszenia zjawiska w stosunku do trendu.





Indexy sezonowe w modelu addytywnym: Yi = Ti + Si + Ci

Index Si mówi o ile wartość danego zjawiska (wydobycie węgla itp.) jest w i-tym obrazie wyższy bądź niższy od poziomu zjawiska opisanego przez trend.

indeks sezonowy = średnia dla sezonu + |suma średnich| / liczba skladowych sezonu


- wartość trendu prognozujemy z równania regresyjnego trendu

- estymujemy indeksami sezonowymi

- składowa cykliczna

Ad. 7

Na dołączonej kartce



Ad. 9


Najlepiej znaną i najczęściej stosowaną w praktyce metodą estymacji nieznanych parametrów strukturalnych modelu jest metoda najmniejszych kwadratów (MNK). Przyjmujemy następujące założenia dotyczące stosowalności MNK do szacowania wektora w modelu


W postaci najprostszej postulat ten brzmi tak: wartością najbardziej prawdopodobną, otrzymaną z szeregu wyników tak samo dokładnych pomiarów, jest taka, od której obliczone odchylenia tych wyników, po podniesieniu do drugiej potęgi i zsumowaniu dają wielkość najmniejszą z możliwych. Czyli przyjęcie do obliczenia odchyleń wielkości dowolnej innej, niż najbardziej prawdopodobna, da sumę ich drugich potęg (kwadratów) większą. Z postulatu Legendre’a wynika, że najbardziej prawdopodobną wielkością z szeregu jednakowo dokładnych pomiarów jednej wielkości jest ich średnia zwykła. W przypadku pomiarów niejednakowo dokładnych postulat ten brzmi podobnie, stosuje się jednak do odchyleń równoważonych „wagami”, tj wartość ma tym większą wagę im bardziej dokładny jest pomiar. W tym przypadku najbardziej prawdopodobną okazuje się wielkość zwana średnią ważoną. Gdy w zadaniu jest wiele niewiadomych, a nie są dostępne bezpośredniemu pomiarowi, muszą być obliczane jako funkcje wielu innych mierzonych wielkości.

Ad. 12

Własności współczynnika determinacji:

  1. R2 = 1 jeżeli dla i= 1,2,...,n

  2. R2 = 0 jeżeli Zmienna X nie ma wpływu na Y



współczynnik determinacji wyrażamy w procentach. Oznacza jaki % zmienności zmienej zależnej Y zostaje wyjaśniony przez regresję liniową zmiennej X

Fakt:



gorzej dopasowane lepiej dopasowane



SSR – zmienność wyjaśniona przez model regresji

SSE – zmienność niewyjaśniona

SST – zmienność całkowita

Ad. 14


Powstaje w wyniku obliczenia średniej z próby z której usunięto obserwacji najmniejszych i obserwacji największych, przy czym zastąpiono usunięte najmniejsze , najmniejszą z pozostałych i największe usunięte, największą z pozostałych.

  1. porządkowanie próby

  2. ucięcie k – obserwacji z obu stron

  3. odcięte obserwacje uzupełniamy o k+1 obserwacji na początku, i n – k’tą na końcu

  4. liczymy średnią



Ad. 15


Jeśli zakldamay liniowy związek między zmienną zależną Y, a zbiorem kilku niezależnych zmiennych lyb gdy zakładany związek między zmiennymi nieliniowymi, wtedy stosujemy metodę zwaną regresją wiloraką.


Założenia:

  1. Dla każdej obserwacji błąd(skladnik) losowy ma rozkład normalny o średniej=0 i standardowym odchyleniu  oraz jest niezależny od składników losowych związanych z wszystkimi innymi obserwacjami i jest niezależny od innych błędów losowych.

  2. W ramach analizy regresji zmienne Xi, uważamy za wielkości których wartości są ustalone, podczas gdy w ramach analizy korelacji zmienne Xi są traktowane jako wielkości losowe. W każdym przypadku zmienne Xi są niezależne od błędu losowego . Gdy zakładamy, że wartości Xi są wartościami ustalonymi, to przyjmujemy, że dotyczy to wszystkich k zmiennych i że jedynym źródłem losowości zmiennych Y jest składnik losowy .


Kroki badania dopasowania:

  1. R2  100%

  2. analiza wariacji

H: a1= a2=...= 0

K: a1<>0 lub a2<>0

  1. testy istotności

H: a1=0

K: a1<>0

  1. czy resety mają rozkąłd normalny



Ad. 16


Regresja – statystyczne metody modelowania związków między zmiennymi


Prosta regresja liniowa – modelowanie związków między dwiema zmiennymi: zmienną zależną (Y) i zmienną niezależną (X). Model którym się posługujemy zakłada że między X i Y zachodzi liniowy związek. Na wykresie rozproszenia zauważamy wzrost Y w odpowiedzi na wzrost X.


Szacowanie (estymacja) parametrów metodą najmniejszych kwadratów. Daje ona najlepsze nieobciążone estymatory parametrów regresji.

Y = b0 + b1X + e

Wtedy równaniem linii regresji jest:



Znajdujemy b0 i b1 minimalizujące SSE:



Linia regresji przechodzi przez punkt




Przebieg regresji liniowej:

  1. Znaleźć funkcję y=f(x) (dopasowanie modelu)

  2. Sprawdzić:

  1. Wsp. Korelacji

  2. Test istotności dla wsp. Kierunkowego b

H: B=0

K: H

  1. analiza wariancji

H: nie istnieje zależnośc miedzy X i Y

K: H

  1. test istotności dla wsp. Korelacji

H: =0

K: H

e) czy resety mają rozkład normalny

Ad. 18


Nieparzysty okres wygładzania:



m – okres wygładzania

m = 2q + 1

Np. dla m = 3: q = 1, Yt = ( 1 / 3 ) * ( Yt-1+Yt+Yt+1) – więc będzie teraz wartością średnią z obserwacji jej poprzedzającej, jej samej i następnej. Przy czym w wygładzonym szeregu pomijamy pierwsze i ostatnie q obserwacji.


Parzysty okres wygładzania:



m – okres wygładzania

m = 2q

Przy czym w wygładzonym szeregu pomijamy pierwsze i ostatnie q obserwacji.

Ad. 19


Problem decyzyjny to pojęcie z zakresu teorii decyzji, oznaczające sytuację problemową, w której podmiot (decydent) staje przed koniecznością wyboru jednego z przynajmniej dwóch możliwych wariantów działania.

Sformułowanie problemu decyzyjnego jest zazwyczaj pierwszym krokiem do zbudowania modelu decyzyjnego. Dobrze sformułowany problem powinien szczegółowo definiować:
    * decydenta lub decydentów
    * warunek ograniczający decyzję
    * zbiór decyzji dopuszczalnych
    * kryteria oceny decyzji

Proces Decyzyjny:


  1. Sformułuj jasno problem decyzyjny ( sytuacja w której podmiot – decydent - staje przed wyborem jednego z przynajmniej dwóch wariantów działania )

  2. Wylicz wszystkie możliwe decyzje ( różne możliwe warianty działania dla decydenta)

  3. Zidentyfikuj wszystkie możliwe stany natury ( czyli każde z możliwych następstw wariantu decyzyjnego, niezależne od decydenta, ale mające wpływ na wypłatę )

  4. Określ wypłatę dla każdej możliwej sytuacji (czyli komórce na przecięciu decyzji/stan natury)

  5. Wybierz stosowny model matematyczny problemu decyzyjnego

  6. Zastosuj wybrany model i podejmij decyzję.


Zbiór możliwych decyzji (akcji)

Zbiór stanów natury

Wypłata (korzyść)


Strata możliwości

Przy danym stanie natury θj strata możliwości związana z decyzją ai jest równa maksymalnej wypłacie w stanie natury θj minus wypłatą w stanie wij odpowiadającą j-temu stanowi natury i i-tej decyzji ai




I

Decyzja ak dominuje decyzję ai (nie jest gorsza od ai), jeżeli



Decyzja ak ściśle dominuje decyzję ai (jest lepsza od ai), jeżeli



oraz



Decyzja ak jest równoważna decyzji ai , jeżeli



Decyzja ak jest dopuszczalna jeśli nie istnieje decyzja ściśle ją dominująca.

Kryteria wyboru decyzji optymalnych


Podejmowanie decyzji w warunkach pewności

(tylko 1 stan natury)

Decyzja optymalną jest decyzja która odpowiada maksymalnej wypłacie.


Podejmowanie decyzji w warunkach ryzyka

Znany jest rozkład prawdopodobieństwa wystąpienia poszczególnych stanów natury. (teoretyczne założenia, badania empiryczne przeprowadzone w przeszłości, subiektywna ocena decydenta)



Kryteria wyboru w warunkach ryzyka:

- maksymalizacja oczekiwanej wypłaty (oczekiwana oznacza ze mnożysz ją przez prawdopodobieństwo)

liczysz EMV dla wierszy, sumując wypłaty mnożone przez prawdopodobieństwo ich zajścia.



wybierasz maksymalną z oczekiwanych wypłat (maksymalne EMV z wszystkich wierszy)



- minimalizacja oczekiwanej straty możliwości (obliczanie tablicy strat możliwości)

liczysz EOL dla wierszy, sumując straty mnożone przez prawdopodobieństwo ich zajścia.



wybierasz minimalną z oczekiwanych strat możliwości




Podejmowanie decyzji w warunkach niepewności:

Nie dysponujemy żadnymi informacjami o prawdopodobieństwie.


Kryteria wyboru w warunkach niepewności:

- kryterium maksymaksowe (MaxMax)

decyzją optymalną jest ta której odpowiada maksymalna wypłata

(wybierasz maksymalna wypłatę z każdego wiersza, i z nich wybierasz maksymalna)



- kryterium maksyminowe (MaxMin)

decyzją optymalną jest ta której odpowiada maksymalna z minimalnych wypłat

(wybierasz minimalną wypłatę z każdego wiersza, i z nich wybierasz maksymalną)




- kryterium Laplace’a

decyzja której odpowiada maksymalna oczekiwana wypłata

(liczysz średnią wypłatę z każdego wiersza (decyzji) i wybierasz największą z nich)

m – ilość stanów natury



- kryterium Hurwicza

decyzja której odpowiada maksymalna wartość oceny Hurwicza



ocenę dla decyzji ai liczymy używając współczynnika α [0,1] (‘stopnia optymizmu’)

( mnożymy maksymalną wypłatę w wierszu przez współczynnik α, i dodajemy do niej minimalną wypłatę w wierszu pomnożoną przez (1 – α) – z tak powstałych ocen wierszy(decyzji) wybieramy maksymalną )



- kryterium Savage’a (minmaxowe, MinMax)

decyzja której odpowiada minimalna z maksymalnych strat możliwości.

(liczymy tablice strat możliwości. W niej z wierszy wybieramy maksymalną wartość , a następnie z wybranych wartości wybieramy minimalną)



Ad. 20


Powstaje w wyniku obliczenia średniej z próby z której usunieto obserwacji najmniejszych i obserwacji największych. Srednia ucięta dla = 1 wynosi 4,25

Krok po krou

  1. Porządkowanie próby

  2. Odcięcie obserwacji krańcowych (% obserwacji, lub k obserwacji) [przeważnie 1-2%]
    k – jeśli znamy liczność próby. k:= max{ k <= n* α }

  3. Liczymy średnią


Dodaj dokument na swoim blogu lub stronie

Powiązany:

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconB. cele wychowawcze dla wszystkich poziomów klas

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconPrzewodnik po prawie. Model edukacji prawnej dla wszystkich poziomów nauczania.”

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconPraca, moc, energia praca: jest ot liczbowa wielkość fizyczna równa iloczynowi siły I przemieszczenia (drogi) w = f ּ s [J]

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconWydaje mi się, że to powinno pozostać z tego krótkiego przeglądu podróży św. Pawła: widzieć jego namiętność ku Ewangelii, wyczuwać tym samym wielkość, piękno, co więcej – głęboką potrzebę Ewangelii dla nas wszystkich

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconAntyk Literatura starożytna stała się wzorem wszystkich późniejszych prądów

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconWymagania dla poszczególnych poziomów odpowiadających skali pozytywnych ocen szkolnych

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconWielkość mierzona – wielkość określona, stanowiąca przedmiot pomiaru,,, Wynik pomiaru

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconStandardy wymagań dla poszczególnych certyfikatowych poziomów zaawansowania znajomości języka polskiego jako obcego

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconZłożoność obliczeniowa stała O(1) Algorytm wykonuje stałą ilość operacji dominujących bez względu na rozmiar danych wejściowych. Złożoność obliczeniowa liniowa O(n)

Μ – niezmienna I stała wielkość równa dla wszystkich poziomów k iconWymagania inwestycyjne dla utworzenia lub utrzymania kanału dystrybucyjnego wielkość zmian związana z poziomem sprzedaży

Umieść przycisk na swojej stronie:
Rozprawki


Baza danych jest chroniona prawami autorskimi ©pldocs.org 2014
stosuje się do zarządzania
Rozprawki
Dom