Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń




Pobierz 31.49 Kb.
NazwaStatystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń
Data konwersji04.01.2013
Rozmiar31.49 Kb.
TypDokumentacja

Terminologia statystyczna - Ewa A.Paulo


STATYSTYKA


Statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji i wyników doświadczeń.

Należy pamiętać, że te obserwacje i wyniki doświadczeń pochodzą najczęściej z badań przeprowadzonych na niewielkiej tylko liczbie elementów (wybranych spośród licznego zbioru elementów tego samego typu) i że z tych obserwacji wyciągamy wnioski dotyczące całego ich zbioru.

Lekarz na przykład wybiera grupę pacjentów spośród chorych na daną chorobę, podaje im pewien lek, notuje wyniki kuracji i po opracowaniu rezultatów leczenia przenosi otrzymane wnioski na wszystkich chorych na tę chorobę. W ten sposób sprawdza działanie leku na wszystkich osobnikach leczonych z powodu danego schorzenia.

Zbiór elementów, na których przeprowadzamy badania, nazywamy próbą a zbiór wszystkich elementów, spośród których wybrana jest próba, nazywamy populacją.

Podstawowa terminologia statystyczna





  1. Populacja - zbiór elementów, zbiorowość statystyczna, której pewne cechy są badane za pomocą narzędzi i metod statystycznych.

  2. Próba losowa - część populacji, którą podano badaniu. Wyniki uzyskane dla wybranej próby przenosi się na całą populację.

  3. Statystyka - zmienna losowa będąca dowolną funkcją wyników próby losowej, tzn. dowolną funkcją .

  4. Estymatory - wartości statystyk wyliczane za pomocą specjalnych wzorów, służące do oszacowania nieznanych wartości parametrów.




  1. Funkcja rozkładu prawdopodobieństwa - funkcja p(x) określona na pewnym zbiorze X, taka, że oraz i dla zmiennej losowej skokowej oraz dla zmiennej losowej ciągłej.




  1. Dystrybuanta - funkcja F(x), taka, że F(x) = P(Xi).




  1. Zmienna losowa - funkcja określona na zbiorze zdarzeń elementarnych, przyporządkowująca każdemu zdarzeniu elementarnemu pewną liczbę. Zmienne losowe oznaczamy zazwyczaj dużymi literami X, Y, Z...

  2. Histogram - graficzna metoda przedstawiania rozkładu zmiennej losowej, czyli wykres, na którym prawdopodobieństwa pk przedstawione są jako pola prostokątów.

  3. Poziom ufności - prawdopodobieństwo, z jakim wartość nieznanego parametru ma się znaleźć w szukanym przedziale ufności.

  4. Poziom istotności - prawdopodobieństwo potrzebne do wyznaczania granic obszaru krytycznego.

  5. Przedział ufności - przedział liczbowy , który pokryje nieznaną wartość parametru m, przy z góry zadanym prawdopodobieństwie nazywamy przedziałem ufności. Długość przedziału ufności zmienia się wraz ze zmianą poziomu ufności. Wraz ze wzrostem poziomu ufności zwiększa się rozpiętość przedziału ufności.

  6. Obszar krytyczny - przedział jedno lub dwustronny określany w celu testowania hipotezy, taki, że jeżeli statystyka kontrolna odpowiednia dla danego modelu znajdzie się w obszarze krytycznym, to hipotezę należy odrzucić.



Wskaźniki położenia - miary tendencji centralnej





  1. Średnia arytmetyczna - suma wszystkich pomiarów podzielona przez ich liczbę.

Jest opisana wzorem:



W Excelu:

ŚREDNIA(liczba1; liczba2;..) lub

ŚREDNIA(zakres)

Jeśli jednak któryś z wyników b. odbiega od pozostałych – (np. pomiar masy ciała grupy dzieci: 41,2; 47,5; 52,2; 43,3; 44,0; 83,9; 42,6; 43,1 średnia=49,7, jednak gdyby pominąć wynik 83,9, to średnia byłaby tylko 44,8 kg, a więc w średniej 1 należałoby odrzucić błąd „gruby”. Dlatego stosujemy tzw. średnią ważoną.


  1. Średnia ważona - sumujemy średnie cząstkowe pomnożone przez odpowiadającą każdej z nich liczbę elementów podgrupy i dzieląc uzyskaną sumę przez sumę liczby pomiarów w każdej z podgrup.








Na rysunku powyżej pokazane jest jak obliczamy średnią ważoną.

Jest to wzór ogólny:


czyli tu: =(500*9,17+200*10,12+300*9,85)/1000


Przy okazji - tekst w ramce powyżej jest utworzony w Excelu jako komentarz. Z menu podręcznego (prawy klawisz myszy w odpowiedniej komórce), kliknąć Wstaw komentarz. Wpisujemy swój komentarz, który będzie zaznaczony czerwonym trójkącikiem. Można go edytować.


  1. Średnią geometryczną szeregu statystycznego zawierającego n obserwacji x1, x2, ....xn nazywamy wartość .

Z definicji wynika, że średnią geometryczną możemy wyznaczać tylko wtedy, gdy obserwacje są liczbami dodatnimi i różnymi od zera.

Średnią geometryczną posługujemy się często przy badaniu związku między średnią wartością progu podniety i średnią reakcją układu nerwowego na podnietę (prawo Webera-Fechnera).

Przy opracowaniu szeregu statystycznego obserwacji posługujemy się średnią geometryczną wtedy, gdy kilka obserwacji ma wartości dużo większe od pozostałych. Średnia geometryczna jest w tych przypadkach lepszym wskaźnikiem położenia niż średnia arytmetyczna.

W Excelu:

ŚREDNIA.GEOMETRYCZNA(liczba1;liczba2;..) lub

ŚREDNIA.GEOMETRYCZNA(zakres) lub

ŚREDNIA.GEOMETRYCZNA(zakres;zakres..)


  1. Średnia harmoniczna - jest opisana wzorem:



W Excelu:

ŚREDNIA.HARMONICZNA(liczba1;liczba2;..liczban) lub

ŚREDNIA.HARMONCZNA(zakres)


  1. Średnia wewnętrzna - jest to średnia arytmetyczna okrojona, liczona dla wartości z określonego zakresu pomniejszonego o określoną procentowo liczbę argumentów, po równo z góry i z dołu.

W Excelu:

ŚREDNIA.WEWN(zakres;procent)


  1. Mediana - me - jest liczbą w środku zbioru liczb, tzn., że połowa liczb ma wartości większe niż mediana i połowa ma wartości mniejsze niż mediana.


W Excelu obliczamy ze wzoru =MEDIANA(liczba1;liczba2;...)

tu: =MEDIANA(B12:B19), ale możemy wybrać inny sposób (niż opisany w średniej) obliczania funkcji:


  1. Wpisujemy dane np. 41,2; 47,5; 52,2; 43,3; 44,0; 83,9; 42,6; 43,1.

  2. Stawiamy kursor w kratce poniżej danych.

  3. Klikamy ikonę .

  4. W otwartym oknie dialogowym wybieramy: Kategorie funkcji Statystyczne Nazwa funkcji Mediana

  5. Pokazuje się nowe okno dialogowe z zakresem komórek.

  6. Sprawdzamy, czy zakres to ten, o który nam chodzi, jeśli tak - klikamy OK., jeśli nie zaznaczmy ten właściwy i też klikamy OK.

  7. W miejscu pustego okienka pojawi się średnia arytmetyczna 43,65 naszych danych (okno dialogowe chowa się samo).




  1. Modą - mo - albo średnią modalną nazywamy wartość obserwacji, która występuje najczęściej. Tym wskaźnikiem położenia posługujemy się wtedy, gdy chcemy zorientować się, jak długo trwa zwykle pewne zjawisko, na przykład okres wylęgania się choroby, tzn. jaki okres wylęgania zdarza się najczęściej. Jako wartość mody, przyjmujemy zwykle, środek przedziału zmienności tej grupy rozdzielczego szeregu statystycznego, w której jest najwięcej obserwacji. Np. wartość mody szeregu liczb 28 i 36, czyli mo = 32.

Wartość mody możemy odczytać z wykresu krzywej częstości. Moda będzie tą wartością x badanej cechy, dla której krzywa częstości osiąga maksimum.

Może się zdarzyć, że wykres częstości będzie miał kilka maksimów. Taki szereg nazywamy szeregiem wielomodalnym.




mo mo1 mo2

rozkład jednomodalny rozkład dwumodalny


W przypadku szeregu jednomodalnego przybliżoną wartość mody obliczmy ze wzoru:

gdzie - jest średnią arytmetyczną obserwacji.


Miary rozproszeń - wskaźniki rozsiewu





  1. Odchylenie standardowe



Odchylenie standardowe dla próby



Odchylenie standardowe dla próby obliczane jest na podstawie wzoru:





natomiast z wykorzystaniem funkcji arkusz kalkulacyjnego Excel:


ODCH.STANDARDOWE(liczba1; liczba2;..),

lub

ODCH.STANDARDOWE.A(wartość1; wartość2;..),


funkcje te akceptują dane logiczne i tekstowe.


Odchylenie standardowe dla populacji



Odchylenie standardowe dla populacji obliczane jest dla elementów całej populacji na podstawie wzoru:




natomiast z wykorzystaniem funkcji arkusza kalkulacyjnego Excel:


ODCH.STANDARD.POPUL(liczba1; liczba2;..), lub

ODCH.STANDARD.POPUL.A(wartość1; wartość2;..),

funkcje te akceptują dane logiczne i tekstowe.


  1. Kwartyle - w statystyce stosuje się miary, dzięki którym można obliczyć wartości odcinające.

W Excelu:

KWARTYL(tablica; liczba)

Parametr tablica określa rozpatrywany zakres komórek, w którym znajdują się wartości liczbowe, natomiast parametr liczba może przyjmować wartości 0, 1, 2, 3, 4.

Ich znaczenie to:

dla 0 - zwrócona zostanie wartość minimum dla określonego zakresu,

dla 1 - zostanie obliczony pierwszy kwartyl,

dla 2 - wartość mediany, czyli drugiego kwartylu,

dla 3 - wartość trzeciego kwartylu,

dla 4 - wartość maximum.





Ćwiczenie

Po wykonaniu 25 niezależnych prób, otrzymano następujące wyniki:

0,57; 0,09; 0,25; 0,76; 0,64; 0,89; 0,21; 0,75; 0,1; 0,93; 0,89; 0,5; 0,44; 0,4; 0,37; 0,75; 0,76; 0,23; 0,21; 0,47; 0,17; 0,29; 0,65; 0,43; 0,9.

Obliczyć: średnią arytmetyczną, odchylenie standardowe, medianę, kwartyle.



  1. Wariancja - omówiona osobno




  1. Percentyle - jeżeli całą zbiorowość podzielimy na 100 części, to każda setna część określa tzw. Percentyle. Funkcja służąca do obliczania percentyli ma postać:


PERCENTYL(tablica; k),

gdzie

parametr tablica oznacza rozpatrywany zakres, zaś liczba k określa, który percentyl chcemy obliczyć z zakresu k <0,1>.


Testowanie hipotez





  1. Błędy pomiarowe i ich pochodzenie

  2. Przedziały ufności



Testy statystyczne





  1. Test t-Studenta

  2. Test Manna-Whitneya

  3. Test Wilcoxona i dokładny test Fishera

  4. Test chi-kwadrat



Jak konstruujemy wzory (formuły) w programie Excel?


Na podstawie poniższych danych oblicz:

średnią arytmetyczną, odchylenie standardowe, medianę i kwartyle.









Dodaj dokument na swoim blogu lub stronie

Powiązany:

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconPrzedmiot oraz podstawowe zadania statystyki. Słowo statystyka

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka może być rozumiana dwojako, w sensie potocznym uważa się za nią niektóre zestawienia liczbowe charakteryzujące np umieralność niemowląt, wydobycie

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka opisowa

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka opisowa

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka – zestaw 3

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconMatematyka, statystyka

Statystyka statystyka zajmuje się gromadzeniem oraz opracowywaniem obserwacji I wyników doświadczeń iconStatystyka opisowa

Umieść przycisk na swojej stronie:
Rozprawki


Baza danych jest chroniona prawami autorskimi ©pldocs.org 2014
stosuje się do zarządzania
Rozprawki
Dom