Adam Łomnicki

Wprowadzenie do statystyki dla przyrodników

Wydanie czwarte poprawione i rozszerzone

Wydawnictwo Naukowe PWN, Warszawa 2010


 

Spis rzeczy

 

1. Prośba autora do czytelników

2. Errata

3. Ćwiczenie 15-1

4. Korespondencja czytelników z autorem

5. R: język i statystyczne oprogramowanie

 

 

 

Prośba autora do czytelników

 

Dotychczasowe wydania „Wprowadzenia do statystyki dla przyrodników” nauczyły mnie, że różnego rodzaju błędy, od drobnych błędów liczbowych do różnego rodzaju niejasności w tekście, są nie do uniknięcia. Dlatego bardzo proszę wszystkich czytelników, a szczególnie studentów, mających po raz pierwszy styczność z tą książką o zawiadomienie mnie o wszelkich napotkanych błędach, niejasnościach i sprzecznościach, które napotkają. Pozwoli to na uzupełnienie Erraty na niniejszych stronach www i stałe ulepszanie tekstu. Przyjmę też wszelkie uwagi krytyczne o tej książce. Aby nie ograniczać czytelników w krytyce sugeruję, aby e-maile do mnie przesyłać anonimowo, posłując się adresem e-mailowym bez nazwiska.

Ze swej strony będę się starał, aby dane do niektórych przykładów ćwiczeń podać w Excelu (Wybrane Dane), co pozwoli czytelnikom przeliczyć je używając podanego poniżej oprogramowania R lub swoim własnym programem statystycznym, bez ich żmudnego przepisywania.

Do rozdziału 15. o analizie kowariancji nie było sensu podawania dodatkowych danych liczbowych dla ćwiczeń, oprócz tych użytych w przykładzie. Obliczenia w tej technice statystycznej dokonywane są za pomocą odpowiednich programów i dlatego nie ma potrzeby ćwiczyć czytelnika w umiejętności stosowania właściwych wzorów. Czytelnik może natomiast sprawdzić przykład tam omawiany w swym programie statystycznym i dlatego w Excelu podano jeszcze raz jego dane liczbowe (Tabela 15.1 w pliku Wybrane-Dane). W analizie kowariancji ważne jest natomiast zrozumienie, jakimi wartościami się posługujemy i jaki jest ich związek z danymi empirycznymi. Takie zrozumienie powinno być uzyskane przez wykonanie Ćwiczenia 15.1.

Do niniejszej witryny dodano bardzo prosty podręcznik języka i oprogramowania R, związany że wstępnymi rozdziałami czwartego wydania „Wprowadzenia...” Podręcznik ten będzie w przyszłości poprawiany i uzupełniamy, pod warunkiem uzyskania reakcji od czytelników, czy jest on pożyteczny i czy dalsze opracowanie jego jest sensowne.

 

 

Errata

do wydania czwartego

Strona 115, wzór (7.7), lewa strona: zamiast t0,005 daj t0,05

 

Strona 150, wiersz 9 od góry: po prawej stronie równania ostatnia różnica w nawiasie podniesiona do kwadratu zamiast , powinno być

 

Strona 234. wiersz 7 od dołu. Po tekście gdy N > 10. daj: Gdy jest tu napisane, że rs powinno być większe od wartości krytycznej oznacza to że absolutna wartość rs winna być większa od krytycznej. Gdybyśmy otrzymali  rs  = -0,902, przy N =6,  to ponieważ absolutna wartość r = 0,902, należy uznać tę korelację za istotną z P < 0,05.

 

 

 

Ćwiczenie 15.1

Ćwiczenie to opiera się na danych i wykresach przedstawionych w rozdziale 15. Polega ono na tym, aby na wykresach naszkicować wszystkie używane w analizie kowariancji odchylenia i kwadraty odchyleń. Obejmuje ono dwie części: (15.1a) dotyczące różnic miedzy grupami i (15.1b) jednorodności prostych regresji. Dla każdej z tych części należy pobrać stronę z wykresami (Wykres-a i Wykres-b) wydrukować ją, naszkicować na tych wykresach odpowiednie odchylenia, a następnie przy każdym odchyleniu naszkicować jego kwadrat tak jak to zrobiono na ryc. 14.4 (strona 217). Kierunek szkicowania tego kwadratu jest bez znaczenia, natomiast użycia dwóch kolorów różnych dla każdej grupy czyni szkic nieco czytelniejszym. Sprawdzenia czy szkice zostały wykonane poprawnie można dokonać porównując je z wynikami dla samych odchyleń (W1-a i W1-b) oraz dla kwadratów odchyleń (W2-a i W2-b).P

 


Korespondencja czytelników z autorem

 

Czytelnik 4. Znalazłem w książce niewielki błąd we wzorze - przesyłam informację o nim, aby możliwe było ewentualne wprowadzenie korekty do następnego wydania: na stronie 150 w
 ustępie: "Po podniesieniu obu stron równania do kwadratu..." ostatni element po prawej stronie równania jest błędnie zapisany. Tym ostatnim elementem powinien być kwadrat 
różnicy między średnią j-tej kolumny i średnią wszystkich pomiarów, a tymczasem w średniej j-tej kolumny w indeksie dolnym mamy zamiast ".j" - "ij". Jest to niewątpliwie błąd drukarski,
 niemniej chwilę zajęło mi zrozumienie, w czym rzecz, bo zacząłem analizę od równania podniesionego już do kwadratu i "coś mi się nie zgadzało".Wojtek Piaseczki
 
Autor. Bardzo Panu dziekuję za powiadomienie mnie o błędzie we "Wprowadzeniu do statystyki dla przyrodników". W najbliższym czasie wprowadzę poprawkę do Erraty na moje 
stronie internetowej. Dziękuję też za dobre słowo o książce. Pozwolę sobie umieścić fragmenty Pana e-mailu na tej stronie, aby innych czytelników zachęcić do szukania błędów.

 

 

Czytelnik 3:

 Mam pytanie związane z testowaniem istotności współczynnika korelacji Spearmana. Konkretnie dla negatywnych zależności. Dla próby o wielkości N=5 wartość krytyczna wynosi rS 0,05= 0,9. Jeżeli wyliczony współczynnik rS= - 0,92, to zgodnie z tym, co jest napisane w podręczniku, ponieważ wartość wyliczona jest mniejsza od wartości krytycznej (-0,92 < 0,9), hipotezę o braku istotnej zależności należałoby odrzucić. Tymczasem intuicja podpowiada mi, iż do porównań z tabelą wartości krytycznych należałoby brać bezwzględne wartości wyliczonego rS. Proszę o potwierdzenie tych przypuszczeń.

Autor: Ma Pani(i) rację. Już poprawiłem.

 

 

Czytelnik 2:

   Gratuluję bardzo dobrej książki! Przyznam, że moim zdaniem jest to najlepsza na polskim  rynku książka o statystyce w biologii (szeroko rozumianej. Niestety, jeszcze nie widziałem 
czwartego wydania, ale posiadam trzecie. Bardzo się cieszę, że dodał Pan Profesor informacje o R, ponieważ jestem jego wielkim wielbicielem i orędownikiem. Używam go od lat i nawet w
 tym semestrze uczę go studentów biologii SGGW.
   Mam pewną uwagę odnośnie niniejszego zdania z opracowania w MS Word, które znajduje się na Pańskiej stronie poświęconej książce:   
"Autorowi tego opracowania nieznana jest funkcja standardowa R dla  obliczania błędu standardowego i na przedziału ufności, co nie znaczy,  ze przy bogactwie R takie funkcje nieistnieją."  
Błąd standardowy można obliczać w bardzo prosty sposób, np. albo  funkcją stdErr {WGCNA}, co wymaga zainstalowania pakietu, albo  prościej, co sam robię, przez wywołanie modelu 
liniowego: 
 x<- rnorm(10, 10, 1)
 summary( lm(x ~ 1) )
  Natomiast przedział ufności wyznaczamy bardzo łątwo przy pomocy funkcji
 t.test:
 t.test(x)
 
 
Autor: 
  Bardzo Panu dziękuje za dobre słowa o mojej książce i o pomyśle, aby ją  uzupełnić elementarnym kursem R. Nowe czwarte wydanie jest rzeczywiście  rozszerzone i obejmuje 
także analizę kowariancji, kontrasty i dodatkowe  informacje o analizie wariancji. Dziękując Panu za rady jak obliczyć błąd  standardowy i przedział ufności w R, nie włączałbym tego do
mojego tekstu,  bo chciałbym, aby czytelnicy posługiwali się raczej swoim pomyślunkiem  bardziej niż wiedzą. Wolałbym aby studenci liczyli błąd standardowy i przedziały ufności  swoimi własnymi funkcjami, których sposób tworzenia jest  tam podany. Pan jest pierwsza 
osoba która skomentowała manuskrypt R w mojej  witrynie. Ja przestałem go pisać, bo nie byłem pewny czy komuś się przyda.  Gdy tylko załatwię inne sprawy wrócę do dokończenia 
tego manuskryptu.
 
Odpowiedź czytelnika 2:
     Wstęp do statystyki w R jest niewątpliwie potrzebny, więc zachęcam Pana do rozwijania go!Przyznam, że osobiście staram się minimalizować zaangażowanie studentow
 w programowanie, więc raczej korzystają z dostępnych funkcji lub tworzę je sam -- a to dlatego
 że 30 h ćwiczeń to zdecydowanie za mało na filizofię statystyki, więc nie chcę tracić zbyt dużo na oprogramowanie. Do tego zauważyłem, że nadmierne skupienie na wzorach i programowaniu
 jest dla nich odstręczające, a nie zachęcające -- i przez to odczuwają większą niż zwykle niechęć do uczenia się statystyki. A statystyka to przecież umiejętność wnioskowania z danych -- czy nie
 jest ważna dla biologa?!
     To oczywiście mój punkt widzenia i wielu moich kolegów się z nim nie zgadza. Ale wolę, żeby moi studenci rozumieli podstawy statystyki, niż potrafili rozwiązać trudne zadania, nie wiedząc,
 o co w nich tak naprawdę chodzi. Zresztą w książce Pana Profesora filozofia jestprzedstawiona bardzo ładnie! Dlatego, przyznam, poleciłem ją do zakupienia dla ok.
 30 słuchaczy studiów podyplomowych na Akademii Rolniczej w Krakowie.

 

 

 

Czytelnik 1: Wzór (7.7) na str. 115 jest bezsensowny. Jest tam suma średnia ważona dwóch wartości t dla różnej liczby stopni swobody przy poziomie istotności 0,05 i nie wiadomo dlaczego

 poziom istotności średniej maleje do 0,005. Czy to na pewno tak ma być?

Autor: Bardzo Panu dziękuje za zwrócenie na to uwagi. To rzeczywiście jest bezsensowne i nie ma tak być. Odpowiednią poprawkę umieściłem w Erracie.

 

 

 

 

 

 

stat4ustat4u