SlideShare una empresa de Scribd logo
1 de 227
Descargar para leer sin conexión
İstatistik
 Araştırmalar, Bilimsel Çalışmalar ve Günlük Olaylardan
  sistemli bir biçimde veri toplama ve bilgilerin
  incelenmesi, özetlenmesi, ölçülmesi, sınıflandırılması,
  çözümlenmesi, neden sonuç ilişkilerinin belirlenmesi,
  karşılaştırılması,    aralarındaki     ilişkilerin   ortaya
  konması,      elde     edilen      sonuçların      kitlelere
  anlayabilecekleri ve etkili bir şekilde sunulmasının tüm
  evrelerini kapsayan bilim dalıdır.

• Teorik İstatistik
• Uygulamalı İstatistik
Herhangi bir konu hakkında
►Bilgi toplamak,
►Toplanan bilgileri düzenlemek,
►Çözümlemek       ve
►Yorumlamak

►için gerekli yöntemler topluluğudur.
Tanımlayıcı İstatistik        Çıkarımsal İstatistik
(Descriptive Statistics)     (Inferential Statistics)



         olarak iki ana gruba ayrılır.
Verilerin özetlenmesi,

Sınıflandırılması,

Tablo ve grafiklerle
 sunulmasını içerir.
Örneklemden elde edilen bulgular yardımıyla


Evren hakkında kestirimde bulunma,


Hipotezleri test etme

Karara varma

İşlemlerini içerir
Evren(population): Belirli özellikleri gösteren
   bireylerin ya da nesnelerin oluşturduğu topluluktur.
Türkiye’deki spor yüksekokullarındaki öğrencilerin
   evreni, tüm spor yüksekokullarındaki tüm
   bölümlerdeki öğrencileri kapsar.
Örnek(sample): Evrenin tüm özelliklerini taşıyan, onu
   tanımlama yeteneğine sahip bir parçasıdır.
Parametre(parameter): Evrende incelenen
   değişkenleri tanımlamak için kullanılan ölçütlerdir
   ortalama(µ), varyans(σ2), oran(p) v.b.
İstatistik: örneklemi tanımlamak için kullanılan
   ölçütlerdir. Örneklem ortalaması (X) standart sapma
   (s) v.b.
Denek(subject): Bilimsel çalışmanın yapıldığı birim
   (insan, hayvan, nesne v.s.)
Evren ve örneklemde gösterim

Tanımlayıcı ölçüt   Örneklemde        Evrende (parametre)
                    (istatistik)
Ortalama            X                 µ
Oran                p                 P
Standart sapma      S                 σ
Varyans             S2                σ2
Gözlem sayısı       N                 N


 Değişken(variable): İncelenen faktör ya da karakter,
 farklı bireylerde farklı değerler alabiliyorsa buna
 değişken denir
Veri (data): Herhangi bir konuda bilinmeyeni
  ortaya çıkarmak amacıyla yapılan araştırma,
  deney, gözlem, uğraşı veya olay sonucu elde
  edilen nicel ya da nitel ham materyaldır.
VERİDE BULUNMASI GEREKEN ÖZELLİKLER
•   DOĞRULUK
•   GÜNCELLİK
•   GÜVENİLİRLİK
•   EKSİKSİZLİK
•   KULLANILABİLİRLİK
•   AMACA UYGUNLUK
Bilgi (information): Verilerin ve önceki bilgilerin
  işlenmesiyle elde edilen anlamlı mesaj veren
  kavramlardır.
VERİ
          BİLGİ

       VERİLERİN İŞLENMESİ

VERİ                  BİLGİ
Niceliksel (Quantitative)   Niteliksel (Qualitative)
Nicelik belirten (ölçü-       Bireylerin sahip olduğu
lerek yada sayılarak          belli özelliklerin sınıflara
elde edilen) verilerdir.      ayrılarak belirtildiği
                              verilerdir.
Örneğin, yaş, ağırlık,
boy gibi.                     Örneğin, cinsiyet, medeni
                              durum, başarılı-başarısız
                              gibi.
Sıralanabilir                         Sınıflanabilir
            (Ordered)                             (Nominal)


Nitelik verilerde belli bir sıralama   Nitelik verilerde belli bir
söz konusu ise (kötü-orta-iyi-         sıralama yoksa bu tür verilere
mükemmel gibi ya da Okur yazar         sınıflanabilir nitelik veriler
olmayan, okur yazar, ortaokul, lise,
üniversite mezunu) bu tür verilere
                                       denir     Örneğin     cinsiyet,
sıralanabilir nitelik veriler denir.   medeni durum gibi.



                                        İki Sınıflı           Çok Sınıflı
Kesikli Sayısal                     Sürekli Sayısal
                                         Continuous numeric variable
     Discrete numeric variable




Belirli bir aralıktaki tam       Ölçümle belirtilirler ve bir
sayıları alan veri türüdür.      aralıktaki bütün değerleri
Örnek: Sınıftaki öğrenci         alırlar. Örnek: Boy uzunluğu,
sayısı, çocuk sayısı gibi        yaş, günlük kalsiyum tüketim
                                 miktarı (mg) gibi.



                                 Aralık Ölçekli              Oran Ölçekli
                                  Interval Scale                 Ratio Scale
ÖLÇME-ÖLÇEK KAVRAMLARI
• Gözlenen olayları sınıflandırma, değer
  verme ile sonuçlanan işlem
• Gözlenen olaylara sayısal bir değer
  verme, ya da olayları belli kurallara göre
  sayısallaştırma işlemidir
ÖLÇEK TÜRLERİ
• Sınıflandırma ölçeği
   – Erkek=1, Kadın=2
• Sıralama ölçeği
   – Ölçümler sadece sıra dizisini gösterir, ama aralarındaki
     uzaklık kesin değildir
   – Doktora, yüksek lisans, lisans, önlisans
• Aralık ölçeği
   – Eşit bölme aralığına sahiptir
   – Başlangıç noktasının sıfır olma zorunluluğu yoktur, varsa da
     yokluğu göstermez
   – Zeka testinden sıfır almak zekasız olmayı göstermez
• Oran ölçeği
   – Puanlar değişkenin gerçek miktarını yansıtır, eşit ölçme
     birimi vardır
   – Sıfır değeri sıfır olma halini gösterir, (uzunluk, ağırlık
     ölçümleri gibi)
Dağılım(distribution):                   Verilerin   oluşturduğu
  yığınların biçimine dağılım denir.
       Kesikli Dağılım: Dağılım aralığı içinde her değeri
  alamayan verilerin dağılımı kesikli dağılımdır. (Hiçbir
  zaman 3.7 bebek olamaz). Hasta-sağlam gibi.
       Sürekli Dağılım: Sürekli verilerin (ölçüm ve
  tartımla belirtilen) oluşturduğu dağılımlardır.

Sürekli veriler sınıflandırılarak kesikli hale getirilebilirler.
Örneğin kişileri boylarına göre uzun boylu, orta boylu ve
   kısa boylu olarak sınıflandırabiliriz.
Sınılandırma yaparken objektif olmaya çalışmak
   gerekmektedir.
VERİLERİN
SINIFLANDIRILMASI
Sınıflandırma
• Bir kitlenin veya grubun özelliklerine
  göre yapısını ortaya çıkarabilmek
  amacıyla, elde edilen bilgileri bir özellik
  ya da özellikler bakımından çeşitli
  seçeneklere ayırarak aynı seçeneğe ait
  birimleri kümeler halinde bir araya
  getirmedir
• Veri sayısı sınırlıyken yapılır
Sınıflandırmaya örnek
Yaş               Frekans (sıklık)
18                21
19                25
20                30
21                18
22                6
TOPLAM            100
Gruplama
• Eğer sınıflandırılacak veri sayısı çok fazla
  ise bunları sınıflandırma yoluyla
  kümelere ayırmak mümkün olsa bile
  anlamlı ve işlemlere elverişli olmayabilir
• Böyle durumlarda bir özelliğin birbirine
  yakın olana seçenekleri gruplar halinde
  toplanır ve yeni gruplamalara
  başvurulur
Frekans Dağılımları
(Frequency Distributions)
• Verilerin her bir sınıf aralığına düşen
  gözlem sayısını (frekans) gösterecek
  şekilde gruplandırılması işlemi
Frekans Dağılımları ile İlgili Temel
Kavramlar
• Dağılım genişliği = Verilerin minimum ile
  maksimum değerleri arasındaki fark
• Sınıf sayısı= O dağılımın incelemek istenen
  sınıf sayısı
• Sınıf sınırları= Sınıfa ait minimum ve
  maksimum sınır değerleri
• Sınıf aralığı= Sınıfın alt ve üst sınırları
  arasındaki fark
• Sınıf orta noktası=Sınıfın alt ve üst sınırlarının
  ortalaması
Sınıf aralığının belirlenmesi
• Sınıf aralığı = Dağılım Genişliği
                      Sınıf Sayısı

Maksimum değer-minimum değer
              sınıf sayısı
33.625 – 12.546 = 21.079 = 3011
       7
Frekans Dağılım Tablosunun Hazırlanması

Sınıflar     Alt sınırlar   Üst Sınırlar
                            (12.546 + 3.011)= 15.557
                            15.557 – 1 = 15.556
1            12.546         15.556
                            (15.557 + 3.011) = 18.568
                            18.568 – 1 = 18.567
2            15.557         18.567
                            (18.568 + 3.011) = 21.579
                            21.579– 1 =21.578
3            18.568         21.578
                            (21.579 + 3.011) = 24.590
                            24.590 – 1 = 24.589
4            21.579         24.589
Frekans Dağılım Tablosunun Hazırlanması

Sınıflar       Alt sınırlar    Üst Sınırlar

                               (24.590 + 3.011) = 27.601
                               27.601 – 1 = 27.600
5              24.590          27.600

                               (27.601 + 3.011) = 30.612
                               30.612 – 1 = 30.611
6              27.601          30.611




7              30.612          33.625
Frekans dağılım tablosu
HİSTOGRAM
Frekans Dağılımlarının Oluşturulmasında
Dikkat Edilecek Noktalar
• Mümkün olduğu kadar eşit sınıf aralıkları
  seçilmelidir
• Eşit olmayan sınıf aralıkları frekansların
  grafiksel gösterimlerinde yanlış
  algılamalara yol açabilir
SUNU YÖNTEMLERİ


• METİN
• TABLO
• GRAFİK
TABLO


• TEK BOYUTLU

• İKİ BOYUTLU

• ÇOK BOYUTLU
TABLO YAPIMINDA
  DİKKAT EDİLECEK NOKTALAR
• BAŞLIK
  – Başlık kısa, özlü olmalıdır.
  – Genelde tablonun üstüne yazılır
  – Başlığın bölüm ve sıra no’ su yazılır
• Kolon ve satır başlıkları,ölçekler,birimler
  yazılır
• Değerlere ek olarak yüzdeler de verilir
• Üçten çok değişken aynı tabloda verilmez,
  verilirse çizgilerle ayrılır
TEK BOYUTLU TABLO
Tablo 1.1 Sporcuların Branşlarına Göre Dağılımı


                     n %
 voleybol            15 30
 judo                10 20
 tenis               15 30
 basketbol            5 10
 yüzme                5 10
 TOPLAM              50 100
İKİ BOYUTLU TABLO
Tablo 1.2 Sporcuların Branşlarına ve Cinsiyetlerine Göre
Dağılımları

                           E           K        TOPLAM
                       n       % n         %
 voleybol             10       20 5        10      15
 judo                  8       16 2         4      10
 tenis                 5       10 10       20      15
 basketbol             2        4 3         6      5
 yüzme                 1        2 4         8      5
 TOPLAM               26       52 24       48      50
ÇOK BOYUTLU TABLO
   Tablo 1.3 Sporcuların Branşlarına Cinsiyetlerine ve
               Yaşlarına Göre Dağılımları
                      Erkek               Kadın         Toplam
                       Yaş                 Yaş

                <20   20-22   22>   <20   20-22   22>

                 2      3      5     1      1      3      15
voleybol
                 1      3      4     0      1      1      10
judo
                 2      1      2     1      1      8      15
tenis
                 0      0      2     0      1      2      5
basketbol
                 0      0      1     0      2      2      5
yüzme
TOPLAM           5      7     14     2      6     16      50
GRAFİK ÇEŞİTLERİ
•   SÜTUN GRAFİK
•   ÇUBUK GRAFİK
•   ÇİZGİ GRAFİK
•   PASTA-DAİRE DİLİMLERİ GRAFİĞİ
•   ALAN GRAFİĞİ
•   HİSTOGRAM, DAĞILIM POLİGONU
•   KUTU VE ÇİZİGİ GRAFİĞİ
•   DAL VE YAPRAK GRAFİĞİ
•   ORTALAMA STANDART SAPMA GRAFİĞİ
•   SAÇILIM (NOKTA GRAFİĞİ)
GRAFİK YAPIMINDA
 DİKKAT EDİLECEK NOKTALAR
• BAŞLIK
  – Her grafiğin bir başlığı olmalıdır
  – Grafiğin altına veya üstüne yazılabilir
  – Başlığın bölüm ve sıra no’ su yazılır.(Grafik 3.2)
• Eksenlerin neyi ifade ettiği ve değişkenlerin
  birimleri belirtilir.
• Kullanılan alan ve çizgi türleri çeşitlilik
  gösteriyorsa grafiğin iç sağ üstünde ya da dış sol
  altında açıklanmalıdır
• Başlıktaki ölçeklendirme ve kısaltmalar
  belirtilmelidir.
SÜTUN GRAFİK
                      Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı

                12
                      10                       10
                10
                                 8
Sporcu Sayısı




                8
                                                                         Erkek
                6          5               5
                                                                    4    Kadin
                4                                        3
                                     2               2
                2                                               1
                0
                     Basketbol   Tenis    Yüzme      Judo     Okçuluk
                                         BRANŞLAR
Sütun Grafik
Çoğunlukla nitelik verilerde kullanılır.
Her bir kategori birbirinden ayrı çubuklarla gösterilir.
Çubukların eni birbirine eşittir ve bitişik değildir.
Yatay eksende incelenen değişkene ilişkin kategoriler dikey eksene
  bu kategorilere ilişkin sayı ya da yüzde değerleri konulur.

            Vücut Ağırlığı            Sayı     %
             Zayıf                     15      30
              Normal                   20      40
              Hafif Şişman             10      20
              Şişman                    5      10
              Toplam                   50      10
                                               0
Öğrencilerinin Ağırlıklarına Göre Dağılımı



       25

       20

       15
Sayı




       10

       5

       0
            Zayıf         Normal         Hafif Şişman     Şişman
                           Öğrencilerin Ağırlıkları
ÇUBUK GRAFİK
                      Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı

           Hentbol                     4
                           1

             Tenis                 3
                               2
Branşlar




                                                                10        Kadin
           Okçuluk
                                             5                            Erkek
              Judo             2
                                                           8

           Voleybol                          5
                                                                10

                      0        2       4         6         8   10    12
                                           Sporcu Sayısı
Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

            100

            80

            60
                                                                              Aile P.
Yüzde (%)




                                                                              Kullanmayan
                                                                              Kullanan
            40

            20

             0
                  Okur Yazar   İlkolul      Ortaokul      Lise   Üniversite
                    Değil
                                         Öğrenim Durumu
ALAN GRAFİK
                       Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine
                                         Göre Dağılımı

                20
                                                                      4
Sporcu Sayısı




                15
                                             10           3
                                                                              Kadın
                10
                                                                     15       Erkek
                 5 5             2                       12
                                              8
                                 5
                 0 2
                Voleybol        Tenis     Basketbol     Judo       Okçuluk
                                          Branşlar
3B SÜTUN GRAFİK
  Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine
                    Göre Dağılımı
                    10

                     8
    Sporcu Sayısı




                     6

                     4                                                           Erkek
                     2                                                           Kadın

                     0                                                   Kadın
                         Voleybol
                                    Hentbol                            Erkek
                                              Judo
                                                     Okçuluk
                                                               Tenis
                     Branşlar
ÇİZGİ GRAFİK
                       Grafik 1.1 Spor Yüksekokulu Öğrencilerinin Başarı
                              Durumlarının Yıllara Göre Dağılımı

                 100

                 80
Not Ortalaması




                 60

                 40

                 20

          0
                             1.yıl         2.yıl            3.yıl      4.yıl
     Erkek
     Kadın                                         Yıllar
8



Ortalama (S.sapma)
                     7




                     6




                     5
                                                                 İLAÇ

                                                                  A
                     4

                                                                  B

                     3                                            C
                         1   Başlangıç     3      4      5   6

                                         Z AM A N (ay)
PASTA GRAFİK
                                                       Tenis
     Grafik 1,1 Sporcuların Branşlarına GöreDağılımı   Voleybol
                                                       Basketbol
            14%                                        Yüzme
                                                14%    Judo


8%




            37%                                        27%
Pasta-Daire Dilimleri Grafiği
              Nitelik verilerde kullanılan bir grafik yöntemidir.

                    Vücut Ağırlığı              Sayı        %
                    Zayıf                        15          30
                    Normal                       20          40
                    Hafif                        10          20
                    Şişman                        5          10
                    Toplam                       50         100




Zayıf için:                  derece    Hafif Şişman için:            derece




Normal için:                  derece   Şişman için:                 derece
Öğrencilerinin Ağırlıklarına Göre Dağılımı


               Şişman
                10%
                                       Zayıf
                                       30%
Hafif Şişman
   20%




                        Normal
                         40%
X-Y DAĞILIMI
                   Grafik 1.2 Çocuklarda Yaşa Göre Ağırlık
               9


               8


               7


               6


               5
 AGIRLIK(kg)




               4


               3
                   0         2   4     6     8      10       12

                   YAS(AY)
Annenin Sigara İçme ve Gebelik Haftası
Durumuna Göre Çocukların Doğum Ağırlığı Doğum Ağırlığı               Gebelik Haftası Sigara

       3600
              Dağılımı                     2940
                                           3130
                                                                           38
                                                                           38
                                                                                      içiyor
                                                                                     İçmiyor
                                                            2420           36         içiyor
                                                            2450           34        İçmiyor
                     3400
    Doğum Ağırlığı




                     3200                                                              
                     3000

                     2800
                                                            Sigara

                     2600                                   İçiyor

                     2400                                   İçmiyor
                         32        36        40        44
                              34        38        42

                               Gebelik Haftası
Histogram

Sürekli değişkenler için kullanılan grafik
türüdür.
Çubuklar birbirine bitişik olarak çizilir.
Sayı ya da yüzde kullanmak grafiğin şeklini
değiştirmez.
Yatay eksende sınıf değeri dikey eksende sayı
ya da yüzde bulunur. (Yatay eksene alt sınır ve
üst sınır değerleri de yazılabilir)
HİSTOGRAM
    ANTREMAN SONRASI 10. DAKİKA NABIZ ÖLÇÜMLERİ
6


5


4


3


2


1                                                                 Std. Dev = 17,70
                                                                  Mean = 92,4
0                                                                 N = 26,00
     60,0    70,0   80,0   90,0   100,0   110,0   120,0   130,0

    NABIZ 10.DK
Simetrik Dağılım

           Öğrencilerin BoyUzunluklarına Göre Dağılımı

          35
          30
          25
Frekans




          20
          15
          10
           5
           0
               147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182
                                        Boy Uzunlukları (cm)
Sağa Çarpık (Pozitif Çarpık) Dağılım

    Öğrencilerin BoyUzunluklarına Göre Dağılımı

          60

          50

          40
Frekans




          30

          20

          10

          0
               147-150   151-154   155-158     159-162   163-166    167-170   171-174   175-178
                                             Boy Uzunlukları (cm)
Sola Çarpık (Negatif Çarpık) Dağılım

                                           Öğrencilerin Boy Uzunluklarına Göre Dağılımı

          70

          60

          50
Frekans




          40

          30

          20

          10

           0
               147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182
                                        Boy Uzunlukları (cm)
Dağılım Poligonu
               Histogramdaki çubukların en üst orta noktalarının çizgilerle
                             birleştirilmesiyle elde edilir.
          Öğrencilerin Boy Uzunlıklarına Göre Dağılımı
          35

          30

          25
Frekans




          20

          15

          10

           5

           0
                147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182
                                          Boy Uzunlukları
5. Kutu ve Çizgi Grafiği


Yüzdelikler yardımıyla veriyi özetlemekte kullanılan basit ve çok
                kullanışlı bir grafik yöntemidir.


Grafikte 25., 50., 75., Yüzdelikler en küçük değer ve en
büyük değer bulunmaktadır.
Daha çok dağılım çarpık olduğunda kullanılır.
Dağılımdaki aşırı gözlemlerin varlığı konusunda da bilgi verir.
Öğrencilerin Boy Uzunluğu (cm)
                                       Sola Çarpık (Negatif Çarpık) Dağılım



                                 175
                                                   *21         Çok Aşırı Değer
                                 170

                                 165               o22          Aşırı Değer
                                                               Aşırı değer Olmayan
                                 160
                                                               En Büyük Değer
                                 155                                          75.Yüzdelik
                                                                Ortanca
                                 150
                                                                              25.Yüzdelik
                                 145                             Aşırı değer Olmayan
                                                                 En Küçük Değer
                                 140
Öğrencilerin Boy Uzunluğu (cm)
                                       Sağa Çarpık (Pozitif Çarpık) Dağılım



                                 175
                                                   *21         Çok Aşırı Değer
                                 170

                                 165
                                                   o22          Aşırı Değer
                                                               Aşırı değer Olmayan
                                 160
                                                               En Büyük Değer
                                 155                                          75.Yüzdelik
                                 150                            Ortanca
                                                                              25.Yüzdelik
                                 145                            Aşırı değer Olmayan
                                                                En Küçük Değer
                                 140
Öğrencilerin Boy Uzunluğu (cm)
                                       Simetrik Dağılım




                                 175

                                 170

                                 165
                                                     Aşırı değer Olmayan
                                 160
                                                     En Büyük Değer
                                 155                               75.Yüzdelik
                                                      Ortanca
                                 150
                                                                   25.Yüzdelik
                                 145                  Aşırı değer Olmayan
                                                      En Küçük Değer
                                 140
Sağa Çarpık      Simetrik       Sola Çarpık




      Ortalama                    Ortalama
                  Ortalama
   Ortanca                          Ortanca
                  Ortanca
 Tepe Değeri      Tepe Değeri      Tepe Değeri
Annelerin Öğrenim Düzeylerine Göre
                            Çocuk Bakım Bilgi Puanlarının Dağılımı
Çocuk Bakım Bilgi Puanı   100                                                 11
                                                                              1
                                                                              46
                          90
                          80
                          70
                                     14

                          60         21
                                     29



                          50
                          40
                          30
                          20
                                                                   27
                                                                   34
                          10
                           0
                                   OYD    İLKOKUL   ORT AOKUL   LİSE    ÜNİVERST E




                                          Öğrenim Durumu
Dal ve Yaprak Grafiği


Dal ve yaprak grafik yöntemi veri kümesini
özetlemek için çok basit ve kullanışlı bir grafik
yöntemidir.
Bu grafikte hem grafiğin şeklini hem de
dağılımdaki gözlem değerlerini görmek
olanaklıdır.
Dal ve Yaprak grafiği her sınıfın karşısına
doğrudan frekansı yazmak yerine bu aralıktaki
değerlerin son haneleri yazılır.
Dal ve Yaprak Grafiği
Veriler: 40, 44, 46, 46, 49, 50, 52, 52, 52, 53, 54, 54, 54, 55, 56, 56, 57, 57,
          58, 58, 58, 59, 59, 59, 59, 59, 60, 61, 62, 63, 64, 64, 64,65, 66, 66, 67, 72, 73



      Dallar                           Yapraklar                                   Sayı
      40-44                            04                                           2
      45-49                            669                                          3
      50-54                            02223444                                     8
      55-59                            5667788899                                   13
      60-64                            99923444
                                       012                                          8
      65-69                            5567                                         4
      70-74                            23                                           2
Dal ve Yaprak Grafiği
Veriler: 17, 17, 18, 18, 21, 21, 22, 22, 24, 25, 25, 27, 30, 33, 33, 33, 33, 33, 36, 36, 36,
         36, 38, 40, 41, 43, 44, 44, 45, 48, 48, 49, 51, 52, 52, 55, 55, 56, 58




              Dallar                            Yapraklar
              •                                 7788
              •                                 11 2 2 4 5 5 7
              3                                 03333366668
              4                                 013445889
              5                                 1225568
Ortalama ve Standart Sapma Grafiği


Sürekli değişkenler için kullanılan
grafik türüdür.
 Dağılım simetrik olduğunda
kullanılır.
 Grafikte ortalama ± 1 x (standart
sapma değeri) bulunur
Bazen ortalama ± 2 x (standart sapma
değeri) de kullanılabilir.
Ortalama ve Standart Sapma Grafiği
                                                                                      Ortalama=158.3
Öğrencilerin Boy Uzunluğu (cm) (Ortalama ± S. Sapma



                                                                                      Standart Sapma=9.9

                                                      170
                                                                                + 1 Standart Sapma

                                                      160
                                                                                      Ortalama

                                                                                - 1 Standart Sapma
                                                      150



                                                      140
Saçılım (Nokta) Grafiği

                                   Sınıftan Rasgele Seçilen 10 Öğrencinin Boy Uzunluğu Dağılımı

                                 185
Öğrencilerin Boy Uzunluğu (cm)




                                 180

                                 175

                                 170

                                 165

                                 160

                                 155

                                 150
Ağırlık   Glukoz
                                                                                    (x)      (y)
                          Görünüşte Sağlıklı Bireylerin Ağırlık ve Glikoz          64.0       90
                                                                                   75.3      109
                                  Değerlerinin Saçılım Grafiği
                          130
                                                                                   73.0      104
                                                                                   82.1      102
                          120
                                                                                   76.2      105
                                                                                   95.7      121
G L U K O Z (mg/100 ml)




                          110
                                                                                     .         .
                                                                                     .         .
                          100
                                                                                   77.6       87

                          90



                          80



                          70
                            50       60        70             80    90      100

                                               A Ğ I R L I K (Kg)
MATRİS SAÇILIM GRAFİĞİ


GTOP




                   MAXVO2




                                SPORYAS
Tanımlayıcı İstatistikler bir değerler dizisinin
    istatistiksel olarak genel özelliklerini tanımlayan
    ölçülerdir


        Tanımlayıcı İstatistikler



Yer Gösteren Ölçüler              Yaygınlık Ölçüleri
Yer Gösteren Ölçütler
• Bir dağılımı tanımlayabilmek için
  gereklidiriler
• İki grupta incelenmektedir:
  – Merkezi ölçütler-ortalama ölçütler
    • Ortalama, ortanca, tepe değeri
  – Merkezi olmayan ölçütler-konum
    bildiren ölçütler
    • Çeyrekler, yüzdeler
Ortalama Ölçütleri
• Dağılımdaki değerlerin en fazla yoğunlaştığı
  bir merkezi referans değeri verirler
• Frekans dağılımları ve grafiklerle gösterilen
  değişkenlerin karşılaştırılmasında daha somut
  olarak bilgi veren ölçütlerdir.
• En yaygın olarak kullanılanları
  –   Aritmetik ortalama
  –   Ortanca (medyan)
  –   Tepe değeri (mod)
  –   Geometrik ortalama
Aritmetik ortalama
• Çoğunlukla simetrik bir yapıya sahip olan
  sürekli sayısal verilerde kullanılan bir ortalama
  ölçüsüdür.
• Büyüklük belirtmesi açısından kesikli sayısal
  verilerde de kullanılabilir. (Örneğin ortalama
  şut sayısı gibi)
• Sınıflandırılmış ve sınıflandırılmamış veriler için
  ayrı ayrı hesaplanır.
• X ile gösterilir
• Sınıflandırılmamış verilerde her bir gözleme
  ilişkin değerlerin toplamı denek sayısına
  bölünerek elde edilir:
Aritmetik Ortalama
Çoğunlukla sayısal verilerde kullanılan bir merkezi eğilim ölçüsüdür. Her
bir gözleme ilişkin değerlerin toplamının denek sayısına bölünmesi ile elde
edilir.

       N : Kitledeki       n : Örneklemdeki denek sayısını göstermek üzere

             Kitle                             Örneklem
          A.Ortalaması                       A. Ortalaması
                                                      n

                                                     ∑x
                 N

                ∑x     i
                                                x=   i =1
                                                              i

          μ=    i =1
                                                          n
                  N


Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki
aşırı değerlerden etkilenir.
Aritmetik ortalama
• Sınıflandırılmamış verilerde:

        n

       Σ xi
       İ=1

X=                   i=1,2,3...n
        n
5 kişinin yaşları: 20, 25, 22, 21, 18 olarak verilmiş olsun

X = (20+25+22+21+18)/5 = 21,2 olarak bulunur
Aritmetik ortalama
• Sınıflandırılmış verilerde:

      k

     Σ fi . si
     İ=1

X=                 i=1,2,3...k (sınıf sayısı)
           n
fi = i.sınıfın frekansı,
si=i.sınıfın sınıf değeri olmak üzere
Aritmetik ortalama
     MaxVO2      fi         si   fisi
     40-44       2          42   84
     45-49       3          47   141
     50-54       8          52   416
     55-59       13         57   741
     60-64       8          62   494
     65-69       4          67   268
     70-74       2          72   144
     Toplam      40              2290

X = 2290 /40 = 57.25 ml/kg/dk
Ortanca (medyan)
• Bir dağılımdaki değerleri iki eşit parçaya bölen
  ve uç değerlerin bulunduğu durumlarda
  kullanılan bir ortalama ölçüsüdür.
• Verileri küçükten büyüğe doğru dizdiğimizde
  gözlem sayısı tek sayılı bir değerse ortanca
  (n+1)/2. gözlem değeridir
• Verileri küçükten büyüğe doğru dizdiğimizde
  gözlem sayısı çift sayılı bir değerse ortanca n/2
  ile (n+2)/2. gözlem değeridir
• Dağılımdaki aşırı değerlerden etkilenmediği
  için dağılımın çarpık olduğu durumlarda
  kullanılması gerekir.
• Ortalamaya göre zayıf olan tarafı dağılımdaki
  her değerin dikkate alınmamış olmasıdır.
Ortanca (medyan)
• 9 adet sporcunun milli olma sayıları şu şekilde
  verilmiş olsun:
5,6,4,7,5,8,38,7,4
Medyanı bulmak için değerler önce küçükten
  büyüğe dizilir:
4,4,5,5,6,7,7,8,38 , ortanca (n+1)/2’den
(9+1)/2=5. değer olan 6 olur
Dağılımın aritmetik ortalaması ise
9.3’tür aşırı değer olan 38’den etkilenmiştir.
Ortanca (medyan)
• 6 adet sporcunun şut sayıları şu şekilde
  verilmiş olsun:
15 21 17 42 18 19
Medyanı bulmak için değerler önce küçükten
  büyüğe dizilir:
15 17 18 19 21 42 , ortanca (n)/2’den
(6)/2=3. gözlem ile (6+2)/2= 4.gözlem
  değerinin ortalamasıdır. yani: (18+19)/2=
  18.5 olarak gerçekleşir.
Yani gözlemlerin %50’si 18.5’in altında %50’si
  ise üstündedir.
Tepe Değeri (mod)
• Dağılımda en fazla tekrarlanan değerdir.
Örneğin şu şekilde bir dağılımda:
13 26 19 16 19 18 19 19 tepe değeri 19 olur
Sınıflandırılmış verilerde en yüksek frekansa sahip sınıfın
   sınıf değeri tepe değeridir.Burada tepe değeri 57 dir
       MaxVo2          Frekans        %
       40-44           2              5
       45-49           3              7.5
       50-54           8              20
       55-59           13             32,5
       60-64           8              20
       65-69           4              10
       70-74           2              5
       Toplam          40             100
Tepe değeri (mod)
• Tek tepe değeri olan dağılımlar olabildiği gibi birbirine çok yakın
  frekansa sahip iki sınıf olabilir.
• Böyle dağılımlara bimodal dağılım denir
• İkiden fazla tepe değeri görüldüğü de olabilmektedir.
• Aritmetik ortalama ve ortancaya göre daha az kullanılan bir
  ortalama ölçüsüdür
• Hesaplaması kolay olduğu için dağılım ortalamasının
  kestiriminde yaklaşık bilgi verebilir
• Dezavantajları ise
    – Yapılan sınıflamaya göre tepe değeri değşmektedir
    – Bazı dağılımlarda tepe değeri olmayacağı gibi bazı dağılımlarda
      birden fazla tepe değeri olabilir
    – Tepe değeri sonuç bir istatistiktir, daha ileri hesaplamalar için pek
      kullanılmaz
KONUM ÖLÇÜTLERİ
Çeyrekler: dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar,


1. Çeyrek (Ç1)               2. Çeyrek (Ç2)                 3. Çeyrek (Ç3)

Değerlerin %25’i Ç1’e         Değerlerin %50’si             Değerlerin %75’i Ç3’e
eşit ya da ondan              Ç2’ye eşit ya da ondan        eşit ya da ondan küçüktür.
küçüktür.                     küçüktür. Bu değer aynı
                              zamanda ortancadır.



  Yüzdelikler

 Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler.
Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.
• ÇEYREKLER:           Dağılımdaki      gözlemler
  büyüklüklerine göre sıralandıklarında %25'
  inci değer 1. çeyrek, %75.değer 3. çeyrektir.
  %50' nci değer 2. çeyrek olup, bu değer aynı
  zamanda ortancadır
•
•     Q1 = n/4' üncü gözlemin aldığı değer
•     Q2 = n/2' inci gözlemin aldığı değer
•     Q3 = 3n/4' üncü gözlemin aldığı değer
•
• eşitlikleriyle hesaplanır.
Yüzdeliklerin hesaplanması
Sıra   Gözlem   Sıra   Gözlem   Sıra   Gözlem   Sıra   Gözlem




1      40       11     54       21     58       31     63
2      44       12     54       22     59       32     64
3      46       13     54       23     59       33     64
4      46       14     55       24     59       34     64
5      49       15     56       25     59       35     65
6      50       16     56       26     59       36     66
7      52       17     57       27     60       37     66
8      52       18     57       28     61       38     67
9      52       19     58       29     62       39     72
10     53       20     58       30     62       40     73


 • Yüzücülerin %25’i hangi değerden az değeri almıştır?
 (25. yüzdelik nedir? sorusudur) 0.25 x 40 = 10.
   gözlemin değeri olan 53’tür
YAYGINLIK
GÖSTEREN ÖLÇÜTLER
• Dağılım içindeki değerler ortalamaya ne kadar
  yakınsa ortalama o dağılım için o denli iyi bir
  ölçüttür. Dağılım içindeki her bir değerin
  ortalamaya olan uzaklığı dağılımın yaygınlığını
  belirler. Ortalamadan ayrılışlar ne kadar
  küçükse dağılım o denli dik, ne kadar büyükse
  o denli yaygındır.

•   VARYANS ( σ 2 , s 2 )
•   STANDART SAPMA ( σ , s )
•   STANDART HATA (σ µ , sx)
•   VARYASYON KATSAYISI (v)
Standart Sapma
• Bir dağılımın yaygınlığını gösteren en önemli
  yaygınlık ölçütlerinden biridir
• Dağılımdaki tüm değerlerin aritmetik
  ortalamaya olan uzaklıklarının ortalamasıdır
• Standart sapma büyüdükçe dağılımın
  yaygınlığı artar
• Dağılımda değerler aynı olduğunda yaygınlık
  yoktur ve standart sapma sıfır olur
• Hesaplanırken dağılımdaki tüm değerler
  dikkate alınır
• Aritmetik ortalamayla birlikte kullanılır X ± s
• VARYANS (σ 2, S2) : Bir dağılıma ilişkin gözlemlerin
  ortalamadan ayrılışlarının kareleri ortalamasına
  VARYANS denir.
•
•              s2 = Σ (Xi - X)2 / (n - 1) i=1, 2 … , n
•
• eşitliği ile ya da bu eşitliğin değişik şekilde ifadesi
  olan,
•
•                      n

•                     Σ Xi2 - (Σ Xi)2 / n
•                   i=1

•            s2 =
•                         n-1
• ile hesaplanır
s2 = Σ (Xi - X)2 / (n - 1)   i=1, 2 … , n
eşitliği ile hesaplanır.

Şu şekilde bir dağılımımız olsun: 2, 1, 4, 3, 5. Bu
   dağılımın ortalaması (2+1+4+3+5)/5=3. Her bir
   gözlemin ortalamadan ayrılışlarını bulalım, bunların
   karesini alalım ve toplayalım
Ortalamadan ayrılış      Kareler varyans
2- 3 = -1                    1   10 / (5-1) = 2,5
1-3 = -2                     4
4-3 = 1                      1
3-3 = 0                      0
5-3 = 2                    +4
                 Toplam      10
Varyansın sınıflandırılmamış verilerde hesaplanması
  • Dağılımımızın şu şekilde olduğunu varsayalım:
  • 2, 6, 1, 15, 6
  •                n

  •                   Σ Xi2 - (Σ Xi)2 / n
  •                   i=1

  •            s2 =
  •                         n-1

  • Σ Xi2 =     22+62+12+152+62 =302
  • (Σ Xi)2 / n = (2+6+1+15+6)=30

  • s2 = 302 – (30)2/5 = 30,5002
             5-1
• Sınıflandırılmış veriler için varyans
  aşağıdaki eşitlikle hesaplanır.
•
•                            n

•                Σ fibi2 - (Σ fibi)2 / n
•                   i=1

•          s2 =
•                       n-1
• Buradaki fi, i.sınıfın frekansı, bi i. sınıfın
  sınıf değeridir.
Varyansın sınıflandırılmış verilerde hesaplanması
MaxVo2      fi     si      si2     fisi    fisi2



40-44       2      42      1764    4       3528
45-49       3      47      2209    141     6627
50-54       8      52      2704    416     21632
55-59       13     57      3249    741     42237
60-64       8      62      3844    496     30752
65-69       4      67      4489    268     17956
70-74       2      72      5184    144     10368
Toplam      40                     2290    133100


 s2 = 133100 – (2290)2 /40 =51,12
           39
• STANDART SAPMA (σ, S): varyansın
  kareköküdür. Varyans ve Standart Sapma
  dağılımın yaygınlığına ilişkin genel bir bilgi
  veriri. Bu değerlerin büyük mü, küçük mü
  olduğu ya da dağılımın homojenliği
  konusunda yargıya varabilmek için ortalaması
  ile kıyaslamak gerekir.
• Sınıflandırılmamış verilerdeki örneğimizde
  varyansımız s2 = 30,5002 standart sapmamız
s= √30,5002 = 5,5227
• Sınıflandırılmış verilerdeki örneğimizde
  varyansımız s2 = 51,1225, standart sapmamız
s= √51,1225 = 7,15 olur
• STANDART HATA (σ µ , SX): Standart
  hata, gözlem başına düşen sapma
  miktarıdır. Aritmetik             ortalama
  genellikle standart hatası ile birlikte X ±
  Sx biçiminde verilir. STANDART HATA,
•
•    Sx = (S2 / n) 1/2          eşitliği ya da
  s/√n eşitliği ile hesaplanır.
• Örneğimizde s= √30,5002 = 5,5227, n=5
    olduğuna göre
• Sx = 5,5227 / √5 olur
• VARYASYON KATSAYISI(v) : Standart
  Sapmanın       ortalamaya    göre    yüzdesine
  VARYASYON KATSAYISI denir.
•
•             V = S 100
•                 X
• eşitliği ile hesaplanır. Bu değerin % 50' den
  büyük olması durumunda dağılım heterojendir
  denilir. Bu ölçüt aynı zamanda iki ya da daha
  çok dağılımın yaygınlıklarını kıyaslamada
  kullanılır.
TEORİK DAĞILIŞLAR

Verilerin oluşturduğu yığınlara dağılım demiştik.
Verinin ölçüm biçimi gözlemlerin aldığı olası
değerlerdir. Bu değerlerin birbirine göre konumu
(büyüklük, küçüklük) dağılım aralığının sınırları v.b.
gibi özelliklerden dolayı farklı yığınlar farklı dağılım
yapısı gösterir. Spor ve sağlık bilimlerinde elde
edilen verilerin oluşturduğu yığınlar daha çok şu üç
dağılım tipine uyarlar:
     Normal dağılım
     Binom dağılım
     Poisson dağılım
       Bunlardan ilki sürekli, diğer ikisi ise kesikli
dağılımdır.
Normal Dağılım Fonksiyonunun Grafiksel Formülü:




  biçimindedir. Bu eğriye çan eğrisi denir. Bu dağılım fonksiyonu Alman
  bilim adamı C.F. Gauss tarafından bulunmuştur. Bu nedenle eğriye Gauss
  eğrisi de denir.
NORMAL DAĞILIM




   X             X




       X         X
Normal dağılım fonksiyonunda herhangi bir deneğin ortalamadan
uzaklığının standart sapmaya oranı Z' ye standart normal dağılım
denir.

           Z=
             Xi - X
                 S
 Bu frekans dağılımının normal dağılım gösterip
   -4     -3      -2     -1      0      1      2      3       4
 göstermediğini saptamada kullanılır. Ortalaması 0 varyansı 1
 olan normal dağılımı aynı standart normal dağılım denir.




      -3        -2   -1     0      1       2      3
Normal Dağılımın Özellikleri:

∀ •Teorik normal dağılımda deneklerin aldığı
  değerler birbirinden bağımsız ve rasgeledir.
∀ •Teorik normal dağılım ortalamaya göre
  simetriktir. Gözlemler ortalamaya yakın
  değerler alırsa homojen, ortalamalardan uzak
  değerler alırsa dağılıma heterojen denir. Aynı
  ortalamaya sahip üç dağılımın dik ya da
  yayvan olması durumundaki eğriler aşağıda
  verilmiştir.
Normal Dağılımın Özellikleri:




∀•      Teorik normal dağılımda veriler
 süreklidir ve dağılım aralığı içinde her
 değeri alabilirler, yani - ∞ < x < + ∞
Normal Dağılımın Özellikleri:
•   Teorik normal dağılımda;
•    X ± S sınırları arasına gözlemlerin %
  68.26' sı
•      X ± 2S sınırları arasına gözlemlerin %
  95.44' ü
•       X ± 3S sınırları arasına gözlemlerin %
  99.74' ü girer.




      -3s   -2s   -1s   X   1s    2s   3s
ÇARPIKLIK VE DİKLİK

Normal dağılıma uyan gerçek veriler her zaman
  ortalamaya göre simetrik olmazlar sola
  (negatif) ya da sağa (pozitif) çarpık olabilirler
  ama bu çarpıklık kabul edilebilir sınırlar
  arasında olmalıdır.

Standart normal dağılımda ortalama, ortanca,
  tepe değeri birbirine eşit ve üstüste çakışır.
  Dağılımın     çarpıklığının ölçüsü   çarpıklık
  katsayısı (Ç) ile ölçülür.
Sağa Çarpık      Simetrik        Sola Çarpık




      Ortalama                        Ortalama
                   Ortalama
   Ortanca                            Ortanca
                    Ortanca
 Tepe Değeri       Tepe Değeri        Tepe Değeri
ÇARPIKLIK VE DİKLİK

           Σ (Xi - X)3
               n
Ç   =
                S3
ile hesaplanır. Bu değer;

Ç = 0 ise dağılım simetrik,
Ç < 0 ise dağılım sola (-) çarpık
Ç > 0 ise dağılım sağa (+) çarpık
ÇARPIKLIK VE DİKLİK

Dağılım ortalamaya göre simetrik olabilir. Aynı
  ortalamaya sahip dağılımların görünümleri,
  varyansları farklı olabilir. Bu farklılık
Basıklık Katsayısı ile belirlenir.
B>0         Σ (Xi - X)4
               n
B   =
               S4
• B>0
• B=0
• B<0


 Burada;   B=0 ise dağılım normal
           B<0 ise dağılım basık
           B>0 ise dağılım dik denir.
Sağa (pozitif) çarpık dağılım
• TD < ortanca<X
         TD
                   X




            ortanca

 Ç = 0 ise dağılım simetrik,
 Ç < 0 ise dağılım sola (-) çarpık
 Ç > 0 ise dağılım sağa (+) çarpık
Sola (negatif) çarpık dağılım
   • X< ortanca<Tepe değeri
                                TD
                X




                      ortanca
Simetrik normal dağılımda ise ortalama, ortanca ve TD birbirine eşittir.
Sağa çarpık dağılımlarda büyük değerler sayısı daha fazla,
sola çarpık dağılımlarda da küçük değerlerin sayısı daha fazladır.
BİNOM (İKİ TERİMLİ) DAĞILIMI

Herhangi bir olayın gerçekleşmesi ya da
  gerçekleşmemesi inceleniyorsa yani iki olası
  sonuç varsa bu verilerin dağılımı binom
  dağılıma uyar. Örnek olarak:
Yapılan antrenman tekniğinin başarılı olup
  olmaması gibi
•POISSON DAĞILIMI
 Çok sayıda olası durum içerisinde aranan olayın
  gerçekleşme olasılığı küçükse ve veriler kesikli
  sayısalsa x=0, 1, 2, 3… v.b bu verilerin dağılımı
  poisson dağılımına uyar.
Verilerde Standartlaştırma
STANDARTLAŞTIRMA
• Elde edilen puanlar veya veriler karşılaştırılırken
  kullanılır
• Örneğin bir öğrencinin sınav sonuçları şu şekilde olsun:
 Ders           İng           Mat            Psikol
 Öğrencinin     80            65             75
 puanları

Öğrencinin sınıfa göre en başarılı olduğu dersi belirlerken
sadece almış olduğu notlara bakarak karar veremeyiz. Sınıf
ortalaması ve sınıf standart sapmasına göre yapılacak bir
standartlaştırma yani yeni bir ölçeğe dönüştürme işlemi
sayesinde daha rahat karşılaştırma yapabiliriz.
STANDARTLAŞTIRMA
• Öğrencinin bulunduğu sınıfa ait değerler de eklenmiş
  olsun

 Ders                   İng        Mat        Psikol
 Öğrencinin puanları    80         65         75

 Sınıfın ortalaması     85         55         60

 Sınıfın standart       10         5          15
 sapması

Aslında öğrencinin en başarılı dersi gibi görünen
İngilizce’de sınıf ortalamasının altında not aldığı başarısız
gibi göründüğü matematik ve psikolojide sınıf
ortalamasının üzerinde aldığı görülmektedir.
Standartlaştırmada Z Skoru
• Verilerin standartlaştırılmasında en çok
  kullanılan yöntemlerden biridir
• Orijinal verileri ortalaması 0, standart
  sapması 1 olan yeni bir skora
  dönüştürür
STANDARTLAŞTIRMA
Ders                      İng   Mat       Psikol
Öğrencinin puanları       80    65        75

Sınıfın ortalaması        85    55        60

Sınıfın standart          10    5         15
sapması


Bu veriler yardımıyla z-skorlarını hesaplayalım;

       z = (Xi – X) / s
STANDARTLAŞTIRMA
Ders                  İng          Mat         Psikol
Öğrencinin puanları   80           65          75

Sınıfın ortalaması    85           55          60

Sınıfın standart      10           5           15
sapması
Z                     (80-85)/10   (65-55)/5   (75-60)/15
                      = - 0,50     = +2        = +1

Öğrenci İngilizce’de ortalamanın 0,50 standart sapma
altında bir z skoruna sahipken, matematik dersinde
ortalamanın 2 standart sapma üzerinde bir z skoruna
sahiptir.
Standartlaştırmada T Skoru
• Standart z skorlarının küçük ondalıklı sayıları
  içermesi ve de negatif ve pozitif değerler
  alabilmesi (genellikle –3 ve +3 arasında) , z
  skoruna dayalı ancak daha kolay anlaşılan t
  skorlarını ortaya koymuştur
• T skorları ortalaması 50, standart sapması 10
  olan bir skorlar kümesidir.
• Genelde 20 ile 80 arasında değer alırlar
STANDARTLAŞTIRMA

T skorunu elde etmek için her bir z skoru 10 ile çarpılarak
50 puan eklenir. En yüksek t skoru 80, en düşük t skoru 20
olabilir.


Ders         İng              Mat              Psikol
Öğrencinin   80               65               75
puanları
Z            (80-85)/10       (65-55)/5        (75-60)/15
             = - 0,50         = +2             = +1
T            (10*-0,50)+50    (10*2)+50        (10*1)+50
             = 45             = 70             =60
Güven Aralıkları
• Kitle dağılımına ilişkin parametreleri elde etmek
  çok zor, çoğu kez de olanaksızdır. Böyle
  durumlarda o kitleden çekilen örnekleme ilişkin
  istatistikler (X, S2, pq…vb) hesaplanır.
• Aynı kitleden aynı koşullarda çekilen farklı
  örneklemlerden elde edilen istatistikler farklı
  değerler alabilirler. Bu farklı değerdeki
  istatistikler belirli bir dağılım aralığı içinde değer
  alırlar ki bu değerlerin kitle parametreleri olan µ
  ve σ2 değerlerine yakın değerler olması beklenir.
• Bu şekilde aynı kitleden çekilen örneklem
  değerlerinin alabileceği değerlerin oluşturduğu
  dağılım aralığına Güven Aralıkları denir.
• KİTLE ORTALAMASI GÜVEN
  ARALIĞI
• Kitle Varyansı Bilindiğinde
∀ σ2 varyansına sahip bir kitlenin
  ortalamasının (µ), güven sınırları, bu
  kitleden rasgele olarak çekilen bir
  örneklemin ortalaması (X), kitle standart
  hatası σµ kullanılarak
•     X- Z σµ ≤ µ ≤ X + Z σµ biçiminde
  hesaplanır.
• Burada σµ = σ / √n olarak hesaplanır.
• KİTLE ORTALAMASI GÜVEN
  ARALIĞI
• Kitle Varyansı Bilinmediğinde
• Kitle varyansı σ2 'nin bilinmediği
  durumda kitle ortalaması, µ'nın güven
  aralığı, bu kitleden çekilen ve ortalaması
  X, varyansı S2 olan bir örnekleme ilişkin
  istatistiklerle,
•     X - t Sx ≤ µ ≤ X + t Sx biçimimde
  hesaplanır. Burada Sx örneklem standart
  hatasıdır.
•     Sx = s / √n olarak hesaplanır.
Hipotez ve Hipotez testleri
Hipotez nedir?
• Hipotez örneklem yardımıyla evren parametreleri
  hakkında kestirimde bulunma sürecidir.
• Herhangi bir konudaki doğruluğu bilimsel olarak
  kanıtlanmamış düşünce, görüş ya da varsayımlardır.
Hipotezin amacı nedir?
• Evrenden çekilen örneklemler yardımıyla evren
  hakkında bir karara varma konusunda yardımcı
  olmaktır.

 Hipotezimizin doğruluğunu nasıl kanıtlarız?
• Hipotezimizin doğruluğunu kanıtlayabilmek için veri
  yapımıza uygun bir hipotez testi uygulamamız
  gerekir. Hipotez testlerine önemlilik ya da anlamlılık
  testleri de denir.
Hangi hipotez testini uygulayacağımız;
•   Araştırma planına
•   Veri tipine
•   Denek sayısına
•   Verilerin dağılım yapısına göre, farklılık
    gösterir.
Hipotezler iki türlüdür:

• H0 farksızlık hipotezi ya da sıfır hipotezi
• H1 alternatif hipotezdir
• H0 farksızlık hipotezi örnekleri:
   – Voleybol ve basketbol oynayan sporcularda vücut
     yağ yüzdeleri arasında fark yoktur.
   – Kızlarla erkeklerin istatistik dersi notları arasında
     fark bulunmaz
   – Spor yöneticiliğini kazanan öğrencilerle beden
     eğitimi öğretmenliğini kazanan öğrencilerin ÖSS
     puan ortalamaları arasında anlamlı bir farklılık
     bulunmaz
• H1 alternatif hipotezi örnekleri:
   – Voleybol ve basketbol oynayan sporcularda vücut
     yağ yüzdeleri arasında farklılık bulunur.
   – Kızlarla erkeklerin istatistik dersi notları farklıdır
   – Spor yöneticiliğini kazanan öğrencilerle beden
     eğitimi öğretmenliğini kazanan öğrencilerin ÖSS
     puan ortalamaları arasında anlamlı bir farklılık
     bulunur
• Hipotezler tek yönlü ve çift yönlü
  olarak kurulmaktadır:
• TEK YÖNLÜ H0 : µ 1 - µ 2 = 0
                  H1 : µ 1 - µ 2 > 0
                  H0 : µ 1 - µ 2 = 0
                  H1 : µ 1 - µ 2 < 0
• ÇİFT YÖNLÜ      H0 : µ 1 - µ 2 = 0
                  H1 : µ 1 - µ 2 ≠ 0
• H0 farksızlık hipotezi örnekleri:
   – Voleybol ve basketbol oynayan sporcularda vücut
     yağ yüzdeleri arasında fark yoktur.
   – Kızlarla erkeklerin istatistik dersi notları arasında
     fark bulunmaz
   – Spor yöneticiliğini kazanan öğrencilerle beden
     eğitimi öğretmenliğini kazanan öğrencilerin ÖSS
     puan ortalamaları arasında anlamlı bir farklılık
     bulunmaz
• H1 alternatif tek yönlü hipotez örnekleri:
   – Voleybol oynayan sporcularda basketbol
     oynayanlara göre vücut yağ yüzdesi daha düşüktür.
   – Kızların istatistik dersi notları erkeklerinkinden
     yüksektir.
   – Spor yöneticiliğini kazanan öğrencilerin ÖSS puan
     ortalamaları beden eğitimi öğretmenliğini kazanan
     öğrencilerinkine göre yüksektir.
Anlamlılık (yanılma ya da hata düzeyi nedir?

• Anlamlılık düzeyi araştırmacı tarafından testten önce
  belirlenen bir değerdir. (α ile gösterilir)
• H0 hipotezi doğru iken onu reddetme olasılığını ifade
  eder.
• Yani; gerçekte karşılaştırdığımız iki evren arasında
  fark yokken yanılıp fark varmış gibi farksızlık
  hipotezini reddetme olasılığıdır.
• Yanılma düzeyi ya da α olarak en çok 0.05 kullanılır.
  Araştırmanın daha hassas olarak yapılması isteniyorsa
  α olarak 0,01 ve 0,001 de kullanılabilir.
Red etme ve kabul etme neye göre olur?
• Bir istatistiksel test uyguladığımızda karşımıza bir test
  istatistiği ve p değeri ortaya çıkacaktır.
• Biz ortaya koyduğumuz H0 veya H1’i bu sonuçlara göre
  kabul veya reddederiz.
• Hesaplamış olduğumuz test istatistikleri teorik tablolardaki
  değerlere eşit ya da büyük ise H0 reddedilir.
• Aynı şekilde elde ettiğimiz p değerleri 0.05’ten küçükse H0’ı
  reddederiz ve H1’i kabul ederiz.
• İstatistiksel paket programlarda elde edilen test
  istatistiklerine karşılık gelen p değerleri verilmekte
  olduğundan ayrıca teorik tablo değerlerine bakılmadan da
  bir hipotezin reddedilip kabul edileceğine karar verebiliriz.
Hipotez testlerinde ne tür hatalar ortaya çıkar?
  • Hipotez testlerinde karar verirken iki tür hata
    yapabiliriz.
  • Bunlar:
     – 1. tip hata (α türü hata)
     – 2. tip hata (β türü hata) olarak adlandırılmaktadır
  • H0 hipotezini gerçekte doğruyken reddetmek
    1. tip hatadır
  • H0 hipotezini gerçekte yanlışken kabul etmek
    de 2. tip hatadır.
Hipotez testlerindeki doğru kararlar ve
hatalar


                H0 doğru iken    H0 yanlış iken

H0 ‘ı kabul     Doğru karar      2.tip hata(β)
etmek

H0 ‘ı reddetmek 1.Tip hata (α)   Doğru karar
Hipotez Testlerinde İzlenecek Adımlar:
•   Hipotezler kurulur
∀   α yanılgı düzeyi belirlenir.
•   Verinin özelliklerine göre (dağılım yapısı
    homojen, heterojen, sürekli, kesikli, denek
    sayısı v.b.) ve hipoteze bakılarak uygun test
    seçilir.
•   Test yapılır.
•   i)Hesaplama bilgisayarda bir paket program
    kullanılarak yapılıyorsa hesaplanan anlamlılık
    düzeyi p , yanılgı düzeyi α ile karşılaştırılır.
•   p > α ise H0 kabul,
•   p ≤ α ise H0 reddedilir.
Hipotez Testlerinde İzlenecek
Adımlar
• ii)Hesaplama elle yapılıyorsa hesaplanan test
  istatistiği, α yanılgı düzeyinde ve o test için
  hesaplanan Serbestlik Derecesindeki (SD) çizelge
  değeri ile karşılaştırılır. Hesapla bulunan test
  istatistiği çizelgeden bulunandan büyükse H0
  yokluk hipotezi reddedilir ve p < α yazılır. Aksi
  durumda H0 hipotezi kabul edilir ve p>α yazılır.
∀ α = 0.05 alınma durumunda p<0.05 ise bunun
  anlamı şudur: Ben bu çalışmada H0 hipotezini
  reddettim farkı anlamlı buldum, benim bu
  kararım 0.95 olasılıkla doğrudur. (H0' ı kabul
  etme) Yanılma olasılığım 0.05' ten küçüktür.
Hipotez testleri

• Hipotez testleri verilerin yapısına ve
  dağılım özelliklerine göre iki ana
  grupta toplanır:
   – Parametrik Hipotez Testleri
   – Parametrik Olmayan Hipotez Testleri
Hipotez testleri
• Bu iki ana gruptan her biri kendi içinde çok
  sayıda hipotez testi içerir. Bunların seçimi
  örneklem dağılımlarının özeliklerine ve
  gözlemlerin skalasına göre belirlenir.
• Bu iki tip hipotez testinden parametrik
  olanların uygulanabilmesi için test edilecek
  verilerde bazı koşullar aranır.
• Bu koşullardan en az birinin
  gerçekleşmemesi durumunda parametrik
  testlerin kullanılması sakıncalı olur.
• Bu durumda parametrik test yerine o testin
  karşıtı olan parametrik olmayan test
  kullanılır. Parametrik testlerin çoğunun
  parametrik olmayan karşıtı vardır.
Parametrik testler ve parametrik olmayan
karşılıkları
          PARAMETRİK               PARAMETRİK OLMAYAN

İki Ortalama Arası Fark         Mann Whitney U Testi

İki Eş Arasındaki Fark          Wilcoxon İki Örnek Testi

Bağımsız İki Oran Arası Fark    2x2 Düzende Ki-Kare Testi

Bağımlı İki Oran Arası Fark     Bağımlı Örneklerde Ki-Kare Testi

Tek Yönlü Varyans Çözümlemesi   Kruskal Wallis Varyans Çözümlemesi

Tekrarlı Denemelerde Varyans    Freidman Testi
   Analizi
PARAMETRİK TESTLERİN
    VARSAYIMLARI
• Normal dağılıma sahip olma
• İkiden çok kitle olduğunda varyansların homojen
  olması
• Verilerin sürekli dağılım gösteren karakterlerden
  oluşması
• Her bir dağılımdaki gözlem sayılarının yeterli sayıda
  olması (nj≥10)
• İki ya da daha çok dağılım birbiri ile
  karşılaştırılıyorsa dağılımlardaki gözlem sayıları
  birbirlerine eşit ya da yakın sayıda olmalıdır. Bu
  koşul küçük n' ler için daha da anlamlıdır.
• Örnekler birbirinden bağımsız ve rasgele
  seçilmelidir.
PARAMETRİK TESTLERİN
   VARSAYIMLARI

• Bu varsayımlardan en az birisi yerine gelmezse
  parametrik testler kullanılmaz, bunun yerine
  parametrik olmayan karşıtı kullanılır.
  Parametrik olmayan testlerin varsayımları ise;
• -Örnekler rasgele ve birbirinden bağımsız olarak
  seçilecek
• -Her bir grupta en az 3 (n≥3) denek olacak
Parametrik test varsayımları
• Normal Dağılıma Uyum:
• Eldeki verilerin çekildiği kitlenin dağılımının normal dağılıma
  uyup uymadığını test etmek için istatistik paket
  programlarındaki normallik testlerinden yararlanılabileceği
  gibi aşağıda verilen ölçütlerle de belirlenebilir.
• Bir dağılımın normal dağılıma uyabilmesi için dağılım
  ortalaması ( X) ile standart sapması (S) kullanılarak
•
  x±S sınırları içine gözlemlerin %68.2nin aldığı değer
  girmelidir.
•
  x±2S         sınırları içine gözlemlerin %95.44nün aldığı değer
  girmelidir
•
  x±3S         sınırları içine gözlemlerin %99.74nün aldığı değer
  girmelidir
Parametrik test varsayımları
• Varyansların Homojenliği:
• Varyansların homojenliği iki yönden ele
  alınmalıdır. Birincisi her bir grubun küçük
  varyanslı olması(varyasyon katsayısı <
  %50)bunun anlamı standart sapma
  ortalamanın yarısından küçük olmalı , ikincisi
  ise birden fazla grup varsa varyanslarının
  birbirine oranı 1'e yakın olmalıdır. Normallik
  testinde olduğu gibi homojenlik testide
  istatistik paket programlarında vardır. Bunlar
  kullanılarak test edilebilirler.
• Dağılımın Sürekli Olması: Bu varsayım için
  temel özellik önce veriler ölçüm mü yoksa
  sayımla belirlenen veriler mi? Bakılır.Ölçüm
  olması dağılımın sürekli olması için yeterli
  değildir. Dağılımda uç değerler (çok küçük yada
  çok büyük)varsa ölçüm olmasına karşın kesikli
  olabilir.
• Örneğin 20 denekten 19 tanesinin kan şekeri
  düzeyi 9-100 arasında değişirken bir tanesi 400
  ise bu değer dağılımın süreklilik yapısını bozar ve
  bu değer dağılımdan çıkartılmalıdır.(Yanlış ölçüm
  ya da yanlış denek) Buna benzer birkaç değer
  varsa, dağılımdan atılamıyorsa bu durumda
  sürekliliği sağlayacak bir transformasyon yöntemi
  uygulanmalıdır. (Log, karekök, vb.)
• Denek Sayıları:
• Herbir dağılımdaki denek sayısı n≥10 olmalıdır. n≥10
  olmasının nedeni bu değerin rasgeleliğin dağılımı
  etkileme altsınırıdır.
• İstatistikteki Büyük Sayılar Kanunu'na göre n
  büyüdükçe rasgeleliğin dağılım üzerindeki etkisi
  azalır, gerçeğe ulaşma olasılığı artar. İşte bu kural
  için alt sınır 10'dur. n≥30 olduğunda rasgeleliğin etkisi
  yok denecek kadar azdır. Bunu bir örnekle
  açıklayalım:Dünyadaki kadın erkek oranı 0.50'dir.Bu
  doğan her bebekten 1 kız 1 erkek olacağı anlamına
  gelir. Doğum kliniği önüne gidelim, doğan bebeklerin
  cinsiyetine bakalım. Hiçbir zaman 1 kız 1 erkek
  doğmaz. Çünkü her doğum birbirinden bağımsızdır ve
  olasılığı 0.50'dir. Bazen arka arkaya 3 kız ya da 2
  erkek ya da farklı oranlarda doğabilir. Hiçbir zaman
  arka arkaya 10 kız yada 10 erkek doğmaz.Bu oran 3
  kız 7 erkek yada 4 erkek 6 kız yada 5 kız 5 erkek vb.
  olabilir. Doğum sayısı 30'a ulaştığında rasgeleliğin
  etkisi tamamen ortadan kalkar, oran 0.50 ulaşır.
• İki yada daha çok grup karşılaştırılacaksa
  gruplardaki denek sayıları birbirine eşit yada
  yakın olmalıdır. bunun amacı herbir gruptaki
  rasgeleliğin etkisini eşit tutmaktır.Örneğin bir
  grupta 10 denek diğerinde 25 denek varsa
  birinci grupta rasgeleliğin etkisi 25 denekli
  ikinci gruptan daha fazladır. bu da farklı
  koşullarda kıyaslama yapmaya ve hatalı sonuç
  bulunmasına yol açar. Herbir gruptaki denek
  sayısının 30'un üzerinde olması durumunda
  eşitlik önemini yitirir. Bir grupta 30 diğerinde
  50 denek olabilir.
• UYGUN TEST SEÇİMİ
• Eldeki veriye uygun test seçmek çok
  önemlidir. Araştırma ne kadar iyi planlansa ne
  kadar iyi uygulansa tüm aşamaları ne kadar
  iyi yürütülse de sonuçta değerlendirme
  aşamasında yanlış test uygulanırsa o
  aşamaya kadar harcanan tüm emekler boşa
  gider. Peki elimizdeki veriye çok sayıda
  testten hangisini seçeceğiz. Doğru kararı nasıl
  vereceğiz. İşte bu iş için istatistikteki karar
  ağacı yöntemini bu amaçla kullanabiliriz. Bu
  aşamada önce verinin ölçüm yada sayım
  olması kriterine bakacağız.
• Veri ölçümle belirtilen karakterlerden
  oluşuyorsa 2 nolu karar ağacını, sayımla
  belirtilen karakterlerden oluşuyorsa 3 nolu
  karar ağacını izleyeceğiz. Testin seçiminde
  karar ağacı ile birlikte önce parametrik test
  varsayımlarını gerçekleştirip
  gerçekleştirmediğine bakacağız.Parametrik
  (P), Nonparametrik (NP) ile belirtilen testi
  alacağız.
VERİ

ÖLÇÜM   SAYIM
ÖLÇÜM


Grup Tek   Grup İki   Grup Çok
ÖLÇÜM


Grup Tek              Grup İki                Grup Çok

           Bağımsız      Bağımlı   Bağımsız        Bağımlı
ÖLÇÜM


     Grup Tek                               Grup İki                           Grup Çok

                     Bağımsız                   Bağımlı           Bağımsız              Bağımlı


Kitle Ortalaması     İki Ortalama                 İki Eş           Tek Yönlü         Tekrarlı Ölçümler
Anlamlılık Testi    Arası Fark Testi          Arası Fark Testi   Varyans Analizi      Varyans Analizi



                         Mann Whitney              Wilcoxon Eş     Kuruskal Wallis
     İşaret Testi                                                                       Fredman Testi
                            U Testi                   Testi        Varyans Analizi




     Parametrik        Parametrik Olmayan
       Testler              Testleri
Sayım


Grup Tek   Grup İki   Grup Çok
SAYIM


Grup Tek         Grup İki         Grup Çok

           Bağımsız     Bağımlı   Bağımsız
SAYIM


  Grup Tek                              Grup İki                Grup Çok

                         Bağımsız              Bağımlı           Bağımsız


 Kitle Oranının       Bağımsız İki Oran      Bağımlı İki Oran
Anlamlılık Testi       Arası Fark Testi      Arası Fark Testi



Tek Değişkenli             2 x 2 Düzeninde         MacNemar      Çok Gözlü
 Ki-KareTesti                Ki-KareTesti            Testi      Ki-Kare Testii
                             Fisher Kesin                        Kolmogrov
                             Ki-KareTesti
                                                                Simirnov Testi


   Parametrik      Parametrik Olmayan
     Testler            Testleri
Parametrik Hipotez Testlerine Giriş
T-Testleri


• Tek grupta t-testi
• Bağımsız iki grupta t-testi
• Eşleştirilmiş iki grupta t-testi
Parametrik Hipotez Testlerine Giriş
T-Testleri
• Tek grupta t-testinin varsayımları
  nelerdir?
  – Test edilecek örneklem normal dağılıma
    uygun olmalıdır.
  – Vakalar rasgele olarak seçilmiş olmalıdır
  – Vakalar birbirinden bağımsız olmalıdır.
Parametrik Hipotez Testlerine Giriş
T-Testleri
• Tek grupta t-testi örneklem ortalamasının
  evren ortalamasına eşit olup olmadığını test
  etmek için kullanılır.
• Örneğin spor yapmayan yetişkin erkeklerin
  depresyon ölçeği puanlarının 50’den fazla
  olduğu yönünde bir hipotezimiz olduğunda
  oluşturduğumuz örneklemdeki puan
  ortalamasının 50’den farklı olup olmadığını
  test etmemiz gerekir. İşte örneklem
  ortalamamızın belli bir evren ortalamasına
  uyup uymadığını test etmek için tek grupta t-
  testini uygularız.
KİTLE ORTALAMASI ÖNEMLİLİK
TESTİ

                         X-µ
                  t=      Sx

H0 : µ = 50         n = 30
H1 : µ ≠ 50         S= 10,33 Sx = 10,33 / √30

              50-54,63     = -2,457 t 0.05,30 = 2.10
    t=           1,88              p=0.020 p< 0,05
Sonuç örneklem ortalaması kitle ortalamasından farklıdır
Örnek
Basketbol oyuncularının vücut yağ yüzdesi ortalamasının
%10 olup araştırılmak istenmektedir. Bu amaçla rasgele
seçilen 30 basketbolcunun vücut yağ yüzdeleri ölçülmüştür.

H0 : Basketbolcuların vücut yağ yüzdesi ortalaması 10’dur.
H1: Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklıdır.

          x−µ    7.68 − 10
       t=      =           = −6.68               P<0.000
          S / n 1.90 30

Yorum:
Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan
farklı bulunmuştur.
İki ortalama arasındaki farkın
anlamlılığı testi
• İncelenen bir değişken yönünden birbirinden
  bağımsız iki grubun karşılaştırılmasında
  kullanılır.
• Varsayımları şunlardır:
  – Karşılaştırılacak iki grup vardır
  – Gruplar birbirinden bağımsızdır yani her grupta
    farklı kişiler yer alır
  – Veriler sürekli sayısal verilerdir
  – Gruplardaki denek sayıları yeterlidir (n>=30)
  – Evren dağılımları normal dağılım gösterir.
  – Evren varyansları homojendir
İki ortalama arasındaki farkın
anlamlılık testi
• Örneğimizde iki farklı grup öğrenci var. 50 adet kız
  öğrenci ve 50 adet erkek öğrenci. Burada cinsiyetin
  bilgi skorları üzerindeki etkisi araştırılmıştır. Buna
  göre iki ayrı cinsiyet grubunda bilgi skorlarının
  ortalaması karşılaştırılmıştır.
   – Birinci adım, iki farklı gruba ait verilerin bu testin
     varsayımlarını karşılayıp karşılamadığıdır.
   – İkinci adım ise verilen istatistiklere göre arada anlamlı fark
     olup olmadığına bakılmasıdır.
   – Birinci grubun bilgi skoru ortalaması 8,46,diğer grubun ise
     7,62 olsun. Formüllerde bunları ve standart sapmaları yerine
     koyduğumuzda ortaya bir t istatistiği çıkacaktır. Bunun p
     değerini bulduğumuzda 0.05’ten küçükse anlamlı bir fark
     olduğunu söyler,H0’ı reddederiz.
İKİ ORTALAMA ARASINDAKİ
 FARKIN ÖNEMLİLİK TESTİ
H0 : X1 - X2 = 0
H1 : X1 - X2 ≠ 0
                        X1 - X2
                   t = √S 2 + S 2
                         1     2

                        n1     n2
Kızlarla erkeklerin bilgi skorları arasında fark var mı?
            8.46 - 7.62
   t=       1.702 + 2.232 = 2.12 t 0.05 , 49 = 2.01
             50       50                   p< 0.05
İki eş arasındaki farkın anlamlılık testi
• Bir denek üzerinde bazen birden fazla deney yapılmak
  istenebilir. Örneğin spor bilimlerinde antrenman öncesi ve
  antrenman sonrası birçok parametre açısından karşılaştırma
  yapılarak antrenmanın bu parametrelere etkisi
  araştırılabilmektedir. Bu tür araştırmalarda grupların bağımlı yani
  aynı kişilerden oluştuğu söylenir.
• Eğer bağımlı grup sayısı 2 ve gruplara ait verilerin yapısı
  parametrik testlerin varsayımlarını karşılıyorsa iki eş arasındaki
  farkın anlamlılık testi ya da paired-t test kullanılabilir.
• Buna göre varsayımlarımız:
    – Bağımlı grup sayısı 2’dir
    – Veriler ölçümle belirtilmiştir
    – Denek sayısı her iki grupta da yeterlidir (n≥30)
    – Gruplardaki gözlem değerleri çıkartılarak elde edilen farkların
      dağılımı normal dağılıma uygunsa bu test kullanılır
Hipotezlerin kurulması:
                   H0:   D =0
                   H1:   D ≠0
Test istatistiğinin hesaplanması:
     a) Gözlemlerin önceki değerlerinden sonraki değerleri
      çıkartılarak fark dizisi oluşturulur.
   b) Farkların ortalaması bulunur:   D
   c) Farkların standart sapması bulunur:   SD
   d) Farkların standart hatası bulunur:   SD = SD / n
e) Test istatistiği (t hesap) hesaplanır:


                          D
                       t=
                          SD

                      l t hesap l > t tablo

ise H0 hipotezi reddedilir ve p< α (örneğin p<0.05)
şeklinde gösterilir.
ÖRNEK:

Primer hipertansiyonlu bireylere günde iki kez 20’şer
dakikalık yürüyüş önerilerek, yürüyüşe başlamadan
önceki 1 haftalık ortalama tansiyon miktarı ile yürüyüşe
başladıktan sonraki 1 haftalık ortalama tansiyon
miktarları arasında fark olup olmadığı öğrenilmek
isteniyor.
Aynı bireylerin iki farklı zamandaki ölçümleri söz
konusu olduğundan gruplar bağımlıdır.
Sis. Kan Basıncı      Fark
 Hasta
           Önce      Sonra    Önce-Sonra
  1         140      125         15
  2         135      120         15
  3         150      145          5
  4         155      155          0
  5         145      150         -5
   .         .        .           ,
   .         .        .           ,
  36        140      120         20
Ortalama   146,86   138,1       8,69
S. sapma     7,06     6
                     7,97       6,18
10




       8



                                                        1,0
       6
SAYI




                                                         ,8

       4

                                                         ,5


       2
                                                         ,3



       0
            -5,0   0,0     5,0   10,0     15,0   20,0   0,0
                                                          0,0   ,3      ,5      ,8   1,0


                         FARK DEĞERLERİ                              P-P PLOT
1. Hipotezlerin Kurulması:
 H0:   D =0
 H1:   D ≠0

2. Test İstatistiğinin Hesaplanması

  S D = S D / n = 6,18 / 36 = 1,03

      D 8,69
   t=    =     = 8,44
      S D 1,03
3. Alfa yanılma düzeyi 0.05 olarak alınmıştır.


4. İstatistiksel karar.




   p<0,05

   Yorum: Yürüyüş sonrasında sistolik kan basıncındaki
   8.69 birimlik (mm/Hg) düşme istatistiksel açıdan
   anlamlıdır.
Tek Yönlü Varyans Analizi
• Parametrik test varsayımları karşılanmalıdır
   – Gruplar normal dağılım göstermelidir
   – Grupların varyansları homojen olmalıdır
   – Gruplar birbirinden bağımsız olmalıdır
   – Veriler ölçümle belirlenmelidir
   – Her bir gruptaki gözlem sayısı 30’un üzerinde
     olmalıdır
• İkiden fazla bağımsız grup arasında fark olup
  olmadığını test etmek için kullanılır
• Yani iki ortalama arasındaki farkın anlamlılığı testinin
  2’den çok gruba uyarlanmış halidir
İkiden Fazla Bağımsız Grupta Tek
Yönlü Varyans Analizi
• Örnek: hentbol, basketbol ve futbol oynayan
  öğrencilerin yüzde yağ değerlerinin karşılaştırılması
  istendiğinde yüzde yağ değeri açısından 3 farklı spor
  grubu karşılaştırılırken tek yönlü varyans analizi
  kullanılır

              Hentbol       Basketbol     Futbol
 X            10,37         7,68          4,89

 n1           30            30            30
Tek Yönlü Varyans Analizi
• Varyans analizi sonucunda gruplar arasında fark yoksa
  işlemler sona erer.
• Varyans analizi sonucunda gruplar arasında fark
  bulunursa hangi gruplar arasında farklılık olduğu ortaya
  çıkarılır. Bunun için post-hoc testler uygulanır:
   –   En küçük önemli fark yöntemi (her bir ortalama 1 kez kullanılır)
   –   Duncan yöntemi
   –   Tukey HSD yöntemi                         ikili karşılaştırma
   –   Student-Newman-Keuls yöntemi
   –   Dunnett yöntemi (her bir deney grubu kontrol grubu ile
       karşılaştırılır)
İkiden Fazla Bağımlı Grupta nTekrarlı
Ölçümlerde Varyans Analizi
• Bazı çalışmalarda aynı denekler ikiden fazla sayıda
  ölçüme tabi tutulurlar. Özellikle farklı zamanlarda
  yapılan ölçümlerin kullanıldığı çalışmalar tekrarlı
  ölçümlerde varyans analiziyle incelenir.
• Bu şekildeki deneylere denekler içi düzen (within-
  subject design) adı verilir.
• Tekrarlı ölçümlerde varyans analizinde de parametrik
  testlerde olduğu gibi
   – Normal dağılıma uygunluk
   – Varyansların homojenliği
   – n sayısının yeterliliği kavramları yer almaktadır.
Tekrarlı Ölçümlerde Varyans Analizi
      • Örnek: Spor yapan kişilerde tansiyonların zaman içindeki
        değişimi incelenmek istenebilir.
      • Bunun için aynı deneklerin spordan önce, spor yapmaya
        başladıktan 3 ay sonra ve 6 ay sonra yapılan tansiyon ölçümleri
        karşılaştırılabilir.
Sporcu    Önce     3 ay sonra   6 ay     175
no                              sonra
                                         170
                                         165
1         175      160          145
                                         160

2         185      172          150      155
                                         150
...       ...      ...          ...      145
                                         140
X         172,64   164,95       153,55
                                               önce    3 ay sonra   6 ay sonra
ÖRNEK:

Lise öğrencilerinin düzey belirleme sınavı öncesi
durumluk kaygı düzeylerini belirlemek ve varolan
kaygı düzeyini azaltmak amacıyla düzenlenen bir
çalışmada, rasgele seçilen 25 lise 1. sınıf öğrencisi
araştırma örneklemini oluşturuyor.
Öğrencilerin ilk düzey belirleme sınavı öncesindeki
durumluk kaygı düzeyleri belirlendikten sonra,
gevşeme çalışması eğitimi veriliyor ve 2. ve 3. seviye
belirleme sınavı öncesindeki kaygı düzeyleri tekrar
ölçülüyor. Kaygı düzeyleri 20 maddelik durumluk
kaygı ölçeği ile elde ediliyor.
Durumluk Kaygı Puanları
          İlk sınav   İkinci     Üçüncü
Öğrenci               sınav       Sınav
    1      Öncesi
            40        Öncesi
                        37       Öncesi
                                    34
    2       52          50          43
    3       35          35          34
    4       38          35          32
    5       45          40          41
    6       41          42          37
    7       41          40          41
    8       40          37          32
    9       44          46          40

    .        .           .              .
   25        42         41          34
Tanımlayıcı İstatistikler

 Zaman       Ortalama S. Sapma       n
 I. Sınav
              42,24     4,92         25
  Öncesi
 II. Sınav
              41,80     4,91         25
  Öncesi
III. Sınav
              38,36     4,57         25
  Öncesi
Durumluk Kaygı Ortalama +- 1 Ss
                                  50

                                  48

                                  46

                                  44

                                  42

                                  40

                                  38

                                  36

                                  34

                                  32

                                  30
                                  28
                                   N=         25                25                  25

                                        I. sınav öncesi                      III. sınav öncesi
                                                          II. sınav öncesi


                                        DURUMLUK KAYGI ÖLÇÜMÜ ZAMANI
HİPOTEZLERİN BELİRLENMESİ

Ho: Eğitim verilmeden önceki ve eğitim verildikten
sonraki dönemlerde elde edilen durumluk kaygı
puanları arasında fark yoktur.

H1: Eğitim verilmeden önceki ve eğitim verildikten
sonraki dönemlerde elde edilen durumluk kaygı
puanları arasında fark vardır.
Karşılaştırma için F dağılımından yararlanılır.
Hesapla bulunan F istatistiğinin elde edilmesinde
kullanılan bilgiler bilgiler sıklıkla varyans analizi
tablosunda özetlenir.
Durumluk kaygı örneği için Varyans Analizi Tablosu
 Değişim
              KT      Sd      KO         F        P
 Kaynağı
Dönemle
         436.4         2     218.2     41.6     0.000
 rArası
Denekler
         182.3        24      7.6
 Arası
   Hata      251.7    48      5.2

Durumluk kaygı puanlarının dönemlere göre değişimi
önemlidir (p<0.05). Hangi dönemler arasında fark olduğu
ikişerli karşılaştırmalarla incelenmelidir.
KT: kareler toplamı, Sd: serbestlik derecesi, Ko:kareler
ortalaması
Sayımla Belirtilen Verilerde
                    Çapraz Tablo ve Ki kare analizi
      İki ya da daha çok değişkenin birlikte değişiminin
  incelenmesi çoğu zaman çapraz tablo yapımını gerektirir.

İki ve daha fazla değişkenin kategorilerinin kesiştiği
yerde frekansların olduğu tablolara çapraz tablo
denir.

Eğer incelenecek iki değişken varsa, bu iki değişkenin birlikte değişimini
göstermek amacıyla oluşturulan tabloya ikili çapraz tablo denir. Üç
değişkenin birlikte değişimini incelemek amacıyla oluşturulan tabloya
üçlü çapraz tablo,.... denir.
A Sağlık Bölgesindeki Nüfusun
               Yaşa ve Cinsiyete Göre Dağılımı
Yaş Grupları        Erkek     %       Kadın      %       Toplam
       0               19     47.5      21       52.5       40
      1-4              85     53.1      75       46.9      160

      5-9              95     47.5     110       52.5      200
    10-14             185     49.3     190       50.7      375
    15-19             210     46.7     240       53.3      450
       .                .         .       .          .        .
       .                .         .       .          .        .
     85+               50      7.6      75        6.3      125
    Toplam          1655      100     1595    100.0       3250
Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

                   Aile Planlaması Kullanma

                     Kullanan    Kullanmayan
Öğrenim             Sayı   (%) Sayı    (%)   Toplam
Okur Yazar Değil     15    25.0 45     75.0     60
İlkokul              25    41.7 35     58.3     60
Ortaokul             32    53.3 28     46.7     60
Lise                 40    66.7 20     33.3     60
Üniversite           48    80.0 12     20.0     60
Toplam              160 53.3 140       46.7    300
Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu

            100

             80
Yüzde (%)




             60

                                                                          Aile P.
             40                                                            Kullanan
                                                                           Kullanmayan

             20

             0
                  Okur Yazar   İlkolul   Ortaokul     Lise   Üniversite
                    Değil
                                     Öğrenim Durumu
Kİ-KARE TESTLERİ
1. Ki-kare testleri veri tipinin nitelik olduğu (kadın-erkek,
iyileşti-iyileşmedi, hasta-sağlam, sosyo-ekonomik düzeyi
iyi-orta-kötü,... gibi) verilerde kullanılır.
2. Ayrıca sürekli ya da kesikli sayısal veri tipinde olduğu
halde sonradan nitelik veri konumuna dönüştürülen
veriler arasında fark olup olmadığının incelenmesinde
de kullanılır.

3. Veriler 2x2, 2x3, 3x3, 3x4, ... Boyutlu çapraz tablo
şeklinde olmalıdır.
2x2 ki-kare testi
  İki yüzde arasındaki farkın anlamlılık
testinin uygulandığı durumlarda istenirse
 2x2 ki-kare testinden de yararlanılabilir.
2x2 ki-kare testinin avantajı, gruplardaki
gözlem sayılarının az olduğu durumlar için
  geliştirilmiş değişik ki-kare testlerinin
olmasıdır. Gruplardaki gözlem sayısının az
  olması durumunda ki-kare testlerinden
       yararlanmak daha uygundur.
ÖRNEKLER: 2x2 (4 gözlü) ki-kare tablosu

                             Yakınma
    Sigara          Var         Yok       Toplam

    İçen

    İçmeyen

    Toplam
ÖRNEKLER: 2x3 ki-kare tablosu

Eğitim           Sağlık Bilgisi
Düzeyi     İyi    Orta   Kötü     Toplam

Düşük

Yüksek

Toplam
Varis Bulgusu
  Çalışma
 Pozisyonu                Olmayan      Toplam
               Olan
 Oturarak       26          175           201
  Ayakta        44           181          225
  Toplam        70           356          426

                                         χ 2 = 3.4
                                         p>0.05
Elde edilen sonuca göre oturarak ve ayakta çalışanlar
Arasında varis bulgusu açısından anlamlı farklılık yoktur
cinsiyet * pre op memnuniyet Crosstabulation

     Count
                  pre op memnuniyet
               zayif  orta  iyi  çok iyi Total
     cinsiyet
           erkek   3     18  25       3    49
           kadin   3      9    6      6    24
     Total         6     27   31      9    73


                       Ch i-S qua r e T e s ts

                            Asymp. Sig.
                  Value  df   (2-sided)
                  8,025a
      Pearson Chi-Square    3    ,046
      Likelihood Ratio
                  7,853     3    ,049
      Linear-by-Linear
                   ,070     1     ,792
      Association
      N of Valid Cases
                     73
          a. cells (37,5%) have expected count less
           3
           minimum expected count is 1,97.

Akdeniz Üniversitesi            Osman Saka       194
Tıp Fakültesi
Korelasyon Analizi ve Tahmin
          Kavramı
Pearson Korelasyon Katsayısı (r)

Ölçümle belirtilen iki değişken arasındaki
 doğrusal ilişkinin kuvveti (derecesi) ve
        yönü hakkında bilgi verir.
           -1<= r <=+1
          arasında değişir.
İlişki Azalır

-1       0           +1
     İlişki artar




                          197
İlişkilerin Değerlendirilmesi
            r(±)           İlişkinin derecesi
        0.90 to 1.00          Çok kuvvetli
        0.70 to 0.89          Kuvvetli
        0.50 to 0.69          Orta
        0.30 to 0.49          Düşük
        0.00 to 0.29          Zayıf

Olarak değerlendirilmekle birlikte ilişkinin derecesi ne
olursa olsun anlamlı (p<0.05)olmalıdır. Aksi halde r ne
olursa olsun (p>0.05) olması durumunda değişkenler
arasında ilişkinin varlığından söz edilemez
•     Boy(cm)   yaş(Ay)   •      Egzersiz_Süresi
     •   60        1                 Performans
     •   65        3          •    60         100
     •   70        5           •   65          98
     •   75        7           •   70          96
     •   80        9           •   75          94
    •   85        11           •   80          92
    •   90        13           •   85          90
    •   97        15           •   90          88
    •   100       17           •   97          86
    •   105       20           •   100         84
    •   110       21           •   105         82
    •   115       23           •   110         80
    •   120       25           •   115         78
    •   125       27           •   120         76
    •   130       30           •   125         74
         •                     •   130         72
                                     •
Tam İlişki
                r=1
                                                          100

      130
                                                          95
      120

                                                          90
      110




                                             performans
      100                                                 85
Boy




      90                                                  80


      80
                                                          75

      70
                                                          70
      60                                                        60   70   80    90       100     110   120   130
            0     5   10   15    20   r=+1
                                       25       30                             Egzersiz_Süresi           r=-1
                           Yaþ
Tam İlişki
                r=1
                                                          100

      130
                                                          95
      120

                                                          90
      110




                                             performans
      100                                                 85
Boy




      90                                                  80


      80
                                                          75

      70
                                                          70

      60                                                        60   70   80    90       100     110   120   130

            0     5   10   15    20     25      30                             Egzersiz_Süresi
                                                                                                         r=-1
                           Yaþ        r=+1
•     Boy_cm_   Yaş_ay_   •      Egzersiz_Süre
     •   60        1                 Performans
     •   62        3          •    60         100
     •   62        5          •    65         100
     •   80        7           •   70          99
     •   80        9           •   75          99
    •   81        11           •   80          90
    •   90        13           •   85          95
    •   97        15           •   90          90
    •   100       17           •   95          88
    •   100       20           •   100         89
    •   100       21           •   105         87
    •   104       23           •   110         83
    •   108       25           •   115         79
    •   114       27           •   120         78
    •   130       30           •   125         70
                               •   130         72
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik
Istatistik

Más contenido relacionado

La actualidad más candente

Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)
Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)
Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Proteinüri hematüri (fazlası için www.tipfakultesi.org )
Proteinüri hematüri (fazlası için www.tipfakultesi.org )Proteinüri hematüri (fazlası için www.tipfakultesi.org )
Proteinüri hematüri (fazlası için www.tipfakultesi.org )www.tipfakultesi. org
 
Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)
Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)
Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)
Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)
Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )
Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )
Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )www.tipfakultesi. org
 
Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)
Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)
Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
İstatistik Temel Kavramlar
İstatistik Temel Kavramlarİstatistik Temel Kavramlar
İstatistik Temel KavramlarZeynep Öztürk
 
Egzersi̇z reçetesi̇
Egzersi̇z reçetesi̇Egzersi̇z reçetesi̇
Egzersi̇z reçetesi̇fethiisnac
 
Stabil anjina pektoris(fazlası için www.tipfakultesi.org)
Stabil anjina pektoris(fazlası için www.tipfakultesi.org)Stabil anjina pektoris(fazlası için www.tipfakultesi.org)
Stabil anjina pektoris(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
KR'da Egzersiz Testleri
KR'da Egzersiz TestleriKR'da Egzersiz Testleri
KR'da Egzersiz TestleriUfuk Yurdalan
 
Hipertansiyon (fazlası için www.tipfakultesi.org)
Hipertansiyon (fazlası için www.tipfakultesi.org)Hipertansiyon (fazlası için www.tipfakultesi.org)
Hipertansiyon (fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Bto418 1_Yansıtıcı Düşünme, Yansıtıcı Günlükler
Bto418 1_Yansıtıcı Düşünme, Yansıtıcı GünlüklerBto418 1_Yansıtıcı Düşünme, Yansıtıcı Günlükler
Bto418 1_Yansıtıcı Düşünme, Yansıtıcı Günlüklernihalmenzi
 

La actualidad más candente (20)

Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)
Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)
Mitral kapak hastalıkları(fazlası için www.tipfakultesi.org)
 
Romatoid Artrit
Romatoid ArtritRomatoid Artrit
Romatoid Artrit
 
Proteinüri hematüri (fazlası için www.tipfakultesi.org )
Proteinüri hematüri (fazlası için www.tipfakultesi.org )Proteinüri hematüri (fazlası için www.tipfakultesi.org )
Proteinüri hematüri (fazlası için www.tipfakultesi.org )
 
z testi
z testiz testi
z testi
 
Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)
Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)
Hipertansiyon patogenezi(fazlası için www.tipfakultesi.org)
 
Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)
Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)
Kalp kapak hastaliklari (fazlası için www.tipfakultesi.org)
 
Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )
Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )
Kronik Böbrek Yetmezliği (fazlası için www.tipfakultesi.org )
 
Osteoporoz
OsteoporozOsteoporoz
Osteoporoz
 
Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)
Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)
Akut kronik konstipasyon(fazlası için www.tipfakultesi.org)
 
Renal osteodistrofi son
Renal osteodistrofi sonRenal osteodistrofi son
Renal osteodistrofi son
 
Hipoglisemi
HipoglisemiHipoglisemi
Hipoglisemi
 
İstatistik Temel Kavramlar
İstatistik Temel Kavramlarİstatistik Temel Kavramlar
İstatistik Temel Kavramlar
 
Egzersi̇z reçetesi̇
Egzersi̇z reçetesi̇Egzersi̇z reçetesi̇
Egzersi̇z reçetesi̇
 
Nefrotik Sendrom
Nefrotik SendromNefrotik Sendrom
Nefrotik Sendrom
 
Stabil anjina pektoris(fazlası için www.tipfakultesi.org)
Stabil anjina pektoris(fazlası için www.tipfakultesi.org)Stabil anjina pektoris(fazlası için www.tipfakultesi.org)
Stabil anjina pektoris(fazlası için www.tipfakultesi.org)
 
KR'da Egzersiz Testleri
KR'da Egzersiz TestleriKR'da Egzersiz Testleri
KR'da Egzersiz Testleri
 
Hipertansiyon (fazlası için www.tipfakultesi.org)
Hipertansiyon (fazlası için www.tipfakultesi.org)Hipertansiyon (fazlası için www.tipfakultesi.org)
Hipertansiyon (fazlası için www.tipfakultesi.org)
 
Fizik Muayene
Fizik MuayeneFizik Muayene
Fizik Muayene
 
Dağılım ölçütleri
Dağılım ölçütleriDağılım ölçütleri
Dağılım ölçütleri
 
Bto418 1_Yansıtıcı Düşünme, Yansıtıcı Günlükler
Bto418 1_Yansıtıcı Düşünme, Yansıtıcı GünlüklerBto418 1_Yansıtıcı Düşünme, Yansıtıcı Günlükler
Bto418 1_Yansıtıcı Düşünme, Yansıtıcı Günlükler
 

Destacado

Gruplanmış verilerde eğilim ve dağılım ölçüleri
Gruplanmış verilerde eğilim ve dağılım ölçüleriGruplanmış verilerde eğilim ve dağılım ölçüleri
Gruplanmış verilerde eğilim ve dağılım ölçüleriGökay Göktaş
 
Histogram, Pasta, Çizgi ve Box-Plot Grafiği
Histogram, Pasta, Çizgi ve Box-Plot GrafiğiHistogram, Pasta, Çizgi ve Box-Plot Grafiği
Histogram, Pasta, Çizgi ve Box-Plot GrafiğiEcenaz Alemdağ
 
Olasılık Dağılımları
Olasılık DağılımlarıOlasılık Dağılımları
Olasılık DağılımlarıGülşah Başol
 
Verilerin Düzenlenmesi Ve Dağılımların Grafiklerle Betimlenmesi
Verilerin Düzenlenmesi Ve Dağılımların Grafiklerle BetimlenmesiVerilerin Düzenlenmesi Ve Dağılımların Grafiklerle Betimlenmesi
Verilerin Düzenlenmesi Ve Dağılımların Grafiklerle BetimlenmesiGülşah Başol
 
Imo38013802 istatistik -2
Imo38013802 istatistik -2Imo38013802 istatistik -2
Imo38013802 istatistik -2serkanarikan
 
Jan 15 2013 Hospital Microbiome Meeting
Jan 15 2013 Hospital Microbiome MeetingJan 15 2013 Hospital Microbiome Meeting
Jan 15 2013 Hospital Microbiome Meetingdansmith01
 
Istatistik ve olasilik_ders_notu
Istatistik ve olasilik_ders_notuIstatistik ve olasilik_ders_notu
Istatistik ve olasilik_ders_notuYasin Bektaş
 
dağılım ölçüleri(fazlası için www.tipfakultesi.org)
dağılım ölçüleri(fazlası için www.tipfakultesi.org)dağılım ölçüleri(fazlası için www.tipfakultesi.org)
dağılım ölçüleri(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Tanımlayıcı araştırma
Tanımlayıcı araştırmaTanımlayıcı araştırma
Tanımlayıcı araştırmaparantez
 
öğRenme ve bellek
öğRenme ve belleköğRenme ve bellek
öğRenme ve bellekburaksolak
 
olasilik(fazlası için www.tipfakultesi.org)
 olasilik(fazlası için www.tipfakultesi.org) olasilik(fazlası için www.tipfakultesi.org)
olasilik(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)
bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)
bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)
istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)
istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
bilgi toplama yollari (fazlası için www.tipfakultesi.org)
bilgi toplama yollari (fazlası için www.tipfakultesi.org)bilgi toplama yollari (fazlası için www.tipfakultesi.org)
bilgi toplama yollari (fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)
LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)
LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)matematikcanavari
 

Destacado (20)

Gruplanmış verilerde eğilim ve dağılım ölçüleri
Gruplanmış verilerde eğilim ve dağılım ölçüleriGruplanmış verilerde eğilim ve dağılım ölçüleri
Gruplanmış verilerde eğilim ve dağılım ölçüleri
 
Histogram, Pasta, Çizgi ve Box-Plot Grafiği
Histogram, Pasta, Çizgi ve Box-Plot GrafiğiHistogram, Pasta, Çizgi ve Box-Plot Grafiği
Histogram, Pasta, Çizgi ve Box-Plot Grafiği
 
Z ve T Puanları
Z ve T PuanlarıZ ve T Puanları
Z ve T Puanları
 
Olasılık Dağılımları
Olasılık DağılımlarıOlasılık Dağılımları
Olasılık Dağılımları
 
Z Skor(Z-Score)
Z Skor(Z-Score)Z Skor(Z-Score)
Z Skor(Z-Score)
 
Verilerin Düzenlenmesi Ve Dağılımların Grafiklerle Betimlenmesi
Verilerin Düzenlenmesi Ve Dağılımların Grafiklerle BetimlenmesiVerilerin Düzenlenmesi Ve Dağılımların Grafiklerle Betimlenmesi
Verilerin Düzenlenmesi Ve Dağılımların Grafiklerle Betimlenmesi
 
Imo38013802 istatistik -2
Imo38013802 istatistik -2Imo38013802 istatistik -2
Imo38013802 istatistik -2
 
Jan 15 2013 Hospital Microbiome Meeting
Jan 15 2013 Hospital Microbiome MeetingJan 15 2013 Hospital Microbiome Meeting
Jan 15 2013 Hospital Microbiome Meeting
 
Istatistik ve olasilik_ders_notu
Istatistik ve olasilik_ders_notuIstatistik ve olasilik_ders_notu
Istatistik ve olasilik_ders_notu
 
dağılım ölçüleri(fazlası için www.tipfakultesi.org)
dağılım ölçüleri(fazlası için www.tipfakultesi.org)dağılım ölçüleri(fazlası için www.tipfakultesi.org)
dağılım ölçüleri(fazlası için www.tipfakultesi.org)
 
Tanımlayıcı araştırma
Tanımlayıcı araştırmaTanımlayıcı araştırma
Tanımlayıcı araştırma
 
t testleri
t testlerit testleri
t testleri
 
öğRenme ve bellek
öğRenme ve belleköğRenme ve bellek
öğRenme ve bellek
 
olasilik(fazlası için www.tipfakultesi.org)
 olasilik(fazlası için www.tipfakultesi.org) olasilik(fazlası için www.tipfakultesi.org)
olasilik(fazlası için www.tipfakultesi.org)
 
bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)
bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)
bilgilerin derlenmesi (fazlası için www.tipfakultesi.org)
 
Biyoistatistik
BiyoistatistikBiyoistatistik
Biyoistatistik
 
istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)
istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)
istatistik ve biyoistatistik nedir (fazlası için www.tipfakultesi.org)
 
bilgi toplama yollari (fazlası için www.tipfakultesi.org)
bilgi toplama yollari (fazlası için www.tipfakultesi.org)bilgi toplama yollari (fazlası için www.tipfakultesi.org)
bilgi toplama yollari (fazlası için www.tipfakultesi.org)
 
istatistik sınav
istatistik sınavistatistik sınav
istatistik sınav
 
LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)
LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)
LİSE - PERMÜTASYON KOMBİNASYON 2 (SLAYT)
 

Similar a Istatistik

İleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma Yöntemleriİleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma YöntemleriGizem Turgut
 
ortalamalar(fazlası için www.tipfakultesi.org)
ortalamalar(fazlası için www.tipfakultesi.org)ortalamalar(fazlası için www.tipfakultesi.org)
ortalamalar(fazlası için www.tipfakultesi.org)www.tipfakultesi. org
 
Açık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel Kavramlar
Açık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel KavramlarAçık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel Kavramlar
Açık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel Kavramlarekaypak
 
1 tanimlayici ista
1 tanimlayici ista1 tanimlayici ista
1 tanimlayici istaMertOzturk6
 

Similar a Istatistik (7)

Veri̇anali̇zi̇
Veri̇anali̇zi̇Veri̇anali̇zi̇
Veri̇anali̇zi̇
 
Veri̇anali̇zi̇
Veri̇anali̇zi̇Veri̇anali̇zi̇
Veri̇anali̇zi̇
 
Veri̇anali̇zi̇
Veri̇anali̇zi̇Veri̇anali̇zi̇
Veri̇anali̇zi̇
 
İleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma Yöntemleriİleri İstatistik ve Bilimsel Araştırma Yöntemleri
İleri İstatistik ve Bilimsel Araştırma Yöntemleri
 
ortalamalar(fazlası için www.tipfakultesi.org)
ortalamalar(fazlası için www.tipfakultesi.org)ortalamalar(fazlası için www.tipfakultesi.org)
ortalamalar(fazlası için www.tipfakultesi.org)
 
Açık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel Kavramlar
Açık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel KavramlarAçık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel Kavramlar
Açık ve Uzaktan Öğrenmede Başarının Ölçme-Değerledirmesi Temel Kavramlar
 
1 tanimlayici ista
1 tanimlayici ista1 tanimlayici ista
1 tanimlayici ista
 

Istatistik

  • 1. İstatistik Araştırmalar, Bilimsel Çalışmalar ve Günlük Olaylardan sistemli bir biçimde veri toplama ve bilgilerin incelenmesi, özetlenmesi, ölçülmesi, sınıflandırılması, çözümlenmesi, neden sonuç ilişkilerinin belirlenmesi, karşılaştırılması, aralarındaki ilişkilerin ortaya konması, elde edilen sonuçların kitlelere anlayabilecekleri ve etkili bir şekilde sunulmasının tüm evrelerini kapsayan bilim dalıdır. • Teorik İstatistik • Uygulamalı İstatistik
  • 2. Herhangi bir konu hakkında ►Bilgi toplamak, ►Toplanan bilgileri düzenlemek, ►Çözümlemek ve ►Yorumlamak ►için gerekli yöntemler topluluğudur.
  • 3. Tanımlayıcı İstatistik Çıkarımsal İstatistik (Descriptive Statistics) (Inferential Statistics) olarak iki ana gruba ayrılır.
  • 5. Örneklemden elde edilen bulgular yardımıyla Evren hakkında kestirimde bulunma, Hipotezleri test etme Karara varma İşlemlerini içerir
  • 6. Evren(population): Belirli özellikleri gösteren bireylerin ya da nesnelerin oluşturduğu topluluktur. Türkiye’deki spor yüksekokullarındaki öğrencilerin evreni, tüm spor yüksekokullarındaki tüm bölümlerdeki öğrencileri kapsar. Örnek(sample): Evrenin tüm özelliklerini taşıyan, onu tanımlama yeteneğine sahip bir parçasıdır. Parametre(parameter): Evrende incelenen değişkenleri tanımlamak için kullanılan ölçütlerdir ortalama(µ), varyans(σ2), oran(p) v.b. İstatistik: örneklemi tanımlamak için kullanılan ölçütlerdir. Örneklem ortalaması (X) standart sapma (s) v.b. Denek(subject): Bilimsel çalışmanın yapıldığı birim (insan, hayvan, nesne v.s.)
  • 7. Evren ve örneklemde gösterim Tanımlayıcı ölçüt Örneklemde Evrende (parametre) (istatistik) Ortalama X µ Oran p P Standart sapma S σ Varyans S2 σ2 Gözlem sayısı N N Değişken(variable): İncelenen faktör ya da karakter, farklı bireylerde farklı değerler alabiliyorsa buna değişken denir
  • 8. Veri (data): Herhangi bir konuda bilinmeyeni ortaya çıkarmak amacıyla yapılan araştırma, deney, gözlem, uğraşı veya olay sonucu elde edilen nicel ya da nitel ham materyaldır. VERİDE BULUNMASI GEREKEN ÖZELLİKLER • DOĞRULUK • GÜNCELLİK • GÜVENİLİRLİK • EKSİKSİZLİK • KULLANILABİLİRLİK • AMACA UYGUNLUK Bilgi (information): Verilerin ve önceki bilgilerin işlenmesiyle elde edilen anlamlı mesaj veren kavramlardır.
  • 9. VERİ BİLGİ VERİLERİN İŞLENMESİ VERİ BİLGİ
  • 10. Niceliksel (Quantitative) Niteliksel (Qualitative) Nicelik belirten (ölçü- Bireylerin sahip olduğu lerek yada sayılarak belli özelliklerin sınıflara elde edilen) verilerdir. ayrılarak belirtildiği verilerdir. Örneğin, yaş, ağırlık, boy gibi. Örneğin, cinsiyet, medeni durum, başarılı-başarısız gibi.
  • 11. Sıralanabilir Sınıflanabilir (Ordered) (Nominal) Nitelik verilerde belli bir sıralama Nitelik verilerde belli bir söz konusu ise (kötü-orta-iyi- sıralama yoksa bu tür verilere mükemmel gibi ya da Okur yazar sınıflanabilir nitelik veriler olmayan, okur yazar, ortaokul, lise, üniversite mezunu) bu tür verilere denir Örneğin cinsiyet, sıralanabilir nitelik veriler denir. medeni durum gibi. İki Sınıflı Çok Sınıflı
  • 12. Kesikli Sayısal Sürekli Sayısal Continuous numeric variable Discrete numeric variable Belirli bir aralıktaki tam Ölçümle belirtilirler ve bir sayıları alan veri türüdür. aralıktaki bütün değerleri Örnek: Sınıftaki öğrenci alırlar. Örnek: Boy uzunluğu, sayısı, çocuk sayısı gibi yaş, günlük kalsiyum tüketim miktarı (mg) gibi. Aralık Ölçekli Oran Ölçekli Interval Scale Ratio Scale
  • 13. ÖLÇME-ÖLÇEK KAVRAMLARI • Gözlenen olayları sınıflandırma, değer verme ile sonuçlanan işlem • Gözlenen olaylara sayısal bir değer verme, ya da olayları belli kurallara göre sayısallaştırma işlemidir
  • 14. ÖLÇEK TÜRLERİ • Sınıflandırma ölçeği – Erkek=1, Kadın=2 • Sıralama ölçeği – Ölçümler sadece sıra dizisini gösterir, ama aralarındaki uzaklık kesin değildir – Doktora, yüksek lisans, lisans, önlisans • Aralık ölçeği – Eşit bölme aralığına sahiptir – Başlangıç noktasının sıfır olma zorunluluğu yoktur, varsa da yokluğu göstermez – Zeka testinden sıfır almak zekasız olmayı göstermez • Oran ölçeği – Puanlar değişkenin gerçek miktarını yansıtır, eşit ölçme birimi vardır – Sıfır değeri sıfır olma halini gösterir, (uzunluk, ağırlık ölçümleri gibi)
  • 15. Dağılım(distribution): Verilerin oluşturduğu yığınların biçimine dağılım denir. Kesikli Dağılım: Dağılım aralığı içinde her değeri alamayan verilerin dağılımı kesikli dağılımdır. (Hiçbir zaman 3.7 bebek olamaz). Hasta-sağlam gibi. Sürekli Dağılım: Sürekli verilerin (ölçüm ve tartımla belirtilen) oluşturduğu dağılımlardır. Sürekli veriler sınıflandırılarak kesikli hale getirilebilirler. Örneğin kişileri boylarına göre uzun boylu, orta boylu ve kısa boylu olarak sınıflandırabiliriz. Sınılandırma yaparken objektif olmaya çalışmak gerekmektedir.
  • 17. Sınıflandırma • Bir kitlenin veya grubun özelliklerine göre yapısını ortaya çıkarabilmek amacıyla, elde edilen bilgileri bir özellik ya da özellikler bakımından çeşitli seçeneklere ayırarak aynı seçeneğe ait birimleri kümeler halinde bir araya getirmedir • Veri sayısı sınırlıyken yapılır
  • 18. Sınıflandırmaya örnek Yaş Frekans (sıklık) 18 21 19 25 20 30 21 18 22 6 TOPLAM 100
  • 19. Gruplama • Eğer sınıflandırılacak veri sayısı çok fazla ise bunları sınıflandırma yoluyla kümelere ayırmak mümkün olsa bile anlamlı ve işlemlere elverişli olmayabilir • Böyle durumlarda bir özelliğin birbirine yakın olana seçenekleri gruplar halinde toplanır ve yeni gruplamalara başvurulur
  • 20.
  • 21.
  • 22. Frekans Dağılımları (Frequency Distributions) • Verilerin her bir sınıf aralığına düşen gözlem sayısını (frekans) gösterecek şekilde gruplandırılması işlemi
  • 23. Frekans Dağılımları ile İlgili Temel Kavramlar • Dağılım genişliği = Verilerin minimum ile maksimum değerleri arasındaki fark • Sınıf sayısı= O dağılımın incelemek istenen sınıf sayısı • Sınıf sınırları= Sınıfa ait minimum ve maksimum sınır değerleri • Sınıf aralığı= Sınıfın alt ve üst sınırları arasındaki fark • Sınıf orta noktası=Sınıfın alt ve üst sınırlarının ortalaması
  • 24.
  • 25.
  • 26. Sınıf aralığının belirlenmesi • Sınıf aralığı = Dağılım Genişliği Sınıf Sayısı Maksimum değer-minimum değer sınıf sayısı 33.625 – 12.546 = 21.079 = 3011 7
  • 27. Frekans Dağılım Tablosunun Hazırlanması Sınıflar Alt sınırlar Üst Sınırlar (12.546 + 3.011)= 15.557 15.557 – 1 = 15.556 1 12.546 15.556 (15.557 + 3.011) = 18.568 18.568 – 1 = 18.567 2 15.557 18.567 (18.568 + 3.011) = 21.579 21.579– 1 =21.578 3 18.568 21.578 (21.579 + 3.011) = 24.590 24.590 – 1 = 24.589 4 21.579 24.589
  • 28. Frekans Dağılım Tablosunun Hazırlanması Sınıflar Alt sınırlar Üst Sınırlar (24.590 + 3.011) = 27.601 27.601 – 1 = 27.600 5 24.590 27.600 (27.601 + 3.011) = 30.612 30.612 – 1 = 30.611 6 27.601 30.611 7 30.612 33.625
  • 31. Frekans Dağılımlarının Oluşturulmasında Dikkat Edilecek Noktalar • Mümkün olduğu kadar eşit sınıf aralıkları seçilmelidir • Eşit olmayan sınıf aralıkları frekansların grafiksel gösterimlerinde yanlış algılamalara yol açabilir
  • 32. SUNU YÖNTEMLERİ • METİN • TABLO • GRAFİK
  • 33. TABLO • TEK BOYUTLU • İKİ BOYUTLU • ÇOK BOYUTLU
  • 34. TABLO YAPIMINDA DİKKAT EDİLECEK NOKTALAR • BAŞLIK – Başlık kısa, özlü olmalıdır. – Genelde tablonun üstüne yazılır – Başlığın bölüm ve sıra no’ su yazılır • Kolon ve satır başlıkları,ölçekler,birimler yazılır • Değerlere ek olarak yüzdeler de verilir • Üçten çok değişken aynı tabloda verilmez, verilirse çizgilerle ayrılır
  • 35. TEK BOYUTLU TABLO Tablo 1.1 Sporcuların Branşlarına Göre Dağılımı n % voleybol 15 30 judo 10 20 tenis 15 30 basketbol 5 10 yüzme 5 10 TOPLAM 50 100
  • 36. İKİ BOYUTLU TABLO Tablo 1.2 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımları E K TOPLAM n % n % voleybol 10 20 5 10 15 judo 8 16 2 4 10 tenis 5 10 10 20 15 basketbol 2 4 3 6 5 yüzme 1 2 4 8 5 TOPLAM 26 52 24 48 50
  • 37. ÇOK BOYUTLU TABLO Tablo 1.3 Sporcuların Branşlarına Cinsiyetlerine ve Yaşlarına Göre Dağılımları Erkek Kadın Toplam Yaş Yaş <20 20-22 22> <20 20-22 22> 2 3 5 1 1 3 15 voleybol 1 3 4 0 1 1 10 judo 2 1 2 1 1 8 15 tenis 0 0 2 0 1 2 5 basketbol 0 0 1 0 2 2 5 yüzme TOPLAM 5 7 14 2 6 16 50
  • 38. GRAFİK ÇEŞİTLERİ • SÜTUN GRAFİK • ÇUBUK GRAFİK • ÇİZGİ GRAFİK • PASTA-DAİRE DİLİMLERİ GRAFİĞİ • ALAN GRAFİĞİ • HİSTOGRAM, DAĞILIM POLİGONU • KUTU VE ÇİZİGİ GRAFİĞİ • DAL VE YAPRAK GRAFİĞİ • ORTALAMA STANDART SAPMA GRAFİĞİ • SAÇILIM (NOKTA GRAFİĞİ)
  • 39. GRAFİK YAPIMINDA DİKKAT EDİLECEK NOKTALAR • BAŞLIK – Her grafiğin bir başlığı olmalıdır – Grafiğin altına veya üstüne yazılabilir – Başlığın bölüm ve sıra no’ su yazılır.(Grafik 3.2) • Eksenlerin neyi ifade ettiği ve değişkenlerin birimleri belirtilir. • Kullanılan alan ve çizgi türleri çeşitlilik gösteriyorsa grafiğin iç sağ üstünde ya da dış sol altında açıklanmalıdır • Başlıktaki ölçeklendirme ve kısaltmalar belirtilmelidir.
  • 40. SÜTUN GRAFİK Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı 12 10 10 10 8 Sporcu Sayısı 8 Erkek 6 5 5 4 Kadin 4 3 2 2 2 1 0 Basketbol Tenis Yüzme Judo Okçuluk BRANŞLAR
  • 41. Sütun Grafik Çoğunlukla nitelik verilerde kullanılır. Her bir kategori birbirinden ayrı çubuklarla gösterilir. Çubukların eni birbirine eşittir ve bitişik değildir. Yatay eksende incelenen değişkene ilişkin kategoriler dikey eksene bu kategorilere ilişkin sayı ya da yüzde değerleri konulur. Vücut Ağırlığı Sayı % Zayıf 15 30 Normal 20 40 Hafif Şişman 10 20 Şişman 5 10 Toplam 50 10 0
  • 42. Öğrencilerinin Ağırlıklarına Göre Dağılımı 25 20 15 Sayı 10 5 0 Zayıf Normal Hafif Şişman Şişman Öğrencilerin Ağırlıkları
  • 43. ÇUBUK GRAFİK Grafik 1.1 Sporcuların Branşlarına Göre Dağılımı Hentbol 4 1 Tenis 3 2 Branşlar 10 Kadin Okçuluk 5 Erkek Judo 2 8 Voleybol 5 10 0 2 4 6 8 10 12 Sporcu Sayısı
  • 44. Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu 100 80 60 Aile P. Yüzde (%) Kullanmayan Kullanan 40 20 0 Okur Yazar İlkolul Ortaokul Lise Üniversite Değil Öğrenim Durumu
  • 45. ALAN GRAFİK Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımı 20 4 Sporcu Sayısı 15 10 3 Kadın 10 15 Erkek 5 5 2 12 8 5 0 2 Voleybol Tenis Basketbol Judo Okçuluk Branşlar
  • 46. 3B SÜTUN GRAFİK Grafik 1.1 Sporcuların Branşlarına ve Cinsiyetlerine Göre Dağılımı 10 8 Sporcu Sayısı 6 4 Erkek 2 Kadın 0 Kadın Voleybol Hentbol Erkek Judo Okçuluk Tenis Branşlar
  • 47. ÇİZGİ GRAFİK Grafik 1.1 Spor Yüksekokulu Öğrencilerinin Başarı Durumlarının Yıllara Göre Dağılımı 100 80 Not Ortalaması 60 40 20 0 1.yıl 2.yıl 3.yıl 4.yıl Erkek Kadın Yıllar
  • 48. 8 Ortalama (S.sapma) 7 6 5 İLAÇ A 4 B 3 C 1 Başlangıç 3 4 5 6 Z AM A N (ay)
  • 49. PASTA GRAFİK Tenis Grafik 1,1 Sporcuların Branşlarına GöreDağılımı Voleybol Basketbol 14% Yüzme 14% Judo 8% 37% 27%
  • 50. Pasta-Daire Dilimleri Grafiği Nitelik verilerde kullanılan bir grafik yöntemidir. Vücut Ağırlığı Sayı % Zayıf 15 30 Normal 20 40 Hafif 10 20 Şişman 5 10 Toplam 50 100 Zayıf için: derece Hafif Şişman için: derece Normal için: derece Şişman için: derece
  • 51. Öğrencilerinin Ağırlıklarına Göre Dağılımı Şişman 10% Zayıf 30% Hafif Şişman 20% Normal 40%
  • 52. X-Y DAĞILIMI Grafik 1.2 Çocuklarda Yaşa Göre Ağırlık 9 8 7 6 5 AGIRLIK(kg) 4 3 0 2 4 6 8 10 12 YAS(AY)
  • 53. Annenin Sigara İçme ve Gebelik Haftası Durumuna Göre Çocukların Doğum Ağırlığı Doğum Ağırlığı Gebelik Haftası Sigara 3600 Dağılımı 2940 3130 38 38 içiyor İçmiyor 2420 36 içiyor 2450 34 İçmiyor 3400 Doğum Ağırlığı 3200    3000 2800 Sigara 2600 İçiyor 2400 İçmiyor 32 36 40 44 34 38 42 Gebelik Haftası
  • 54. Histogram Sürekli değişkenler için kullanılan grafik türüdür. Çubuklar birbirine bitişik olarak çizilir. Sayı ya da yüzde kullanmak grafiğin şeklini değiştirmez. Yatay eksende sınıf değeri dikey eksende sayı ya da yüzde bulunur. (Yatay eksene alt sınır ve üst sınır değerleri de yazılabilir)
  • 55. HİSTOGRAM ANTREMAN SONRASI 10. DAKİKA NABIZ ÖLÇÜMLERİ 6 5 4 3 2 1 Std. Dev = 17,70 Mean = 92,4 0 N = 26,00 60,0 70,0 80,0 90,0 100,0 110,0 120,0 130,0 NABIZ 10.DK
  • 56. Simetrik Dağılım Öğrencilerin BoyUzunluklarına Göre Dağılımı 35 30 25 Frekans 20 15 10 5 0 147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182 Boy Uzunlukları (cm)
  • 57. Sağa Çarpık (Pozitif Çarpık) Dağılım Öğrencilerin BoyUzunluklarına Göre Dağılımı 60 50 40 Frekans 30 20 10 0 147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 Boy Uzunlukları (cm)
  • 58. Sola Çarpık (Negatif Çarpık) Dağılım Öğrencilerin Boy Uzunluklarına Göre Dağılımı 70 60 50 Frekans 40 30 20 10 0 147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182 Boy Uzunlukları (cm)
  • 59. Dağılım Poligonu Histogramdaki çubukların en üst orta noktalarının çizgilerle birleştirilmesiyle elde edilir. Öğrencilerin Boy Uzunlıklarına Göre Dağılımı 35 30 25 Frekans 20 15 10 5 0 147-150 151-154 155-158 159-162 163-166 167-170 171-174 175-178 179-182 Boy Uzunlukları
  • 60. 5. Kutu ve Çizgi Grafiği Yüzdelikler yardımıyla veriyi özetlemekte kullanılan basit ve çok kullanışlı bir grafik yöntemidir. Grafikte 25., 50., 75., Yüzdelikler en küçük değer ve en büyük değer bulunmaktadır. Daha çok dağılım çarpık olduğunda kullanılır. Dağılımdaki aşırı gözlemlerin varlığı konusunda da bilgi verir.
  • 61. Öğrencilerin Boy Uzunluğu (cm) Sola Çarpık (Negatif Çarpık) Dağılım 175 *21 Çok Aşırı Değer 170 165 o22 Aşırı Değer Aşırı değer Olmayan 160 En Büyük Değer 155 75.Yüzdelik Ortanca 150 25.Yüzdelik 145 Aşırı değer Olmayan En Küçük Değer 140
  • 62. Öğrencilerin Boy Uzunluğu (cm) Sağa Çarpık (Pozitif Çarpık) Dağılım 175 *21 Çok Aşırı Değer 170 165 o22 Aşırı Değer Aşırı değer Olmayan 160 En Büyük Değer 155 75.Yüzdelik 150 Ortanca 25.Yüzdelik 145 Aşırı değer Olmayan En Küçük Değer 140
  • 63. Öğrencilerin Boy Uzunluğu (cm) Simetrik Dağılım 175 170 165 Aşırı değer Olmayan 160 En Büyük Değer 155 75.Yüzdelik Ortanca 150 25.Yüzdelik 145 Aşırı değer Olmayan En Küçük Değer 140
  • 64. Sağa Çarpık Simetrik Sola Çarpık Ortalama Ortalama Ortalama Ortanca Ortanca Ortanca Tepe Değeri Tepe Değeri Tepe Değeri
  • 65. Annelerin Öğrenim Düzeylerine Göre Çocuk Bakım Bilgi Puanlarının Dağılımı Çocuk Bakım Bilgi Puanı 100 11 1 46 90 80 70 14 60 21 29 50 40 30 20 27 34 10 0 OYD İLKOKUL ORT AOKUL LİSE ÜNİVERST E Öğrenim Durumu
  • 66. Dal ve Yaprak Grafiği Dal ve yaprak grafik yöntemi veri kümesini özetlemek için çok basit ve kullanışlı bir grafik yöntemidir. Bu grafikte hem grafiğin şeklini hem de dağılımdaki gözlem değerlerini görmek olanaklıdır. Dal ve Yaprak grafiği her sınıfın karşısına doğrudan frekansı yazmak yerine bu aralıktaki değerlerin son haneleri yazılır.
  • 67. Dal ve Yaprak Grafiği Veriler: 40, 44, 46, 46, 49, 50, 52, 52, 52, 53, 54, 54, 54, 55, 56, 56, 57, 57, 58, 58, 58, 59, 59, 59, 59, 59, 60, 61, 62, 63, 64, 64, 64,65, 66, 66, 67, 72, 73 Dallar Yapraklar Sayı 40-44 04 2 45-49 669 3 50-54 02223444 8 55-59 5667788899 13 60-64 99923444 012 8 65-69 5567 4 70-74 23 2
  • 68. Dal ve Yaprak Grafiği Veriler: 17, 17, 18, 18, 21, 21, 22, 22, 24, 25, 25, 27, 30, 33, 33, 33, 33, 33, 36, 36, 36, 36, 38, 40, 41, 43, 44, 44, 45, 48, 48, 49, 51, 52, 52, 55, 55, 56, 58 Dallar Yapraklar • 7788 • 11 2 2 4 5 5 7 3 03333366668 4 013445889 5 1225568
  • 69. Ortalama ve Standart Sapma Grafiği Sürekli değişkenler için kullanılan grafik türüdür.  Dağılım simetrik olduğunda kullanılır.  Grafikte ortalama ± 1 x (standart sapma değeri) bulunur Bazen ortalama ± 2 x (standart sapma değeri) de kullanılabilir.
  • 70. Ortalama ve Standart Sapma Grafiği Ortalama=158.3 Öğrencilerin Boy Uzunluğu (cm) (Ortalama ± S. Sapma Standart Sapma=9.9 170 + 1 Standart Sapma 160  Ortalama - 1 Standart Sapma 150 140
  • 71. Saçılım (Nokta) Grafiği Sınıftan Rasgele Seçilen 10 Öğrencinin Boy Uzunluğu Dağılımı 185 Öğrencilerin Boy Uzunluğu (cm) 180 175 170 165 160 155 150
  • 72. Ağırlık Glukoz (x) (y) Görünüşte Sağlıklı Bireylerin Ağırlık ve Glikoz 64.0 90 75.3 109 Değerlerinin Saçılım Grafiği 130 73.0 104 82.1 102 120 76.2 105 95.7 121 G L U K O Z (mg/100 ml) 110 . . . . 100 77.6 87 90 80 70 50 60 70 80 90 100 A Ğ I R L I K (Kg)
  • 74. Tanımlayıcı İstatistikler bir değerler dizisinin istatistiksel olarak genel özelliklerini tanımlayan ölçülerdir Tanımlayıcı İstatistikler Yer Gösteren Ölçüler Yaygınlık Ölçüleri
  • 75. Yer Gösteren Ölçütler • Bir dağılımı tanımlayabilmek için gereklidiriler • İki grupta incelenmektedir: – Merkezi ölçütler-ortalama ölçütler • Ortalama, ortanca, tepe değeri – Merkezi olmayan ölçütler-konum bildiren ölçütler • Çeyrekler, yüzdeler
  • 76. Ortalama Ölçütleri • Dağılımdaki değerlerin en fazla yoğunlaştığı bir merkezi referans değeri verirler • Frekans dağılımları ve grafiklerle gösterilen değişkenlerin karşılaştırılmasında daha somut olarak bilgi veren ölçütlerdir. • En yaygın olarak kullanılanları – Aritmetik ortalama – Ortanca (medyan) – Tepe değeri (mod) – Geometrik ortalama
  • 77. Aritmetik ortalama • Çoğunlukla simetrik bir yapıya sahip olan sürekli sayısal verilerde kullanılan bir ortalama ölçüsüdür. • Büyüklük belirtmesi açısından kesikli sayısal verilerde de kullanılabilir. (Örneğin ortalama şut sayısı gibi) • Sınıflandırılmış ve sınıflandırılmamış veriler için ayrı ayrı hesaplanır. • X ile gösterilir • Sınıflandırılmamış verilerde her bir gözleme ilişkin değerlerin toplamı denek sayısına bölünerek elde edilir:
  • 78. Aritmetik Ortalama Çoğunlukla sayısal verilerde kullanılan bir merkezi eğilim ölçüsüdür. Her bir gözleme ilişkin değerlerin toplamının denek sayısına bölünmesi ile elde edilir. N : Kitledeki n : Örneklemdeki denek sayısını göstermek üzere Kitle Örneklem A.Ortalaması A. Ortalaması n ∑x N ∑x i x= i =1 i μ= i =1 n N Aritmetik ortalama dağılımdaki tüm değerleri dikkate alır. Ancak dağılımdaki aşırı değerlerden etkilenir.
  • 79. Aritmetik ortalama • Sınıflandırılmamış verilerde: n Σ xi İ=1 X= i=1,2,3...n n 5 kişinin yaşları: 20, 25, 22, 21, 18 olarak verilmiş olsun X = (20+25+22+21+18)/5 = 21,2 olarak bulunur
  • 80. Aritmetik ortalama • Sınıflandırılmış verilerde: k Σ fi . si İ=1 X= i=1,2,3...k (sınıf sayısı) n fi = i.sınıfın frekansı, si=i.sınıfın sınıf değeri olmak üzere
  • 81. Aritmetik ortalama MaxVO2 fi si fisi 40-44 2 42 84 45-49 3 47 141 50-54 8 52 416 55-59 13 57 741 60-64 8 62 494 65-69 4 67 268 70-74 2 72 144 Toplam 40 2290 X = 2290 /40 = 57.25 ml/kg/dk
  • 82. Ortanca (medyan) • Bir dağılımdaki değerleri iki eşit parçaya bölen ve uç değerlerin bulunduğu durumlarda kullanılan bir ortalama ölçüsüdür. • Verileri küçükten büyüğe doğru dizdiğimizde gözlem sayısı tek sayılı bir değerse ortanca (n+1)/2. gözlem değeridir • Verileri küçükten büyüğe doğru dizdiğimizde gözlem sayısı çift sayılı bir değerse ortanca n/2 ile (n+2)/2. gözlem değeridir • Dağılımdaki aşırı değerlerden etkilenmediği için dağılımın çarpık olduğu durumlarda kullanılması gerekir. • Ortalamaya göre zayıf olan tarafı dağılımdaki her değerin dikkate alınmamış olmasıdır.
  • 83. Ortanca (medyan) • 9 adet sporcunun milli olma sayıları şu şekilde verilmiş olsun: 5,6,4,7,5,8,38,7,4 Medyanı bulmak için değerler önce küçükten büyüğe dizilir: 4,4,5,5,6,7,7,8,38 , ortanca (n+1)/2’den (9+1)/2=5. değer olan 6 olur Dağılımın aritmetik ortalaması ise 9.3’tür aşırı değer olan 38’den etkilenmiştir.
  • 84. Ortanca (medyan) • 6 adet sporcunun şut sayıları şu şekilde verilmiş olsun: 15 21 17 42 18 19 Medyanı bulmak için değerler önce küçükten büyüğe dizilir: 15 17 18 19 21 42 , ortanca (n)/2’den (6)/2=3. gözlem ile (6+2)/2= 4.gözlem değerinin ortalamasıdır. yani: (18+19)/2= 18.5 olarak gerçekleşir. Yani gözlemlerin %50’si 18.5’in altında %50’si ise üstündedir.
  • 85. Tepe Değeri (mod) • Dağılımda en fazla tekrarlanan değerdir. Örneğin şu şekilde bir dağılımda: 13 26 19 16 19 18 19 19 tepe değeri 19 olur Sınıflandırılmış verilerde en yüksek frekansa sahip sınıfın sınıf değeri tepe değeridir.Burada tepe değeri 57 dir MaxVo2 Frekans % 40-44 2 5 45-49 3 7.5 50-54 8 20 55-59 13 32,5 60-64 8 20 65-69 4 10 70-74 2 5 Toplam 40 100
  • 86. Tepe değeri (mod) • Tek tepe değeri olan dağılımlar olabildiği gibi birbirine çok yakın frekansa sahip iki sınıf olabilir. • Böyle dağılımlara bimodal dağılım denir • İkiden fazla tepe değeri görüldüğü de olabilmektedir. • Aritmetik ortalama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür • Hesaplaması kolay olduğu için dağılım ortalamasının kestiriminde yaklaşık bilgi verebilir • Dezavantajları ise – Yapılan sınıflamaya göre tepe değeri değşmektedir – Bazı dağılımlarda tepe değeri olmayacağı gibi bazı dağılımlarda birden fazla tepe değeri olabilir – Tepe değeri sonuç bir istatistiktir, daha ileri hesaplamalar için pek kullanılmaz
  • 87. KONUM ÖLÇÜTLERİ Çeyrekler: dağılımı 4 eşit parçaya bölen değerlerdir. Bunlar, 1. Çeyrek (Ç1) 2. Çeyrek (Ç2) 3. Çeyrek (Ç3) Değerlerin %25’i Ç1’e Değerlerin %50’si Değerlerin %75’i Ç3’e eşit ya da ondan Ç2’ye eşit ya da ondan eşit ya da ondan küçüktür. küçüktür. küçüktür. Bu değer aynı zamanda ortancadır. Yüzdelikler Yüzdelikler sıraya dizilmiş verilerde yığılımlı sıklıkları gösterirler. Örneğin verilerin ilk %30’u 30. Yüzdeliğe (Y30) eşit ya da ondan küçüktür.
  • 88. • ÇEYREKLER: Dağılımdaki gözlemler büyüklüklerine göre sıralandıklarında %25' inci değer 1. çeyrek, %75.değer 3. çeyrektir. %50' nci değer 2. çeyrek olup, bu değer aynı zamanda ortancadır • • Q1 = n/4' üncü gözlemin aldığı değer • Q2 = n/2' inci gözlemin aldığı değer • Q3 = 3n/4' üncü gözlemin aldığı değer • • eşitlikleriyle hesaplanır.
  • 89. Yüzdeliklerin hesaplanması Sıra Gözlem Sıra Gözlem Sıra Gözlem Sıra Gözlem 1 40 11 54 21 58 31 63 2 44 12 54 22 59 32 64 3 46 13 54 23 59 33 64 4 46 14 55 24 59 34 64 5 49 15 56 25 59 35 65 6 50 16 56 26 59 36 66 7 52 17 57 27 60 37 66 8 52 18 57 28 61 38 67 9 52 19 58 29 62 39 72 10 53 20 58 30 62 40 73 • Yüzücülerin %25’i hangi değerden az değeri almıştır? (25. yüzdelik nedir? sorusudur) 0.25 x 40 = 10. gözlemin değeri olan 53’tür
  • 90. YAYGINLIK GÖSTEREN ÖLÇÜTLER • Dağılım içindeki değerler ortalamaya ne kadar yakınsa ortalama o dağılım için o denli iyi bir ölçüttür. Dağılım içindeki her bir değerin ortalamaya olan uzaklığı dağılımın yaygınlığını belirler. Ortalamadan ayrılışlar ne kadar küçükse dağılım o denli dik, ne kadar büyükse o denli yaygındır. • VARYANS ( σ 2 , s 2 ) • STANDART SAPMA ( σ , s ) • STANDART HATA (σ µ , sx) • VARYASYON KATSAYISI (v)
  • 91. Standart Sapma • Bir dağılımın yaygınlığını gösteren en önemli yaygınlık ölçütlerinden biridir • Dağılımdaki tüm değerlerin aritmetik ortalamaya olan uzaklıklarının ortalamasıdır • Standart sapma büyüdükçe dağılımın yaygınlığı artar • Dağılımda değerler aynı olduğunda yaygınlık yoktur ve standart sapma sıfır olur • Hesaplanırken dağılımdaki tüm değerler dikkate alınır • Aritmetik ortalamayla birlikte kullanılır X ± s
  • 92. • VARYANS (σ 2, S2) : Bir dağılıma ilişkin gözlemlerin ortalamadan ayrılışlarının kareleri ortalamasına VARYANS denir. • • s2 = Σ (Xi - X)2 / (n - 1) i=1, 2 … , n • • eşitliği ile ya da bu eşitliğin değişik şekilde ifadesi olan, • • n • Σ Xi2 - (Σ Xi)2 / n • i=1 • s2 = • n-1 • ile hesaplanır
  • 93. s2 = Σ (Xi - X)2 / (n - 1) i=1, 2 … , n eşitliği ile hesaplanır. Şu şekilde bir dağılımımız olsun: 2, 1, 4, 3, 5. Bu dağılımın ortalaması (2+1+4+3+5)/5=3. Her bir gözlemin ortalamadan ayrılışlarını bulalım, bunların karesini alalım ve toplayalım Ortalamadan ayrılış Kareler varyans 2- 3 = -1 1 10 / (5-1) = 2,5 1-3 = -2 4 4-3 = 1 1 3-3 = 0 0 5-3 = 2 +4 Toplam 10
  • 94. Varyansın sınıflandırılmamış verilerde hesaplanması • Dağılımımızın şu şekilde olduğunu varsayalım: • 2, 6, 1, 15, 6 • n • Σ Xi2 - (Σ Xi)2 / n • i=1 • s2 = • n-1 • Σ Xi2 = 22+62+12+152+62 =302 • (Σ Xi)2 / n = (2+6+1+15+6)=30 • s2 = 302 – (30)2/5 = 30,5002 5-1
  • 95. • Sınıflandırılmış veriler için varyans aşağıdaki eşitlikle hesaplanır. • • n • Σ fibi2 - (Σ fibi)2 / n • i=1 • s2 = • n-1 • Buradaki fi, i.sınıfın frekansı, bi i. sınıfın sınıf değeridir.
  • 96. Varyansın sınıflandırılmış verilerde hesaplanması MaxVo2 fi si si2 fisi fisi2 40-44 2 42 1764 4 3528 45-49 3 47 2209 141 6627 50-54 8 52 2704 416 21632 55-59 13 57 3249 741 42237 60-64 8 62 3844 496 30752 65-69 4 67 4489 268 17956 70-74 2 72 5184 144 10368 Toplam 40 2290 133100 s2 = 133100 – (2290)2 /40 =51,12 39
  • 97. • STANDART SAPMA (σ, S): varyansın kareköküdür. Varyans ve Standart Sapma dağılımın yaygınlığına ilişkin genel bir bilgi veriri. Bu değerlerin büyük mü, küçük mü olduğu ya da dağılımın homojenliği konusunda yargıya varabilmek için ortalaması ile kıyaslamak gerekir. • Sınıflandırılmamış verilerdeki örneğimizde varyansımız s2 = 30,5002 standart sapmamız s= √30,5002 = 5,5227 • Sınıflandırılmış verilerdeki örneğimizde varyansımız s2 = 51,1225, standart sapmamız s= √51,1225 = 7,15 olur
  • 98. • STANDART HATA (σ µ , SX): Standart hata, gözlem başına düşen sapma miktarıdır. Aritmetik ortalama genellikle standart hatası ile birlikte X ± Sx biçiminde verilir. STANDART HATA, • • Sx = (S2 / n) 1/2 eşitliği ya da s/√n eşitliği ile hesaplanır. • Örneğimizde s= √30,5002 = 5,5227, n=5 olduğuna göre • Sx = 5,5227 / √5 olur
  • 99. • VARYASYON KATSAYISI(v) : Standart Sapmanın ortalamaya göre yüzdesine VARYASYON KATSAYISI denir. • • V = S 100 • X • eşitliği ile hesaplanır. Bu değerin % 50' den büyük olması durumunda dağılım heterojendir denilir. Bu ölçüt aynı zamanda iki ya da daha çok dağılımın yaygınlıklarını kıyaslamada kullanılır.
  • 100. TEORİK DAĞILIŞLAR Verilerin oluşturduğu yığınlara dağılım demiştik. Verinin ölçüm biçimi gözlemlerin aldığı olası değerlerdir. Bu değerlerin birbirine göre konumu (büyüklük, küçüklük) dağılım aralığının sınırları v.b. gibi özelliklerden dolayı farklı yığınlar farklı dağılım yapısı gösterir. Spor ve sağlık bilimlerinde elde edilen verilerin oluşturduğu yığınlar daha çok şu üç dağılım tipine uyarlar:  Normal dağılım  Binom dağılım  Poisson dağılım Bunlardan ilki sürekli, diğer ikisi ise kesikli dağılımdır.
  • 101. Normal Dağılım Fonksiyonunun Grafiksel Formülü: biçimindedir. Bu eğriye çan eğrisi denir. Bu dağılım fonksiyonu Alman bilim adamı C.F. Gauss tarafından bulunmuştur. Bu nedenle eğriye Gauss eğrisi de denir.
  • 102. NORMAL DAĞILIM X X X X
  • 103. Normal dağılım fonksiyonunda herhangi bir deneğin ortalamadan uzaklığının standart sapmaya oranı Z' ye standart normal dağılım denir. Z= Xi - X S Bu frekans dağılımının normal dağılım gösterip -4 -3 -2 -1 0 1 2 3 4 göstermediğini saptamada kullanılır. Ortalaması 0 varyansı 1 olan normal dağılımı aynı standart normal dağılım denir. -3 -2 -1 0 1 2 3
  • 104. Normal Dağılımın Özellikleri: ∀ •Teorik normal dağılımda deneklerin aldığı değerler birbirinden bağımsız ve rasgeledir. ∀ •Teorik normal dağılım ortalamaya göre simetriktir. Gözlemler ortalamaya yakın değerler alırsa homojen, ortalamalardan uzak değerler alırsa dağılıma heterojen denir. Aynı ortalamaya sahip üç dağılımın dik ya da yayvan olması durumundaki eğriler aşağıda verilmiştir.
  • 105. Normal Dağılımın Özellikleri: ∀• Teorik normal dağılımda veriler süreklidir ve dağılım aralığı içinde her değeri alabilirler, yani - ∞ < x < + ∞
  • 106. Normal Dağılımın Özellikleri: • Teorik normal dağılımda; • X ± S sınırları arasına gözlemlerin % 68.26' sı • X ± 2S sınırları arasına gözlemlerin % 95.44' ü • X ± 3S sınırları arasına gözlemlerin % 99.74' ü girer. -3s -2s -1s X 1s 2s 3s
  • 107. ÇARPIKLIK VE DİKLİK Normal dağılıma uyan gerçek veriler her zaman ortalamaya göre simetrik olmazlar sola (negatif) ya da sağa (pozitif) çarpık olabilirler ama bu çarpıklık kabul edilebilir sınırlar arasında olmalıdır. Standart normal dağılımda ortalama, ortanca, tepe değeri birbirine eşit ve üstüste çakışır. Dağılımın çarpıklığının ölçüsü çarpıklık katsayısı (Ç) ile ölçülür.
  • 108. Sağa Çarpık Simetrik Sola Çarpık Ortalama Ortalama Ortalama Ortanca Ortanca Ortanca Tepe Değeri Tepe Değeri Tepe Değeri
  • 109. ÇARPIKLIK VE DİKLİK Σ (Xi - X)3 n Ç = S3 ile hesaplanır. Bu değer; Ç = 0 ise dağılım simetrik, Ç < 0 ise dağılım sola (-) çarpık Ç > 0 ise dağılım sağa (+) çarpık
  • 110. ÇARPIKLIK VE DİKLİK Dağılım ortalamaya göre simetrik olabilir. Aynı ortalamaya sahip dağılımların görünümleri, varyansları farklı olabilir. Bu farklılık Basıklık Katsayısı ile belirlenir. B>0 Σ (Xi - X)4 n B = S4
  • 111. • B>0 • B=0 • B<0 Burada; B=0 ise dağılım normal B<0 ise dağılım basık B>0 ise dağılım dik denir.
  • 112. Sağa (pozitif) çarpık dağılım • TD < ortanca<X TD X ortanca Ç = 0 ise dağılım simetrik, Ç < 0 ise dağılım sola (-) çarpık Ç > 0 ise dağılım sağa (+) çarpık
  • 113. Sola (negatif) çarpık dağılım • X< ortanca<Tepe değeri TD X ortanca Simetrik normal dağılımda ise ortalama, ortanca ve TD birbirine eşittir. Sağa çarpık dağılımlarda büyük değerler sayısı daha fazla, sola çarpık dağılımlarda da küçük değerlerin sayısı daha fazladır.
  • 114. BİNOM (İKİ TERİMLİ) DAĞILIMI Herhangi bir olayın gerçekleşmesi ya da gerçekleşmemesi inceleniyorsa yani iki olası sonuç varsa bu verilerin dağılımı binom dağılıma uyar. Örnek olarak: Yapılan antrenman tekniğinin başarılı olup olmaması gibi •POISSON DAĞILIMI Çok sayıda olası durum içerisinde aranan olayın gerçekleşme olasılığı küçükse ve veriler kesikli sayısalsa x=0, 1, 2, 3… v.b bu verilerin dağılımı poisson dağılımına uyar.
  • 116. STANDARTLAŞTIRMA • Elde edilen puanlar veya veriler karşılaştırılırken kullanılır • Örneğin bir öğrencinin sınav sonuçları şu şekilde olsun: Ders İng Mat Psikol Öğrencinin 80 65 75 puanları Öğrencinin sınıfa göre en başarılı olduğu dersi belirlerken sadece almış olduğu notlara bakarak karar veremeyiz. Sınıf ortalaması ve sınıf standart sapmasına göre yapılacak bir standartlaştırma yani yeni bir ölçeğe dönüştürme işlemi sayesinde daha rahat karşılaştırma yapabiliriz.
  • 117. STANDARTLAŞTIRMA • Öğrencinin bulunduğu sınıfa ait değerler de eklenmiş olsun Ders İng Mat Psikol Öğrencinin puanları 80 65 75 Sınıfın ortalaması 85 55 60 Sınıfın standart 10 5 15 sapması Aslında öğrencinin en başarılı dersi gibi görünen İngilizce’de sınıf ortalamasının altında not aldığı başarısız gibi göründüğü matematik ve psikolojide sınıf ortalamasının üzerinde aldığı görülmektedir.
  • 118. Standartlaştırmada Z Skoru • Verilerin standartlaştırılmasında en çok kullanılan yöntemlerden biridir • Orijinal verileri ortalaması 0, standart sapması 1 olan yeni bir skora dönüştürür
  • 119. STANDARTLAŞTIRMA Ders İng Mat Psikol Öğrencinin puanları 80 65 75 Sınıfın ortalaması 85 55 60 Sınıfın standart 10 5 15 sapması Bu veriler yardımıyla z-skorlarını hesaplayalım; z = (Xi – X) / s
  • 120. STANDARTLAŞTIRMA Ders İng Mat Psikol Öğrencinin puanları 80 65 75 Sınıfın ortalaması 85 55 60 Sınıfın standart 10 5 15 sapması Z (80-85)/10 (65-55)/5 (75-60)/15 = - 0,50 = +2 = +1 Öğrenci İngilizce’de ortalamanın 0,50 standart sapma altında bir z skoruna sahipken, matematik dersinde ortalamanın 2 standart sapma üzerinde bir z skoruna sahiptir.
  • 121. Standartlaştırmada T Skoru • Standart z skorlarının küçük ondalıklı sayıları içermesi ve de negatif ve pozitif değerler alabilmesi (genellikle –3 ve +3 arasında) , z skoruna dayalı ancak daha kolay anlaşılan t skorlarını ortaya koymuştur • T skorları ortalaması 50, standart sapması 10 olan bir skorlar kümesidir. • Genelde 20 ile 80 arasında değer alırlar
  • 122. STANDARTLAŞTIRMA T skorunu elde etmek için her bir z skoru 10 ile çarpılarak 50 puan eklenir. En yüksek t skoru 80, en düşük t skoru 20 olabilir. Ders İng Mat Psikol Öğrencinin 80 65 75 puanları Z (80-85)/10 (65-55)/5 (75-60)/15 = - 0,50 = +2 = +1 T (10*-0,50)+50 (10*2)+50 (10*1)+50 = 45 = 70 =60
  • 124. • Kitle dağılımına ilişkin parametreleri elde etmek çok zor, çoğu kez de olanaksızdır. Böyle durumlarda o kitleden çekilen örnekleme ilişkin istatistikler (X, S2, pq…vb) hesaplanır. • Aynı kitleden aynı koşullarda çekilen farklı örneklemlerden elde edilen istatistikler farklı değerler alabilirler. Bu farklı değerdeki istatistikler belirli bir dağılım aralığı içinde değer alırlar ki bu değerlerin kitle parametreleri olan µ ve σ2 değerlerine yakın değerler olması beklenir. • Bu şekilde aynı kitleden çekilen örneklem değerlerinin alabileceği değerlerin oluşturduğu dağılım aralığına Güven Aralıkları denir.
  • 125. • KİTLE ORTALAMASI GÜVEN ARALIĞI • Kitle Varyansı Bilindiğinde ∀ σ2 varyansına sahip bir kitlenin ortalamasının (µ), güven sınırları, bu kitleden rasgele olarak çekilen bir örneklemin ortalaması (X), kitle standart hatası σµ kullanılarak • X- Z σµ ≤ µ ≤ X + Z σµ biçiminde hesaplanır. • Burada σµ = σ / √n olarak hesaplanır.
  • 126. • KİTLE ORTALAMASI GÜVEN ARALIĞI • Kitle Varyansı Bilinmediğinde • Kitle varyansı σ2 'nin bilinmediği durumda kitle ortalaması, µ'nın güven aralığı, bu kitleden çekilen ve ortalaması X, varyansı S2 olan bir örnekleme ilişkin istatistiklerle, • X - t Sx ≤ µ ≤ X + t Sx biçimimde hesaplanır. Burada Sx örneklem standart hatasıdır. • Sx = s / √n olarak hesaplanır.
  • 127. Hipotez ve Hipotez testleri
  • 128. Hipotez nedir? • Hipotez örneklem yardımıyla evren parametreleri hakkında kestirimde bulunma sürecidir. • Herhangi bir konudaki doğruluğu bilimsel olarak kanıtlanmamış düşünce, görüş ya da varsayımlardır. Hipotezin amacı nedir? • Evrenden çekilen örneklemler yardımıyla evren hakkında bir karara varma konusunda yardımcı olmaktır. Hipotezimizin doğruluğunu nasıl kanıtlarız? • Hipotezimizin doğruluğunu kanıtlayabilmek için veri yapımıza uygun bir hipotez testi uygulamamız gerekir. Hipotez testlerine önemlilik ya da anlamlılık testleri de denir.
  • 129. Hangi hipotez testini uygulayacağımız; • Araştırma planına • Veri tipine • Denek sayısına • Verilerin dağılım yapısına göre, farklılık gösterir. Hipotezler iki türlüdür: • H0 farksızlık hipotezi ya da sıfır hipotezi • H1 alternatif hipotezdir
  • 130. • H0 farksızlık hipotezi örnekleri: – Voleybol ve basketbol oynayan sporcularda vücut yağ yüzdeleri arasında fark yoktur. – Kızlarla erkeklerin istatistik dersi notları arasında fark bulunmaz – Spor yöneticiliğini kazanan öğrencilerle beden eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunmaz • H1 alternatif hipotezi örnekleri: – Voleybol ve basketbol oynayan sporcularda vücut yağ yüzdeleri arasında farklılık bulunur. – Kızlarla erkeklerin istatistik dersi notları farklıdır – Spor yöneticiliğini kazanan öğrencilerle beden eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunur
  • 131. • Hipotezler tek yönlü ve çift yönlü olarak kurulmaktadır: • TEK YÖNLÜ H0 : µ 1 - µ 2 = 0 H1 : µ 1 - µ 2 > 0 H0 : µ 1 - µ 2 = 0 H1 : µ 1 - µ 2 < 0 • ÇİFT YÖNLÜ H0 : µ 1 - µ 2 = 0 H1 : µ 1 - µ 2 ≠ 0
  • 132. • H0 farksızlık hipotezi örnekleri: – Voleybol ve basketbol oynayan sporcularda vücut yağ yüzdeleri arasında fark yoktur. – Kızlarla erkeklerin istatistik dersi notları arasında fark bulunmaz – Spor yöneticiliğini kazanan öğrencilerle beden eğitimi öğretmenliğini kazanan öğrencilerin ÖSS puan ortalamaları arasında anlamlı bir farklılık bulunmaz • H1 alternatif tek yönlü hipotez örnekleri: – Voleybol oynayan sporcularda basketbol oynayanlara göre vücut yağ yüzdesi daha düşüktür. – Kızların istatistik dersi notları erkeklerinkinden yüksektir. – Spor yöneticiliğini kazanan öğrencilerin ÖSS puan ortalamaları beden eğitimi öğretmenliğini kazanan öğrencilerinkine göre yüksektir.
  • 133. Anlamlılık (yanılma ya da hata düzeyi nedir? • Anlamlılık düzeyi araştırmacı tarafından testten önce belirlenen bir değerdir. (α ile gösterilir) • H0 hipotezi doğru iken onu reddetme olasılığını ifade eder. • Yani; gerçekte karşılaştırdığımız iki evren arasında fark yokken yanılıp fark varmış gibi farksızlık hipotezini reddetme olasılığıdır. • Yanılma düzeyi ya da α olarak en çok 0.05 kullanılır. Araştırmanın daha hassas olarak yapılması isteniyorsa α olarak 0,01 ve 0,001 de kullanılabilir.
  • 134. Red etme ve kabul etme neye göre olur? • Bir istatistiksel test uyguladığımızda karşımıza bir test istatistiği ve p değeri ortaya çıkacaktır. • Biz ortaya koyduğumuz H0 veya H1’i bu sonuçlara göre kabul veya reddederiz. • Hesaplamış olduğumuz test istatistikleri teorik tablolardaki değerlere eşit ya da büyük ise H0 reddedilir. • Aynı şekilde elde ettiğimiz p değerleri 0.05’ten küçükse H0’ı reddederiz ve H1’i kabul ederiz. • İstatistiksel paket programlarda elde edilen test istatistiklerine karşılık gelen p değerleri verilmekte olduğundan ayrıca teorik tablo değerlerine bakılmadan da bir hipotezin reddedilip kabul edileceğine karar verebiliriz.
  • 135. Hipotez testlerinde ne tür hatalar ortaya çıkar? • Hipotez testlerinde karar verirken iki tür hata yapabiliriz. • Bunlar: – 1. tip hata (α türü hata) – 2. tip hata (β türü hata) olarak adlandırılmaktadır • H0 hipotezini gerçekte doğruyken reddetmek 1. tip hatadır • H0 hipotezini gerçekte yanlışken kabul etmek de 2. tip hatadır.
  • 136. Hipotez testlerindeki doğru kararlar ve hatalar H0 doğru iken H0 yanlış iken H0 ‘ı kabul Doğru karar 2.tip hata(β) etmek H0 ‘ı reddetmek 1.Tip hata (α) Doğru karar
  • 137. Hipotez Testlerinde İzlenecek Adımlar: • Hipotezler kurulur ∀ α yanılgı düzeyi belirlenir. • Verinin özelliklerine göre (dağılım yapısı homojen, heterojen, sürekli, kesikli, denek sayısı v.b.) ve hipoteze bakılarak uygun test seçilir. • Test yapılır. • i)Hesaplama bilgisayarda bir paket program kullanılarak yapılıyorsa hesaplanan anlamlılık düzeyi p , yanılgı düzeyi α ile karşılaştırılır. • p > α ise H0 kabul, • p ≤ α ise H0 reddedilir.
  • 138. Hipotez Testlerinde İzlenecek Adımlar • ii)Hesaplama elle yapılıyorsa hesaplanan test istatistiği, α yanılgı düzeyinde ve o test için hesaplanan Serbestlik Derecesindeki (SD) çizelge değeri ile karşılaştırılır. Hesapla bulunan test istatistiği çizelgeden bulunandan büyükse H0 yokluk hipotezi reddedilir ve p < α yazılır. Aksi durumda H0 hipotezi kabul edilir ve p>α yazılır. ∀ α = 0.05 alınma durumunda p<0.05 ise bunun anlamı şudur: Ben bu çalışmada H0 hipotezini reddettim farkı anlamlı buldum, benim bu kararım 0.95 olasılıkla doğrudur. (H0' ı kabul etme) Yanılma olasılığım 0.05' ten küçüktür.
  • 139. Hipotez testleri • Hipotez testleri verilerin yapısına ve dağılım özelliklerine göre iki ana grupta toplanır: – Parametrik Hipotez Testleri – Parametrik Olmayan Hipotez Testleri
  • 140. Hipotez testleri • Bu iki ana gruptan her biri kendi içinde çok sayıda hipotez testi içerir. Bunların seçimi örneklem dağılımlarının özeliklerine ve gözlemlerin skalasına göre belirlenir. • Bu iki tip hipotez testinden parametrik olanların uygulanabilmesi için test edilecek verilerde bazı koşullar aranır. • Bu koşullardan en az birinin gerçekleşmemesi durumunda parametrik testlerin kullanılması sakıncalı olur. • Bu durumda parametrik test yerine o testin karşıtı olan parametrik olmayan test kullanılır. Parametrik testlerin çoğunun parametrik olmayan karşıtı vardır.
  • 141. Parametrik testler ve parametrik olmayan karşılıkları PARAMETRİK PARAMETRİK OLMAYAN İki Ortalama Arası Fark Mann Whitney U Testi İki Eş Arasındaki Fark Wilcoxon İki Örnek Testi Bağımsız İki Oran Arası Fark 2x2 Düzende Ki-Kare Testi Bağımlı İki Oran Arası Fark Bağımlı Örneklerde Ki-Kare Testi Tek Yönlü Varyans Çözümlemesi Kruskal Wallis Varyans Çözümlemesi Tekrarlı Denemelerde Varyans Freidman Testi Analizi
  • 142. PARAMETRİK TESTLERİN VARSAYIMLARI • Normal dağılıma sahip olma • İkiden çok kitle olduğunda varyansların homojen olması • Verilerin sürekli dağılım gösteren karakterlerden oluşması • Her bir dağılımdaki gözlem sayılarının yeterli sayıda olması (nj≥10) • İki ya da daha çok dağılım birbiri ile karşılaştırılıyorsa dağılımlardaki gözlem sayıları birbirlerine eşit ya da yakın sayıda olmalıdır. Bu koşul küçük n' ler için daha da anlamlıdır. • Örnekler birbirinden bağımsız ve rasgele seçilmelidir.
  • 143. PARAMETRİK TESTLERİN VARSAYIMLARI • Bu varsayımlardan en az birisi yerine gelmezse parametrik testler kullanılmaz, bunun yerine parametrik olmayan karşıtı kullanılır. Parametrik olmayan testlerin varsayımları ise; • -Örnekler rasgele ve birbirinden bağımsız olarak seçilecek • -Her bir grupta en az 3 (n≥3) denek olacak
  • 144. Parametrik test varsayımları • Normal Dağılıma Uyum: • Eldeki verilerin çekildiği kitlenin dağılımının normal dağılıma uyup uymadığını test etmek için istatistik paket programlarındaki normallik testlerinden yararlanılabileceği gibi aşağıda verilen ölçütlerle de belirlenebilir. • Bir dağılımın normal dağılıma uyabilmesi için dağılım ortalaması ( X) ile standart sapması (S) kullanılarak • x±S sınırları içine gözlemlerin %68.2nin aldığı değer girmelidir. • x±2S sınırları içine gözlemlerin %95.44nün aldığı değer girmelidir • x±3S sınırları içine gözlemlerin %99.74nün aldığı değer girmelidir
  • 145. Parametrik test varsayımları • Varyansların Homojenliği: • Varyansların homojenliği iki yönden ele alınmalıdır. Birincisi her bir grubun küçük varyanslı olması(varyasyon katsayısı < %50)bunun anlamı standart sapma ortalamanın yarısından küçük olmalı , ikincisi ise birden fazla grup varsa varyanslarının birbirine oranı 1'e yakın olmalıdır. Normallik testinde olduğu gibi homojenlik testide istatistik paket programlarında vardır. Bunlar kullanılarak test edilebilirler.
  • 146. • Dağılımın Sürekli Olması: Bu varsayım için temel özellik önce veriler ölçüm mü yoksa sayımla belirlenen veriler mi? Bakılır.Ölçüm olması dağılımın sürekli olması için yeterli değildir. Dağılımda uç değerler (çok küçük yada çok büyük)varsa ölçüm olmasına karşın kesikli olabilir. • Örneğin 20 denekten 19 tanesinin kan şekeri düzeyi 9-100 arasında değişirken bir tanesi 400 ise bu değer dağılımın süreklilik yapısını bozar ve bu değer dağılımdan çıkartılmalıdır.(Yanlış ölçüm ya da yanlış denek) Buna benzer birkaç değer varsa, dağılımdan atılamıyorsa bu durumda sürekliliği sağlayacak bir transformasyon yöntemi uygulanmalıdır. (Log, karekök, vb.)
  • 147. • Denek Sayıları: • Herbir dağılımdaki denek sayısı n≥10 olmalıdır. n≥10 olmasının nedeni bu değerin rasgeleliğin dağılımı etkileme altsınırıdır. • İstatistikteki Büyük Sayılar Kanunu'na göre n büyüdükçe rasgeleliğin dağılım üzerindeki etkisi azalır, gerçeğe ulaşma olasılığı artar. İşte bu kural için alt sınır 10'dur. n≥30 olduğunda rasgeleliğin etkisi yok denecek kadar azdır. Bunu bir örnekle açıklayalım:Dünyadaki kadın erkek oranı 0.50'dir.Bu doğan her bebekten 1 kız 1 erkek olacağı anlamına gelir. Doğum kliniği önüne gidelim, doğan bebeklerin cinsiyetine bakalım. Hiçbir zaman 1 kız 1 erkek doğmaz. Çünkü her doğum birbirinden bağımsızdır ve olasılığı 0.50'dir. Bazen arka arkaya 3 kız ya da 2 erkek ya da farklı oranlarda doğabilir. Hiçbir zaman arka arkaya 10 kız yada 10 erkek doğmaz.Bu oran 3 kız 7 erkek yada 4 erkek 6 kız yada 5 kız 5 erkek vb. olabilir. Doğum sayısı 30'a ulaştığında rasgeleliğin etkisi tamamen ortadan kalkar, oran 0.50 ulaşır.
  • 148. • İki yada daha çok grup karşılaştırılacaksa gruplardaki denek sayıları birbirine eşit yada yakın olmalıdır. bunun amacı herbir gruptaki rasgeleliğin etkisini eşit tutmaktır.Örneğin bir grupta 10 denek diğerinde 25 denek varsa birinci grupta rasgeleliğin etkisi 25 denekli ikinci gruptan daha fazladır. bu da farklı koşullarda kıyaslama yapmaya ve hatalı sonuç bulunmasına yol açar. Herbir gruptaki denek sayısının 30'un üzerinde olması durumunda eşitlik önemini yitirir. Bir grupta 30 diğerinde 50 denek olabilir.
  • 149. • UYGUN TEST SEÇİMİ • Eldeki veriye uygun test seçmek çok önemlidir. Araştırma ne kadar iyi planlansa ne kadar iyi uygulansa tüm aşamaları ne kadar iyi yürütülse de sonuçta değerlendirme aşamasında yanlış test uygulanırsa o aşamaya kadar harcanan tüm emekler boşa gider. Peki elimizdeki veriye çok sayıda testten hangisini seçeceğiz. Doğru kararı nasıl vereceğiz. İşte bu iş için istatistikteki karar ağacı yöntemini bu amaçla kullanabiliriz. Bu aşamada önce verinin ölçüm yada sayım olması kriterine bakacağız.
  • 150. • Veri ölçümle belirtilen karakterlerden oluşuyorsa 2 nolu karar ağacını, sayımla belirtilen karakterlerden oluşuyorsa 3 nolu karar ağacını izleyeceğiz. Testin seçiminde karar ağacı ile birlikte önce parametrik test varsayımlarını gerçekleştirip gerçekleştirmediğine bakacağız.Parametrik (P), Nonparametrik (NP) ile belirtilen testi alacağız.
  • 151. VERİ ÖLÇÜM SAYIM
  • 152. ÖLÇÜM Grup Tek Grup İki Grup Çok
  • 153. ÖLÇÜM Grup Tek Grup İki Grup Çok Bağımsız Bağımlı Bağımsız Bağımlı
  • 154. ÖLÇÜM Grup Tek Grup İki Grup Çok Bağımsız Bağımlı Bağımsız Bağımlı Kitle Ortalaması İki Ortalama İki Eş Tek Yönlü Tekrarlı Ölçümler Anlamlılık Testi Arası Fark Testi Arası Fark Testi Varyans Analizi Varyans Analizi Mann Whitney Wilcoxon Eş Kuruskal Wallis İşaret Testi Fredman Testi U Testi Testi Varyans Analizi Parametrik Parametrik Olmayan Testler Testleri
  • 155. Sayım Grup Tek Grup İki Grup Çok
  • 156. SAYIM Grup Tek Grup İki Grup Çok Bağımsız Bağımlı Bağımsız
  • 157. SAYIM Grup Tek Grup İki Grup Çok Bağımsız Bağımlı Bağımsız Kitle Oranının Bağımsız İki Oran Bağımlı İki Oran Anlamlılık Testi Arası Fark Testi Arası Fark Testi Tek Değişkenli 2 x 2 Düzeninde MacNemar Çok Gözlü Ki-KareTesti Ki-KareTesti Testi Ki-Kare Testii Fisher Kesin Kolmogrov Ki-KareTesti Simirnov Testi Parametrik Parametrik Olmayan Testler Testleri
  • 158. Parametrik Hipotez Testlerine Giriş T-Testleri • Tek grupta t-testi • Bağımsız iki grupta t-testi • Eşleştirilmiş iki grupta t-testi
  • 159. Parametrik Hipotez Testlerine Giriş T-Testleri • Tek grupta t-testinin varsayımları nelerdir? – Test edilecek örneklem normal dağılıma uygun olmalıdır. – Vakalar rasgele olarak seçilmiş olmalıdır – Vakalar birbirinden bağımsız olmalıdır.
  • 160. Parametrik Hipotez Testlerine Giriş T-Testleri • Tek grupta t-testi örneklem ortalamasının evren ortalamasına eşit olup olmadığını test etmek için kullanılır. • Örneğin spor yapmayan yetişkin erkeklerin depresyon ölçeği puanlarının 50’den fazla olduğu yönünde bir hipotezimiz olduğunda oluşturduğumuz örneklemdeki puan ortalamasının 50’den farklı olup olmadığını test etmemiz gerekir. İşte örneklem ortalamamızın belli bir evren ortalamasına uyup uymadığını test etmek için tek grupta t- testini uygularız.
  • 161. KİTLE ORTALAMASI ÖNEMLİLİK TESTİ X-µ t= Sx H0 : µ = 50 n = 30 H1 : µ ≠ 50 S= 10,33 Sx = 10,33 / √30 50-54,63 = -2,457 t 0.05,30 = 2.10 t= 1,88 p=0.020 p< 0,05 Sonuç örneklem ortalaması kitle ortalamasından farklıdır
  • 162. Örnek Basketbol oyuncularının vücut yağ yüzdesi ortalamasının %10 olup araştırılmak istenmektedir. Bu amaçla rasgele seçilen 30 basketbolcunun vücut yağ yüzdeleri ölçülmüştür. H0 : Basketbolcuların vücut yağ yüzdesi ortalaması 10’dur. H1: Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklıdır. x−µ 7.68 − 10 t= = = −6.68 P<0.000 S / n 1.90 30 Yorum: Basketbolcuların vücut yağ yüzdesi ortalaması 10’dan farklı bulunmuştur.
  • 163. İki ortalama arasındaki farkın anlamlılığı testi • İncelenen bir değişken yönünden birbirinden bağımsız iki grubun karşılaştırılmasında kullanılır. • Varsayımları şunlardır: – Karşılaştırılacak iki grup vardır – Gruplar birbirinden bağımsızdır yani her grupta farklı kişiler yer alır – Veriler sürekli sayısal verilerdir – Gruplardaki denek sayıları yeterlidir (n>=30) – Evren dağılımları normal dağılım gösterir. – Evren varyansları homojendir
  • 164. İki ortalama arasındaki farkın anlamlılık testi • Örneğimizde iki farklı grup öğrenci var. 50 adet kız öğrenci ve 50 adet erkek öğrenci. Burada cinsiyetin bilgi skorları üzerindeki etkisi araştırılmıştır. Buna göre iki ayrı cinsiyet grubunda bilgi skorlarının ortalaması karşılaştırılmıştır. – Birinci adım, iki farklı gruba ait verilerin bu testin varsayımlarını karşılayıp karşılamadığıdır. – İkinci adım ise verilen istatistiklere göre arada anlamlı fark olup olmadığına bakılmasıdır. – Birinci grubun bilgi skoru ortalaması 8,46,diğer grubun ise 7,62 olsun. Formüllerde bunları ve standart sapmaları yerine koyduğumuzda ortaya bir t istatistiği çıkacaktır. Bunun p değerini bulduğumuzda 0.05’ten küçükse anlamlı bir fark olduğunu söyler,H0’ı reddederiz.
  • 165. İKİ ORTALAMA ARASINDAKİ FARKIN ÖNEMLİLİK TESTİ H0 : X1 - X2 = 0 H1 : X1 - X2 ≠ 0 X1 - X2 t = √S 2 + S 2 1 2 n1 n2 Kızlarla erkeklerin bilgi skorları arasında fark var mı? 8.46 - 7.62 t= 1.702 + 2.232 = 2.12 t 0.05 , 49 = 2.01 50 50 p< 0.05
  • 166. İki eş arasındaki farkın anlamlılık testi • Bir denek üzerinde bazen birden fazla deney yapılmak istenebilir. Örneğin spor bilimlerinde antrenman öncesi ve antrenman sonrası birçok parametre açısından karşılaştırma yapılarak antrenmanın bu parametrelere etkisi araştırılabilmektedir. Bu tür araştırmalarda grupların bağımlı yani aynı kişilerden oluştuğu söylenir. • Eğer bağımlı grup sayısı 2 ve gruplara ait verilerin yapısı parametrik testlerin varsayımlarını karşılıyorsa iki eş arasındaki farkın anlamlılık testi ya da paired-t test kullanılabilir. • Buna göre varsayımlarımız: – Bağımlı grup sayısı 2’dir – Veriler ölçümle belirtilmiştir – Denek sayısı her iki grupta da yeterlidir (n≥30) – Gruplardaki gözlem değerleri çıkartılarak elde edilen farkların dağılımı normal dağılıma uygunsa bu test kullanılır
  • 167. Hipotezlerin kurulması: H0: D =0 H1: D ≠0 Test istatistiğinin hesaplanması: a) Gözlemlerin önceki değerlerinden sonraki değerleri çıkartılarak fark dizisi oluşturulur. b) Farkların ortalaması bulunur: D c) Farkların standart sapması bulunur: SD d) Farkların standart hatası bulunur: SD = SD / n
  • 168. e) Test istatistiği (t hesap) hesaplanır: D t= SD l t hesap l > t tablo ise H0 hipotezi reddedilir ve p< α (örneğin p<0.05) şeklinde gösterilir.
  • 169. ÖRNEK: Primer hipertansiyonlu bireylere günde iki kez 20’şer dakikalık yürüyüş önerilerek, yürüyüşe başlamadan önceki 1 haftalık ortalama tansiyon miktarı ile yürüyüşe başladıktan sonraki 1 haftalık ortalama tansiyon miktarları arasında fark olup olmadığı öğrenilmek isteniyor. Aynı bireylerin iki farklı zamandaki ölçümleri söz konusu olduğundan gruplar bağımlıdır.
  • 170. Sis. Kan Basıncı Fark Hasta Önce Sonra Önce-Sonra 1 140 125 15 2 135 120 15 3 150 145 5 4 155 155 0 5 145 150 -5 . . . , . . . , 36 140 120 20 Ortalama 146,86 138,1 8,69 S. sapma 7,06 6 7,97 6,18
  • 171. 10 8 1,0 6 SAYI ,8 4 ,5 2 ,3 0 -5,0 0,0 5,0 10,0 15,0 20,0 0,0 0,0 ,3 ,5 ,8 1,0 FARK DEĞERLERİ P-P PLOT
  • 172. 1. Hipotezlerin Kurulması: H0: D =0 H1: D ≠0 2. Test İstatistiğinin Hesaplanması S D = S D / n = 6,18 / 36 = 1,03 D 8,69 t= = = 8,44 S D 1,03
  • 173. 3. Alfa yanılma düzeyi 0.05 olarak alınmıştır. 4. İstatistiksel karar. p<0,05 Yorum: Yürüyüş sonrasında sistolik kan basıncındaki 8.69 birimlik (mm/Hg) düşme istatistiksel açıdan anlamlıdır.
  • 174. Tek Yönlü Varyans Analizi • Parametrik test varsayımları karşılanmalıdır – Gruplar normal dağılım göstermelidir – Grupların varyansları homojen olmalıdır – Gruplar birbirinden bağımsız olmalıdır – Veriler ölçümle belirlenmelidir – Her bir gruptaki gözlem sayısı 30’un üzerinde olmalıdır • İkiden fazla bağımsız grup arasında fark olup olmadığını test etmek için kullanılır • Yani iki ortalama arasındaki farkın anlamlılığı testinin 2’den çok gruba uyarlanmış halidir
  • 175. İkiden Fazla Bağımsız Grupta Tek Yönlü Varyans Analizi • Örnek: hentbol, basketbol ve futbol oynayan öğrencilerin yüzde yağ değerlerinin karşılaştırılması istendiğinde yüzde yağ değeri açısından 3 farklı spor grubu karşılaştırılırken tek yönlü varyans analizi kullanılır Hentbol Basketbol Futbol X 10,37 7,68 4,89 n1 30 30 30
  • 176. Tek Yönlü Varyans Analizi • Varyans analizi sonucunda gruplar arasında fark yoksa işlemler sona erer. • Varyans analizi sonucunda gruplar arasında fark bulunursa hangi gruplar arasında farklılık olduğu ortaya çıkarılır. Bunun için post-hoc testler uygulanır: – En küçük önemli fark yöntemi (her bir ortalama 1 kez kullanılır) – Duncan yöntemi – Tukey HSD yöntemi ikili karşılaştırma – Student-Newman-Keuls yöntemi – Dunnett yöntemi (her bir deney grubu kontrol grubu ile karşılaştırılır)
  • 177. İkiden Fazla Bağımlı Grupta nTekrarlı Ölçümlerde Varyans Analizi • Bazı çalışmalarda aynı denekler ikiden fazla sayıda ölçüme tabi tutulurlar. Özellikle farklı zamanlarda yapılan ölçümlerin kullanıldığı çalışmalar tekrarlı ölçümlerde varyans analiziyle incelenir. • Bu şekildeki deneylere denekler içi düzen (within- subject design) adı verilir. • Tekrarlı ölçümlerde varyans analizinde de parametrik testlerde olduğu gibi – Normal dağılıma uygunluk – Varyansların homojenliği – n sayısının yeterliliği kavramları yer almaktadır.
  • 178. Tekrarlı Ölçümlerde Varyans Analizi • Örnek: Spor yapan kişilerde tansiyonların zaman içindeki değişimi incelenmek istenebilir. • Bunun için aynı deneklerin spordan önce, spor yapmaya başladıktan 3 ay sonra ve 6 ay sonra yapılan tansiyon ölçümleri karşılaştırılabilir. Sporcu Önce 3 ay sonra 6 ay 175 no sonra 170 165 1 175 160 145 160 2 185 172 150 155 150 ... ... ... ... 145 140 X 172,64 164,95 153,55 önce 3 ay sonra 6 ay sonra
  • 179. ÖRNEK: Lise öğrencilerinin düzey belirleme sınavı öncesi durumluk kaygı düzeylerini belirlemek ve varolan kaygı düzeyini azaltmak amacıyla düzenlenen bir çalışmada, rasgele seçilen 25 lise 1. sınıf öğrencisi araştırma örneklemini oluşturuyor. Öğrencilerin ilk düzey belirleme sınavı öncesindeki durumluk kaygı düzeyleri belirlendikten sonra, gevşeme çalışması eğitimi veriliyor ve 2. ve 3. seviye belirleme sınavı öncesindeki kaygı düzeyleri tekrar ölçülüyor. Kaygı düzeyleri 20 maddelik durumluk kaygı ölçeği ile elde ediliyor.
  • 180. Durumluk Kaygı Puanları İlk sınav İkinci Üçüncü Öğrenci sınav Sınav 1 Öncesi 40 Öncesi 37 Öncesi 34 2 52 50 43 3 35 35 34 4 38 35 32 5 45 40 41 6 41 42 37 7 41 40 41 8 40 37 32 9 44 46 40 . . . . 25 42 41 34
  • 181. Tanımlayıcı İstatistikler Zaman Ortalama S. Sapma n I. Sınav 42,24 4,92 25 Öncesi II. Sınav 41,80 4,91 25 Öncesi III. Sınav 38,36 4,57 25 Öncesi
  • 182. Durumluk Kaygı Ortalama +- 1 Ss 50 48 46 44 42 40 38 36 34 32 30 28 N= 25 25 25 I. sınav öncesi III. sınav öncesi II. sınav öncesi DURUMLUK KAYGI ÖLÇÜMÜ ZAMANI
  • 183. HİPOTEZLERİN BELİRLENMESİ Ho: Eğitim verilmeden önceki ve eğitim verildikten sonraki dönemlerde elde edilen durumluk kaygı puanları arasında fark yoktur. H1: Eğitim verilmeden önceki ve eğitim verildikten sonraki dönemlerde elde edilen durumluk kaygı puanları arasında fark vardır. Karşılaştırma için F dağılımından yararlanılır. Hesapla bulunan F istatistiğinin elde edilmesinde kullanılan bilgiler bilgiler sıklıkla varyans analizi tablosunda özetlenir.
  • 184. Durumluk kaygı örneği için Varyans Analizi Tablosu Değişim KT Sd KO F P Kaynağı Dönemle 436.4 2 218.2 41.6 0.000 rArası Denekler 182.3 24 7.6 Arası Hata 251.7 48 5.2 Durumluk kaygı puanlarının dönemlere göre değişimi önemlidir (p<0.05). Hangi dönemler arasında fark olduğu ikişerli karşılaştırmalarla incelenmelidir. KT: kareler toplamı, Sd: serbestlik derecesi, Ko:kareler ortalaması
  • 185. Sayımla Belirtilen Verilerde Çapraz Tablo ve Ki kare analizi İki ya da daha çok değişkenin birlikte değişiminin incelenmesi çoğu zaman çapraz tablo yapımını gerektirir. İki ve daha fazla değişkenin kategorilerinin kesiştiği yerde frekansların olduğu tablolara çapraz tablo denir. Eğer incelenecek iki değişken varsa, bu iki değişkenin birlikte değişimini göstermek amacıyla oluşturulan tabloya ikili çapraz tablo denir. Üç değişkenin birlikte değişimini incelemek amacıyla oluşturulan tabloya üçlü çapraz tablo,.... denir.
  • 186. A Sağlık Bölgesindeki Nüfusun Yaşa ve Cinsiyete Göre Dağılımı Yaş Grupları Erkek % Kadın % Toplam 0 19 47.5 21 52.5 40 1-4 85 53.1 75 46.9 160 5-9 95 47.5 110 52.5 200 10-14 185 49.3 190 50.7 375 15-19 210 46.7 240 53.3 450 . . . . . . . . . . . . 85+ 50 7.6 75 6.3 125 Toplam 1655 100 1595 100.0 3250
  • 187. Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu Aile Planlaması Kullanma Kullanan Kullanmayan Öğrenim Sayı (%) Sayı (%) Toplam Okur Yazar Değil 15 25.0 45 75.0 60 İlkokul 25 41.7 35 58.3 60 Ortaokul 32 53.3 28 46.7 60 Lise 40 66.7 20 33.3 60 Üniversite 48 80.0 12 20.0 60 Toplam 160 53.3 140 46.7 300
  • 188. Öğrenim Düzeylerine Göre Aile Planlaması Kullanma Durumu 100 80 Yüzde (%) 60 Aile P. 40 Kullanan Kullanmayan 20 0 Okur Yazar İlkolul Ortaokul Lise Üniversite Değil Öğrenim Durumu
  • 189. Kİ-KARE TESTLERİ 1. Ki-kare testleri veri tipinin nitelik olduğu (kadın-erkek, iyileşti-iyileşmedi, hasta-sağlam, sosyo-ekonomik düzeyi iyi-orta-kötü,... gibi) verilerde kullanılır. 2. Ayrıca sürekli ya da kesikli sayısal veri tipinde olduğu halde sonradan nitelik veri konumuna dönüştürülen veriler arasında fark olup olmadığının incelenmesinde de kullanılır. 3. Veriler 2x2, 2x3, 3x3, 3x4, ... Boyutlu çapraz tablo şeklinde olmalıdır.
  • 190. 2x2 ki-kare testi İki yüzde arasındaki farkın anlamlılık testinin uygulandığı durumlarda istenirse 2x2 ki-kare testinden de yararlanılabilir. 2x2 ki-kare testinin avantajı, gruplardaki gözlem sayılarının az olduğu durumlar için geliştirilmiş değişik ki-kare testlerinin olmasıdır. Gruplardaki gözlem sayısının az olması durumunda ki-kare testlerinden yararlanmak daha uygundur.
  • 191. ÖRNEKLER: 2x2 (4 gözlü) ki-kare tablosu Yakınma Sigara Var Yok Toplam İçen İçmeyen Toplam
  • 192. ÖRNEKLER: 2x3 ki-kare tablosu Eğitim Sağlık Bilgisi Düzeyi İyi Orta Kötü Toplam Düşük Yüksek Toplam
  • 193. Varis Bulgusu Çalışma Pozisyonu Olmayan Toplam Olan Oturarak 26 175 201 Ayakta 44 181 225 Toplam 70 356 426 χ 2 = 3.4 p>0.05 Elde edilen sonuca göre oturarak ve ayakta çalışanlar Arasında varis bulgusu açısından anlamlı farklılık yoktur
  • 194. cinsiyet * pre op memnuniyet Crosstabulation Count pre op memnuniyet zayif orta iyi çok iyi Total cinsiyet erkek 3 18 25 3 49 kadin 3 9 6 6 24 Total 6 27 31 9 73 Ch i-S qua r e T e s ts Asymp. Sig. Value df (2-sided) 8,025a Pearson Chi-Square 3 ,046 Likelihood Ratio 7,853 3 ,049 Linear-by-Linear ,070 1 ,792 Association N of Valid Cases 73 a. cells (37,5%) have expected count less 3 minimum expected count is 1,97. Akdeniz Üniversitesi Osman Saka 194 Tıp Fakültesi
  • 195. Korelasyon Analizi ve Tahmin Kavramı
  • 196. Pearson Korelasyon Katsayısı (r) Ölçümle belirtilen iki değişken arasındaki doğrusal ilişkinin kuvveti (derecesi) ve yönü hakkında bilgi verir. -1<= r <=+1 arasında değişir.
  • 197. İlişki Azalır -1 0 +1 İlişki artar 197
  • 198. İlişkilerin Değerlendirilmesi r(±) İlişkinin derecesi 0.90 to 1.00 Çok kuvvetli 0.70 to 0.89 Kuvvetli 0.50 to 0.69 Orta 0.30 to 0.49 Düşük 0.00 to 0.29 Zayıf Olarak değerlendirilmekle birlikte ilişkinin derecesi ne olursa olsun anlamlı (p<0.05)olmalıdır. Aksi halde r ne olursa olsun (p>0.05) olması durumunda değişkenler arasında ilişkinin varlığından söz edilemez
  • 199. Boy(cm) yaş(Ay) • Egzersiz_Süresi • 60 1 Performans • 65 3 • 60 100 • 70 5 • 65 98 • 75 7 • 70 96 • 80 9 • 75 94 • 85 11 • 80 92 • 90 13 • 85 90 • 97 15 • 90 88 • 100 17 • 97 86 • 105 20 • 100 84 • 110 21 • 105 82 • 115 23 • 110 80 • 120 25 • 115 78 • 125 27 • 120 76 • 130 30 • 125 74 • • 130 72 •
  • 200. Tam İlişki r=1 100 130 95 120 90 110 performans 100 85 Boy 90 80 80 75 70 70 60 60 70 80 90 100 110 120 130 0 5 10 15 20 r=+1 25 30 Egzersiz_Süresi r=-1 Yaþ
  • 201. Tam İlişki r=1 100 130 95 120 90 110 performans 100 85 Boy 90 80 80 75 70 70 60 60 70 80 90 100 110 120 130 0 5 10 15 20 25 30 Egzersiz_Süresi r=-1 Yaþ r=+1
  • 202. Boy_cm_ Yaş_ay_ • Egzersiz_Süre • 60 1 Performans • 62 3 • 60 100 • 62 5 • 65 100 • 80 7 • 70 99 • 80 9 • 75 99 • 81 11 • 80 90 • 90 13 • 85 95 • 97 15 • 90 90 • 100 17 • 95 88 • 100 20 • 100 89 • 100 21 • 105 87 • 104 23 • 110 83 • 108 25 • 115 79 • 114 27 • 120 78 • 130 30 • 125 70 • 130 72