İstatistik Giriş – Genel Kavramlar
Neden İstatistik? Bir şeyi anlamak/öğrenmek için öncelikle onun hakkında veri toplamamız gerekir.
Örnek olarak;
– Ekonomiyi anlamak istiyorsak geçmiş yıllara ait ekonomik verileri toplarız
(enflasyon değerleri, döviz kurları)
– Bir otomobilin ne kadar yakıt tükettiğini anlamak için önceki kullanımlara ait
kilometre-yakıt verileri
– Bir ilacin işe yarayıp yaramadığını anlamak için bu ilacı kullanan ve
kullanmayan hastalardan veri toplarız.
-Bir yolun günün hangi saatlerinde yoğun olduğunu anlamak için o yoldan daha
önce geçen taşıtların verilerini toplarız.
Toplanan veriyi anlamak, bu veriden sonuçlar çıkarmak içinse istatistiğe ihtiyaç
duyarız. Böylece herhangi bir şeyi anlamanın yolu istatistikten geçer.
Kısaca; bir şeyi anlamak için veriye ihtiyacımız vardır; veriyi analiz etmek için ise
istatistiğe ihtiyacımız vardır.

İstatiksel Analiz
Tanımlayıcı İstatistik
(Descriptive Statistics)
Elimizdeki veriyi (örneği) tanımlar,
özetlememizi sağlar.
Tanımlayıcı istatistik iki şeyi ölçer:
1. Merkezi eğilim (Central
tendency): Ortalama, medyan,
mode..
2. Dağınıklık (varyasyon): standart
sapma,kurtosis
Çıkarımsal İstatistik
(Inferential Statistics)
Elimizdeki verinin toplandığı
popülasyon ile ilgili (büyük resim ile
ilgili) çıkarım yapmamızı
sağlar. Genel bir yargıya varmamızı,
elimizdeki verinin ötesine geçmemizi
sağlar.
Tanımlayıcı İstatistik ve Çıkarımsal İstatistik
Bu iki istatistik türünün farkını anlamak için öncelikle popülasyon- örnek
kavramlarını bilmeliyiz.
Popülasyon : İlgilendiğimiz, çıkarım yapmak istediğimiz, elemanların
tamamının kümesini kast eder.
Örnek Küme (örneklem, numune, sample): Popülasyondan alınan herhangi bir
alt kümedir; elimizdeki veri setidir

Türkiye’deki tüm seçmenler
Belirli bir otobandan geçen tüm
arabalar
Bir fabrikanın ürettiği tüm mallar
Her ilden rastgele seçilmiş 100 kişinin
oluşturduğu topluluk
Bu otobandan saat 14.00-15.00
arası geçen arabalar
Fabrikanın ürettiği mallar içinden
rastgele seçilen 5000 ürün
Popülasyondan Örnek Nasıl Seçilmelidir?
Bir popülasyondan bir örnek (sample) seçilerken iki şeye dikkat edilir:
1. Seçilim rastgele (random) yapılmalıdır. Bu, popülasyondaki her bir
elemanının eşit seçilim şansının olması demektir.
2. Örnek, elde edildiği popülasyona benzemelidir. Yani popülasyonu temsil
edebilmelidir (representative olmalı).
Tanımlayıcı istatistik, örnek kümenin (elimizdeki verinin) merkezinin ne
olduğunu (en çok hangi elemanlar gözlemlendiğini) ve bu elemanların küme
içinde nasıl dağıldığını anlatır.
Tanımlayıcı istatistik içerisinde şu kavramları göreceğiz:
• ortalama, medyan, mod;
• varyasyon, standart sapma.
Çıkarımsal istatistik ise örneğin alındığı popülasyon hakkında çıkarım yapmamızı
sağlar.
Çıkarımsal istatistik içerisinde şu kavramları göreceğiz:
• hipotez testi,
• güven aralığı,
• regresyon.
ör. Tanımlayıcı istatistik: Bu verideki (elimizdeki örnekte) x değişkenin
ortalaması 44.3 tür.
Çıkarımsal istatistik: x değişkeninin bu verinin alındığı popülasyondaki
ortalaması (%95 kesinlikle) [37.8, 51.27] aralığındadır.
Neyi Ölçeceğiz?
Veri toplarken öncelikle neyi ölçeceğimize karar vermemiz gerekir. Ölçeceğimiz şey, anlamak
istediğimiz şey hakkında ayırt edici, bilgi verici olmalıdır.
Örnek olarak,
- Belirli bir yolun ne kadar yoğun olduğunu anlamak istiyorsak, o yoldan gün içinde geçen araba
sayısını ölçebiliriz. - Bir semtteki evlerin en çok hangi renkte olduğunu anlamak istiyorsak, o semtteki evlerin
rengini ölçebiliriz. - Bir sınıftaki öğrencilerin çalışkanlık düzeylerini anlamak istiyorsak, her bir öğrenicinin günde
toplam kaç saat çalıştığını yada derslerde aldıkları notları ölçebiliriz.
Ölçtüğümüz şeye değişken (variable) diyeceğiz. Burada önemli olan değişkenin popülasyonun farklı elemanları arasında değişkenlik göstermesi; böylece popülasyonun elemanlarını karakterize etmesidir!
Örneğin, bir sınıfın tüm öğrencilerinin istatistik dersinden AA alması durumunda bu ders notu değişken olamaz, öğrencileri karakterize edemez. Bu durumda kendimize başka değişken bulmamız gerekir.
Değişken Türleri (Neden – Sonuç İlişkisine Göre)
Değişkenleri neden – sonuç ilişkisine göre ikiye ayıracağız: bağımsız değişkenler
(independent variables) ve bağımlı değişkenler (dependent variables).
Kısaca:
Bağımsız değişken = neden
Bağımlı değişken = sonuç
ör. Kafeinin iştaha etki edip etmediğini anlamak istiyorsunuz.
Alınan kafein miktarı bağımsız değişken, açlığınızın miktarı bağımlı değişken.
ör. Evin büyüklüğü, evin merkeze uzaklığı, evin yaşı : bağımsız değişkenler
Evin fiyatı: bağımlı değişken
ör. Sınava kaç saat çalışıldığı: bağımsız değişken
Sınavdan alınan not: bağımlı değişken
ör. Yaş : bağımsız değişken
Göz etrafındaki çizgi miktarı: bağımlı değişken
Bağımsız Değişken – Bağımlı Değişken
Y = 3𝑋 − 4
Y= Bağımlı değişken
X= Bağımsız değişken

Diyelim ki çeşitli sıvıların bir bitkinin büyümesine olan etkilerini ölçmek istiyoruz. Bu deneyde sıvı türü bağımsız değişken, bitkinin boyu bağımlı değişken olur
Değişken Türleri (Ölçüm Seviyesine Göre)
Diyelim ki havanın sıcaklığı bizim değişkenimiz. Bu sıcaklığı iki şekilde ölçebiliriz:
1. kategorik olarak: çok soğuk, soğuk, serin, normal, ılık, sıcak, çok sıcak

2. sayısal olarak: -38.5°𝐶, -11°𝐶, 0°𝐶, 5°𝐶,46.912°𝐶,

Kategorik ve sayısal değişkenler arasındaki temel fark: kategorik değişkende
herhangi iki değişken arası bir başka değişken olacağı garanti değildir. Soğuk ve Serin değişkenleri arasında bir başka değişken yok.(Soğuktan serine atlıyor) Sayısal türdeki değişkenlerde ise iki değişken arası her zaman bir başka değişken
bulunur. Bu yüzden sayısal değişkenin bir adı da sürekli (continious) değişkendir. -11 ile 0 değişkenleri arası değişkenleri arasında
sonsuz değişken var.
Sayısal türdeki değişken daha değerlidir, çünkü yapılan ölçüm çok daha fazla
kesinlik bildirir. ör: Hava 34.12°𝐶. Bu yüzden sayısal veriye daha kaliteli
diyebiliriz.
Kategorik olarak ölçülmüş değişken ise daha az bilgi verir: Hava ılık (fakat kime
göre, neye göre??)
Şu halde değişkenleri, neden sonuç ilişkisine ilaveten ölçüm seviyelerine göre de
iki ana grup altında inceleyebiliriz: kategorik, sayısal.
Kategorik Değişken
Kategorik değişkenleri de kendi içinde iki grupta inceleyebiliriz:
Sembolik (Nominal) ve Sıralı (Ordinal).
Sembolik Kategorik Değişken
Sembolik değişkenler birer isimdir. Bu değişkenleri sıralayamayız, aritmetik işlem
yapamayız.
ör. Renkler: Bir torbadaki topların rengi değişebilir: mavi, kırmızı, yeşil.
Cinsiyet: Bir sınıftaki öğrencilerin cinsiyeti değebilir: erkek, kız.
Hasta şikayeti: Hastaların şikayeti değişebilir: mide bulantısı, ateş, tansiyon.
(anlamsızdır).
Sembolik kategorik değişkenler ile yapabileceğimiz tek işlem: iki değişken aynı mı
değil mi diye bakmaktır. Yani burada tanımlı tek operasyon: = ve ≠
ör. mavi = mavi, mavi ≠ kırmızı
Sıralı Kategorik Değişken
Sıralı kategorik değişkende ise sembolik olandan farklı olarak değişkenleri
sıralayabiliriz. Bu bize sıralama ≤, ≥, >, < operasyonlarını kullandırır.
ör. çok soğuk < soğuk < serin < normal < ılık, < sıcak < çok sıcak
ör. fakir < orta sınıf < zengin
ör. xs < s < m < l < xl < xxl
Sayısal (Sürekli) Değişken
Sayısal değişkenler genelde bir ölçüm aleti kullanılarak elde edilen değişkenlerdir.
Örneğin, kilo, boy, büyük tansiyon, kandaki demir miktarı, hava sıcaklığı…
Sayısal değişkenler de sıralamaya ek olarak bütün aritmetik işlemleri yapabiliriz.
Yani iki sayısal değişkeni toplayabilir, çıkartabilir, birbirine bölebilir yada bu
değişkenleri çarpabiliriz. Örneğin 27 kg + 41kg = 68 kg
Not: Sayısal değişkenler, sıralı kategorik değişkene dönüştürülebilir:
