Ocak 27, 2023
11 11 11 ÖÖ
2048 Old Game Privacy Policy
Scan Text – Metin Tarayıcı Terms & Conditions
Scan Text – Metin Tarayıcı Privacy Policy
Calculator – Hesap Makinesi Privacy Policy
Calculator – Hesap Makinesi Terms & Conditions
QR Code Reader – Kare Kod Okuyucu Terms & Conditions
QR Code Reader – Kare Kod Okuyucu Privacy Policy
Show PDF – PDF Görüntüleyici Terms & Conditions
Show PDF – PDF Görüntüleyici Privacy Policy
Photo Editor – Resim Düzenleme Uygulaması Terms & Conditions
Son Yazılar
2048 Old Game Privacy Policy Scan Text – Metin Tarayıcı Terms & Conditions Scan Text – Metin Tarayıcı Privacy Policy Calculator – Hesap Makinesi Privacy Policy Calculator – Hesap Makinesi Terms & Conditions QR Code Reader – Kare Kod Okuyucu Terms & Conditions QR Code Reader – Kare Kod Okuyucu Privacy Policy Show PDF – PDF Görüntüleyici Terms & Conditions Show PDF – PDF Görüntüleyici Privacy Policy Photo Editor – Resim Düzenleme Uygulaması Terms & Conditions
R studio

Korelasyon – R’ a Giriş

Paylaşım , Takip İçin

Korelasyon (Correlation)

Korelasyon dan önce Şimdiye kadar hep tek bir değişken ile ilgilendik (bir değişkenin ortalaması,
varyansı …). Şimdi ise diyelim ki verimizde birden çok değişken var ve bu
değişkenler arasında bir ilişki var mı yok mu diye merak ediyoruz.
Örneğin derse katılan hafta sayısı ve vize notları arasında bir ilişki var mi diye
merak ediyoruz. Bunun için 10 kişiden aşağıdaki veriyi topluyoruz.

Korelasyon – R’ a Giriş

Bu veriyi yataydaki değişken hafta sayısı, dikeydeki değişken vize notu olacak
şekilde görselleştirirsek:

Korelasyon – R’ a Giriş

Bu plotta, derse girilen hafta sayısı ile
alınan vize notu arasında pozitif bir ilişki
görülmektedir. Hafta sayısı arttıkça vize
notu artar; hafta sayısı azaldıkça vize
notu azalır (iki değişken birlikte hareket
ederler). Bu durumda bu iki değişken
arasında pozitif korelasyon vardır
diyeceğiz.

Korelasyonun Hesaplanması (Korelasyonun Sayısal Olarak Ölçülmesi)

Elimizdeki veri 𝑥1, 𝑦1 , … , 𝑥𝑁, 𝑦𝑁 çiftlerinden oluşsun.
𝑥1, … , 𝑥𝑁 değişkenlerinin ortalaması 𝑥ҧ; 𝑦1, … , 𝑦𝑁 değişkenlerinin ortalaması 𝑦ത olsun.
𝑥𝑖
, 𝑦𝑖 çiftini ele alalım.
𝑥𝑖 − 𝑥ҧ , 𝑥𝑖 değişkeninin kendi merkezi olan 𝑥ҧ‘den sapmasını verir.
𝑦𝑖 − 𝑦ത , 𝑦𝑖 değişkeninin kendi merkezi olan 𝑦ത ‘den sapmasını verir.

1. 𝑥𝑖 > 𝑥ҧve 𝑦𝑖 > 𝑦ത ise bu çarpım pozitif olur (bu durumda her iki değer de
merkezinden daha büyük)
Yada
2. 𝑥𝑖 < 𝑥ҧve 𝑦𝑖 < 𝑦ത ise bu çarpım yine pozitif olur (bu durumda her iki değer de
merkezinden daha küçük).

Korelasyonun Hesaplanması (Korelasyonun Sayısal Olarak Ölçülmesi)
Sonuç olarak iki durumda da; iki değişken benzer hareket ediyorlar (ya ikisi birden
merkezlerinden daha büyük, ya ikisi birden merkezlerinden daha küçük). O halde
𝑥𝑖
, 𝑦𝑖 çifti benzerdir; ve 𝑥 ve 𝑦 değişkenlerinin korelasyonuna pozitif katkıda
bulunur.
Tersi olarak
𝑥𝑖 − 𝑥ҧ 𝑦𝑖 − 𝑦ത
çarpımında eğer:
1. 𝑥𝑖 > 𝑥ҧve 𝑦𝑖 < 𝑦ത ise bu çarpım negatif olur olur (bu durumda birinci değişken
merkezinden büyük iken ikinci değişken merkezinden küçüktür; bu iki değişken
arasında uyumsuzluk vardır)
2. 𝑥𝑖 < 𝑥ҧve 𝑦𝑖 > 𝑦ത ise bu çarpım yine negatif olur olur (bu durumda birinci
değişken merkezinden küçük iken ikinci değişken merkezinden büyüktür; bu iki
değişken arasında yine uyumsuzluk vardır)

Bu ifade sadeleştirilerek korelasyon hesaplanır:

Korelasyon – R’ a Giriş

Bu değere Pearson Korelasyon Katsayısı diyeceğiz. Bu değer her zaman [−1, 1]
arasındadır.
Eğer 𝑥 ve 𝑦 değişkenleri arasında negatif korelasyon varsa korelasyon negatiftir
−1, 0 arası değer alır;
eğer 𝑥 ve 𝑦 değişkenleri arasında pozitif korelasyon varsa korelasyon pozitiftir
(0, 1] arası bir değer alır;
eğer 𝑥 ve 𝑦 değişkenleri arasında herhangi bir korelasyon yoksa, korelasyon 0’dır.

ör. Daha önce gördüğümüz hafta – sayısı vize notu arasındaki korelasyonu
hesaplayalım.

Korelasyon – R’ a Giriş

Şu halde korelasyon 𝜌 =
504.5
48.9 ∙5526.5
= 0.97 (çok yüksek pozitif korelasyon)

R Nedir ?

R basit ara yüzlü, tamamen açık kaynak kodlu bir istatistik programıdır.
R ile ileri derece hesaplama yapabilir, elinizdeki veriyi görselleştirebilir,
manipüle edebilir, değiştirebilirsiniz.
R’da birçok hazır fonksiyon mevcuttur. Bu fonksiyonlar genelde package (yani
bir bakima library) içinde bulunur. Bunun haricinde bildiğimiz anlamda kendi
fonksiyonlarınızı da yazabilirsiniz.
R’da komut gireceğimiz konsol > yada >> satırı ile komut alır.
Bir de fraklı olarak R’da atama (assign etme) operatörü <- ‘dır. Bunu sağdan
sola bir ok gibi düşünün. Zaten herhangi bir programlama dilinde atama her
zaman soldan sağa olur
> x<-3
Not: İsterseniz atamayı bildiğimiz = ile de yapabilirsiniz, program hata vermez
>x=3

R Studio


R’ı indirdiğinizde çok basit bir ara yüzle gelir. Bu ara yüz her türlü komutu çalıştırmak için yeterli olsa da,
biz kullanım kolaylığı açısından R’ın en popüler ide’lerinden biri olan R Studio’yu kullanacağız.

R studio

Sol üst – Veri
setlerinin
ön gösterimi

Sol alt – R
Konsolu

Sağ üst – yüklü
değişkenler

Sağ alt – working
directory’deki
dosyalar

R Studio’da Working Directory’i Ayarlamak

R’da normalde getwd() komutu ile o anki working directory (wd) görülebilir; setwd() komutuyla,
örneğin setwd(“C:/Users/burak/Dropbox/Stat 20”), komutuyla wd değiştirilebilir. Fakat R
studio’da bu komutu hatırlamak zorunda değilsiniz.

R’da Package Yüklemek

R’da install.packages(“”) komutu ile package (yani library) yukleyebiliriz. Ornegin en meshur paketlerden biri data gorsellestirmede kullancagimiz ggplot2 iki paketidir:

>install.packages(“ggplot2”)

Bir paketin yüklenmesi (install) edilmesi demek o paketi hemen kullanabilecegimiz anlamina gelmez. Bunun için o paketi library komutuyla çağırmalıyız:

>library(“ggplot2”)

Daha önce install.packages() komutuyla yüklenmiş paketler R Studio’ile şu şekilde de çağrılabilir:

R Studio’da sağ altta yer alan package tab’ında yüklü paketler gösterilir. Buradan çağırmak istediğiniz paketi tıklarsanız, konsolda otomatik olarak library komutuyla bu paketi çağırmış olursunuz. 

R Studio’da Data Yüklemek (import/read etmek)

R’da txt, .csv, .xlsx ve SPSS dataları kolayca import edilebilir. Zaten normalde veriyi elimizle tek tek oluşturmayız. Onun yerine bize verilen bir data ile uğraşır, bu datayı R’da çağırırız ederiz. Örneğin xlsx uzantılı bir excel dosyasını çağırırken, önce library(readxl) komutuyla ilgili paketi yüklemek daha sonra read_excel komutuyla working directory’de olan datayı yükleriz. R Studio’da bu ara yüzü sayesinde daha kolay yapılır: 

R studio

Eğer excel’deki ilk satırınız da kolon adları yoksa bunu seçmeyiniz. Bunu seçerseniz col_names=TRUE olur . Seçmezseniz col_names=FALSE olur.

R’da Merkezi Eğilim ve Korelasyon Hesabı


R’da bir yükledigimiz Excel dosyası “data table” olarak tutulur, yani degişken turu data table’dır. Şu
şekilde bir sampleData.xlsx adında Excel dosyamız olsun:

Simdi bu datayı oyuncular adı ile R’da okuyalım (isterseniz direkt R studio ile okuyabilirsiniz,
böylece sintaksi hatırlamanız gerek kalmaz)
>oyuncular<-read_excel(“sampleData.xlsx”,col_names=TRUE)
names komutu bir data table’daki colon adlarını getirir.
>names(oyuncular)
Tek bir kolona erişmek istediğimizde $ işaretini kullanırız.

Olasılık ve İstatistik konusunun bir önceki konusu için — Tıklayınız


Paylaşım , Takip İçin
5 1 vote
Article Rating

Bir Cevap Yazın

0 Yorum
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
HAYALİNDEKİ YAZILIM
%d blogcu bunu beğendi: