Python ile Merkezi Limit Teoremi Uygulaması

Mehmet Fatih AKCA
Deep Learning Türkiye
3 min readJul 22, 2020

Merkezi Limit Teoremi Nedir?

Merkezi Limit Teorimi , bir seriden (serinin normal dağılmasına gerek yoktur) rastgele alınan örneklemlerin(alınan örneklemin boyutunun=n 30'dan büyük olması gerekir) ortalamasının serinin ortalaması etrafında normal dağılacağını ifade eder. Alınan örneklem sayısı arttıkça (n) normal dağılıma yaklaşır (Kalabalığın Bilgeliği / Wisdom of the Crowd).

Neder Önemlidir?

Merkezi Limit Teoremi tanımda bahsettiğim gibi alınan örneklemlerin ortalamasının serinin ortalaması etrafında normal dağılmasıdır. Bu teorem sayesinde anormal durumlar yakalanabilir. Örnek vermek gerekirse nabzınız anormal bir şekilde alçak veya yüksekse bunu Merkezi Limit Teoremi ile yakalayabilirsiniz.

Python Uygulaması

Öncelikle seri oluşturalım.
0 ile 100 arasında rastgele seçilmiş 5000 elemanlı bir seri oluşturuyorum.

data = np.random.randint(101,size=5000)

Serimizi seaborn yardımı ile görselleştirelim.

#Histogram oluşturuyor.
sns.distplot(data,bins=101)
#x ve y sütununa etiket ekliyor.
plt.xlabel('Number')
plt.ylabel('Probability')
#Oluşan histogramı ekrana yazdırıyor.
plt.show()

Çıktı:

Serimizin ortalamasını yazdıralım.

print(f"Mean: {data.mean()}")

Çıktı:

Buradan anlıyoruz ki Merkezi Limit Teorimine göre örneklemlerimizin ortalaması 49.32 etrafında normal dağılacak.

Sıra geldi örneklem almaya. Öncelikle örneklemlerin ortlamasını toplamak için means adında bir liste oluşturuyorum.Ardından 1000 kere rastgele örneklem almak için, döngü yardımı ile her seferinde rastgele 100 değer alıyorum ve rastgele alınan her örneklemin ortalamasını means listesine ekliyorum.

means=[]for i in range(1,1000):

means.append(np.random.choice(data,size=100).mean())

Elde ettiğim listeyi seaborn yardımı ile görselleştiriyorum.

#Histogram oluşturuyor.
sns.distplot(means)
#x ve y sütununa etiket ekliyor.
plt.xlabel('Mean')
plt.ylabel('Probability')
#Oluşan histogramı ekrana yazdırıyor.
plt.show()

Çıktı:

Görselden anlaşıldığı gibi serimiz normal dağılmış olmasa bile rastgele alınan örneklemlerin ortalaması normal dağılmaktadır.

Rastgele oluşturulmuş serinin dağılımı üzerindeyse bu şekilde gözüküyor:

Merkezi Limit Teoremi göründüğü üzere oldukça kolaydır, buna karşın birçok analizin temelinde bu teorem yatmaktadır.

--

--

Mehmet Fatih AKCA
Deep Learning Türkiye

Sakarya Üniversitesi Yönetim Bilişim Sistemleri 4.sınıf öğrencisiyim. Makine Öğrenmesi, Veri Madenciliği, Veri Analizi ve Görüntü İşleme www.mfakca.com