Olasılık ve İstatistik — 3

Aysenur Durak
5 min readAug 3, 2022
  • Olasılık (Probability)
  • Independent and Dependent Events (Bağımsız ve Bağımlı Olaylar)
  • Permutation (Permütasyon)
  • Combination (Kombinasyon)
  • Intersection, Unions and Complements (Kesişim, Birleşim ve Tamamlayıcı)
  • Conditional Probability (Şartlı Olasılık)
  • Bayes Theorem (Bayes Teoremi)

Olasılık

Olasılık temel tanımı ile bir olayın olma veya olmamasının matematiksel değeri veya olabilirlik yüzdesi olarak tanımlanır.

Değer aralığı 0 ve 1 arasında değişir. 1 olayın kesin olduğunu, 0 ise olayın imkansız olduğunu gösterir.

Burada değinilmesi gereken birkaç kavram vardır. Bu kavramları bir örnek içerisinde anlatmak çok daha yararlı olacaktır. Bunun için yazı tura örneğini verebiliriz. Elimizde bir bozuk para var olsun ve bu bozuk paranın yazı veya tura gelme olasılıpını hesaplayalım.

  • Trial: Yazı tura atma eylemi burada trial olarak adlandırılır.
  • Independent Olay: Bir bozuk paranın yazı veya tura gelmesi birbirinin sonucunu etkilemez. Bu olaylara independent olay denir.
  • Dependent Olay: Bir olayın sonucu ardından gelecek olayın sonucu üzerinde etikili ise bu olaylar dependent olay olarak adlandırılır.

Independent ve dependent olaylara örnek olarak torbadan top çekme örneğini verebiliriz. Çeşitli renklerde toplar bulunan bir torbamız olsun ve bu torbadan üç defa üst üste kırmızı renkte top çekme olasılığını hesaplayalım. Eğer çekilen top her defa torbaya tekrar atılıyor ise bu olay independent olay kategorisine girer. Ama çekilen top dışarıda tutulup deneye o top haricindeki toplarla devam ediliyorsa bu olay dependent olay olarak isimlendirilir.

  • Experiment: Her bir trial olayı experiment olarak adlandırılır.
  • Simple Event: Ortaya çıkabilecek sonuçlara simple event ismini veririz. Yazı tura örneğinde simple evetler yazı ve turadır.
  • Sample Space: Simple eventlerin, yani tüm olabilecek olayların toplamıdır. Yazı tura örneğinde S = {Yazı, Tura} olarak gözlemlenir.

Permutation (Permütasyon)

Permütasyon, bir sembolün tekararlanmasının olasılıksal ifadesi olarak tanımlanır. Temel olarak ikiye ayırabiliriz, bunlar:

  • Her sembolün yalnızca bir defa kullanılması ile elde edilen sonuç
  • Sembollerin birden fazla kullanılmasına izin verilip elde edilen sonuçtur.

Tekrarlama olmaması durumunda formülü şu şekildedir:

non-repetitive permutation

Burada bir örnek vererek formülü anlayabiliriz:

Elimizde a, b, c, d ve e isimli 5 eleman olsun. Bu elemanların üçlü şekilde sıralanması durumunun sayısını istersek

n = 5

r = 3

olarak kabul edilir ve formülün uygulanması durumunda 5!/(5–3)! = 60 sonucu elde edilir.

Eğer tekrarlanabilir olmasını istersek bu formül çok basit anlaşılabilecek bir seviyeye iner ve aşağıdaki şekli alır.

iterative permutation

burada aynı örnek ile devam edecek olursak her 3 ihtimalde de aynı sayılar gelme olasılığı bulunur ve 5*5*5 işlemi ile 125 sonucunu buluruz.

Combination (Kombinasyon)

Kombinasyon bir nesne grubu içerisinden sıra gözetmeksizin yapılan seçimlerdir. Formülü aşağıda gösterilmiştir.

Combination Formula

a, b, c, d, e harflerinden 3 tanesini seçme işlemini kombinasyon yardımı ile yaparız.

Permütasyon sıralama, kombinsyon seçme işlemidir.

Intersection, Unions and Complements

(Kesişim, Birleşim ve Tamamlayıcı)

Basit küme işlemleri ne kadar kolay olsalar da olasılıktaki en önemli kavramlardır.

Intersection ( kesişim ): iki olayın aynı anda olması durumudur.

Unions ( birleşim ): iki olaydan en az birinin olması durumudur.

Aşağıdaki tabloda bu durumlar görselleştirilmiştir.

Intersection, Unions and Complements

Conditional Probability ( Şartlı Olasılık )

Şartlı olasılığı anlamaya .alışırken bir örnekle başlamak daha yararlı olacaktır.

Bir zar atıldığında üst yüzde bulunan sayının 2'den büyük olduğu bilindiğine göre çift sayı olma olasılığı nedir?

Yukarıdaki soru bize şartlı olasılığın mantığını basit bir biçimde gösterir. Bu sorunun cevabı için elemanları analizlemeye ve formüle ihtiyacımız var. Formülü şu şekildedir:

Conditional Probability

Sorumuzu formüle uygulayacak olursak:

E ( Evrensel küme ) = { 1, 2, 3, 4, 5, 6 }

B ( İlk şart ) = { 3, 4, 5, 6}

A ( İkinci Şart ) = { 2, 4, 6 }

A ve B nin kesişimi = 2 eleman ise cevabımız 2 / 4 = 1/2 = 0,5 olur.

Bayes Theorem ( Bayes Teoremi )

Bayes teoremi probabilistik sonuçlara dayanan önemli algoritmalardan biri olan Bayes teoremi, makine öğrenmesinde de sıkça kullanılır. Olasılık konusunda da oldukça önemli bir yere sahiptir. Bu bölümde anlatılan tüm kavramları Bayes teoremini anlamak için kullanacağız. Tanımını yapacak olursak, bir olasılık değerini, bildiğimiz diğer bazı olasılık değerlerini kullanarak hesaplama fikridir. Formülü şu şekildedir:

Bayes Theorem

Bu teoremi anlamak için örenkler üzerinden gitmek yararlı olacaktır.

Bir araştırmaya göre her 43 çocuktan 1 tanesi, yetişkinlikte ortaya çıkan belli bir hastalığa yakalanmakta ve tam güvenilir olmamasına rağmen yapılan test sonuçlarına göre, hastalıklı bir çocuğun testi %80 pozitif, sağlıklı bir çocuğun testi ise %10 pozitif sonuç vermektedir. Bu bilgilere göre test sonucu pozitif olan bir çocuğun gerçekten hasta olma olasılığı nedir?

P(A) : Çocuğun hasta olması olasılığı = 1/43

P(B) : Testin pozitif çıkması olasılığı = 1/43 * 0.80 + 42/43 * 0.10 = 5/43

P(A|B) : Pozitif çıkan testin hastalık çıkma olasılığı ( sorulan bu )

P(B|A) : Hastalıklı çocuğun testinin pozitif çıkma olasılığı = 0.80

P(A|B) = P(B|A)*P(A)/P(B) = (0.80 * 1/43) / (5/43) = 0.16 = %16 bulunur.

Ali kaşındığını söylüyor. Kedi alerjisi için bir test var, ancak bu test her zaman doğru değil: Gerçekten alerjisi olan insanlar için, testin “Evet” sonucu vermesi %80 oranında. Alerjisi olmayan insanlar için, testin “Evet” sonucu vermesi %10 oranında (“false positive “). Nüfusun %1'inde alerji varsa ve test “Evet” çıkıyorsa, Ali’nin gerçekten alerji olma olasılığı nedir?

A: Alerji, B: Testin Evet çıkması

P(A) : Alerji olasılığı = 0.01

P(B) : Testin evet çıkma olasılığı = ? (hesaplamamız gerekecek)

P(A|B) : Testin evet çıkması durumunda alerji olasılığı = ?? (istenen sonuç)

P(B|A) : Alerji olması durumunda testin evet çıkma olasılığı = 0.80

Önce P(B) yi bulalım. Testin evet çıkma olasılığını alerjisi olan ve olmayanlar için yani tüm nüfus için hesaplayacağız.

P(B) = 0.01 * 0.80 + 0.99 * 0.10 = 0.107 bulduk.

Şimdi bulunacak bir sonuç kaldı tüm verileri denkleme yerleştirip sonucu alalım.

P(A|B) = P(A) * P(B|A) / P(B) = 0.01 * 0.80 / 0.107 = 0.075 => yaklaşık %7 bulunur.

Okuduğunuz için teşekkürler.

--

--