R Programlama Dili Nedir ?

Rahime Yeşil
Data Runner
Published in
4 min readApr 8, 2020

R programlama dili kısaca; istatistiksel hesaplama, veri analizi ve bilimsel araştırmalarda verileri temizlemek, analiz etmek, görselleştirmek ve anlamlı hale getirmek için istatistikçiler, veri bilimcileri,veri analistleri,araştırmacılar ve pazarlamacılar tarafından yaygın olarak kullanılan bir programlama dilidir.

R Programlama Dilinin Ortaya Çıkışı

R dilinin ortaya çıkış serüveni Waterloo üniversitesinde görev alan Robert Gentleman’in üç ay boyunca ders vermek amacıyla Auckland Üniversitesi’ne gitmesi ve ortak ilgi alanlarına sahip olduğunu keşfettiği o zamanlar istatistik profösürü olan Ross Ihaka ile tanışmasıyla başlar. S dilinden türetilen ve daha sonrasında S Plus kullanıcılarının geçişini kolaylaştırmasında aktif rol oynayan R dili,1993 yılında piyasaya duyurulmuştur. İkilinin amacı her ne kadar yazılımı ticari ürüne dönüştürmek olduysa da, ETH Zürih istatistikçisi Dr. Martin Mächler’in önerisiyle R dilini özgür bir yazılım olması fikrini kabul ederek 1995 yılında R’nin kaynak kodunu bir özgür yazılım lisansı altında kullanılabilir hale getirdi(yani insanlar onu istedikleri gibi kullanabilir, değiştirebilir ve dağıtabilirler). Dil geliştikçe daha fazla kullanıcı katıldı ve bu hataların gizlenmesi için daha az yer anlamına geliyordu.1997 yılının ortalarında Ihaka, Gentleman, Mächler, Peter Dalgaard, Kurt Hornik, Friedrich Leisch ve Thomas Lumley dahil 11 kişi R’nin kaynak kodunun anahtarlarına erişerek kendilerini “R Core Team” olarak adlandırdı. Yine o sene Viyana Ekonomi ve İşletme Üniversitesi’nden Hornik ve Leisch, kapsamlı R Arşiv Ağı’nı yani CRAN’ı oluşturarak R dilinin temel bilgilerini ve dosyalarını tek bir yerden indirmeye hazır hale getirilmesini sağladı.

2000 yılında, R projesinin kullanıma hazır olduğunu düşündükleri ilk sürüm olan R sürüm 1.0.0'ı yayımlandı. Ertesi yıl, birkaç alanında sözü geçen istatistikçi veri bilimi üzerine makaleler yayınladı ve 2003 yılında bu büyüyen alana adanmış ilk akademik dergi çıkarıldı. Şu anda veri bilimcisi olarak tanımlanan insanlar için, R, CRAN ve daha geniş diğer topluluklar, kendilerini istatistiksel araçlar ve tekniklerle keşfetme olanağı sundu.

İlerleyen zamanlarda bu veri bilimcileri, R dilinin ekoloji, dil bilimi, biyoinformatik ve ağ bilimi gibi çeşitli alanlardan önemli veri türlerini ve modellerini yönetmesine yardımcı olmak amacıyla CRAN’a paketler ekledi. Yavaş yavaş R bilgisi, veri bilimi alanlarında ve faaliyetlerinde çalışmak için bir ön koşul haline geldi. Bugünlerde ise R dili sektörde bir veri bilimcinin sahip olması gereken nitelikleri arasında yer almaktadır.

R Programlama Dili Hangi Alanlarda Kullanılır?

Dünya çapında birçok analist ve veri bilimci, kurumlar için temel bir araç haline gelen R programlama dilini finanstan tutun üretim, e-ticaret, sağlık, banka, kapsamlı pazarlamaya kadar uzanan alanlardaki en zor sorunlarıyla ilgilenmek için kullanmaktadır. R’ın gerçek hayat uygulamalarını incelersek;

Twitter: Semantik kümeleme, veri görselleştirme ve kullanıcı deneyimlerini görüntülemede R dilinden yararlanır.

Facebook: Kullanıcıların etkileşimlerini tahmin etmek ve sosyal ağ grafiğini güncellemek için R’ı kullanmaktadır.

Amazon: Müşterilere çapraz ürün önerilerini geliştirmek için veri analizlerinde R kullanır.

Mozilla: Arama motoru alanında faaliyet göstermekte olan Mozilla şirketi, web etkinliklerini görselleştirmek için R’ı kullanır.

Microsoft: R dilini Azure Machine Learning ürünlerinde istatistiksel bir motor olarak ve Xbox eşleştirme( matchmaking) hizmeti için de kullanır.

Google: Arama sonuçlarını iyileştirmek, daha iyi arama önerileri sunmak, reklam kampanyalarının yatırım getirisini hesaplamak, çevrimiçi reklamcılığın verimliliğini artırmak ve ekonomik etkinliklerini tahmin etmek için R dilinden yararlanmaktadır.

Bank of America: Finansal raporlama ve finansal kayıpları hesaplamak için R kullanır.

Merck: Merck & Co. şirketi klinik araştırmalar ve ilaç testi için R programlama dilini kullanır.

Ford Motor Company: Ford, iş stratejisini ve gelecekteki tasarımlarını geliştirmelerine yardımcı olan ürün hakkındaki müşteri düşüncelerini analiz etmek için R’ı istatistiksel analizler için kullanıyor.

National Weather Service: Hava durumu tahmini ve afet tahmini için R’ı kullanır. Ayrıca, afetlerden etkilenen alanları analiz etmek için tahminlerini ve tahminlerinin görselleştirilmesi için de kullanırlar.

Python ve R Arasındaki Farklılar Nelerdir?

Veri bilimci olma yolculuğunuzda duyduğunuz ya da henüz duymadıysanız mutlaka duyacağınız programlama dilleri arasında en popüler olanlar Python ve R’dır. Veri bilimi için önemli olan bu iki programa dili, geniş bir topluluğa sahip açık kaynaklı programlama dilleridir. Her ne kadar benzer bir amaca hizmet etseler veya aynı alanda isimleri anılsa bile aralarında bazı farklıklar bulunmaktadır.

  • Python, “Bir şeyi yapmanın tek ve tercihen tek bir yolu olmalı” felsefesi üzerine tasarlanmıştır. Bu nedenle bir görevi yerine getirmek için birkaç ana paketi vardır. R ise aynı görevi gerçekleştirmek için yüzlerce pakete sahiptir.
  • R karmaşık matematiksel hesaplamaları ve istatistiksel testleri kullanmayı kolaylaştırır. Python ise sıfırdan yeni bir şey inşa etmek, uygulama geliştirmek için kullanılır.
  • R ile başlamak kolaydır çünkü daha basit kütüphanelere ve plot’lara sahiptir. Fakat, Python kütüphanelerini öğrenmek biraz karmaşık olabilir.(Bu durumun tam tersini de iddia edenler var.)
  • Python’un yaygın olarak kullanılan IDE’lerinden bazıları: PyCharm, Spyder, Thonny, Ipython. R’ın yaygın olarak kullanılan IDE’lerinden bazıları ise R Studio, Visual Studio for R, Eclipse’dir.
  • Popülerlik bakımından Python, R’a göre daha popülerdir.
  • R veri görselleştirilmesinde, Python ise derin öğrenme alanında daha iyidir.

Örnek bir çift dağılım grafiği (pairwise scatterplots) yapmak için:

R kodu:

Dataquest

Python kodu:

Dataquest

R ve R studio’yu bilgisayarınıza indirmek için öncelikle R Project ziyaret ederek buradan herhangi bir ülkenin server’ına bağlanıp kullandığınız işletim sistemini seçerek indirebilirsiniz. Ardından yapmanız gereken R Studio ziyaret edip R Studio Desktop seçeneğini seçerek tercih edeceğiniz sürümünü yüklemek olacaktır.

--

--