ChatGPT’nin arkasında neler oluyor Allah Aşkına!!!

Muslum Yildiz
Academy Team
Published in
11 min readAug 18, 2023

ChatGPT, sadece ilk beş gününde bir milyon kullanıcıya ulaşarak büyük bir dikkat çekmiş ve teknoloji dünyasında en çok konuşulan konu haline gelmiştir. ChatGPT’ın hızlı yükselişi hem insan dilini anlama hem de üretme yeteneklerindeki etkileyici potansiyelini yansıtmaktadır. Hatta son kullanıcıyı direkt etkileyen son 30 yılın en büyük değişim hamlesi diyenler de var. Bu makale, ChatGPT’ın karmaşık iç mekanizmasını ayrıntılı bir şekilde açıklamayı amaçlamaktadır. Doğal Dil İşleme (NLP) konusunu, makine öğrenimi tekniklerinin inceliklerini ve Transformer’ların gücünü ele alarak, ChatGPT’ın potansiyelini daha etkili bir şekilde kullanmanıza yardımcı olacak bilgiler sunmayı hedeflemektedir. Ayrıca, bu alandaki en son teknolojik gelişmeler hakkında bilgi edinmenizi sağlayacaktır.

ChatGPT’ye Bir Bakış

Makine iletişimini ve yapay zekâyla etkileşimi birleştiren ChatGPT, doğal dil işleme ve makine öğrenimi algoritmalarının güçlü bir bileşimiyle çalışan bir yapay zekâ destekli sohbet botudur. Onu diğer benzerlerinden ayıran özellik, bağlamı anlama ve kullanıcıların taleplerine uygun yanıtlar sunabilme yeteneğinin olağanüstü derecesidir.

Geleneksel sohbet botlarının sık sık konuşmanın inceliklerini anlamada zorlandığını yaşayarak tecrübe etmişsinizdir. ChatGPT, bağlamı olağanüstü şekilde anlama yeteneğiyle dikkat çeker. İlgili bağlamı çözümleme, altta yatan anlamları tespit etme ve kullanıcının amacına uygun yanıtlar verme yeteneğine sahiptir.

ChatGPT’nin gerçek gücü, zekasını besleyen devasa veri kümesinden ortaya çıkar. GPT-3.5 tabanlı olarak ChatGPT’nin eğitim verileri yaklaşık 45 terabayttır. Bir terabaytın yaklaşık 83 milyon sayfa bilgiye eşit olduğunu düşündüğünüzde bu devasa veri kümesi, ChatGPT’ye sözcükler ve ifadeler arasındaki desenleri, ince ayrıntıları ve ilişkileri anlaması için eşsiz bir ölçekte yetenek kazandırır. Bu, geniş bir yelpazede sorulara koherent (mantıklı ve tutarlı) ve anlamlı yanıtlar üretme kapasitesini sağlar.

ChatGPT’nin çalışma prensibi, iki temel aşamaya dayanmaktadır: girdiyi anlama ve yanıt üretme. İlk aşamada, kullanıcılar tarafından yazılan metin girdileri, ChatGPT’nin sinir ağının başlangıç kısmına yönlendirilir. Bu kısım, girdinin anlamını ve bağlamını anlamaya çalışır. Ardından, ikinci aşamada yanıt üretilir. Bu aşamada, girdinin anlaşılmasıyla elde edilen bilgiler kullanılarak yanıt üretilir.

Not: İnsan beyninin karmaşıklığı ve yapay zeka ile olan bağının detaylarına hakim olmak isterseniz.. Aşağıdaki linkten ulaşabilirsiniz.
İnsan beyninin karmaşıklığı ve yapay zeka ile olan bağı: ANN, RNN, LSTM ve GRU

Doğal Dil İşleme (Natural Language Processing) ve Önemi:

Doğal Dil İşleme (NLP), dilbilimi ve bilgisayar biliminin kesişim noktasında yer alır. Bu teknoloji, bilgisayarların insan dilini anlamalarına, yorumlamalarına ve yeni şeyler üretmelerine olanak sağlar. NLP’nin günlük yaşantımızdaki etkileri, otomatik düzeltme özelliklerinden intihal tespit sistemlerine kadar birçok alanda hissedilir. ChatGPT için, NLP temel bir yapı taşıdır. Model, kullanıcının girdisini anlamalı ve insana benzer yanıtlar üretebilmelidir. Ancak burada bir sorun vardır: Bilgisayarlar insanlar gibi doğal dil anlayamazlar. Peki, nasıl oluyor da bir bilgisayar metinleri anlamayı başarıyor?

Bilgisayarlar, metin verilerini anlamak ve işlemek için karmaşık algoritmalar ve veri yapıları kullanırlar. Metinlerin içerdiği anlamı anlayabilmek için metinlerin özünü yakalayacak şekilde sayısal veya vektör tabanlı bir yapı oluşturulur. Bu yapılar, bilgisayarların metinleri anlama kapasitesini artırır ve metinlerin altında yatan anlamı çıkarmalarını sağlar. Bu sayede, bilgisayarlar insanlar gibi metinlerin derinlemesine anlamını çözebilir ve insana benzer metinler üretebilir hale gelirler.

Bu yapılar, kelime vektörleri veya gömme (embedding) temelli yöntemlerle oluşturulabilir. Her kelime, bir vektörle temsil edilir ve bu vektörler arasındaki uzaklık veya benzerlik hesaplamaları ile kelimenin anlamı yakalanır. Bu sayede, bilgisayarlar farklı kelimelerin anlamsal ilişkilerini anlayabilir ve metindeki bağlamı çözebilirler.

Ayrıca, metinlerin içerdikleri yapıları ve ilişkileri anlamak için derin öğrenme modelleri kullanılır. Bu modeller, metindeki desenleri ve ilişkileri tespit edebilir, böylece metnin anlamını daha iyi kavrayabilirler. Özellikle Transformer tabanlı modeller, metin içeriğini katman katman işleyerek anlamın daha derinlemesine anlaşılmasını sağlar.

Bilgisayarların metinleri anlamak için bu tür yapılar oluşturması, insana benzer metinler üretme yeteneğini de beraberinde getirir. Çünkü metnin içeriğini anlamak, metindeki dil yapısı, anlam ve tonlamayı kavramak anlamına gelir. Bu nedenle, bu yapılar sayesinde bilgisayarlar, metinlerin altında yatan anlamı yakalayabilir ve insana benzer, akıcı metinler üretebilirler. Bu, metin tabanlı uygulamalarda ve yapay zeka destekli metin oluşturma alanında büyük bir ilerlemedir.

Generative Pre-trained Transformers (GPT):

Perde arkasında yatan, ChatGPT’nin entelektüel kabiliyetlerini besleyen temel, Generative Pre-trained Transformer (GPT) mimarisidir. “Transformer” terimi, sinir ağı yapısının girdileri bağlam içerikli çıktılara dönüştürme yeteneğine bir göndermedir. Bu temel, OpenAI’nin sahip olduğu bir yapıdır ve ChatGPT’nin yeteneklerinin temelini oluşturur.

ChatGPT, dil işleme yeteneklerini inanılmaz bir şekilde geliştirmek için Generative Pre-trained Transformers (GPT) mimarisini kullanır. Bu dönüştürücü mimari, yapay zeka alanında devrim niteliğinde bir adım olarak kabul edilir ve ChatGPT’nin başarısının temelini oluşturur.

Generative Pre-trained Transformers (GPT), önceden geniş bir veri kümesi üzerinde öğrenme yeteneği ile bilinir. Bu veri kümesi, metinler, belgeler, web sayfaları ve daha fazlasını içerir. ChatGPT, bu veri kümesini kullanarak dilin yapılarını, kalıplarını ve anlamını anlamaya başlar. Bu pre-trained (ön eğitimli) yapısı sayesinde, ChatGPT metinleri anlama ve üretme yeteneklerini geliştirirken, temel dil bilgisini de kazanır.

GPT mimarisi, dil işleme görevlerinde olağanüstü sonuçlar elde etmek için tasarlanmıştır. Bu mimari, metinlerdeki bağlamı ve ilişkileri anlamada son derece etkilidir. Metindeki kelimelerin ve cümlelerin birbirleriyle nasıl etkileşime girdiğini anlamak için dikkat mekanizmasını (attention) kullanır. Bu sayede, metinlerdeki anlamı daha derinlemesine kavrayabilir ve bu anlamı kullanarak insan benzeri metinler üretebilir.

ChatGPT’nin kullanımı, bu GPT mimarisinin ne kadar güçlü olduğunu gösterir. ChatGPT, öğrenilen bilgileri anında kullanarak metinleri analiz eder, anlar ve buna uygun cevaplar üretir. Bu, konuşma tabanlı uygulamalarda, metin üretiminde ve hatta dil anlama araştırmalarında büyük bir atılımı temsil eder.

Generative Pre-trained Transformers (GPT) mimarisi, ChatGPT’nin dil işleme yeteneklerini yükseltmek için kullanılan temel teknolojidir. İnsan beyninin mükemmelliğini yansıtan bu mimari, dilin derinlemesine karmaşıklığını çözme ve zenginliğini anlama konusundaki olağanüstü yetenekleriyle, ChatGPT’nin doğal dilde son derece etkileyici bir performans sergilemesine olanak tanır. Bu, metinleri anlama, mantıksal bağlantıları kurma, yaratıcı ifadeler oluşturma ve çeşitli dil görevlerini başarma yetenekleri açısından insan beyninin üstün kapasitesini yansıtmada önemli bir adım olarak kabul edilir.

Model Eğitimi:

ChatGPT’nin eğitimi çeşitli makine öğrenimi tekniklerini içerir:

ChatGPT karmaşık sinir ağı desenlerini kullanarak bağlamı anlamak ve cevap üretmek için işlev gösterir. Öğrenme süreci, bağlamı anlama ve cevap üretimi aşamalarından oluşan gözetimsiz ve denetimli öğrenme (unsupervised and supervised learning) aşamalarını içerir. İnsan gözetimi, yapay zekanın etik ve ahlakı öğrenmesine yardımcı olur ve geliştirme süreci insan beyninin gelişiminden daha hızlıdır.

1. Veri Toplama ve Önişleme (Data Collection and Preprocessing):

Gözetimsiz öğrenme süreci, metin verisi toplama ve ön işleme aşamalarıyla başlar.

Veri toplama aşamasında, internet üzerinden farklı kaynaklardan geniş bir metin verisi havuzu toplanır. Bu kaynaklar arasında blog yazıları, haberler, makaleler, web sayfaları, forumlar ve daha fazlası bulunur.

Toplanan metin verileri, büyük bir çeşitlilik ve kapsam içermelidir, böylece model farklı konularda ve dil yapılarında etkili bir şekilde çalışabilir.

Toplanan veri, önişleme aşamasından geçirilir:

Tokenizasyon: Metin, en küçük anlamlı birimlere (tokenlar) bölünür. Bu genellikle kelimeler veya alt metin parçacıklarıdır. Örneğin, “Merhaba, nasılsınız?” cümlesi “Merhaba”, “,”, “nasılsınız” ve “?” gibi tokenlara ayrılır.

Temizleme: Metin içindeki gereksiz özel karakterler, bağlantılar, HTML etiketleri ve diğer gürültü unsurları temizlenir.

Düşük Harf Dönüşümü: Metin genellikle küçük harflere dönüştürülür, böylece büyük-küçük harf farkı göz ardı edilir.

Stopwords Kaldırma: Anlamı olmayan “ve”, “ama”, “veya” gibi yaygın kelimeler çıkarılır, çünkü genellikle cümlenin anlamını taşımayan kelimelerdir.

Lemmatizasyon: Kelimeler kök formlarına dönüştürülür. Örneğin, “koşuyor”, “koştu”, “koşmak” gibi farklı çekimler “koşmak” kelimesine dönüştürülür.

2. Gözetimsiz Öğrenme (Unsupervised Learning) ve Transformer Mimarisi:

ChatGPT’nin çalışma prensibi, insan bebeklerinin dil öğrenme süreciyle benzerlikler taşır. Bebekler, çevrelerindeki yetişkinlerin konuşmalarını dinleyerek ve çeşitli konuşmaları içselleştirerek dil öğrenirler. Benzer şekilde, ChatGPT, internet üzerinden topladığı metin verilerini analiz ederek dil öğrenir. Bebeklerdeki gibi, ChatGPT’nin sinir ağları da kendiliğinden bağlantılar kurar, kalıpları tanır ve yanıtlar üretir. Bu süreç, unsupervised learning (gözetimsiz öğrenme) olarak adlandırılır.

ChatGPT’nin öğrenme süreci, öncelikle gözetimsiz öğrenme aşamasıyla başlar. Bu aşamada, yapay zeka büyük miktarda metin verisini işlerken hiçbir insan gözetimi veya rehberlik olmadan çalışır. İnternet üzerinde bulunan blog yazıları, makaleler, haberler, web sayfaları ve daha fazlası gibi çeşitli metin kaynaklarından veri toplanır. Bu metinler, konuları, bağlamları ve dil örüntülerini içerir.

ChatGPT, bu veriyi işleyerek metinler arasındaki benzerlikleri, bağlantıları ve kalıpları anlamaya çalışır. Özellikle, metinlerdeki kelime sıklıkları, cümle yapıları ve terimler arası ilişkileri keşfetmeye çalışarak metinleri gruplar ve konuları anlamaya çalışır. Bu aşama, ChatGPT’nin metinleri analiz ederek farklı konuların ve bağlamların farkındalığını kazanmasını sağlar. Gözetimsiz öğrenme aşamasının sonucunda, ChatGPT’nin sinir ağları metinlerdeki desenleri ve bağlantıları anlayabilir hale gelir. Bu aşamada, metinlerin konu kategorizasyonu, anahtar kelimelerin tanınması, dil örüntülerinin belirlenmesi gibi özniteliklerin çıkarılması gerçekleşir. ChatGPT’nin bağlamı anlama yeteneği bu aşamada gelişir ve farklı metinleri anlamada daha iyileşmiş bir yetenek kazanır.

Bu aşamada, bağlamı anlama ile ilgilenen sinir ağı, internet üzerinden büyük miktarda metin verisiyle karşılaşır. Yapay zeka, insan yönlendirmesi olmaksızın bu veriden desenleri, ilişkileri ve konuları belirler. Benzer bilgileri bir araya getirir ve kavramlar arasında bağlantılar kurar. Metin verisi, büyük ölçekli Transformer modeli ile işlenir. Transformer, dil modellemesinde çığır açan bir mimaridir ve metin içindeki uzun mesafe bağımlılıkları yakalayabilir.

Transformer mimarisi, yapay zeka alanında devrim niteliğinde bir yenilik olarak kabul edilir. Bu yenilik, dil işleme ve metin anlama alanlarında önemli bir ilerleme sağlamıştır. Önceki modeller, metinlerdeki uzun mesafe bağımlılıklarını ele almakta zorlanırken, Transformer mimarisi bu sorunu etkili bir şekilde çözmüştür. Dikkat mekanizması (Attention), her bir kelimenin metindeki diğer kelimelerle olan ilişkilerini anlamak için kullanılır. Bu sayede uzun ve karmaşık cümle yapılarındaki ilişkileri yakalayarak daha doğru anlam çıkarılabilir. Aynı zamanda, paralel işleme yeteneği sayesinde büyük metin verileri hızla işlenebilir. Bu özellikleriyle Transformer, çeşitli dil modelleri ve metin tabanlı görevlerde olağanüstü başarı elde etmiştir. Hem gözetimli öğrenme aşamalarında hem de takviyeli öğrenme süreçlerinde, Transformer mimarisi sayesinde daha akıllı, anlamlı ve bağlamsal olarak zengin cevaplar üretmek mümkün hale gelmiştir. Bu yönüyle Transformer’lar, dil işleme ve yapay zeka alanında harika bir atılımın temelini oluşturmuştur.

Encoder ve Decoder Blokları: Transformer, birçok tekrarlayan Encoder ve Decoder bloğundan oluşur. Encoder’lar metin içindeki öznitelikleri çıkarırken, Decoder’lar ardışık tokenlerin tahminlenmesi için kullanılır.

Dikkat (Attention) Mekanizması: Transformer, dikkat mekanizması kullanarak her bir tokenin diğer tokenlarla olan ilişkilerini anlar. Bu, metin içindeki bağlamı yakalayabilmek için önemlidir.

3. Denetimli Öğrenme (Supervised Learning) ve İnsan Gözetimi:

Gözetimsiz öğrenme aşamasının ardından, ChatGPT denetimli öğrenme aşamasına geçer. Bu aşamada insan gözetimi ve rehberliği devreye girer. Kullanıcılardan gelen girdi ve taleplerle ilgili doğru cevapları üretmeyi öğrenmek için ChatGPT, insanlar tarafından yönlendirilir. Denetimli öğrenme aşamasında, insan hakemler veya eğitmenler, ChatGPT’nin ürettiği cevapları değerlendirir. Doğru, yanlış, uygun veya uygunsuz cevaplar arasında ayrım yaparlar. Bu geri bildirim, ChatGPT’nin cevap üretme yeteneğini geliştirmesine yardımcı olur. İnsan gözetimi sayesinde, ChatGPT etik ve ahlaki sınırlamaları öğrenir ve yanlış cevaplarını düzeltebilir.

Gözetimsiz öğrenme sonucunda elde edilen model, verilen sorulara mantıklı cevaplar üretmeyi öğrenmek için denetimli öğrenme aşamasına geçer.

İnsanlar tarafından sağlanan girdi ve çıktı örnekleri kullanılarak model eğitilir. İnsanlar, gerçekçi ve anlamlı cevaplar üretmesi için modeli yönlendirir.

Eğitim verisi, genellikle gerçek insan cevapları ve girdilerini içerir. Model, bu eğitim verileri üzerinden token seviyesindeki ağırlıkları ayarlayarak girdilere uygun cevapları üretmeyi öğrenir. ChatGPT’nin eğitimi iki aşamada gerçekleştirilir. İlk aşamada, girdi anlama ağına, internet üzerinden toplanan metin verileri yüklenir. Bu aşama, yaklaşık bir yıl sürebilir ve milyonlarca GPU (Grafik İşlem Birimi) kullanır. İkinci aşamada ise, yanıt üretme ağı, insan denetimli eğitim ile öğrenir. İnsanlar, üretilen yanıtları değerlendirir ve düzeltir. Bu şekilde ahlaki ve etik standartlar ChatGPT’ye aktarılır.

Sonuç olarak, ChatGPT’nin öğrenme süreci gözetimsiz öğrenme aşamasıyla başlar, metinleri analiz ederek konu bağlamlarını ve dil desenlerini öğrenir. Denetimli öğrenme aşamasında ise insan gözetimiyle cevap üretimi geliştirilir. Bu iki aşama birlikte çalışarak, ChatGPT’nin kullanıcılara daha anlamlı, uygun ve kaliteli yanıtlar sunmasını sağlar.

4. Takviyeli Öğrenme (Reinforcement Learning):

ChatGPT belirli bir çıktı olmadan çeşitli girdi verilerine maruz kalır. Ön eğitim temeli üzerinden desenleri, bağlamı ve ilişkileri geliştirir. Bu, ChatGPT’yi çeşitli girdilerle anlamlı, bağlamında ve ilgili şekillerde yanıt verme yetisiyle donatır. Denetimli öğrenme sonrasında, takviyeli öğrenme aşaması eklenir. Bu aşama, daha iyi cevaplar üretmek için insan denetçilerin puanlama geri bildirimlerini kullanır.

Bir “denetleyici” model, cevapları üretir ve insan denetçiler, üretilen cevapları puanlar. Daha yüksek kaliteli cevaplar daha yüksek puan alır.

Model, cevapların kalitesini artırmak için puanlama geri bildirimlerine göre optimize edilir.

Cevapları optimize etmek için ödül modeline dayalı olarak öğrenir. Model, olumlu ve olumsuz geri bildirimlere dayanarak cevaplarını geliştirmeyi öğrenir. Bunu, bir köpeğin komutları öğrenmesiyle karşılaştırabiliriz. Doğru davranışlar ödüllendirilirken, hatalar cezalandırılır ve köpek zaman içinde doğru davranışları öğrenir. ChatGPT da aynı şekilde, yanıtlarını geliştirerek öğrenir.

Sonraki aşamada geliştiriciler, ChatGPT’yi olası çıktılara ödüller veya sıralamalar atamaya yönlendirir. Farklı potansiyel yanıtlar arasından en iyi cevapları ayırt ederek, ChatGPT yüksek kaliteli sonuçları tanımlama yeteneğini öğrenir ve böylece bağlama uygun yanıtlar sunma kapasitesini artırır.

5. İteratif İlerleme ve Yeniden Eğitim (Iterative Progress and Re-training) :

Denetimli öğrenme aşaması boyunca, ChatGPT cevap üretimini insanlar tarafından değerlendirilmiş ve puanlanmış cevaplar üzerinden geliştirir. Bu süreç tekrar edilir ve yapay zeka, daha iyi ve daha uygun yanıtlar üretmeyi öğrenir. İnsan gözetimi ve geri bildirim, ChatGPT’nin cevapları iyileştirmesine ve daha yüksek kaliteli yanıtlar üretmesine yardımcı olur.

Denetimli ve takviyeli öğrenme aşamaları tekrar edilir. Model sürekli olarak daha fazla eğitim verisi ve insan puanlama geri bildirimleriyle beslenir.

Model, yanlış veya zayıf cevaplar üzerinde çalışarak performansını geliştirir.

Eğitim verileri sürekli olarak güncellenir ve modelin cevap üretme yetenekleri iyileştirilmeye çalışılır.

6. Servis Hizmeti ve Kullanıcı İnteraksiyonu (Service Deployment and User Interaction):

Eğitim süreci tamamlandığında, ChatGPT hizmete sunulur.

Kullanıcılar, metin girdileriyle ChatGPT’ye sorular sorar veya konuşurlar.

ChatGPT, öğrenilen dil modelini kullanarak anlamlı ve akıllı cevaplar üretir.

7. Sürekli İyileştirme ve Güncelleme (Continuous Improvement and Updates):

Kullanıcı geri bildirimleri ve kullanım verileri sürekli olarak toplanır.

Bu veriler, ChatGPT’nin performansını değerlendirmek ve iyileştirmek için kullanılır.

Yeni veriler ve geri bildirimlerle modeller güncellenir, böylece daha doğru ve kullanışlı cevaplar üretilir.

Bu makalede, ChatGPT’nin çalışma mantığını detaylı bir şekilde inceledik ve bu teknolojinin dil işleme alanında nasıl devrim niteliğinde bir değişim yarattığını gördük. GPT-3.5/4 tabanlı ChatGPT, metin anlama, cevap üretme ve hatta yaratıcı metinler oluşturma gibi birçok görevde benzersiz bir yetenek sergiliyor. Gelişmiş dil modellemesi ve Transformer mimarisi sayesinde, ChatGPT’nin gerçekçi ve akıllı cevaplar üretme kapasitesi göz kamaştırıcıdır.

Bu teknolojinin gelecekteki potansiyeli oldukça heyecan vericidir. ChatGPT’nin öğrenme süreci, daha fazla veri ve geri bildirimle sürekli olarak iyileştirilebilir. İnsanlarla daha etkileşimli ve duygusal olarak zengin metinler üretme yeteneği geliştirildikçe, öğrenen bir yapay zeka modeli ile daha kişiselleştirilmiş deneyimlerin kapısı aralanabilir. ChatGPT’nin sağlık, eğitim, müzik, edebiyat ve daha birçok alanda yaratıcı çözümler sunabileceği bir geleceği hayal etmek heyecan vericidir.

Sonuç olarak, ChatGPT’nin çalışma mantığı sadece metinlerle değil, aynı zamanda hayal gücümüzü de genişletiyor. Dilin gücünü ve yapay zekanın potansiyelini bir araya getirerek, ChatGPT gibi teknolojiler geleceğin iletişimini ve bilgi işlemesini şekillendirecek önemli araçlar olacaktır. Geleceğe dair bu heyecan verici yolculukta, hem teknolojiye hem de insanlığın değerlerine adım adım ilerlemeliyiz.

--

--