Bilişsel Bilim Ne Kadar Zor? — Rich, Haan, Wareham, van Rooij

CogIST
CogIST
Published in
20 min readJan 30, 2022

--

Özgün Adı: How hard is cognitive science?
Çevirmen: İrem Çelik
Editör: Oya Özağaç

Patricia Rich

Felsefe Bölümü, Bayreuth Üniversitesi, Almanya

Ronald de Haan

Mantık, Dil ve Hesaplama Enstitüsü, Amsterdam Üniversitesi, Hollanda

Todd Wareham

Bilgisayar Bilimi Bölümü, Newfoundland Memorial Üniversitesi, Kanada

Iris van Rooij

Donders Beyin, Biliş ve Davranış Enstitüsü, Radboud Üniversitesi, Hollanda

Bilişsel Bilim Ne Kadar Zor?

ÖZ

Bilişsel bilimin kendisi bilişsel bir aktivitedir. Yine de, hesaplamalı bilişsel bilim araçları nadir olarak bilişsel bilimcilerin düşünmesini (sınırlarını) araştırır. Burada, bunu hesaplama düzeyinde (computational-level) modelleme ve karmaşıklık analizi (complexity analysis) kullanarak gerçekleştiriyoruz. Bilişsel bilimcilerin karşılaştığı temel bir çıkarım probleminin idealize edilmiş biçimsel bir modelini sunuyoruz: Bir sistemin davranışlarının gözlemlerinin verilmiş olduğu bir durumda, bu davranışları makul bir biçimde üretebilecek bilişsel süreçlerin çıkarımı. Bu problemin varyantlarını farklı açıklama seviyelerinde ele alıyoruz ve her seviyede çıkarım probleminin izlenemez (intractable) ve hatta hesaplanamaz (uncomputable) olduğunu kanıtlıyoruz. Bu durumun bilişsel bilim açısından ne ima ettiğini tartışıyoruz.

Anahtar Kelimeler: bilişsel bilim felsefesi, biçimsel epistomoloji (formal epistemology), dışaçekim (abduction), hesaplamasal karmaşıklık (computational complexity), izlenemezlik (intractability)

GİRİŞ

Bir bilişsel sistemin davranışını ve içsel mekanizmasını açıklamak isteyen, Dr. Conjectura isimli bir bilim insanı hayal edin. Girdi-çıktı davranışlarının üst düzey (high-level) fonksiyonel açıklamalarından düşük düzeyli işlem (lower-level process) ya da mekanik açıklamalarına uzanan farklı anlamsal birim (granularity) düzeylerindeki açıklamalarla ilgileniyor olabilir [1] [2] [3] [4] [5] [6]. Dr. Conjectura’nın karşı karşıya olduğu birtakım zorluklar şimdiye kadar fark edilmiş ve çeşitli seviyelerde çalışılmıştır. Geleneksel olarak, belirsizliğin oluşturduğu zorluklar odak noktası olmuştur (ör. veriden istatistiksel çıkarım etkileri [statistically inferring effects from data], tümevarım problemleri ve genellenebilirlik, verilere göre teoride eksik belirlenim [underdetermination]). Bu yazıda biz, tüm bu belirsizliğin ortadan kaldırılmış olması halinde bile, bilişi açıklayabilmenin önünde büyük bir engel kalacağını gösteriyoruz. Bilhassa, Dr. Conjectura’nın çözmeyi amaçladığı çıkarım problemleri (inference problems) hesaplamasal olarak izlenemezler (computationally intractable) ve hatta bazıları hesaplanamazdır. Bu da bize, yalnızca belirsizliği (uncertanity) ortadan kaldırmak veya yanıtlamak için kullanılan tekniklerle bilişi açıklayamayacağımızı gösterir; bu görev daha temel bir biçimde zordur ve farklı tür stratejiler gerektirir.

Enerjinin çoğunun nereye harcandığına dayanarak, bilişsel biliminin başlıca zorluğunun yeterli ve yüksek kaliteli ampirik delillerin toplanması olduğu söylenebilir. Bu fikir, (büyük ölçüde “tekrarlanabilirlik krizi” ile (replication crisis) ortaya çıkmış olan) güncel bilimsel reformların hangi etkilerin gerçek, hangilerinin hayali olduğuyla ilgili belirsizliği azaltmaya yönelik uygulamalar ve prosedürler tasarlamaya odaklanmış olması gerçeğiyle daha da güçlendirilebilir [7] [8]. Bu yaklaşımların yardımcı mı olduğu yoksa engel mi oluşturduğu tartışma konusudur [9] [10] [11], fakat tartışmanın seyri adına bu zorluğun çözüldüğünü ve deneylerimizin ve istatistiksel analizlerimizin sadece gerçek sonuçları ortaya koyacağını varsayalım. Ancak hâlâ, mevcut sonuçların gelecek gözlemlere dair çıkarım yapmadaki yetersizliğinden kaynaklanan büyük bir problem mevcuttur: tümevarım problemi [12] [13]. Dr. Conjectura, insanların belirli bir şekilde davrandığını ya da bir deney sırasında beyinde belirli bir bölgenin aktive olduğunu gözlemlemiş, ama bu gözlemleri bağlamlar ve zamanlar bazında nasıl genelleyeceğiyle ilgili kararsız kalmış olabilir.

Fakat tümevarım probleminin de (the problem of induction) çözüldüğünü ve hatta Dr. Conjectura’nın şimdi ve gelecekteki tüm gerçeklere tam ve otomatik erişiminin olduğunu varsayalım. Bu durumda tahminleri doğru olurdu, ancak Dr. Conjectura bize bilişsel fenomenlerin doğru açıklamalarını da sağlayabilir miydi? Geriye az bir iş kalmış gibi görünebilir ama açıklama hâlâ eksiktir. Hem büyük miktarda veri pratik bir zorluk yaratır, hem de teori, veriler tarafından (herkesçe bilinen şekilde) eksik belirlenmiş olur [14]. Dr. Conjectura, bu yeni teori tarafsız olduğu için daha doğru olduğundan değil, daha basit ve işe yarar olduğu için gelecekteki gözlemcilerin teoriyi daha uygun bir alternatif ile değiştirmeleri için bir açıklama sunmuş olabilir [17].

Şimdi, bu zorluğun da ortadan kalktığını varsayalım; bir şekilde kesin olarak biliyoruz ki, kabul edilebilir tek bir teori verimizle tutarlıdır. Birçoğunun, geride ciddi teorik zorluklar kalmadığını ve Dr. Conjectura’nın artık isteyebileceğimiz tüm cevapları bize kesin olarak sağlayabileceğini düşündüğünü farz ediyoruz. Bu makalenin amacı, bunun doğru olmadığını kanıtlamaktır: Bilimsel çıkarım problemlerinden tüm belirsizlikler kaldırılmış olsa bile, açıklamalar üretebilmenin önünde çıkarım problemlerinin hesaplama karmaşıklığından kaynaklı ilkesel engeller bulunmaktadır. Bu çıkarım problemlerimizin, cevaplarımızın tamamıyla belirsizliğe (uncertainty) yönelik olarak geliştirilmesiyle çözülemeyeceğini göstermektedir. Dahası, bilimsel çıkarımın önündeki hesaplama engellerine yönelik stratejiler bulmayı düşünmenin diğer engeller ele alındıktan sonraya ertelenmesi de bir hata oluşturmaktadır; Dr. Conjectura uzun vadede başarıya götürmeyecek olan kısa vadeli çözümlerle vakit kaybetmediyse, metodolojik öneriler, her şeyin düşünüldüğü olası ihtimaller açısından değerlendirilmelidir.

Makalenin geri kalanı şu şekilde organize edilmiştir. İlk olarak, Dr. Conjectura’nın bir bilişsel sistemin işleyişiyle ilgili açıklamalar üretirken karşılaştığı çıkarım problemlerinin idealleştirilmiş modellerini sunacağız. Sonrasında, bu çıkarım problemlerinin ne kadar zor olduklarını, hesaplamasal ve karmaşık matematik teorilerinin kavramlarını, araçlarını ve tekniklerini kullanarak analiz edeceğiz. Son olarak, hâlihazırda var olan çalışmalara göre sonuçlarımızı konumlandıracağız ve sonuçlarımızın bilişsel bilimcilerin kullanımına yönelik etkilerini açıklamak için kurmaca bir diyalog kullanacağız.

Bilimsel Dışaçekimsel Çıkarımların Biçimselleştirilmesi

Bu bölümde, Dr. Conjectura’nın bir bilişsel sistem olan M’nin (bkz. Şekil 1) işleyişini açıklamaya çalışırken karşılaştığı çıkarım problemlerini biçimleştireceğiz. Genellik’i (generality) kaybetmeden, oldukça idealleştirilmiş bir senaryoyla çalışıyoruz: Dr. Conjectura’nın, hiçbir gözlemde ölçüm veya yorumlama hatasının bulunmadığı D⊆ S × B veri setine erişimi bulunmaktadır. Her çift (s, b) ∈ D, M’nin bir durumdaki (s S) gözlemlenmiş bir davranışını (b B) ifade etmektedir (bkz. Tablo 1).

Tablo 1: Varsayımsal veri seti D’nin örneklemesi. Burada, durumlar herhangi bir şey olabilir (ör. seçim problemleri, görsel görevler, sosyal durumlar veya bunların kombinasyonları). Aynı şekilde davranışlar da herhangi bir şey olabilir (ör. seçimler, hareket yörüngeleri, söz eylemleri, reaksiyon süreleri veya bunların kombinasyonları).

Dr. Conjectura, D’den, diğer bir deyişle dışaçekimsel gidimsel çıkarımlardan (abductive inference) yola çıkarak, dünyanın doğası ile ilgili art alan bilgisi (background knowledge) (ör. hesaplama zaman alır, fiziksel sistemler mekanla sınırlıdır) ve varsayımları da hesaba katarak, M için fonksiyonel ve/ya algoritmik seviyede açıklamalar üretmeyi hedeflemektedir. Biz bu fikri şu şekilde biçimselleştiriyoruz: Dr. Conjectura, fonksiyonel seviyede bir açıklama olarak bir fonksiyon F∈ F arar; F fonksiyonlar sınıfı (class of functions) olmak üzere F : S → 2B art alan varsayımlarını karşılar.

Şekil 1: Bir (bilişsel) sistem olan M, bilinmeyen bir FM fonksiyonunu bilinmeyen bir AM algoritması kullanarak hesaplıyor. Dr. Conjectura M’nin davranışlarını çeşitli durumlarda gözlemliyor ve gözlemler ve art alan bilgisiyle (background knowledge) tutarlı bir fonksiyon F ve algoritma A bulmaya çalışıyor. [Resim freepik.com adresinden ögelerle oluşturulmuştur]

Benzer biçimde, Dr. Conjectura, A’nın algoritmalar sınıfını gösterdiği ve ilgili art alan varsayımları karşılayacak şekilde F ∈ F fonksiyonunu hesaplayabildiği bir A∈ A algoritmasını algoritmik seviyede açıklamaya çalışır.

Dr. Conjectura, bir şekilde bu F ve A açıklamalarını, muhtemelen doğal dil (natural language), matematiksel gösterim ve şematik krokilerden faydalanarak tanımlamaya ihtiyaç duyacaktır [18] [19]. Dr. Conjectura’nın fonksiyonel seviyede açıklamalar için kullandığı bilimsel dil sistemini, herhangi bir LF dizisini (bir fonksiyonun tanımı) haritalandırabilen bir LF fonksiyonu ve kümeler S ve B olmak üzere, bir LF (S, B, LF) = F : S → 2B fonksiyonu olarak biçimlendiriyoruz. Pratikte, bu tür tanımlamalar gelişigüzel uzunlukta yapılamazlar; bilimsel bir makale ya da kitaba uygun uzunlukta olmaları gerekir. Bu sebeple, biz Dr. Conjectura’nın çalışılabilir ve yayınlanabilir olarak değerlendirdiği tanımlamaların uzunluğunda bir üst sınır (K) varsayıyoruz.

Şu ana kadar elimizde olan biçimlemelerle artık, Dr. Conjectura’nın fonksiyonel seviyedeki açıklamalarla birlikte ortaya çıktıkça çözdüğü çıkarım problemlerini daha kesin bir biçimde tanımlayabiliriz (algoritmik seviye varyantını ilerde ele alacağız):

(F , LF) — DIŞAÇEKİMSEL ÇIKARIMLAR (ABDUCTIVE INFERENCE)

Verilen: Gözlemlenmiş durum-davranış ikilileriyle (s, b) ∈ S × B, bilinmeyen bir F tipi FM : SM → 2BM fonksiyonuyla birlikte, S SM, B BM ve üst sınırın K ∈ ℕ ∪ {∞} olduğu bir D veri seti.

Çıkarım: D ile tutarlı F ∈ F fonksiyonunun LF ∈ LF tanımı, öyle ki, böyle bir LF’in varlığı halinde LF en fazla K uzunluğunda. Aksi halde “hiç”.

Burada ‘tutarlı’dan kastın ne olduğu bir dereceye kadar yoruma açıktır ve tıpkı farklı F sınıflarında ve LF dillerinde olduğu gibi farklı yorumlardan çıkarım problemlerinin nispeten farklı varyantları elde edilir. Sunumun kolaylığını sağlaması için, ‘tutarlı’ kelimesini her bir (s, b) ∈ D için bF (s) anlamında kullanalım. Tartışma bölümünde açıklayacağımız gibi, analizlerimiz ve bulgularımız tanımdaki varyasyonlara karşı dirençlidir.

Dışaçekimsel çıkarım problemini bir örnekle açıklıyoruz: Diyelim ki Dr. Conjectura insanların seçim davranışını açıklamakla ilgileniyor. Bir meslektaşı, Dr. Mensura, Dr. Conjectura’ya her kişiye seçimlerin (ör. kişinin aralarından seçim yapabileceği seçenekler kümesi) sunulduğu durumlar (s ⊆ S) ve kişinin yapmış olduğu belirli bir seçim (b ∈ B) (verilen kümeden seçilmiş bir veya daha fazla seçenek) olmak üzere büyük bir veri seti D ⊆ S × B sağlıyor. Önceden almış oldukları davranışsal ekonomi eğitimine dayanarak, Dr. Conjectura katılımcının davranışını tanımlayan fonksiyonel seviyedeki açıklamanın (LF) takip eden sabitler (F ) ile oluşturalacağını varsaymaktadır: Her kişinin (p) seçim opsiyonlarını (x ∈ X ) öznel değerle (up (x) ∈ ℝ ) eşleştiren bir kullanım işlevi (up (x) ∈ ℝ ) vardır ve kişi, bazı asgari öznel değer ölçütlerini (t) karşılayabilmek için opsiyonlar seçer. Diğer bir deyişle, kişi (p), seçeneklerin bir alt kümesi (X ⊆ X ) olacak şekilde, x ∈ { x | x ∈ X ve up (x) ≥ t } bir seçim yapacaktır. Bu varsayımla, D değeri için dışaçekimsel çıkarım problemi, D ile tutarlı bir işlevler (up) ve değerler (tp) kombinasyonu aramaya indirgenmektedir. Elbette bu açıklamanın aynı zamanda bir şekilde (LF içinde, ör. yukarıda bizim de kullandığımız gibi doğal dil ve formel gösterimlerin bir karışımı kullanılarak) tanımlanması ve kullanılabilirliği açısından çok uzun olmaması gerekmektedir.

Bu, Dr. Conjectura’nın F ile ilgili yapabileceği varsayımlardan sadece birine örnektir. Buna ek varsayımlar da yapabilir (ör. kullanım işlevlerinin geçişkenlik (transitivity) gibi rasyonalite ilkelerini karşılaması); çok daha farklı varsayımlarda da bulunabilir (ör. tercihlerin dinamik olarak yapılandırılıp herhangi bir seçenek-seviyesi kullanım işlevi (option-level utility function) ile tanımlanamaması [20]); veya neredeyse hiç varsayım yapmayabilir (ör. karar verme işleminin bazı (hesaplanabilir veya işlenebilir) işlevlerle açıklanabilir olması durumu gibi [21]. Bu durum, (F,LF ) — DIŞAÇEKİMSEL ÇIKARIMLAR’ın model uyumu (model fitting) gibi dar kapsamlı veya model belirleme (model specification) ya da teori oluşumu (theory formation) gibi geniş kapsamlı olarak yorumlanabileceğini gösterir.

Bir sonraki aşamada, Dr. Conjectura’ın dışaçekimsel çıkarım problemini algoritmik seviyede tanımlıyoruz. Burada yine, üst (ör. bilişsel) düzeyden düşük (nöral) düzeye uzanan herhangi bir anlamsal birim (cognitive granularity) seviyesindeki açıklamaların ifade edilebilmesi için bir dile (LA) ihtiyaç duyulmaktadır. Bu dilin fonksiyonel-seviye dili (LF) ile temel farklılığı, LA’nın yapıcı (constructive) olması gerekmesidir. Örneğin LF, Dr. Conjectura’nın, X ‘ seçenekler kümesinin sunulduğu bir karar vericinin, bu x’e nasıl ulaşıldığını açıklamadan, herhangi bir x ∈ { x | x X’ ve up (x) ≥ t } seçeceğini varsaymasına olanak tanımıştır. Bunun aksine, bir kişinin tam olarak nasıl küme üyeliğini hesapladığının düşünüldüğünü algoritmik seviyede bir açıklamanın belirtmesi gerekmektedir. LA, yalnızca Dr. Conjectura’ın çalışılan sistem tarafından gerçekleştirilebilir olduğuna inandığı hesaplama adımlarına izin veren bir programlama diline benzetilebilir. Tıpkı fonksiyonel seviye açıklamalar gibi, algoritmik seviye açıklamaları yayınlanabilir olmalıdır ve bu sebeple (üzerinde hesaplama yaptıkları etki alanları sonsuz olmasına rağmen)gelişigüzel uzunlukta olamazlar. Dolayısıyla, Dr. Conjectura’ın algoritmik seviyede açıklama problemini şu şekilde tanımlayabiliriz:

(A, LA ) — DIŞAÇEKİMSEL ÇIKARIM

Verilen: S SM, B BM ve üst sınır K ∈ ℕ ∪ { ∞ } olmak üzere, bilinmeyen bir A tipi algoritma AM tarafından üretilmiş, bilinmeyen bir FM : SM → 2BM fonksiyonunu hesaplayan, gözlemlenmiş durum-davranış ikilileri (s, b) ∈ S × B ile birlikte bir D veri seti.

Çıkarım: D ile tutarlı bir fonksiyon FA’yı hesaplayan bir algoritma A ∈ A’nın tanımı LA ∈ LA, öyle ki, böyle bir LA’nın var olması durumunda LA en fazla K uzunluğunda. Aksi halde “hiç”.

(A, LA) — DIŞAÇEKİMSEL ÇIKARIM ve (F, LF) — DIŞAÇEKİMSEL ÇIKARIM’ın aslında iki farklı problem olduğunu dikkate almak gerekmektedir; bunlardan biri için uygun olan çözüm, otomatik olarak diğerinin de çözümü olmaz. Tek yönlü olarak bunu açıkça görmek mümkündür: Bir F fonksiyonunun LF tanımı, F’yi hesaplamak için bir A algoritması belirtmez. Tersinin de geçerli olduğunu görebilmek için, A algoritması, LA tanımının F fonksiyonunun hesaplanması için bir yöntem belirleyebilirken, kendi içinde LF açıklayıcı dilinde F’yi doğal olarak kısaca tanımlayamadığını unutmamak lazım [22] [23] [24].

Hesaplamalı Karmaşıklık Analizi

Dr. Conjectura’ya yöneltilen çıkarım problemlerinin ne kadar zor olduğunu analiz etmek için hesaplama ve karmaşıklık matematiğinden kavramlar ve kanıt tekniklerinden yola çıkacağız. Başlangıç noktamız, anahtar tanımları ulaşılabilir bir formda amaçlarımıza yetecek biçimde sunmak olacak. Daha kapsamlı ve formel işleyişler için şu ders kitapları incelenebilir; [25] [26] [27] [28] [29].

Tanım 1 (Hesaplanabilirlik) Bir bağıntının (ör. fonksiyon veya çıkarım problemi) Q : X → 2Y, her x X için y Q (x)’i hesaplayabilen en az bir algoritma olması halinde hesaplanabilir olduğu söylenebilir. Aksi halde Q’nun hesaplanamaz olduğunu söylenir.

Tanım 2 (P-Zaman Algoritması) n girdi boyutu ve c sabit olmak üzere O (nc) zamanında yürütülebilen bir A algoritmasının polinomsal zaman (polynomial-time) algoritması olduğu söylenebilir.

Üstel zaman (exponential time) algoritmaları gibi polinomsal zamandan daha uzun süren algoritmalar genellikle, küçük girdi boyutları haricinde, tüm girdi boyutları için izlenemez olarak kabul edilir [30] [31]. Neden olduğunu gösterebilmek adına, D veri setiyle birlikte dışaçekimsel çıkarım problemini makul boyutta |D|= 100 olarak hesaba katalım. Bu durumda, O (cn) zamanında c = 2 ile çalışan bir üslü zaman algoritması, 1030 adımlık mertebeler halini alır; bu da evrenin oluşumundan bu yana geçen saniye sayısından (<1018 saniye) daha fazladır. |D| = 500 için bu sayı 10150’luk bir mertebe olurdu ve evrendeki atom sayısını (< 1082 atom) geçerdi. Bu da demektir ki, böyle bir data grubu için bir beynin ya da makinenin–ya da evrendeki bütün atomlar kadar fazla paralel hesaplama kanalları olan beyin ya da makinelerin birleşiminin–bu çıkarımsal süreci tamamlaması için evrenin oluşumundan bu yana geçen bütün zaman kadar uzun bir sürenin geçmesi gerekir. Şu kadarı söylenilebilir ki, pratikte, izlenemez dışaçekimsel çıkarımlar orta ile büyük girdi boyutları için uygulanabilir değildir.

Tanım 3 (İzlenebilirlik) Bir Q bağıntısının, kendisini hesaplayabilecek en az bir polinomsal zaman algoritması olması halinde izlenebilir olduğu söylenebilir. Aksi halde, Q izlenemez.

Tanım 4 (İzlenebilir Doğrulanabilirlik) Bir Q : X → 2Y bağıntısının, (i) x boyutunda polinomsal zamanda yürütülen bir algoritma olması ve (ii) verilen x ve y’nin y Q (x) geçerliliğini doğrulayabilmesi halinde izlenebilir şekilde doğrulanabilir (tractably verifiable) olduğu söylenebilir.

Eğer Q izlenebilir (tractable) ise, aynı zamanda izlenebilir şekilde doğrulanabilirdir (tractably verifiable). Bunun tam tersinin ise genel olarak yanlış olduğu varsayılır [32].

Burada, hem bilişsel sistemler tarafından hesaplanan fonksiyonların hem de bilişsel bilimcilerin kendilerinin çıkarımsal kapasitelerinin izlenebilirlik gereklilikleri ile sınırlı olduklarını kabul ediyoruz (daha kapsamlı bir argüman için bkz. [33]). Bu varsayıma dayanarak şu soruyu soruyoruz: Bilişsel bilim ne kadar zordur? Bu soruyu ele almak için, genel olarak Conjectura teoremleri olarak bahsettiğimiz bir dizi teori türetiyoruz (bkz. detaylar ve ispatlar için ek materyaller ve genel bir bakış için Tablo 2):

Teorem 1 Eğer LF ∈ LF açıklamasının uzunluğunda bir sınır yok ise (ör. K = ∞), bu durumda (F, LF) –bazı LF için DIŞAÇEKİMSEL ÇIKARIM hesaplanamaz.

Teorem 1’e göre, LF izlenebilir olsa bile (ve dolayısıyla F sadece izlenebilir fonksiyonlar içerir.) geçerlidir. Bu durum, (F, LF) — DIŞAÇEKİMSEL ÇIKARIM’ın hesaplanamaz oluşunun sebebinin açıklanacak olan bilişsel sistemin aşırı karmaşık olmasından ziyade açıklamanın uzunluğunda bir sınır bulunmamasından kaynaklanır. Bu yorum Teorem 2 ile doğrulanmaktadır.

Teorem 2 Eğer LF ∈ LF açıklamasının uzunluğunda bir sınır (K ∈ ℕ) var ise, bu durumda (F, LF) — DIŞAÇEKİMSEL ÇIKARIM tüm LF için hesaplanabilir.

Her ne kadar açıklamaların uzunluğundaki sınırlar hesaplanabilirlik sağlasa da, şimdi gösterileceği üzere, henüz izlenebilirlik (tractability) sağlamamaktadır.

Teorem 3 Eğer LF ∈ LF açıklamasının uzunluğunda bir sınır (K ∈ ℕ) var ve LF izlenebilir (ve dolayısıyla F yalnızca izlenebilir fonksiyonlar içerir) ise bu durumda, (F, LF) — DIŞAÇEKİMSEL ÇIKARIM bazı LF için izlenemezdir.

Teorem 3, verilen herhangi bir veri seti için (sınırlı boyutları olan) izlenebilir fonksiyonel açıklamalar üretebilecek herhangi bir polinomsal zaman algoritmasının var olamayacağını göstermektedir. Mümkün olan şey ise, şimdi gösterileceği üzere, açıklamaları tesadüfen bulunduğunda izlenebilir olarak tanımaktır.

Teorem 4 Eğer LF ∈ LF açıklamasının bir sınırı (K ∈ ℕ) var ve LF izlenebilir (ve dolayısıyla F yalnızca izlenebilir fonksiyonlar içerir) ise bu durumda, (F, LF) — DIŞAÇEKİMSEL ÇIKARIM tüm LF için izlenebilir şekilde doğrulanabilirdir.

M’nin sonlu durum otomatı (finite state automaton) gibi sınırlı bir hesaplamalı aracı olduğu varsayıldığında bile Teorem 4 geçerlidir.

Şu ana kadar listelenen teoremler fonksiyonel seviyede açıklamalarla ilgidir. Algoritmik seviyede dışaçekimsele yönelik de tamamen bunlarla benzeşik bir teoremler grubumuz bulunmaktadır.

Teorem 5 Eğer LA ∈ LA açıklamasının uzunluğunda bir sınır (ör. K = ∞) yoksa, bu durumda (A, LA) — DIŞAÇEKİMSEL ÇIKARIM bazı LA için hesaplanamazdır.

Teorem 6 Eğer LA ∈ LA açıklamasının uzunluğundan bir sınır (K ∈ ℕ) varsa, bu durumda (A, LA ) — DIŞAÇEKİMSEL ÇIKARIM tüm LA için hesaplanabilirdir.

Teorem 7 Eğer LA ∈ LA açıklamasının uzunluğunda bir sınır (K ∈ ℕ) varsa ve LA izlenebilir (dolayısıyla A yalnızca izlenebilir fonksiyonlar içerir) ise, bu durumda (A, LA ) — DIŞAÇEKİMSEL ÇIKARIM bazı LA için izlenemezdir (intractable).

Teorem 8 Eğer LA ∈ LA açıklamasının uzunluğunda bir sınır (K ∈ ℕ) varsa ve LA izlenebilir (dolayısıyla A yalnızca izlenebilir fonksiyonlar içerir) ise, bu durumda (A, LA) — DIŞAÇEKİMSEL ÇIKARIM tüm LA için izlenebilir şekilde doğrulanabilirdir (tractably verifiable).

Tartışma

Araştırmamıza, gözlemlerimizde hiçbir belirsizlik olmasaydı ve ilgili tüm veriye erişebiliyor olsaydık bilişsel bilim ne kadar zor olurdu sorusunu sorarak başladık. Conjectura teoremleri, böyle ideal bir durumda bile gözlemlerimizle tutarlı açıklamalar üretebilmenin, etkili herhangi bir dışaçekimsel çıkarım sürecine karşı koyduğunu ortaya koymaktadır (sonuçlara genel bir bakış için bkz. Tablo 2). Bulgularımızın etkilerini ortaya koymadan önce onları literatür çerçevesinde konumlandırıyoruz.

Bilişsel bilim camiasının bir kısmı bulguların sezgilere aykırı (unintuitive) olduklarını ve hayal kırıklığı uyandırdıklarını düşünürken, diğerleri şaşırmayacaklardır çünkü en azından 1960’lara dayanan ve özünde benzer sonuçlara sahip birçok negatif teorik sonuç bulunmaktadır. Göze çarpanların çoğunu, hesaplamalı ve klasik öğrenme teorisi [34] [35] [36] [37] ve bilimin bilişsel bilimi oluşturmaktadır [38]. Araştırmanın alanları, amaçları, genellenebilirlik dereceleri ve ele aldıkları bilimsel problemler farklılık göstermektedir. Bu var olan yaklaşımlarla bizim biçimselleştirdiğimiz arasında birkaç önemli fark bulunmaktadır.

Örneğin; tümevarım, tahmin etme veya test edilebilirlik yerine biz, açıklama yapmaya odaklanıyoruz [39 [40]. Sınırda öğrenilebilirlik (learnability in the limit) [41] [42] yerine hesaplamalı karmaşıklığı (computational complexity) inceliyoruz. Daha genel biçimselleştirmelerin [43] [44] tam tersine, bilişsel sistemin art alan varsayımlarına dayanarak geriçıkarım problemi özelinde modelleme yapıyoruz. Ancak modellerimiz, dışaçekimselin Bayesçi [45] [46] ya da tutarlı (coherentist) [47] [48] modellerinin tam tersine, bilişsel bilimdeki tüm açıklayıcı hesaplamalı çerçeveleri kapsayacak kadar geneldir. Özetle, biçimselleştirmelerimiz bilişsel bilimcilerin ilgilendiği spesifik, tanımlanabilir dışaçekimsel çıkarım problemlerinin ne kadar zor olduğunu göstermemize olanak sağlamaktadır.

Her ne kadar olumsuz sonuçların doğası gereği, çözümlemeden çevresinden dolaşılacak “çözüm” olmasa da, hangi olumsuz sonuçların bu spesifik problemler için geçerli olduğunu belirtmek önemlidir. Bunu, makine öğrenmesinin, öğrenme problemlerinin hepsine uygulanabilecek mükemmel bir algoritma yoktur [49] anlamına gelen “bedava öğle yemeği yok teoremi” (no free lunch theorem) ile karşılaştıralım; bunun bilincinde olmak önemlidir çünkü böylece araştırmacılar her şeye uygulanabilir en iyi algoritmayı bulmaya çalışmazlar. Benzer şekilde, tüm bilişsel bilimcilerin de, her şeye en doğru cevabı verecek bir genel sürecin mümkün olmadığının ayırdına varmaları önemlidir çünkü böylece, böylesi bir sürece girmezler ve bu tür bir sonucun varlığını iddia etmezler.

Sonuçlarımızın bilişsel bilimler araştırma uygulamalarına olan etkilerinin tümünü ortaya dökmek kolay değil ve bu yazıyı okuyanların her türlü soruya, itiraza ve karşıt-sezgiselliklere (counter-intuition) sahip olabileceklerini olabileceğini düşünüyoruz. Alan sınırlılığı sebebiyle burada hepsine yer vermemiz mümkün değil. Bunun yerine bulguların etkilerini, en muhtemel kaygıları ele alarak kurgusal bir diyalogla ortaya koyacağız. Diyalogda, Dr. Conjectura (C ile ifade edilmiş) sonuçların kendi uygulamaları ile ilgisini görmeyen kuşkucu rolünü üstlenirken, R bizim cevaplarımızı yansıtacaktır.

C: Araştırmamın amacına ulaşmak için bana yardım etmeye çalışmanızı takdir ediyorum ama bunu nasıl başaracağınızı anlayamıyorum. Bu teoremlerle benim ilgim nedir? Benim verilerim hiçbir zaman teorem olacak kadar ideal sonuçlar vermedi.

R: Hangi ideal sonuç?

C: Mükemmel, hatasız gözlemlerim olduğunu varsayarak çıkarım problemlerimi biçimselleştirdiniz ancak verilerim hep eksik ve yanlış sonuçlardan oluşuyor.

R: Teoremler, ideal durumda gerçeklerle tutarlı açıklamalar bulabilmenin izlenemez olduğunu gösteriyor. İlgili gerçeklerle ilişkili daha çok belirsizlik, bu problemi nasıl daha kolay hale getirebilir? Sadece daha zor hale getirebilirmiş gibi duruyor.

C: Mantıklı. Ama siz açıklamalar için gerçekçi olmayan standartlar oluşturdunuz. Hiçbir açıklama mükemmel değildir; en iyi ihtimalle mükemmele yakın olabilir.

R: ‘Yakınlık’ derken tam olarak neyi kast ediyorsunuz?

C: Mesela, açıklamaların her zaman tüm verilerle tutarlı olması gerekmiyor.

R: Bu şekilde yüksek bir standart varsaymamız gerekmiyor. Açıklamanın, verinin yarısıyla diyelim, tutarlı olması gerekse bile, böyle ‘yarı-tutarlı’ açıklamalar üretebilmek yine de izlenemez (intractable) olurdu.

C: Oh. Bu karşıt-sezgisel (counter-intuitive).

R: Umarım bu, tanıttığımız idealizasyonlarla ilgili kaygılarını ortadan kaldırmıştır. Genel olarak, çözülmesi izlenemez olan çoğu problemin aynı zamanda, ‘yakınlık’ kelimesinin çeşitli anlamları için, yakın olarak da çözülmesi zordur.

C: Ama ben hâlâ anlamıyorum. Eğer bana mükemmel, hatasız gözlemler veriyorsanız, benim için bu veri üreten mekanizmayı anlamamın kolay olması gerekmez mi?

R: Açıklama bir bedel olmaksızın gelmiyor. Dil ve matematikle tarifini yapabileceğiniz olası mekanizmaların sayısı astronomik düzeydedir. Verilerle tutarlı bir mekanizmayı saptayan bir açıklama bulmak samanlıkta iğne aramaya benzer; bu yeri arayacak etkili genel bir süreç yoktur.

C: Ama ben hâlihazırda seçenekleri daralttım. Sadece spesifik bir bilişsel yapı [buraya favori çerçevenizi girin, ör. ACT-R, Uyarlanabilir Araç Kutusu [Adaptive Toolbox], PDP, Subsumption-Architecture, vb.] için açıklama arayışındayım.

R: Sizin yapısal bağlılıklarınıza dayanarak uygun biçimde, analizlerimiz bir seçenek olarak, olası fonksiyonların (F kümesi) alanını ve algoritmalarını (A) sınırlandırarak bu bakışı da kapsıyor. Bu genel a priori bağlılıklarla bile, alan, önemli ölçüde hesaplama gücü olan yapılar için hâlâ astronomik ölçüde büyük olmaya devam ediyor.

C: Önemli ölçüde derken neyi kast ediyorsunuz?

R: Bir sistemin sadece birkaç olası iç durumu ve tamamen basit kurallarla idare edilen davranışları olsa bile, davranışlarına yönelik açıklamalar üretebilmek izlenemez olmaya devam eder. Sizce insan bilişi bundan daha mı basittir?

C: Hayır, muhtemelen daha karmaşıktır.

R: O zaman bizim izlenemezlik sonuçlarımız sizin çalışmalarınıza uyarlanabilir.

C: Çalışmamın umutsuz olduğunu mu söylüyorsunuz? Ben hiç biliş için tatmin edici bir açıklama getirmeyi umamayacak mıyım?

R: Umutsuz demeyelim. Şans eseri tatmin edici bir açıklama bulabilirseniz, o zaman bunun farkına varırsınız.

C: (iç çekiş) Bu pek de bir plana benzemiyor.

R: Bence izlenemezlik konusu, hâlihazırda uğraştığınızdan, verinin, genellemelerinin ve teorinin özündeki belirsizlikten daha fazla cesaretinizi kırmamalı. Yine de bu durum, çıkarım çalışmalarınızın etkili bir şekilde süreç haline getirilemeyeceğini gösteriyor. Dolayısıyla bir algoritma oluşturmaya çalışmayın ya da bilimsel düşüncenizin yerini alacak, sıkı kurallar dizisi oluşturmayın.

C: Neden olmasın? Bu, neden yanlış olur?

R: Gerçekte düşündüklerinizin dışında kalan astronomik büyüklükte bir alanın küçük bir kısmında sıkışmışken, kendinizi tüm alanı araştırdığınız düşüncesiyle kandırıyor olabilirsiniz. Aynı zamanda bu, çalıştığınız sistemin gerçekten inandığınızdan daha basit olduğunu düşünmenize yol açabilir, çünkü aksi halde süreçleriniz etkili bir biçimde aynı noktada buluşmaz (converge).

C: Peki kullanabileceğim herhangi bir süreç ilerlememi engelleyebilecekse, bu durumda ben ne yapabilirim?

R: Ben süreçleştirmenin karşısında bir meta-yaklaşım öneririm. Bu, bilişsel bilimde giderek daha dar metodolojik yaklaşım setlerine odaklandığımız şu anda, daha da önemlidir. Verebileceğim en iyi tavsiye topluluğa ilişkindir: Zihni anlamak için tek umudumuz, bu topluluğun yaklaşımlarda ve farklı araştırmacıların benimseyebileceği sınırsız sayıda süreçte çoğulculuğa olanak sağlamasıdır.

C: Neden sınırsız?

R: Çünkü izlenemez problemlerin belirli sayıda paralel süreçle çözülemediği biliniyor.

C: Ama yaklaşımların sayısına bir sınır koymazsak, aynı zamanda birçok kötü yaklaşım olmaz mı?

R: Alternatif yaklaşımlara ihtiyaç olduğunu ve bunların geçerliliklerini kabul etmek, yapıcı eleştirinin önkoşuludur. Yani, yaklaşımları sağlam temellere dayandırarak eleştirebilirsiniz, ama sizi herhangi bir sabit süreci (leri/ setlerini) doğru olarak atfedip, diğerlerini de bunu benimsemeye ikna etmeye çalışmaktan vazgeçirmeliyim. Bazı meslektaşlarınızın kullandığı fazla öznel metotlardan şikâyet ettiğinizi fark ettim; yaşamalı ve size aykırı gelen bu fikirleri yaşatmalısınız.

Teşekkür

Yazarlar, metnin önceki versiyonuna yapmış oldukları faydalı yorumlar için anonim inceleyicilere ve bu araştırmaya ilham olan tartışmaları için Berna Devezer’a teşekkürlerini sunar. TW, NSERC Discovery Grant 228104–2015 tarafından desteklenmiştir. IvR; Schloss Dagstuhl’a: geri çekilmiş araştırmaya (nr. 19299) desteklerinden dolayı Leibniz Enformatik Merkezi’ne ve Netherlands Institute for Advanced Studies in the Humanities and Social Sciences (NIAS-KNAW)’a ve 2020/21 Distinguished Lorentz Fellowship ödülü için Lorentz Center’a teşekkürlerini sunar.

KAYNAKÇA

[1] Marr, D. (1982). Vision: A computational investigation into the human representation and processing of visual information. San Francisco: W. H. Freeman.

[2] Bechtel, W., & Shagrir, O. (2015). The non-redundant contributions of Marr’s three levels of analysis for explaining information-processing mechanisms. Topics in Cognitive Science, 7(2), 312–322.

[3] Anderson, J. (1990). The adaptive character of thought. Psychology Press.

[4] Egan, F. (2017). Function-theoretic explanation and the search for neural mechanisms. In Explanation and Integration in Mind and Brain Science (pp. 145–163). Oxford University Press.

[5] Jarecki, J. B., Tan, J. H., & Jenny, M. A. (2020). A framework for building cognitive process models. Psychonomic Bulletin & Review, 27(6), 1218–1229.

[6] Love, B. C. (2020). Levels of biological plausibility. Philosophical Transactions of the Royal Society B: Biological Sciences, 376(1815), 20190632.

[7] Open Science Collaboration. (2015). Estimating the reproducibility of psychological science. Science, 349(6251).

[8] Nosek, B. A., Beck, E. D., Campbell, L., Flake, J. K., Hardwicke, T. E., Mellor, D. T., . . . Vazire, S. (2019). Preregistration is hard, and worthwhile? Trends in Cognitive Sciences, 23(10), 815–818.

[9] Szollosi, A., Kellen, D., Navarro, D. J., Shiffrin, R., van Rooij, I., Van Zandt, T., & Donkin, C. (2020). Is peregistration worthwhile? Trends in Cognitive Sciences, 24(2), 94–95.

[10] Devezer, B., Navarro, D. J., Vandekerckhove, J., & Ozge Buzbas, E. (2021). The case for formal methodology in scientific reform. Royal Society Open Science, 8(3), 200805.

[11] Irvine, E. (2021). The role of replication studies in theory building. Perspectives on Psychological Science.

[12] Hume, D. (1739). A treatise of human nature. Oxford: Oxford University Press.

[13] Goodman, N. (1983). Fact, fiction, and forecast. Cambridge, MA: Harvard University Press.

[14] Quine, W. V. (1951). Main trends in recent philosophy: Two dogmas of empiricism. The Philosophical Review, 20–43.

[15] Anderson, J. (1991). Is human cognition adaptive? Behavioral and brain sciences, 14(3), 471–571.

[16] Varma, S. (2014). The subjective meaning of cognitive architecture: a Marrian analysis. Frontiers in Psychology, 5, 440.

[17] Kuhn, T. (1962). The Structure of Scientific Revolutions. Chicago: University of Chicago Press.

[18] Guest, O., & Martin, A. E. (2021). How computational modeling can force theory building in psychological science. Perspectives on Psychological Science.

[19] van Rooij, I., & Blokpoel, M. (2020). Formalizing verbal theories: A tutorial by dialogue. Social Psychology, 51(5), 285–298.

[20] Payne, J. W., Bettman, J. R., & Johnson, E. J. (1993). The adaptive decision maker. Cambridge university press.

[21] van Rooij, I., Blokpoel, M., Kwisthout, J., & Wareham, T. (2019). Cognition and Intractability: A Guide to Classical and Parameterized Complexity Analysis. Cambridge Univ. Press.

[22] Bechtel, W., & Shagrir, O. (2015). The non-redundant contributions of Marr’s three levels of analysis for explaining information-processing mechanisms. Topics in Cognitive

Science, 7(2), 312–322.

[23] Egan, F. (2017). Function-theoretic explanation and the search for neural mechanisms. In Explanation and Integration in Mind and Brain Science (pp. 145–163). Oxford University Press.

[24] Varma, S. (2014). The subjective meaning of cognitive architecture: a Marrian analysis. Frontiers in Psychology, 5, 440.

[25] Lewis, H. R., & Papadimitriou, C. H. (1997). Elements of the Theory of Computation. Prentice Hall PTR.

[26] Garey, M. R., & Johnson, D. S. (1979). Computers and Intractability: A Guide to the Theory of NP-Completeness (1st Edition ed.). New York u.a: W. H. Freeman.

[27] Arora, S., & Barak, B. (2009). Computational complexity: a modern approach. Cambridge University Press.

[28] Primiero, G. (2019). On the Foundations of Computing. Oxford University Press.

[29] van Rooij, I., Blokpoel, M., Kwisthout, J., & Wareham, T. (2019). Cognition and Intractability: A Guide to Classical and Parameterized Complexity Analysis. Cambridge University Press.

[30] Garey, M. R., & Johnson, D. S. (1979). Computers and Intractability: A Guide to the Theory of NP-Completeness (1st Edition ed.). New York u.a: W. H. Freeman.

[31] Arora, S., & Barak, B. (2009). Computational complexity: a modern approach. Cambridge University Press.

[32] Goldreich, O. (2010). P, NP, and NP-completeness: The basics of complexity theory. Cambridge University Press.

[33] van Rooij, I., Blokpoel, M., Kwisthout, J., & Wareham, T. (2019). Cognition and Intractability: A Guide to Classical and Parameterized Complexity Analysis. Cambridge University Press.

[34] Solomonoff, R. J. (1964). A formal theory of inductive inference. Parts I and II. Information and Control, 7(1 and 2), 1–22 and 224–254.

[35] Angluin, D. (1992). Computational learning theory: survey and selected bibliography. In Proceedings of 24th ACM symposium on Theory of Computing (pp. 351–369).

[36] Kelly, K. T. (1996). The Logic of Reliable Inquiry. New York: Oxford University Press.

[37] Gierasimczuk, N. (2010). Knowing one’s limits: logical analysis of inductive inference Unpublished doctoral dissertation. ILLC, Univ. of Amsterdam.

[38] Thagard, P. (2012). The Cognitive Science of Science: Explanation, Discovery, and Conceptual Change. MIT Press.

[39] Kelly, K. T. (1996). The Logic of Reliable Inquiry. New York: Oxford University Press.

[40] Kelly, K. T., & Schulte, O. (1995). The computable testability of theories making uncomputable predictions. Erkenntnis, 29–66.

[41] Gold, E. M. (1967). Language identification in the limit. Information and control, 10(5), 447–474.

[42] Solomonoff, R. J. (1964). A formal theory of inductive inference. Parts I and II. Information and Control, 7(1 and 2), 1–22 and 224–254.

[43] Gold, E. M. (1978). Complexity of automaton identification from given data. Information and control, 37(3), 302–320.

[44] Angluin, D. (1992). Computational learning theory: survey and selected bibliography. In Proceedings of 24th ACM symposium on Theory of Computing (pp. 351–369).

[45] Kwisthout, J. (2011). Most probable explanations in bayesian networks: Complexity and tractability. International Journal of Approximate Reasoning, 52(9), 1452–1469.

[46] Lipton, P. (2003). Inference to the best explanation. Routledge.

[47] Thagard, P. (1989). Explanatory coherence. Behavioral and Brain Sciences, 12(3), 435 502.

[48] Thagard, P., & Verbeurgt, K. (1998). Coherence as constraint satisfaction. Cognitive Science, 22(1), 1–24.

[49] Wolpert, D. H. (1996). The lack of a priori distinctions between learning algorithms. Neural computation, 8(7), 1341–1390.

[50] Arora, S. (1998). The approximability of NP-hard problems. In Proceedings of the thirtieth annual acm symposium on theory of computing (pp. 337–348).

[51] Garey, M. R., & Johnson, D. S. (1979). Computers and Intractability: A Guide to the Theory of NP-Completeness (1st Edition ed.). New York u.a: W. H. Freeman.

[52] Gentner, D. (2019). Cognitive science is and should be pluralistic. Topics in Cognitive Science, 11(4), 884–891.

[53] Devezer, B., Nardin, L. G., Baumgaertner, B., & Buzbas, E. O. (2019). Scientific discovery in a model-centric framework: Reproducibility, innovation, and epistemic diversity.

PLOS ONE, 14(5), e0216125.

[54] Dale, R. (2008). The possibility of a pluralist cognitive science. Journal of Experimental and Theoretical Artificial Intelligence, 20(3), 155–179.

[55] van Rooij, I., Wright, C. D., & Wareham, T. (2012). Intractability and the use of heuristics in psychological explanations. Synthese, 187, 471–487.

[56] Dow, S. C. (2008). Plurality in orthodox and heterodox economics. Journal of Phil. Economics, 1(2), 73–96.

[57] Field, S. M., & Derksen, M. (2021). Experimenter as automaton; experimenter as human: exploring the position of the researcher in scientific research. European Journal for

Philosophy of Science, 11(1), 1–21.

[58] Feyerabend, P. (1975). Against method. London: Verso.

[59] Kitcher, P. (1990). The division of cognitive labor. The Journal of Philosophy, 87(1), 5 22.

[60] Weisberg, M., & Muldoon, R. (2009). Epistemic landscapes and the division of cognitive labor. Philosophy of science, 76(2), 225–252.

[61] Thoma, J. (2015). The epistemic division of labor revisited. Philosophy of Science, 82(3), 454–472.

[62] Zollman, K. J. (2010). The epistemic benefit of transient diversity. Erkenntnis, 72(1), 17.

[63] O’Connor, C., & Bruner, J. (2019). Dynamics and diversity in epistemic communities. Erkenntnis, 84(1), 101–119.

--

--

CogIST
CogIST
Editor for

We are an independent community which is formed by a group of students who love cognitive science.