Yapay Zekâ Ya Araştırmayı Kurtaracak Ya Da Bitirecek
Bu tartışma akademik dünyada her gün büyüyor ve her gün yeni yüzlerce yeni bakış geliyor, çoğu da iki uçtan birinde duruyor. “AI bütün literatür taramayı bir saatte yapar, peer review öldü” diyenler bir tarafta; “AI akademik dürüstlüğün sonunu getirecek” diyenler öbür tarafta. İkisi de aynı oranda yanlış. Daha doğrusu, ikisi de yanlış sorunun cevabı.
Doğru soru “yapay zekâ kullanılmalı mı” değil. O tren kalktı. Asıl soru şu: “araştırma sürecinin hangi aşamalarında otomasyon daha mantıklı, hangilerinde insan dokunuşu olmazsa olmaz — ve neden?” Vurgu “dokunuş” üzerinde. Çünkü hâlihazırda her aşamada bir miktar otomasyon var; mesele bunun nereye, ne kadar genişleyeceği.

Zaten Kara Kutuyla Yaşıyoruz Gerçeği
Yapay zekâ tartışmasına geçmeden önce sıklıkla atlanan bir nokta var: biz zaten hiç anlamadığımız otomasyonlara güveniyoruz.
PubMed’in Best Match sıralaması nasıl çalışır? Bilmiyoruz. Google Scholar bir makaleyi neden başka birinin önünde gösterir? Bilmiyoruz. Web of Science’ın Relevance skorunun ardındaki ağırlıklar nedir? Bilmiyoruz. Embase’in mapping algoritması bir MeSH terimini nasıl genişletir? Tam olarak bilmiyoruz. Google’ın ürünü reklam, arama sonuçları “kim para verdiyse o önce gelir” mantığıyla çalışıyor. Ama yine de çoğumuz için bunlar suyun içindeki balığın suyu fark etmemesi gibi kabullenilmiş, normalleşmiş, sorgulanmıyor.
İşin daha ilginç tarafı: bir araştırmacı PubMed’e ("acute kidney injury"[Mesh] AND contrast[tiab]) AND ("2020"[PDat] : "2025"[PDat]) yazdığı an, arama sürecinin önemli bir kısmını zaten algoritmaya devretmiş oluyor. Gelen sıralamayı sorgulamadan ilk 20 sonuca bakıyor, çoğu zaman ilk sayfanın ötesine geçmiyor. Bu da bir otomasyon. Hem de şeffaf dediğimiz ama aslında olmayan versiyonu.
Buna karşın aynı araştırmacı bir AI aracına “bu konuda son beş yılın yayınlarını bana özetle” dediğinde aniden ahlaki alarmlarımız çalmaya başlıyor. Kısmen elbette haklılık payı var: kaynak şeffaflığı, halüsinasyon riski, telif sorunları, tam metin erişimi gibi gerçek sorunlar da mevcut. Ama burada bir çifte standart var: AI’dan kusursuz tekrarlanabilirlik ve şeffaflık beklerken, eski sistemlerin opaklığını hiç sorgulamadan kabul ediyoruz.
Birkaç hafta önce Embase güncelleme yaparak mapping algoritmasında bir değişiklik yaptığını duyurdu ama tam olarak ne değişti açıklamadı. Sistematik derleme protokollerimizde şu veritabanaı şu tarihte tarandı gibi cümleler yazmak zorundayız. Çünkü hepimiz biliyoruz ki bu tip algoritma değişiklikleri, geri çekilen yayınlar, geç yapılan kayıtlar gibi nedenlerle ertesi gün bile aynı arama sorgusu ile farklı sonuçlar bulabiliriz. E o zaman bu da başlı başına bir “AI kara-kutu” durumu. Ama kimse bunu öyle adlandırmıyor, ve alıştığımız için de hiç sorgulamıyoruz.
Mesele AI’yı sorgusuzca kabul etmek değil. Mesele tutarlı olmak. Otomasyonu sorguluyorsak, tüm otomasyonu sorgulayalım. Belirli bir mecranın yeni olması, eskilerin de en az o kadar opak olduğu gerçeğini değiştirmiyor.

Otomatikleştirilemeyecek Olan Temel Beceriler
Tartışmanın asıl kalbi şu sorudaydı: iyi araştırmayı iyi yapan ne? Ya da tersinden: hangi araştırma becerilerini otomatize sistemlere henüz devretmemeliyiz?
Birincisi, doğru girdileri seçme ve birleştirme yargısı. Araştırma özünde mevcut bilgilerin yeni şekillerde bir araya getirilmesidir. Bilim, her araştırmacının koyduğu tuğlalarla örülen bir duvar. Olabildiğince benzer şekil ve yapılarda, yapılış özellikleri şeffaf tuğlalar üretmeye çalışıyoruz ki duvar düzgün olsun, sağlam olsun. Ama aslında hiçbir şey yoktan var olmuyor. Mevcut bilgileri daha ilginç biçimlerde birleştiriyoruz. Bir AI, renal kolik tedavisinde IV parasetamol ile morfini karşılaştıran 47 RCT’yi listeleyebilir. Bunların hangisinin non-inferiority tasarımı kullandığını, hangisinin margin’i klinik anlamlı bir farktan türettiğini, hangisinin ITT analizinde post-randomization dışlama yaptığını da işaretleyebilir. Ama “bu çalışmaların hangisi senin klinik soruna uyuyor, hangisi senin popülasyonunla benzeşmiyor, hangisi atılmalı” kararı hâlâ insan işi. Çünkü bu karar, soruyu sormuş olan kişinin zihninde, klinik bağlamla birlikte mevcut.
İkincisi, etik, risk yönetimi ve uzun vadeli kurumsal planlama. Birçok yayıncı artık AI araçlarına içerik yüklenmesini açıkça yasaklayan hükümler koyuyor. Elsevier, Springer Nature, Wiley’nin son kullanıcı sözleşmelerine bakın. Tıp alanında çalışıyorsanız, kapalı devre araçlar (sadece verdiğiniz veriyi işleyenler, RAG’da deniyor bunlara) ile internetin tamamından beslenen genel modeller arasında kritik bir fark var. Ama uygulamada çoğu kişi bu ayrımı bilmeden kendi verisini ya da daha kötüsü başkasının verisini (hakemlikte olduğu gibi) yüklüyor. KVKK ve sağlık verisinin özel nitelikli kişisel veri olması meselesi de ayrı bir konu; bir hasta dosyasının özetini ChatGPT’ye yapıştırmak, teknik olarak veri ihlali. Bunlar da otomatikleştirilebilecek konular değil ve kurumsal karar gerektiriyor.
Üçüncüsü ve en zor tanımlananı, araştırmayı yerel kuruma ve bağlama bağlama. Deneyimli bir araştırmacı yıllar içinde biriken bir bağlamı taşır: alanın geçmiş on yılda yaşadığı metodolojik dönüşümler, hangi dergilerin hangi tasarımları yayımlamadığı, kongrelerde kurulan ilişkiler, belli bir hasta popülasyonunda tedavinin ya da yaklaşımın pratikte işe yarayıp yaramayacağı, SGK’nın hangi tedaviyi geri ödediği, hastaların gündelik hayatta nasıl davranıp düşüneceği, hekimin rutinde hangi kısayolları kullanıp süreci ve protokolü ihlal edebileceği, etik kurulun hangi konuda neye takıldığı. Bunların hiçbiri LLM’e öğretilebilir parametreler değil. Bunlar yaşanmış profesyonel deneyimin ürünü.
Yazılım dünyasındaki vibe coding tartışması ile de bu bazı paralellikler taşıyor: temel bilgisi olmayan birinin AI ile uygulama yazması, uzun vadede yazılımcıların temizlemek zorunda kalacağı bir karmaşa üretiyor. Araştırmada da aynı şey. Bilim okuryazarlığı olmadan AI araçlarının çıktılarındaki gizli eksik ve hataların anlaşılması en iyi ihtimalle zor, büyük ihtimalle de imkansız. Çünkü araç, kullananın sorduğu soru kadar iyi. Bir asistan hekim AI’ya “kontrast nefropatisinde N-asetilsistein işe yarar mı” diye sorarsa, AI ona 2003’ten bir meta-analiz dahil yirmi çalışma sunar. Eğer AI o meta-analizden sonra yayınlanan büyük RKÇ’ler göz ardı eder (PRESERVE, AMACING) ve kanıt piramidine sadık kalırsa bunu kaçırabilir.

Konuşmadığımız Faydalar
Gözden kaçırdığımız şey AI’nın araştırmaya getirdiği avantajların, özellikle de görünmeyenlerin, yeterince konuşulmaması.
Artan yayın sayısı kalite ve hakemlik yükü konusunda endişe yaratıyor; predatory journal patlaması ortada. Ama madalyonun öbür yüzü de var: daha önce zamanı, kaynağı ya da dil yetkinliği olmadığı için yayın sürecine giremeyenler artık girebiliyor. İhtisas yapan bir asistanı düşünün, ayda 6-8 nöbet tutuyor, protokol ve yazım kurallarına tam hakim değil, ingilizcesi derginin istediği yayın kalitesi düzeyinde değil. AI temelli düzenleme araçları bu açıdan gerçekten metnin kalitesini arttırıyor. Bütün bu üretimi AI diyerek toptan reddetmek hem haksızlık hem de gerçeği yansıtmıyor.
Küçük ekipler için durum daha da somut. Ulusal derneklerin çalışma grupları ya da hastanede çalışan hekimlerin bir kütüphanesi, kurumsal araştırma destek departmanı yok. Eğitim materyali güncellemek, müfredat geliştirmek, kurumsal eğitimler için literatür sentezi çıkarmak, soru hazırlamak gibi görevlerin çoğu ciddi emek yoğun işler. AI bu görevlerin önemli bir kısmını kısmen otomatikleştirebiliyor; geriye kalan zaman, gerçekten insan yargısı isteyen kısma ayrılabiliyor. Verimlilik bir lüks değil; küçük ekiplerin bu sistemde üretmeye devam edebilmesinin esas yolu.
Erişilebilirlik tarafı da yeterince konuşulmuyor. ADHD’li bir araştırmacı için bir makaleyi okumanın en zor kısmı, başlamak. AI özetiyle o ilk eşiği aşmak, “okumayacağı bir makaleyle anlamlı şekilde meşgul olmak” arasındaki farkı yaratabilir. İkinci dilde çalışan uluslararası araştırmacılar için, networkü olmayan kariyerinin başındaki akademisyenler için, akademi dışından literatürü takip etmek isteyen profesyoneller için de aynı şey geçerli. Eğer erişilebilirliğe gerçekten inanıyorsak, mevcut akademik yayın ekosisteminin dışlayıcı olduğunu kabul etmek zorundayız. AI bunu da kısmen düzeltiyor.
Bir de sayısı az ama gerçek bir grup var: yoğun klinik yükü olan klinisyen-araştırmacılar. 60 saatlik nöbet ve ameliyat dolu haftalardan sonra üç saatlik bir literatür taraması yerine, AI’nın ön elemesinden geçirilmiş 12 makaleyi okumak bu araştırmacı klinisyen türünün tükenmemesi için elzem.

Kanıt Sentezi ve Yazma
AI araçları büyük literatür kümeleri içinden örüntü çıkarmakta giderek iyileşiyor. Bulgu kümeleri, uzlaşı/çatışma noktaları, geleneksel veri tabanlarının kaçırdığı gri literatür. Ama örüntü tanıma, yorumlama ile aynı şey değil. Bir alan uzmanı şunu bilir: bu alt-alan on yıl önce metodolojik bir kırılma yaşadı; o tarihten önceki bulgular farklı bir tanımlama sistemi içinde anlam ifade ediyordu. Bir asistan AI’ya ‘kardiyojenik şokta inotrop seçiminde levosimendan vs dobutamin’ diye sorduğunda, SURVIVE ve LEVO-CTS çalışmalarını özetler: ikisi de nötr. Ama soru aslında yanlış sorulmuş olabilir. Meta-analiz düzeyinde nötr olan bir karşılaştırma, sağ ventrikül baskın yetmezliği olan alt grupta tamamen farklı davranır. AI hastanın hangi hemodinamik fenotipte olduğunu sormaz; siz sormak zorundasınız. Aracın yararı, doğru soruyu sorabilecek klinik zeminin üstüne kurulur. Bunu bir LLM’e öğretebilirsiniz ama o bilgiyi anlamlı kullanması için sorulması gereken doğru soruyu siz sormak zorundasınız.

Makaleyi AI yazıp hakemliği de AI yaparsa akademik üretim nerde?
Bu tepki ilk bakışta haklı görünüyor. Ama hakemliğin kendisi de belgelenmiş insan biaslarıyla dolu: öğle yemeği yememiş hakem, belirli bir gruba kin tutan hakem, kötü gününde olan hakem, kendi alternatif hipotezini ısrarla dayatan hakem. Hakemliğin kısmen daha teknoloji destekli hale gelmesine karşı çıkmak bence kaçırılan bir fırsat. Metodolojik tutarlılık kontrolü, istatistik hata taraması, makale yazım kılavuz uyumu (CONSORT, STROBE, PRISMA) gibi şeyler için AI insan hakemden daha tutarlı.
Uç senaryoyu hayal edilim. Literatür keşfinin, veri toplamanın, istatistik analizin ve ilk taslağın büyük ölçüde otomatikleştiği bir gelecekte, araştırmacının günü daha az okumak ve yazmak, daha çok yönetmek, prompt’lamak ve denetlemek haline gelecektir. Finansal analizde de bu dönüşüm yaşandı: analistler artık gecenin üçünde şirket bilançolarını okuyup değerlenirmiyor. Hazırladıkları modelleri ayarlayıp ve veri akışlarını yönlendiriyorlar. Finans dünyasında da hala bol miktarda inovasyon, bol miktarda insan yargısı ve bunun gibi tartışmalar devam ediyor. İnsan katkısı kalkmıyor, sadece şekil değiştiriyor.

Ne Değişmeli?
Klişeyle bitirmek yerine, kurumların, dergilerin ve araştırmacıların gerçekten farklı yapması gereken şeylere geleceğim.
Birincisi, araçları deneyin. Hem de sadece birini değil, birkaç tanesi deneyip karşılaştırın. Net bir amaçla yaklaşın: iş akışınızın hangi noktasında zaman kazanmak istiyorsunuz? Araştırma danışanlarıma şu basit soruyu soruyorum: günün hangi anında “bu işi yapmamam gerek ama yapmak zorundayım” diyorsunuz? Cevap genellikle literatür taraması, dergi yazım kılavuzu ya da raporlama formatına uydurma, ingilizce kontrol ya da abstrakt yazma oluyor. İşte AI’a o noktadan başlayın.
İkincisi, değerlendirme çerçeveleri kurun. Bir kurum olarak hangi araçların hangi koşullarda kullanılabilir olduğunu belirleyen bir politika belgeniz yoksa, bireysel araştırmacılar boşlukta karar veriyor demektir. Etik kurul önerilerinden ayrı, kurumsal düzeyde “AI Yol Haritası” türü dokümanlar — hangi verinin hangi araca yüklenebileceği, hangi yayın aşamasında AI kullanımının nasıl beyan edileceği, hangi araçların kapalı devre çalıştığı yazılmalı. Bu boşluk doldurulmalı.
Üçüncüsü, AI okuryazarlığını yeni bilgi okuryazarlığı olarak kabul edin. Tıp fakültesindeki bir öğrenci, mezun olduğunda klinik pratiğinde AI kullanacak. Buna kurum hazırlasa da hazırlamasa da olacak olan bu. Seçenek, bu adaptasyonu yönlendirmekle geride kalmak arasında. Türkçe konuşan tıp eğitimi camiasında bu konu hâlâ “kullanmasınlar” söylemiyle ele alınıyor; oysa mesele kullanıp kullanmamak değil, iyi mi kötü mü kullandıkları.
Dördüncüsü, araştırma çıktılarını nasıl ölçtüğümüzü yeniden düşünün. Yayın hacmi dramatik şekilde artacaksa — ki artıyor — değerlendirme metriklerimizin de evrilmesi gerek. Etki metrikleri, tekrarlanabilirlik standartları, gerçek katkı kanıtı; bunlar derginin adından ya da impact factor’ündan daha önemli olmalı. Türkiye’de doçentlik kriterleri, akademik yükseltme jürileri, TÜBİTAK puanlamaları — hepsi hâlâ dergiyi sayıyor, içeriği değil. Bu zaten yanlıştı; AI çağında daha da yanlış olacak.
Beşincisi, müfredatı dikkatlice yeniden tasarlayın. İlk veriler, AI’ya izin verilen eğitimlerde öğrencilerin materyalle daha derin etkileşim kurduğu, çünkü artık erişebilir ve kullanabilir hale geldikleri yönünde. Hedef “tüm kısıtlamaları kaldırmak” değil. Bazı görevler bilerek doğrudan etkileşim gerektirmeli, bazı sınavlar bilerek araçsız olmalı — tıpkı bazı sınavların not getirmemeyi gerektirdiği gibi. Ama toptan yasaklar artık savunulabilir değil. Bir asistan hekime “AI kullanma” demek, 2010’da “UpToDate kullanma” demek kadar absürd.

Son Söz
AI hakkındaki hepimiz çok şey söylüyoruz, ama büyük kısmı iki uçta: ya tamamen iyi ya tamamen kötü. Daha verimli yol, her görevin bu spektrumda nereye düştüğünü dikkatlice düşünmek; hem insanların hem makinelerin sınırlarına dair dürüst olmak; ve bu geçişi bilinçle yönetecek çerçeveleri kurmak.
LitElekt’i geliştirirken de aynı sorularla karşılaşıyorum. Sistematik derlemede başlık-özet taraması yapay zekâ için biçilmiş kaftan. Bir araştırmacının 8.000 makaleyi tek tek elemesi, hem zamanı israf eden hem de yargıyı yoran bir iş. AI ön eleme yaparsa, insan hakem 800 makaleye bakar. Ama dahil/hariç kriterlerini belirleme, sınırda makaleler için karar verme, çıkan bulguların klinik anlamını yorumlama gibi işler hâlâ evde sessiz bir köşede, keyifli bir kafede, ya da kütüphanede biraz zaman ayırıp, demli çayla, kâğıda not alarak yapılan işler. Olmaya devam edecek. Ya da en azından ben devam etmesini yürekten diliyorum.
Heather’ın özetlediği gibi söyleyeyim:
“AI buraya yerleşti, gitmiyor. O zaman ön safta olalım. Çünkü geride kalırsak, söz hakkımız da kalmaz.”