“Türk Dilinde Kaç Söz Var?”: Rakamın Ötesinde Düşünmek
Selam forumdaşlar,
Bugün “Türk dilinde kaç söz var?” sorusunu birlikte kurcalayalım istiyorum. Kulağa basit geliyor ama içine dalınca sözlük tanımlarından ağız derlemelerine, akademik ölçüm yöntemlerinden gündelik dile kadar uzanan koca bir evrenden söz ediyoruz. Farklı bakış açılarını seven biri olarak, hem veri/nesnellik tarafını hem de dilin toplumsal ve duygusal boyutunu tartışmaya açmak istiyorum. Aramızda “rakam” görmek isteyenler de var, “hikâye” duymak isteyenler de. O halde aynı masaya oturalım: erkeklerin objektif–veri odaklı yaklaşımı ile kadınların duygusal–toplumsal etkiler odaklı yaklaşımını temsil eden karakterler ve argümanlar üzerinden bu soruyu derinleştirelim.
---
1) Söz mü, Kelime mi, Lema mı?—Önce Tanım
“Kaç söz var?” derken neyi sayıyoruz?
- Sözlük maddesi mi? (maddeler, bazen birden çok anlam, birleşik yapılar, varyantlar içerir)
- Kelime biçimleri mi? (koş, koşar, koştular…; türetim/çekim)
- Lema mı? (temel sözlük başlığı: git- leması altında gider, gitti, gidecek…)
- İfade ve deyimler mi? (zurnanın zırt dediği yer gibi kalıplar)
- Ağızlar ve lehçeler mi? (Anadolu’nun yerel söz varlığı, tarihsel katmanlar)
- Alan jargonu mu? (tıptan yazılımcı diline, zanaat sözlerine)
Tanımı genişlettikçe sayı büyür; daralttıkça küçülür. Bu yüzden tek bir rakam yok, yalnızca yaklaşım var.
---
2) Erkeklerin Objektif/Veri Odaklı Penceresi: “Önce Ölçelim”
Bu yaklaşımı forumdan “Mert” karakteriyle düşünelim. Mert önce ölçümün çerçevesini çizer:
- Kaynak seti: Hangi sözlük(ler), hangi derlem(ler), hangi tarih aralığı?
- Metodoloji: Lema tabanlı sayım mı, tür türevlerini (eklerle türeyen biçimler) de dahil mi ediyoruz?
- Temizleme/ayıklama: Yabancı dillerden geçici alıntılar, özel adlar, yazım varyantları nasıl yönetilecek?
- Eşikler: En az kaç bağlamda görünen birim “söz varlığının” parçası sayılır?
Mert’in masaya koyacağı veri cephaneliği şöyle olurdu:
- Sözlük envanterleri: Güncel genel sözlüklerde on binlerce madde; deyim ve atasözleriyle birlikte bu rakam daha da genişler.
- Derlem tabanlı sayım: Ulusal derlemler (gazete, edebiyat, konuşma metinleri) farklı türlerde farklı “benzersiz lema” büyüklüğü verir. Bir roman korpusuyla bir teknoloji haberleri derlemi aynı sonucu vermez.
- Ağız/yerel söz varlığı: Anadolu ağızları ve tarihî metinler, standart yazı dilinin çok ötesinde bir “uzun kuyruk” üretir. Bu kuyruk, nadir ama zengin bir hazinedir; sayıyı dramatik biçimde artırır.
Mert’in vardığı çıkarım: “Rakam veren herkes, aslında seçimini anlatır.” Yani 80 bin diyen de 300 bin diyen de yanılmaz; yalnızca ölçüm seti farklıdır. Veri tarafında esas tartışma, kapsam–hassasiyet dengesidir: Kapsamı genişletince gürültü (tekrarlı, eş anlamlı, arkaik madde) artar; daraltınca dilin nefesi kısalır.
---
3) Kadınların Duygusal/Toplumsal Penceresi: “Söz, Sadece Sayı Değildir”
Bu yaklaşımı “Elif” karakteri taşısın. Elif der ki:
- Bir dilin söz varlığı, toplumsal belleğin ve ortak duyguların haritasıdır. “Keder” ile “hüzün” arasındaki nüans, bir sayımda iki birim gibi görünür; ama toplum için iki ayrı duygu tonudur.
- Göç, şehirleşme, dijital kültür: Son yıllarda aramıza katılan yazılımcı jargonları, oyun/çevrimiçi sohbet terimleri, melez sokak dili… Bunları saymadıkça “kaç söz var” sorusu eksik kalır.
- Kadın dili ve görünmeyen alanlar: Evin içindeki zanaat, bakım emeği, yerel bitki adları, doğum/ritüel sözcükleri; sözlüklerin kıyısında kalmış olabilir. Sayılar artarken temsil azalabilir.
- Duygusal incelikler: Aynı kelimenin farklı anlam gölgeleri (sevgi, sevda, sevdalık…) toplumun duygusal repertuvarını belirler. Salt rakam, bu zenginliği eksiltir.
Elif’in vardığı sonuç: “Söz saymak, biraz da hikâye saymaktır.” Dilin kaç söze sahip olduğuna karar vermek, hangi hayatların görünür olduğuna da karar vermektir. Bu yüzden toplumsal çeşitliliği yansıtmayan bir sayım, teknik olarak “doğru” olsa bile, kültürel olarak eksik kalır.
---
4) Aynı Masada Uzlaşma: İki Yaklaşım Nasıl Buluşur?
Bir forum mutabakatı kuralım:
1. Çok katmanlı sayı: Tek bir rakam yerine, üç katmanlı rapor üretelim:
- Çekirdek yazı dili (lema bazlı, güncel genel sözlük + ana derlem)
- Genişletilmiş çağdaş söz varlığı (deyimler, alan jargonu, çevrimiçi dil)
- Tarihî ve yerel katman (ağızlar, tarihî metinler, arkaik söz)
2. Şeffaf metodoloji: Hangi kaynaklar, hangi filtreler, hangi tarihler? Tüm varsayımlar açıkça listelensin.
3. Toplumsal temsil: Kadın emeği, kırsal zanaat, göçmen etkisi, gençlik/oyun kültürü gibi alanlardan örnekleme zorunluluğu getirilsin.
4. Anlamsal kümeler: Kelimeyi tekil saymak yerine, anlam ailesi yaklaşımı (sevgi—sevda—muhabbet kümesi) rapora ikinci eksen olarak eklensin.
5. Canlı ölçüm: Dil yaşayan bir organizmadır; yılda bir kez yeniden sayım yapılmalı, değişim grafikleri yayınlanmalı.
Bu model, Mert’in veri disiplinini Elif’in temsil duyarlılığıyla çaprazlar ve tek rakam saplantısını aşar.
---
5) Peki Neden Bu Kadar Zor?—Uzun Kuyruk, Melezlik, Zaman
- Uzun kuyruk: Dilin nadir kullanılan öğeleri (yerel bitki adı, unutulmuş zanaat terimi) sayının büyük kısmını oluşturur ama kullanımda az görünür. Eklemek mi, ayıklamak mı?
- Melezleşme: Türkçenin tarih boyunca aldığı–verdiği kelimeler (Arapça, Farsça, Fransızca, İngilizce) nerede “bizim” sayılır? Güncel internet dilindeki hibrit okumlarda sınır bulanıktır.
- Zaman katmanı: 19. yüzyıl metinlerindeki söz varlığını bugüne eklersek, sayı şişer; eklemezsek tarih körlüğü yaşarız.
- Biçimbirimsel üretkenlik: Eklemeli yapı nedeniyle tek bir kökten yüzlerce türetim mümkündür. Türetilmiş her biçimi mi sayacağız, yoksa lemanın etrafında bir aile mi kuracağız?
Bu zorluklar, “kaç söz var?” sorusunu aslında “dili nasıl görüyorsun?” sorusuna dönüştürür.
---
6) Forumun Rolü: Rakamı Tamamlayan Hikâyeler
Bir öneri: Forum içinde küçük bir gönüllü derlem deneyelim. Herkes kendi bölgesinden, mesleğinden, çocukluğundan bir kelime/ifade getirsin: anlamı, kullanım bağlamı, küçük bir anekdotla birlikte.
- Mert gibiler bu veriyi normalize eder, yineleri ayıklar, kümeler kurar.
- Elif gibiler her bir sözcüğün arkasındaki insan hikâyesini yazar, temsil boşluklarını işaretler.
- Böylece ortaya hem sayılabilir hem de anlatılabilir bir söz varlığı çıkar: bir tarafın grafiği, diğer tarafın anlatısı eksik kalsa da birlikte bütün olur.
---
7) Sıcak Sorular: Tartışmayı Ateşleyelim
- “Sayı”yı hangi seviyede vermek daha anlamlı: çekirdek yazı dili mi, genişletilmiş çağdaş küme mi, yoksa tarihî+yerel dahil tam panorama mı?
- Ağız/yerel sözleri eklemeden “Türkçenin söz varlığı” dediğimizde, kimi dışarıda bırakıyoruz? Bu dışarıda kalanlar kimlerin hikâyeleri?
- Lema–türetim ayrımında sizin için “adil” sınır nerede? Koş/koşar/koştular ayrı mı sayılmalı, aynı ailenin üyeleri mi?
- Çevrimiçi dilin melez terimlerini (ör. oyun içi jargon) Türkçe söz varlığına nasıl indekslemeli? “Kullanım eşiği” mi, “yerleşiklik” mi?
- Rakamın büyüklüğü bizi neden tatmin ediyor? Büyük sayı dil gururu mu, yoksa belirsizliğin tesellisi mi?
---
8) Küçük Bir Uzlaşma Cümlesi
Belki de doğru soru “Türkçede kaç söz var?” değil; “Türkçenin hangi katmanında kaç söz var?”dır. Rakamı bir tabloda, hikâyeyi bir romanda düşünelim. Mert’in soğukkanlı grafikleri ile Elif’in sıcacık anlatıları yan yana geldiğinde, dilin gerçek büyüklüğü ortaya çıkar: ölçülebilir çeşitlilik ile yaşanmış anlamın toplamı.
---
9) Söz Sizde: Hem Sayın, Hem Anlatın
Hadi şimdi sıra forumda:
- Yaşadığınız şehirden/ailenizden, “sözlüklerde görmediğiniz ama evde–mahallede kullanılan” bir kelime/ifade paylaşır mısınız? Anlamı ve küçük bir hikâyesiyle…
- Mesleğinizin jargonundan “Türkçeleşmiş” bir terim var mı? Sizce bu terim söz varlığına eklenmeli mi? Neden?
- “Bir kelimenin karşılığı var ama tonunu eksik buluyorum” dediğiniz anlar oluyor mu? Hangi kelimeler sizce daha çok duygu yüklüyor?
- Son olarak: Eğer tek bir rakam vermek zorunda olsaydınız, hangi kapsam tanımıyla verirdiniz?
Cevaplarınızı merakla bekliyorum. Belki rakamı yine tartışırız ama kesin olan bir şey var: Her birimizin getirdiği kelime, Türkçenin gerçek sayacına bir “tık” daha ekleyecek; hem de sadece sayıya değil, anlama.
Selam forumdaşlar,
Bugün “Türk dilinde kaç söz var?” sorusunu birlikte kurcalayalım istiyorum. Kulağa basit geliyor ama içine dalınca sözlük tanımlarından ağız derlemelerine, akademik ölçüm yöntemlerinden gündelik dile kadar uzanan koca bir evrenden söz ediyoruz. Farklı bakış açılarını seven biri olarak, hem veri/nesnellik tarafını hem de dilin toplumsal ve duygusal boyutunu tartışmaya açmak istiyorum. Aramızda “rakam” görmek isteyenler de var, “hikâye” duymak isteyenler de. O halde aynı masaya oturalım: erkeklerin objektif–veri odaklı yaklaşımı ile kadınların duygusal–toplumsal etkiler odaklı yaklaşımını temsil eden karakterler ve argümanlar üzerinden bu soruyu derinleştirelim.
---
1) Söz mü, Kelime mi, Lema mı?—Önce Tanım
“Kaç söz var?” derken neyi sayıyoruz?
- Sözlük maddesi mi? (maddeler, bazen birden çok anlam, birleşik yapılar, varyantlar içerir)
- Kelime biçimleri mi? (koş, koşar, koştular…; türetim/çekim)
- Lema mı? (temel sözlük başlığı: git- leması altında gider, gitti, gidecek…)
- İfade ve deyimler mi? (zurnanın zırt dediği yer gibi kalıplar)
- Ağızlar ve lehçeler mi? (Anadolu’nun yerel söz varlığı, tarihsel katmanlar)
- Alan jargonu mu? (tıptan yazılımcı diline, zanaat sözlerine)
Tanımı genişlettikçe sayı büyür; daralttıkça küçülür. Bu yüzden tek bir rakam yok, yalnızca yaklaşım var.
---
2) Erkeklerin Objektif/Veri Odaklı Penceresi: “Önce Ölçelim”
Bu yaklaşımı forumdan “Mert” karakteriyle düşünelim. Mert önce ölçümün çerçevesini çizer:
- Kaynak seti: Hangi sözlük(ler), hangi derlem(ler), hangi tarih aralığı?
- Metodoloji: Lema tabanlı sayım mı, tür türevlerini (eklerle türeyen biçimler) de dahil mi ediyoruz?
- Temizleme/ayıklama: Yabancı dillerden geçici alıntılar, özel adlar, yazım varyantları nasıl yönetilecek?
- Eşikler: En az kaç bağlamda görünen birim “söz varlığının” parçası sayılır?
Mert’in masaya koyacağı veri cephaneliği şöyle olurdu:
- Sözlük envanterleri: Güncel genel sözlüklerde on binlerce madde; deyim ve atasözleriyle birlikte bu rakam daha da genişler.
- Derlem tabanlı sayım: Ulusal derlemler (gazete, edebiyat, konuşma metinleri) farklı türlerde farklı “benzersiz lema” büyüklüğü verir. Bir roman korpusuyla bir teknoloji haberleri derlemi aynı sonucu vermez.
- Ağız/yerel söz varlığı: Anadolu ağızları ve tarihî metinler, standart yazı dilinin çok ötesinde bir “uzun kuyruk” üretir. Bu kuyruk, nadir ama zengin bir hazinedir; sayıyı dramatik biçimde artırır.
Mert’in vardığı çıkarım: “Rakam veren herkes, aslında seçimini anlatır.” Yani 80 bin diyen de 300 bin diyen de yanılmaz; yalnızca ölçüm seti farklıdır. Veri tarafında esas tartışma, kapsam–hassasiyet dengesidir: Kapsamı genişletince gürültü (tekrarlı, eş anlamlı, arkaik madde) artar; daraltınca dilin nefesi kısalır.
---
3) Kadınların Duygusal/Toplumsal Penceresi: “Söz, Sadece Sayı Değildir”
Bu yaklaşımı “Elif” karakteri taşısın. Elif der ki:
- Bir dilin söz varlığı, toplumsal belleğin ve ortak duyguların haritasıdır. “Keder” ile “hüzün” arasındaki nüans, bir sayımda iki birim gibi görünür; ama toplum için iki ayrı duygu tonudur.
- Göç, şehirleşme, dijital kültür: Son yıllarda aramıza katılan yazılımcı jargonları, oyun/çevrimiçi sohbet terimleri, melez sokak dili… Bunları saymadıkça “kaç söz var” sorusu eksik kalır.
- Kadın dili ve görünmeyen alanlar: Evin içindeki zanaat, bakım emeği, yerel bitki adları, doğum/ritüel sözcükleri; sözlüklerin kıyısında kalmış olabilir. Sayılar artarken temsil azalabilir.
- Duygusal incelikler: Aynı kelimenin farklı anlam gölgeleri (sevgi, sevda, sevdalık…) toplumun duygusal repertuvarını belirler. Salt rakam, bu zenginliği eksiltir.
Elif’in vardığı sonuç: “Söz saymak, biraz da hikâye saymaktır.” Dilin kaç söze sahip olduğuna karar vermek, hangi hayatların görünür olduğuna da karar vermektir. Bu yüzden toplumsal çeşitliliği yansıtmayan bir sayım, teknik olarak “doğru” olsa bile, kültürel olarak eksik kalır.
---
4) Aynı Masada Uzlaşma: İki Yaklaşım Nasıl Buluşur?
Bir forum mutabakatı kuralım:
1. Çok katmanlı sayı: Tek bir rakam yerine, üç katmanlı rapor üretelim:
- Çekirdek yazı dili (lema bazlı, güncel genel sözlük + ana derlem)
- Genişletilmiş çağdaş söz varlığı (deyimler, alan jargonu, çevrimiçi dil)
- Tarihî ve yerel katman (ağızlar, tarihî metinler, arkaik söz)
2. Şeffaf metodoloji: Hangi kaynaklar, hangi filtreler, hangi tarihler? Tüm varsayımlar açıkça listelensin.
3. Toplumsal temsil: Kadın emeği, kırsal zanaat, göçmen etkisi, gençlik/oyun kültürü gibi alanlardan örnekleme zorunluluğu getirilsin.
4. Anlamsal kümeler: Kelimeyi tekil saymak yerine, anlam ailesi yaklaşımı (sevgi—sevda—muhabbet kümesi) rapora ikinci eksen olarak eklensin.
5. Canlı ölçüm: Dil yaşayan bir organizmadır; yılda bir kez yeniden sayım yapılmalı, değişim grafikleri yayınlanmalı.
Bu model, Mert’in veri disiplinini Elif’in temsil duyarlılığıyla çaprazlar ve tek rakam saplantısını aşar.
---
5) Peki Neden Bu Kadar Zor?—Uzun Kuyruk, Melezlik, Zaman
- Uzun kuyruk: Dilin nadir kullanılan öğeleri (yerel bitki adı, unutulmuş zanaat terimi) sayının büyük kısmını oluşturur ama kullanımda az görünür. Eklemek mi, ayıklamak mı?
- Melezleşme: Türkçenin tarih boyunca aldığı–verdiği kelimeler (Arapça, Farsça, Fransızca, İngilizce) nerede “bizim” sayılır? Güncel internet dilindeki hibrit okumlarda sınır bulanıktır.
- Zaman katmanı: 19. yüzyıl metinlerindeki söz varlığını bugüne eklersek, sayı şişer; eklemezsek tarih körlüğü yaşarız.
- Biçimbirimsel üretkenlik: Eklemeli yapı nedeniyle tek bir kökten yüzlerce türetim mümkündür. Türetilmiş her biçimi mi sayacağız, yoksa lemanın etrafında bir aile mi kuracağız?
Bu zorluklar, “kaç söz var?” sorusunu aslında “dili nasıl görüyorsun?” sorusuna dönüştürür.
---
6) Forumun Rolü: Rakamı Tamamlayan Hikâyeler
Bir öneri: Forum içinde küçük bir gönüllü derlem deneyelim. Herkes kendi bölgesinden, mesleğinden, çocukluğundan bir kelime/ifade getirsin: anlamı, kullanım bağlamı, küçük bir anekdotla birlikte.
- Mert gibiler bu veriyi normalize eder, yineleri ayıklar, kümeler kurar.
- Elif gibiler her bir sözcüğün arkasındaki insan hikâyesini yazar, temsil boşluklarını işaretler.
- Böylece ortaya hem sayılabilir hem de anlatılabilir bir söz varlığı çıkar: bir tarafın grafiği, diğer tarafın anlatısı eksik kalsa da birlikte bütün olur.
---
7) Sıcak Sorular: Tartışmayı Ateşleyelim
- “Sayı”yı hangi seviyede vermek daha anlamlı: çekirdek yazı dili mi, genişletilmiş çağdaş küme mi, yoksa tarihî+yerel dahil tam panorama mı?
- Ağız/yerel sözleri eklemeden “Türkçenin söz varlığı” dediğimizde, kimi dışarıda bırakıyoruz? Bu dışarıda kalanlar kimlerin hikâyeleri?
- Lema–türetim ayrımında sizin için “adil” sınır nerede? Koş/koşar/koştular ayrı mı sayılmalı, aynı ailenin üyeleri mi?
- Çevrimiçi dilin melez terimlerini (ör. oyun içi jargon) Türkçe söz varlığına nasıl indekslemeli? “Kullanım eşiği” mi, “yerleşiklik” mi?
- Rakamın büyüklüğü bizi neden tatmin ediyor? Büyük sayı dil gururu mu, yoksa belirsizliğin tesellisi mi?
---
8) Küçük Bir Uzlaşma Cümlesi
Belki de doğru soru “Türkçede kaç söz var?” değil; “Türkçenin hangi katmanında kaç söz var?”dır. Rakamı bir tabloda, hikâyeyi bir romanda düşünelim. Mert’in soğukkanlı grafikleri ile Elif’in sıcacık anlatıları yan yana geldiğinde, dilin gerçek büyüklüğü ortaya çıkar: ölçülebilir çeşitlilik ile yaşanmış anlamın toplamı.
---
9) Söz Sizde: Hem Sayın, Hem Anlatın
Hadi şimdi sıra forumda:
- Yaşadığınız şehirden/ailenizden, “sözlüklerde görmediğiniz ama evde–mahallede kullanılan” bir kelime/ifade paylaşır mısınız? Anlamı ve küçük bir hikâyesiyle…
- Mesleğinizin jargonundan “Türkçeleşmiş” bir terim var mı? Sizce bu terim söz varlığına eklenmeli mi? Neden?
- “Bir kelimenin karşılığı var ama tonunu eksik buluyorum” dediğiniz anlar oluyor mu? Hangi kelimeler sizce daha çok duygu yüklüyor?
- Son olarak: Eğer tek bir rakam vermek zorunda olsaydınız, hangi kapsam tanımıyla verirdiniz?
Cevaplarınızı merakla bekliyorum. Belki rakamı yine tartışırız ama kesin olan bir şey var: Her birimizin getirdiği kelime, Türkçenin gerçek sayacına bir “tık” daha ekleyecek; hem de sadece sayıya değil, anlama.