Kelime-i Dijital

Birden çok dosyada yer alan metinlerde toplam kaç kelime vardır? Bu metinler toplam kaç farklı kelimenin muhtelif tekrarından oluşur? Birkaç dakika içinde bu soruların cevabı bulunabilir mi?

Teknoloji mi yaşamı hızlandırıyor yoksa teknolojisiz yaşam mı yavaş? Sadece bakış açısına göre değil alışılmış olan paradigma ya da norma göre de cevabı değişkenlik gösterecek bir soru. Yeni bir teknoloji ortaya çıkıp da yaşamı “hızlandırdığında”, ilk tepki süratin baş döndürücülüğü olurken, o teknolojinin o süratine alıştıktan sonra baş dönmesi geçiyor.

Basit bir örnek: Otomobil ile seyahat. Bugün elli yaşındaki bir araca binip her zaman seyahat ettiğiniz yollarda bir gezintiye çıkın ve şaşkınlık içinde zihninizden şu soruyu geçirirken kendinizi suç üstü yakalayın: Biz (yaşınız tutmuyorsa “onlar”) bu hızda mı seyahat ediyormuş(uz)?

Bir başka örnek: 1 Nisan 2016’dan 8 Ocak 2021’e dek bu köşede yayınlanan 250 makalede toplam kaç kelime kullanıldı? Bunun için toplam kaç farklı kelime kullanıldı? Bu iki basit sorunun cevabını bulmak için kullanılacak yöntem kalem kağıt olursa iki şey kolaylıkla tespit edilir: Birincisi bu çalışma günler sürerdi. İkincisi hata yapılıp yapılmamış olduğu konusunda kesin bir hükme varılamazdı (çalışmaya kontrol amaçlı birkaç kişi daha dahil edilmediği taktirde).

Bir MS-Word dosyasının kaç kelimeden oluştuğunu bilmek hazır. Yazılımın sol alt köşesinde. Peki dosya içinde hangi kelime kaç kere tekrar etmiş sorusunun cevabı? Internetin başına geçtim, birkaç dakikalık arama sonunda hazır bir makro (programcık) buldum. Son yazmış olduğum makaleye uyguladım; sonuçlar birkaç saniye içinde ekranda belirdi. Veriyi Excel dosyasına aktardım ve böylece iki bilgiye ulaşmış oldum: Excel’deki toplam dolu satır sayısı farklı kelime adedini verirken, her kelimenin tekrar adedinin toplamı metindeki toplam kelime sayısını teyit ediyordu.

Her bir makale ayrı bir Word dosyasında durduğuna göre bu işlemi 250 kere yapmak yerine tek bir dosyada birleştirip onun üzerinde tatbik etmek daha pratik olacaktı. 250 kere kopyala/yapıştır yapmak yerine daha kolay bir çözümün olup olmadığını araştırdım. Hani deniyor ya Word’ün özelliklerinin ancak yüzde yirmisi kullanılıyor diye. İşte o kullanılmayan özelliklerden birisini keşfettim. Tek bir işlemde istenildiği adette Word dosyası tek bir dosyada alt alta tek metin haline getirilebiliyordu. Bu işlem de birkaç saniye sürdü.

Daha önce tek bir makale üzerinde çalıştırdığım makroyu bu kez 250 makalenin birleşmiş olduğu dosya üzerinde çalıştırdım. Tahmin edileceği üzere program bir noktada patladı. Makroyu yazıp internette ücretsiz olarak kullanıma sunan kişi birbirinden farklı olabilecek kelime adedine bir üst limit koymuştu. Dokuz bin! Makro yazılımının basit kodunu inceleyince daha birinci satırda bununla ilgili tanımı tespit ettim. Adedi 30 bine çıkardım ve yeniden çalıştırdım. Birkaç dakika sonra sonuçlar ekrandaydı.

Böylece geçen beş senedeki 250 makalede toplam 92 bin 429 kelime yazmış olduğumu, bunların da 21 bin 467 farklı kelimenin muhtelif tekrarından oluştuğunu öğrenmiş oldum. En çok tekrar eden kelimeler mi? Şöyle: bir (3,284), bu (1,793), da/de (1,173/1,042), ve (791), o (707). Bu “olağan şüpheliler”i şu kelimenin izlediğini görünce açıkçası mutlu oldum: dijital (613 kere)!

Herkese Bilim Teknoloji Dergisi; “Dijital Kültür” Köşesi (Sayı 251 15.01.2021)

Popüler Etiketler