Özet

Bu projenin amacı, Türkçe üzerine çalışan dil/dilbilim araştırmacıları için araştırmacıların araştırma sorularına bağlı olarak biçimlendirilebilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve bu çerçevede araştırma sonuçlarının sağlıklı bir şekilde raporlanabildiği bir derlem platformu geliştirmektir.

Bilindiği üzere batı dilleri için geliştirilmiş olan metin işleme/derlem yazılımları o dillere özgü standart birtakım veri işleme özelliklerine sahiptir. Türkçe için kısmen kullanılabilen söz konusu yazılımlar, Türkçe karakter desteği sunabilmelerine karşın bu yazılımların en büyük eksikliği, oluşturuldukları diller de dahil olmak üzere, araştırma sorularına bağlı olarak işlenen verilerin, ortaya çıkan raporların saklanamaması ve amaca uygun olarak düzenlenememesidir. Bu yazılımların belirli alanlarda özelleşmiş olmaları da söz konusu yazılımların eksiklikleri olarak değerlendirilebilir. Örneğin, AntConc, WordSmith Tools, MonoConc Pro, TextStat, Nooj benzeri sık kullanlan paket yazılımlar sıklık, bağımlı dizin, anahtar sözcük gösterimi, n-gram hesaplama, eşdizimlilik hesaplama gibi geliştirildikleri diller için çıktılar verebilmektedir. Kısmen de olsa bu çıktılar metin belgeleri olarak dışa aktarılabilmekte ve sonuç olarak araştırmacı metin yığınlarından elde edilmiş ayrıştırılmamış, filtrelenmemiş başka bir metin yığını ile karşı karşıya kalmaktadır. Söz konusu paket yazılımların bir diğer olumsuz yönü farklı işletim sistemlerine özgü olmalarıdır. Her ne kadar paket yazılımların UNIX, Mac, Windows gibi farklı işletim sisteleri için sürümleri mevcutsa da bu durum programlara erişimi ve kullanımını genellikle zorlaştırabilmektedir.

Oysa dil/dilbilim çalışmaları bugün daha ayrınlıtılı araştırma sorularına cevap arama eğilimindedir. Türkçe üzerine yürütülen derlem çalışmalarının sınırlılığı ve gün geçtikçe derlem oluşturma ve derlem dilbilim yöntemleriyle Türkçeyi değerlerdirme eğiliminin de arttığı bir gerçektir. Ayrıca söz konusu metin işleme/derem yazılımlarını kullanmayı öğrenmek bile başlı başına bir iş olarak araştırmacıların karşısında durmaktadır. Bu anlamda kullanıcı dostu, kolay erişilebilir, araştırma sorularına bağlı olarak geliştirilebilen esnek bir platformlara ihtiyaç vardır. Kullanıcı dostu ve sadece bir tarayıcı (browser) aracılığıyla oluşturulacak olan "Kendi Kendine Derlem Platformu" (KKDP) söz konusu tüm olumsuzlukları kullacının yararına dönüştürebilecektir. Diğer taraftan her dilbilimciden derlem oluşturma/işleme gibi özel bir alana dair yazılım bilgisi edinmesi de pratik bir yaklaşım gibi görünmemektedir.

Önerilen "Kendi Kendine Derlem Platformu" her geçen gün geçerliliği artan bir uygulama alanı olan derlem dilbilimin ilke ve yöntemlerini kuramsal ve uygulamalı açıdan temel alarak oluşturulacaktır. Bu çerçevede proje dilbilimcilere var olan stantandart derlem çıktıları vermek yerine araştırmacıların araştırma sorularına bağlı olarak biçimlendirilebilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve araştırma sonuçlarının sağlıklı bir şekilde raporlanabildiği bir derlem altyapısı sunmayı hedeflemektedir. Proje ekibi söz konusu derlem altyapısını oluşturacak olan bütünleşik sistemin parçalarını farklı derlem projelerinde başarılı sonuçlar üreterek deneyimlemiştir. Bu noktada proje ekibi edindiği birikimi diğer dilbilimcilerin de istifadesine sunmayı amaçlamaktadır.

Diğer taraftan, son yıllarda dünyada bilişim teknolojilerinin sunduğu olanaklar dil/dilbilim alanında yürütülen bilimsel çalışmaların nitelik ve niceliğini arttırmıştır. Önerilen projeyle, Türkçe üzerine yürütülen çalışmaların da nitelik ve niceliğinin arttacağı öngörülmektedir. Bu anlamda batıda uygulamalı dilbilim çerçevesinde karşımıza çıkan dilbilgisi, ağız, çeviri bilim, tarihsel dilbilgisi ve dilsel değişim, dil öğrenimi ve öğretimi, anlambilim, kullanımbilim, toplum dilbilim, söylem çözümlemesi, biçembilim ve yazınbilim gibi dilbilimin alt dallarında (McEnery vd., 2006) araştırmacılar derleme dayılı çalışmalar yürütebilme olanağınına sahip olacaklardır. Örneğin, sözcük anlambilimi ya da cümle anlambilimiyle ilgilenen bir araştırmacı standart derlem işleme basamaklarının yanında kendi derleminde yer alacak olan tabakaları ve metinleri belirleyebilecek, tabakaların ve metinlerin metadatalarının girişini yapabilecek, istediği dil birimini araştırma soruları çerçevesinde istediği etiketleri kullanarak işaretleyebilecek ve sonuç olarak tüm bunları sağlıklı bir şeklide raporlayabilecektir.

Proje Takvimi :

Başlangıç Tarihi : 01/06/2015

Bitiş Tarihi : 01/06/2016

Bu proje TÜBİTAK 1005 - Ulusal Yeni Fikirler ve Ürünler Araştırma Destek Programı çerçevesinde desteklenmektedir.
Proje No:114E791