Konu ve Kapsam

Literatürde yer alan bilenen metin işleme/derlem yazılımları Türkçe dışında diller için geliştirilmiş yazılımlardır. Söz konusu yazılımlarını bazılarının Türkçe karakter desteği olmasına karşın Türkçenin eklemeli bir dil olması ve kendine özgü sözdizimsel yapısının bu yazılımlar aracılığıyla çözümlenemeyeceği gözlemlenmiştir. Bu yazılımların Türkçe için sadece Türkçe karakter (ç, ş, ü, ö vb.) sorunun metin dosyalarının okunma aşamasında çözümleyebildiği bilinmektedir. Ancak sözdizimsel yapısı gereği Türkçe için Türkçeye özgü etiketleme ve etiketlenen verilerin raporlanması konusunda yetersiz kaldığı görülür. Literatürde var olan metin işleme/derlem yazılımlarının Türkçe için özelleşmiş yazılımlar olduğu söylenemez.

Bu anlamda kullanılan yazılımların bir diğer eksikliği standart birtakım raporlama araçlarına sahip olmasıdır. Oysa her araştırma, araştırma sorularına bağlı olarak kendine özgü birtakım özellikler taşır ve söz konusu özellikler derlem dilbilimin araştırma mantığına göre farklı raporlamalar ve etiketlemeler/işaretlemeler gerektirir.

Bu anlamda önerilen projenin konusu, derlem dilbilimin yöntemsel yaklaşımlarına paralel olarak kullanıcının ihtiyaçlarını en üst seviyede karşılayabilecek, doğrudan Türkçenin kendine özgü yapısının araştırma sorularına göre biçimlendirilebileceği bir platformu araştırmacılar için oluştumak ve Türkçe üzerine çalışan dil/dilbilim araştırmacıları için araştırmacıların araştırma sorularına bağlı olarak biçimlendirilebilen, araştırmacıya özel, esnek, kolay ulaşılabilir, veri tabanı destekli ve bu çerçevede araştırma sonuçlarının sağlıklı bir şekilde raporlanabildiği bir derlem platform oluşturmaktır. Bu çerçevede projenin kapsamı Türkçe için özelleştirilmiş küçük ve orta ölçekli derlem projelerinde etkili bir şekilde kullanılabilecek bir derlem platformu geliştirmektir.

Bu proje TÜBİTAK 1005 - Ulusal Yeni Fikirler ve Ürünler Araştırma Destek Programı çerçevesinde desteklenmektedir.
Proje No:114E791