Çekim ekleri kelimenin sonundan başlayarak başına doğru birer birer tespit edilerek temizlenecek. Türkçe'deki ek öncelikleri dikkate alınacak. Temizlenen her ekten sonra kökler sözlüğüne bakılacak, eğer kök bulunursa işlem sonlanacak. Böylece mümkün olan en uzun kök tespit edilerek ek olmayan ancak eke benzeyen heceler yanlışlıkla silinmemiş olacak.
Yapım ekleri bu projede ikincil öneme sahip. Projenin ana amacı özgün kelimeleri bularak metin benzerliğinde kullanmak.
(Önceliğe göre azalan sırayla)
Tip | Örüntü |
---|---|
Çokluk Eki | (l[ae]r) |
İyelik Ekleri | ([ıi][mn]?[ıi]?z?) |
Tamlanan eki | ([ns])?([ıiuü]) |
Hal (Durum) Ekleri | ([yn])?([ıiuü]|[ae]|[dt][ae]n?) |
Tamlayan (İlgi) Eki | (n)?([ıiuü]n) |
İlgi zamiri | (ki) |
Vasıta Eki | (y)?(l[ae]) |
Eşitlik Eki | ([cç][ae]) |
- Elmalarımızdakiyle
- Evleriyle
- Gözlerinin
- İnsanlarca
(Önceliğe göre azalan sırayla)
Tip | Örüntü |
---|---|
Olumsuzluk eki | (m[ae]?) |
Geniş zaman | ([aeıiuü]?r|z) |
Şimdiki zaman | ([ıiuü]yor) |
Bilinen geçmiş zaman | ([dt][ıiuü]) |
Öğrenilen geçmiş zaman | (m[ıiuü]ş) |
Gelecek zaman | (y)?([ae]c[ae][kğ]) |
Gereklilik kipi | (m[ae]l[ıi]) |
Şart kipi | (s[ae]) |
Dilek kipi | ([ae]) |
Şahıs ekleri | ((?:[rkğ]|([sy]))[ıiuü])?([mnk])?([ıiuü]z)?(l[ae]r)? |
- almıştık
- yapmayacaktınız
- gelmeliydiler
- sevmiyorsun
- koşmazsınız
- gezsinler
Ek-fiiller hem isimlerin hem de fiillerin sonuna eklenebilir. Birden fazla ek-fiil alma durumu istisnai olduğu için şimdilik ihmal edilecek. O yüzden, bu ek grubunda (şahıs eki hariç) bir öncelik sırası yok.
Tip | Örüntü |
---|---|
Hikaye kipi | (y)?([dt][ıiuü]) |
Rivayet kipi | (y)?(m[ıiuü]ş) |
Şart kipi | (y)?(s[ae]) |
Geniş zaman kipi | ((y)?[ıiuü]m |
Şahıs ekleri | ((?:[rkğ]|([sy]))[ıiuü])?([mnk])?([ıiuü]z)?(l[ae]r)? |
- üzgünsündür
- mutluydum
- evlerindeymişiz
- geliyorlarsa
- duyacaksalar
- kurulmuştur
Sert sessizle biten bir kelimeye, sesli harfle başlayan bir ek eklendiğinde sert sessiz yumuşar. Bu olasılığı sağlamak amacıyla, eğer bulunan kökün son harfi değişebilen bir sessizse, düzenli ifadeye alternatifi ile birlikte eklenecek. Kökler sözlüğündeki kelimeler de bu şekilde güncellenecek. Örneğin:
Kök | Yumuşama | Düzenli ifade |
---|---|---|
bardak | bardağı | barda[kgğ] |
araç | araca | ara[çc] |
dolap | dolabın | dola[pb] |
Son hecesinde dar ünlü bulunan bir kelimeye ünlü ile başlayan bir ek eklendiğinde dar ünlü düşer. Bu durumu sağlamak için, eğer kökün son hecesinde dar ünlü bulunuyorsa, düzenli ifadeye opsiyonel olarak eklenecek. Kökler sözlüğündeki kelimeler de bu şekilde güncellenecek. Örneğin:
Kök | Düşme | Düzenli ifade |
---|---|---|
burun | burnu | buru?n |
oğul | oğlum | oğu?l |