Skip to content

Güncel Türkçe Sözlük'ün 12. baskısı, JSON ve MOBI formatında.

Notifications You must be signed in to change notification settings

bora-7/tdk-12-kindle

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

34 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

TDK-12 Logo en License Static Badge

Bu projede Güncel Türkçe Sözlük'ün 12. baskısı ve onunla üretilen projeler bulunmaktadir.

Bu sözlük baskisi 99,182 madde içermektedir. Bu 11. baskıdan 6776 kelime daha fazladır. Bir çok maddenin tanımı güncellenmiştir.

Tüm tanımlari içeren JSON dosyasini tdk-12 klasörünün içinde bulabilirsiniz. Bu dosya sıkıştırıldığı için 11.8 MB boyutundadır. Açıldıktan sonra 124.8 MB boyutuna sahip olacaktır.

Webscraper Kod

İlgilenenler için bu sözlüğü yapan kod, src dosyasının içinde bulunmaktadır.

Bu kod 3 Python script'ine bölünmüştür:

  • get_all_words.py: Tüm kelimeleri autocomplete.json dosyasına kaydeder. Sözlük çok büyük olduğu için bu script sözlüğü 20 dosyaya böler. Bu, sonraki aşamaları kolaylaştırır. Aynı zamanda concurrency'i mümkün kılar.
  • make_dictionary.py: Bir dosya numarası alır, ve o dosyadakı sözcüklerin tanımını başka bir dosyaya yazar. Tanımı bulunamayan sözcükler de başka bir dosyaya yazılır.
  • combine_results.py: Tüm dosyalar doldurulduktan sonra, bu script tüm tanımları aynı dosyaya yazar. Ondan sonra tanımı bulunamayan sözcükleri yeniden dener, gerekirse tanımı tdk-11'den alır.

Alternatif Sözlük Kod

tdk.boraakyuz.me linkinde alternatif sözlüğün ilk versiyonu bulunmaktadır. Bu versiyon TDK-12'ye bir web interface sağlama amaçlıdır. Bu versiyonun kodu hala geliştirilmektedir, ama şu anki kodu app dosyasında görebilirsiniz. Söz araması için SQLite3 kullanılmıştır. Bu kod herkes tarafından kullanılıp değiştirilebilir.

Kindle

Bu sözlügun Kindle versiyonunu kindle klasörünün içinde bulabilirsiniz.

Bu dosyayı açtıktan sonra bir .mobi dosyası çıkacaktır. Bu dosyayı kindle'a aktarmanız yeterlidir. Sözlük otomatik olarak aktif olacaktır.

Eski versiyonda (1.0) bu projedeki Python betiği kullanılmıştır. Hunspell kullanan open-source bir versiyon ben ve birkaç Türk developer tarafından hazırlanmaktadır. şu anki versiyon ve bu ilerideki versiyon herkes tarafından kullanılıp degiştirilebilir.

Detaylı aşamalar hazirlanmaktadir.

Lisans

MIT