From 3fba650b9cb889ccf08de45504f9de9d4a1cb4a7 Mon Sep 17 00:00:00 2001 From: =?UTF-8?q?Judithe=20Denb=C3=A6k?= Date: Thu, 28 Nov 2024 14:35:50 +0100 Subject: [PATCH] rettelse af fejl og stavekontrolrelateret --- devtools/speller_result_typos.to.kl.html | 92 ++++++++----------- src/fst/filters/rm-ill-morph-comb.regex | 20 +++- .../affixes/derivations-inflections.lexc | 49 +++------- src/fst/morphology/stems/acronyms.lexc | 4 +- src/fst/morphology/stems/nouns.lexc | 24 ++--- src/fst/morphology/stems/pronouns.lexc | 2 +- src/fst/morphology/stems/propernouns.lexc | 2 +- src/fst/morphology/stems/verbs.lexc | 2 +- test/data/typos.txt | 3 +- tools/spellcheckers/editdist.default.txt | 1 - tools/spellcheckers/final_strings.default.txt | 2 +- tools/spellcheckers/strings.default.txt | 21 ----- tools/spellcheckers/words.default.txt | 6 +- 13 files changed, 90 insertions(+), 138 deletions(-) diff --git a/devtools/speller_result_typos.to.kl.html b/devtools/speller_result_typos.to.kl.html index 936c2f614..c8a15830a 100644 --- a/devtools/speller_result_typos.to.kl.html +++ b/devtools/speller_result_typos.to.kl.html @@ -13,11 +13,11 @@ @@ -124,10 +124,10 @@
  • 200-nut
  • 200-tut
  • 200-ua
  • -
  • 200-uit
  • 20-t
  • 100-t
  • 200-nit
  • +
  • 250-it
  • @@ -149,10 +149,10 @@
  • 300-nut
  • 300-tut
  • 300-ua
  • -
  • 300-uit
  • 100-t
  • 300-nit
  • 30-t
  • +
  • 200-t
  • @@ -174,10 +174,10 @@
  • 40-mut
  • 40-tut
  • 40-ua
  • -
  • 40-uit
  • 50-it
  • 80-it
  • 70-it
  • +
  • 60-it
  • @@ -224,10 +224,10 @@
  • 500-nut
  • 500-tut
  • 500-ua
  • -
  • 500-uit
  • 50-it
  • 100-t
  • 550-it
  • +
  • 300-t
  • @@ -332,10 +332,10 @@
  • Ameerukkaallu
  • Ameerukkaalu
  • Ameerukkillu
  • -
  • Aameersikkallu
  • Ameerakkaallu
  • Ameerakkullu
  • Ameerakuallu
  • +
  • Ameeralikkallu
  • @@ -355,12 +355,12 @@
  • Amerikamit
  • Amerikamiut
  • Amerikatut
  • -
  • Aameersikkamut
  • Ameerakkaamut
  • Ameeralikkamut
  • Amenersikkamut
  • Amererakkamut
  • Amereriakkamut
  • +
  • Amereriikkamut
  • @@ -431,15 +431,9 @@ DR-ip 1 1 - + @@ -528,10 +522,9 @@ ICC-p 1 1 - + @@ -555,17 +548,13 @@ - + Imanuelsen TP Immanuelsen 1 - 1 - - - + 0 + @@ -712,19 +701,13 @@ - + Korniliussen TP Korneliussen 1 - 1 - - - + 0 + @@ -3838,13 +3821,10 @@ franskit 1 1 - + @@ -3937,12 +3917,12 @@
  • naaja
  • baaja
  • laaja
  • -
  • paaja
  • raaja
  • aaja
  • haa-a
  • taava
  • taama
  • +
  • qaava
  • @@ -3960,14 +3940,14 @@ @@ -3988,11 +3968,11 @@
  • HIV-mi
  • HIV-mit
  • HIV-nik
  • -
  • HIV2-mik
  • -
  • HIV3-mik
  • -
  • HIV4-mik
  • -
  • HIV8-mik
  • -
  • HIV9-mik
  • +
  • tv-mik
  • +
  • bhivimik
  • +
  • hk-mik
  • +
  • hr.-mik
  • +
  • ivamik
  • @@ -4432,8 +4412,8 @@
  • inatsisinnik
  • ilatsinnik
  • anatsinnik
  • -
  • dnatsinnik
  • imatsinnik
  • +
  • initsinnik
  • @@ -6261,13 +6241,13 @@
  • nangillunilu
  • naqillunilu
  • aagillunilu
  • -
  • dnagillunilu
  • unagillunilu
  • naagillunilu
  • nakillunilu
  • nangillunili
  • nanillunilu
  • napillunilu
  • +
  • nasillunilu
  • diff --git a/src/fst/filters/rm-ill-morph-comb.regex b/src/fst/filters/rm-ill-morph-comb.regex index 95efb77b9..5edb1dfd4 100644 --- a/src/fst/filters/rm-ill-morph-comb.regex +++ b/src/fst/filters/rm-ill-morph-comb.regex @@ -1,8 +1,13 @@ !Remove long distance illegal suffix combinations, when flag diacritics can't do the job -!keep an alphabetical order based on initial letter of first suffix +!keep an alphabetical order based on initial letter of stem, first suffix OR tag +!top:stem first +!middle:suffix first +!bottom: tag first ~[ +$[ f r a n s k e q ?* [ %+Sg | %+Pl ] [ %+3SgPoss | %+3PlPoss ] ] +| $[ %+GUSUP ?* %+INNAQ ?* [ %+LIR | %+LIK ] ?* (%+TAQ) ] | $[ %+IP ?* %+TUQ ?* %+SSAQ ?* %+U ] @@ -10,8 +15,21 @@ $[ %+IP ?* %+TUQ ?* %+SSAQ ?* %+U ] $[ %+IR ?* %+SIR ?* %+TAQ ] | $[ %+LAAR ?* %+TUQ ?* %+SSAQ ?* %+U ] +| +$[ %+TIP ?* [ %+HTR | %+TIP ] ?* %+JA ] +| +$[ %+Num ?* %+R ?* %+Opt ?* %+3Pl ] +| +$[ %+Num ?* %+U ?* [ %+Int | %+Imp ] ?* %+2Sg ] +| +$[ %+Num ?* %+U ?* %+Opt ?* %+3Pl ] ] ; !## examples of eliminated strings ##! !aameersikkallu +!franskia +!ilinniartitsiasumi !Paaserusuinnaligaana +!300+Num+U+Gram/IV+Der/nv+Gram/IV+V+Int+2Sg +!.00+Num+U+Gram/IV+Der/nv+Gram/IV+V+Opt+3Pl +!.00+Num+R+Der/nv+Gram/IV+Gram/IV+V+Opt+3Pl diff --git a/src/fst/morphology/affixes/derivations-inflections.lexc b/src/fst/morphology/affixes/derivations-inflections.lexc index 7def9e0d4..d06f43823 100644 --- a/src/fst/morphology/affixes/derivations-inflections.lexc +++ b/src/fst/morphology/affixes/derivations-inflections.lexc @@ -2511,7 +2511,6 @@ LEXICON IVschwa2 !!= * @CODE@ Derivativer der tilfoejes intransitive verber på +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>iniaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>iniaalussa IV-mod_ssa ; +NIAR+Der/vv:%>iniar IV-mod_C ; -!+NIAR+Sem/Time:%>iniutaa part ; !PL 20180223 flyttet til flex-iv_schwa som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>iniaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>iniaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>iniarajup IV-mod_C ; @@ -6154,7 +6153,6 @@ LEXICON IV_r2 !!= * @CODE@ +LIRTUR+Der/vv+TIP+Der/vv:%>%TRUNClertortip HTR_C_TAQ_tsi ; +LIRTUR+Der/vv+TIP+Der/vv+QE+Der/vv:%>%TRUNClertorte%TRUNCq TV-mod_qe ; +LLAARE+Der/vv:%>%TRUNCllaar flex-iv_schwa ; -!+LLAATAA+:%>%TRUNCllaataa Part ; !livm 20171005 !PL 20180223 flyttet til flex-iv sammen med NIUTAA+vn og NIARIUTAA +LLAP+Der/vv:%>%TRUNCllap flex-iv ; +LLAP+Der/vv+GIARTUR+Der/vv:%>%TRUNCllakkiartor IV-mod_C ; +LLAP+Der/vv+GIARTUR+Der/vv+GALUAR+Der/vv:%>%TRUNCllakkiartoraluar IV-mod_C ; @@ -11321,7 +11319,6 @@ LEXICON IV_k2 !!= * @CODE@ +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ;!livm 20170505 -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -15594,7 +15591,6 @@ LEXICON IV_long2 !!= * @CODE@ +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv_long som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -19872,7 +19868,6 @@ LEXICON IV_voq2 !!= * @CODE@ skal få 200 medl. +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv_voq som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -24204,7 +24199,6 @@ LEXICON XIi_voqXmorf2 !!= * @CODE@ +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv_voq som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -28493,7 +28487,6 @@ LEXICON XIiXmorf2 !!= * @CODE@ skal få 200 medl. +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til XIiX som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -32670,7 +32663,6 @@ LEXICON XIiXmorf_UdenTIP !!= * @CODE@ som XIiXmorf, men uden TIP for at blokere +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til XIiX som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -36820,7 +36812,6 @@ LEXICON XIirXmorf2 !!= * @CODE@ til iR såsom *er* +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til XIiX som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -41300,7 +41291,6 @@ LEXICON XItX2 !!= * @CODE@ +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -45692,7 +45682,6 @@ LEXICON XIitX2 !!= * @CODE@ +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -50097,7 +50086,6 @@ LEXICON XIuteXmorf2 !!= * @CODE@ skal få 200 medl. +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-iv som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -54575,7 +54563,6 @@ LEXICON XIi_uteXmorf2 !!= * @CODE@ som oqallipput +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til IV-mod_C som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -58972,7 +58959,6 @@ LEXICON XItsXmorf2 !!= * @CODE@ +NIAALUP+Der/vv+NIAR+Der/vv+GUNAR+Der/vv+GALUAR+Der/vv:%>niaalunniarunaraluar IV-mod_C ; +NIAALUP+Der/vv+SSA+Der/vv:%>niaalussa IV-mod_ssa ; +NIAR+Der/vv:%>niar IV-mod_C ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til XItsX som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ARSUP+Der/vv:%>niaarsup IV-mod_C ; ! Ondi 20230823 +NIAR+Der/vv+ARSUP+Der/vv+GALUAR+Der/vv:%>niaarsukkaluar IV-mod_C ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup IV-mod_C ; @@ -63975,7 +63961,7 @@ LEXICON TV !!= * @CODE@ Forudsættes tagget via HTR +SIMAAR+Der/vv+TSIAR+Der/vv:%>simaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>simaajutig Saq_schwa ; +SIMAAR+Der/vv+VALLAAR+Der/vv:%>simaarpallaar Gaq ; @@ -66963,7 +66949,7 @@ LEXICON TV_UdenTIP !!= * @CODE@ Forudsættes tagget via HTR +SIMAAR+Der/vv+TSIAR+Der/vv:%>simaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>simaajutig Saq_schwa ; +SIMAAR+Der/vv+VALLAAR+Der/vv:%>simaarpallaar Gaq ; @@ -68559,7 +68545,6 @@ LEXICON TV_vaa !!= * @CODE@ Forudsættes tagget via HTR +NGAJAP+Der/vv+VIP+Der/vv+QE+Der/vv:%>ngajave%TRUNCq Saq_schwa ; +NGAJAP+Der/vv+VIP+Der/vv+SIMA+Der/vv:%>ngajavissima Saq ; +NIAR+Der/vv:%>niar Gaq ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-tv_vaa som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>niarallar gallar-tv ; +NIAR+Der/vv+GALLAR+Der/vv+GI+Der/vv:%>niarallari XTgujaaX ; @@ -69899,7 +69884,7 @@ LEXICON TV_vaa !!= * @CODE@ Forudsættes tagget via HTR +SIMAAR+Der/vv+TSIAR+Der/vv:%>simaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>simaajutig Saq_schwa ; +SIMAAR+Der/vv+VALLAAR+Der/vv:%>simaarpallaar Gaq ; @@ -71711,7 +71696,6 @@ LEXICON XTuteXmorf !!= * @CODE@ type oqalungusiuppaa. Forudsættes tagget via HT +NGAJAP+Der/vv+VIP+Der/vv+QE+Der/vv:%>%TRUNCtingajave%TRUNCq Saq_schwa ; +NGAJAP+Der/vv+VIP+Der/vv+SIMA+Der/vv:%>%TRUNCtingajavissima Saq ; +NIAR+Der/vv:%>niar Gaq ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til XTuteX som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>niarallar gallar-tv ; +NIAR+Der/vv+GALLAR+Der/vv+GI+Der/vv:%>niarallari XTgujaaX ; @@ -73226,8 +73210,8 @@ LEXICON XTuteXmorf !!= * @CODE@ type oqalungusiuppaa. Forudsættes tagget via HT +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>%TRUNCsimaatsiarniar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>%TRUNCsimaatsiarniaraluar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>%TRUNCsimaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>%TRUNCsimaartuar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>%TRUNCsimaajutig Saq_schwa ; @@ -75653,7 +75637,6 @@ LEXICON XTiuteXmorf !!= * @CODE@ type annippaa, pitsippaa Forudsættes tagget vi +NGAJAP+Der/vv+VIP+Der/vv+QE+Der/vv:%>%TRUNCsingajave%TRUNCq Saq_schwa ; +NGAJAP+Der/vv+VIP+Der/vv+SIMA+Der/vv:%>%TRUNCsingajavissima Saq ; +NIAR+Der/vv:%>niar Gaq ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til XTuteX som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>niarallar gallar-tv ; +NIAR+Der/vv+GALLAR+Der/vv+GI+Der/vv:%>niarallari XTgujaaX ; @@ -77160,8 +77143,8 @@ LEXICON XTiuteXmorf !!= * @CODE@ type annippaa, pitsippaa Forudsættes tagget vi +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>%TRUNCsimaatsiarniar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>%TRUNCsimaatsiarniaraluar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>%TRUNCsimaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>%TRUNCsimaartuar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>%TRUNCsimaajutig Saq_schwa ; @@ -79340,7 +79323,6 @@ LEXICON XTirXmorf !!= * @CODE@ til stammer med ir +NGAJAP+Der/vv+VIP+Der/vv+QE+Der/vv:%>%TRUNCngajave%TRUNCq Saq_schwa ; +NGAJAP+Der/vv+VIP+Der/vv+SIMA+Der/vv:%>%TRUNCngajavissima Saq ; +NIAR+Der/vv:%>niar Gaq ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-tv som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>niarallar gallar-tv ; +NIAR+Der/vv+GALLAR+Der/vv+GI+Der/vv:%>niarallari XTgujaaX ; @@ -80637,7 +80619,7 @@ LEXICON XTirXmorf !!= * @CODE@ til stammer med ir +SIMAAR+Der/vv+TSIAR+Der/vv:%>simaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>simaajutig Saq_schwa ; +SIMAAR+Der/vv+VALLAAR+Der/vv:%>simaarpallaar Gaq ; @@ -80682,7 +80664,7 @@ LEXICON XTirXmorf !!= * @CODE@ til stammer med ir +SIMAAR+Der/vv+TSIAR+Der/vv:%>simaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>simaajutig Saq_schwa ; +SIMAAR+Der/vv+VALLAAR+Der/vv:%>simaarpallaar Gaq ; @@ -82819,7 +82801,6 @@ LEXICON TVi_vaa !!= * @CODE@ tuni forudsættes Gram-tagget via HTR +NGAJAP+Der/vv+VIP+Der/vv+QE+Der/vv:%>ngajave%TRUNCq Saq_schwa ; +NGAJAP+Der/vv+VIP+Der/vv+SIMA+Der/vv:%>ngajavissima Saq ; +NIAR+Der/vv:%>niar Gaq ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-tv_ivaa som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+ALUP+Der/vv:%>nialup Taq ; +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>niarallar gallar-tv ; @@ -84143,7 +84124,7 @@ LEXICON TVi_vaa !!= * @CODE@ tuni forudsættes Gram-tagget via HTR +SIMAAR+Der/vv+TSIAR+Der/vv:%>simaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>simaajutig Saq_schwa ; +SIMAAR+Der/vv+VALLAAR+Der/vv:%>simaarpallaar Gaq ; @@ -86347,7 +86328,6 @@ LEXICON TVschwa !!= * @CODE@ Forudsættes Gram-tagget via HTR +NGAJAP+Der/vv+VIP+Der/vv+QE+Der/vv:%>ingajave%TRUNCq Saq_schwa ; +NGAJAP+Der/vv+VIP+Der/vv+SIMA+Der/vv:%>ingajavissima Saq ; +NIAR+Der/vv:%>iniar Gaq ; -!+NIAR+Sem/Time:%>iniutaa part ; !PL 20180223 flyttet til flex-tv_schwa som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+GAJUP+Der/vv:%>iniarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>iniarallar gallar-tv ; +NIAR+Der/vv+GALLAR+Der/vv+GI+Der/vv:%>iniarallari XTgujaaX ; @@ -87676,7 +87656,7 @@ LEXICON TVschwa !!= * @CODE@ Forudsættes Gram-tagget via HTR +SIMAAR+Der/vv+TSIAR+Der/vv:%>isimaatsiar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>isimaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>isimaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>isimaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>isimaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>isimaartuar Gaq ; +SIMAAR+Der/vv+TURUJUSSUU+Der/vv:%>isimaartorujussuu Saq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>isimaajutig Saq_schwa ; @@ -89565,7 +89545,6 @@ LEXICON XTtX !!= * @CODE@ nakappaa nunguppaa anippaa Forudsætter Gram-tag fra H +NIAR+Der/vv:%>niar TV-mod_r ; !PL202409 forsøg på at tillade passive nominer uden at skabe rekursivitet +NIAR+Der/vv+TAQ+Der/vn:%>niagaq Z1+kaZmorf ; !PL202409 forsøg på at tillade passive nominer uden at skabe rekursivitet +NIAR+Der/vv+HTR+Der/vv:%>niaa IV_voq ; -!+NIAR+Sem/Time:%>niutaa part ; !PL 20180223 flyttet til flex-tv som NIUTAA+vn sammen med LLAATAA og NIARIUTAA +NIAR+Der/vv+GAJUP+Der/vv:%>niarajup Taq ; +NIAR+Der/vv+GALLAR+Der/vv:%>niarallar gallar-tv ; +NIAR+Der/vv+GALLAR+Der/vv+GI+Der/vv:%>niarallari XTgujaaX ; @@ -91064,8 +91043,8 @@ LEXICON XTtX !!= * @CODE@ nakappaa nunguppaa anippaa Forudsætter Gram-tag fra H +SIMAAR+Der/vv+TSIAR+Der/vv+GALUAR+Der/vv:%>simaatsiaraluar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>%TRUNCsimaatsiarniar Gaq ; +SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv:%>simaatsiarniar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>%TRUNCsimaatsiarniaraluar Gaq ; -+SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALURA+Der/vv:%>simaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>%TRUNCsimaatsiarniaraluar Gaq ; ++SIMAAR+Der/vv+TSIAR+Der/vv+NIAR+Der/vv+GALUAR+Der/vv:%>simaatsiarniaraluar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>%TRUNCsimaartuar Gaq ; +SIMAAR+Der/vv+TUAR+Der/vv:%>simaartuar Gaq ; +SIMAAR+Der/vv+UTIGE+Der/vv:%>%TRUNCsimaajutig Saq_schwa ; @@ -120736,4 +120715,4 @@ LEXICON tuq_vn 1Pl_gennemgang ; LEXICON iv_tur -< "@U.turvv.ON@" > Gaq ; \ No newline at end of file +< "@U.turvv.ON@" > Gaq ; diff --git a/src/fst/morphology/stems/acronyms.lexc b/src/fst/morphology/stems/acronyms.lexc index b230e5f90..7537114c6 100644 --- a/src/fst/morphology/stems/acronyms.lexc +++ b/src/fst/morphology/stems/acronyms.lexc @@ -194,8 +194,8 @@ LEXICON ACRO @U.acro.norm@ ACRO_all ; LEXICON ACRO_all -%- arabiskeefterkomma ; ! Here we dive over to the numerals, - arabiskeefterkomma ; ! Here we dive over to the numerals ++Use/-Spell:%- arabiskeefterkomma ; ! Here we dive over to the numerals, ++Use/-Spell:0 arabiskeefterkomma ; ! Here we dive over to the numerals +N+Gram/ACR: acroconnector ; ! Here we add the POS tag and go ACRO LEXICON ACRO_C diff --git a/src/fst/morphology/stems/nouns.lexc b/src/fst/morphology/stems/nouns.lexc index b72625100..28a5cbc40 100644 --- a/src/fst/morphology/stems/nouns.lexc +++ b/src/fst/morphology/stems/nouns.lexc @@ -2156,7 +2156,7 @@ iffasersoq Z1Zmorf ; iffiaarniarfik Z2-Zmorf ; iffiaq Z1Zmorf ; iffigaq+Use/-Spell:iffigaq Z1+kaZmorf ; -@U.Num.Pl@iffikkiaq+Use/-Spell:@U.Num.Pl@iffikkiaq Z1Zmorf ; +iffikkiaq+Use/-Spell@U.Num.Pl@:iffikkiaq@U.Num.Pl@ Z1Zmorf ; iffiugaq Z1+kaZmorf ; iga Z1VZmorf ; iga+Gram/IV+TAQ+Der/vn:igaaq Z1Zmorf ; @@ -6022,7 +6022,7 @@ maligaasaq Z1Zmorf ; maligassaasoq Z1Zmorf ; maligassiuisoq Z1Zmorf ; maligiaq Z1+ssZmorf ; -@U.nnaaq.OFF@malik:@U.nnaaq.OFF@ma Z2+lZmorf ; +malik@U.nnaaq.OFF@:ma@U.nnaaq.OFF@ Z2+lZmorf ; malimaagaq Z1+kaZmorf ; @U.iar.OFF@malinnaaq Z1Zmorf ; malinnguaaq Z1Zmorf ; @@ -9341,7 +9341,7 @@ paaguserfik Z2-Zmorf ; paagussaasoq Z1Zmorf ; paagussisoq Z1Zmorf ; paagut tptmorf ; -paaja Z1VZmorf ; +paaja+Use/-Spell:paaja Z1VZmorf ; paajaqisoq Z1Zmorf ; paajaqisorujussuusoq Z1Zmorf ; paakillisoq Z1Zmorf ; @@ -20900,9 +20900,9 @@ dildo N_Loan_o ; direktør N_Loan ; disko N_Loan_o ; diætist N_Loan ; -dj N_Loan ; -dl N_Loan ; -dna N_Loan_V ; +dj+Use/-Spell:dj N_Loan ; +dl+Use/-Spell:dl N_Loan ; +dna+Use/-Spell:dna N_Loan_V ; doktor N_Loan ; doktorafhandling N_Loan ; doktordisputats N_Loan ; @@ -20915,7 +20915,7 @@ download N_Loan ; drone N_Loan_e ; drone+Err/Sub+N+Abs+Sg:droni Krestr ; dronning N_Loan ; -dvd N_Loan ; +dvd+Use/-Spell:dvd N_Loan ; e-boks N_Loan ; e-cigaret N_Loan_t ; !20201019 Rina e-mail N_Loan ; @@ -21041,7 +21041,7 @@ galar+OLang/DAN+Err/Sub:galaari Z1VZmorf ; galaxe N_Loan_e ; galiot N_Loan_GEM ; galoche N_Loan_e ; -game N_Loan_e ; +game+Use/-Spell:game N_Loan_e ; gang N_Loan ; gas N_Loan_GEM_s ; !forsøg på oprydning gasmaske N_Loan_e ; @@ -21132,9 +21132,9 @@ hepatitis N_Loan ; heroin N_Loan ; hertug N_Loan ; hest N_Loan ; -HF N_Loan ; -hf N_Loan ; -hhx N_Loan ; +HF+Use/-Spell:HF N_Loan ; +hf+Use/-Spell:hf N_Loan ; +hhx+Use/-Spell:hhx N_Loan ; hindbær N_Loan ; hip-hop N_Loan_GEM ; hippie N_Loan_ie ; @@ -21148,7 +21148,7 @@ hormon N_Loan ; hotel N_Loan ; hovedbanegård N_Loan ; hovedbestyrelse N_Loan_e ; -htx N_Loan ; +htx+Use/-Spell:htx N_Loan ; hvidkål N_Loan ; hvidløg N_Loan ; hvidvin N_Loan ; diff --git a/src/fst/morphology/stems/pronouns.lexc b/src/fst/morphology/stems/pronouns.lexc index 5b1d20be7..98f33c9d5 100644 --- a/src/fst/morphology/stems/pronouns.lexc +++ b/src/fst/morphology/stems/pronouns.lexc @@ -44,7 +44,7 @@ TA+una:taav DemPron1 ; TA+una+KKULUK+Der/nn+Gram/Dem+Pron+Abs+Sg:taannakkuluk Krestr ; TA+una+NNGUAQ+Der/nn+Gram/Dem+Pron+Abs+Sg:taannannguaq Z1nnguaqZmorf ; !PL 20170404 !@U.Num.Sg@TA+una+PIAQ+Der/nn+Gram/Dem:taannarpiaq@U.Num.Sg@ tup- ; -@U.Num.Pl@TA+una+PIAQ+Der/nn+Gram/Dem:taakkorpiaq@U.Num.Pl@ tup- ; +TA+una+PIAQ+Der/nn+Gram/Dem@U.Num.Pl@:taakkorpiaq@U.Num.Pl@ tup- ; TA+una+SUAQ+Der/nn+NNGUAQ+Der/nn+Gram/Dem+Pron+Abs+Sg:taannarsuannguaq Krestr ; !liv 170427 TA+una+TAQ+Der/nn+Gram/Dem+Pron+Abs+Sg+3SgPoss:taannartaa Krestr ; !taannartaa TA+una+TAQ+Der/nn+Gram/Dem+Pron+Abs+Sg+3PlPoss:taannartaat Krestr ; !taannartaat diff --git a/src/fst/morphology/stems/propernouns.lexc b/src/fst/morphology/stems/propernouns.lexc index aa9beee3f..3446f321a 100644 --- a/src/fst/morphology/stems/propernouns.lexc +++ b/src/fst/morphology/stems/propernouns.lexc @@ -7715,7 +7715,7 @@ Kornilio:Kornilio Z1Mask_ateqZ ; Korniliu:Korniliu Z1Mask_GrlateqZ ; Korniliuse:Korniliuse Z1Mask_ateqZ ; Korniliusi:Korniliusi Z1Mask_GrlateqZ ; -Korniliusse:Korniliusse Z1Mask_ateqZ ; +Korniliusse+Use/-Spell:Korniliusse Z1Mask_ateqZ ; Korsgaard Zateq_oqsZmorf ; Korsgård Zateq_oqsZmorf ; Korsholm Zateq_oqsZmorf ; diff --git a/src/fst/morphology/stems/verbs.lexc b/src/fst/morphology/stems/verbs.lexc index 0c086c8e2..1657eb7fa 100644 --- a/src/fst/morphology/stems/verbs.lexc +++ b/src/fst/morphology/stems/verbs.lexc @@ -2358,7 +2358,7 @@ avissaarutige:avissaarutig UDEN_HTR_schwa_SAQ ; avissaarutaa IV_voq ; avissaar IV_long ; avissaar HTR_longV_GAQ_addi ; -@U.Num.Pl@avissaar+TUR+Der/vv+UTE+Der/vv+Gram/Reci:@U.Num.Pl@avissaartuup XIuteXmorf ; +avissaar+TUR+Der/vv+UTE+Der/vv+Gram/Reci@U.Num.Pl@:avissaartuup@U.Num.Pl@ XIuteXmorf ; avitsi XIi_voqXmorf_stem ; avittaasior IV_r ; aviu IV_voq ; diff --git a/test/data/typos.txt b/test/data/typos.txt index 9c286994c..fba0b62e8 100644 --- a/test/data/typos.txt +++ b/test/data/typos.txt @@ -528,4 +528,5 @@ kaammattuutingerusunnaq kaammattuutigerusunnaq atorneqarsinnaassangaluarami atorneqarsinnaassagaluarami malinnaavingineqarlutik malinnaavigineqarlutik isumanga isumaga -inuiaqatigiinnni inuiaqatigiinni \ No newline at end of file +inuiaqatigiinnni inuiaqatigiinni +itilerisllarami itileriallarami \ No newline at end of file diff --git a/tools/spellcheckers/editdist.default.txt b/tools/spellcheckers/editdist.default.txt index 3986e09c1..4d1915522 100644 --- a/tools/spellcheckers/editdist.default.txt +++ b/tools/spellcheckers/editdist.default.txt @@ -48,7 +48,6 @@ z i u 8 g q 3 n g 8 -##s t 5 #giver forkerte rettelser - skal laves om til kontekstafhængig u i 8 ## Swaps. NB! Please note that these depend on the variable diff --git a/tools/spellcheckers/final_strings.default.txt b/tools/spellcheckers/final_strings.default.txt index 443cbbf44..5c8433328 100644 --- a/tools/spellcheckers/final_strings.default.txt +++ b/tools/spellcheckers/final_strings.default.txt @@ -2,4 +2,4 @@ # forkert:korrektvægt # (10 = default, for at få effekt bør det være under 5, lave nummer får prioritet) -aalaap:aallap 8 \ No newline at end of file +aalaap:aallap 8 diff --git a/tools/spellcheckers/strings.default.txt b/tools/spellcheckers/strings.default.txt index e434b504c..e4b745f37 100644 --- a/tools/spellcheckers/strings.default.txt +++ b/tools/spellcheckers/strings.default.txt @@ -1,27 +1,6 @@ # Add your error:correct string pairs here (not complete words, they have # a separate file), followed by TAB and the weight for the edit operation: -#disse er for generelle og gør det bare ustyrligt -#aa:a 8 -#ee:e 8 -#ff:f 8 -#ii:i 8 -#kk:k 6 -#ll:l 7 -#nn:n 6 -#oo:o 8 -#qq:q 5 -#ss:s 6 - -#a:aa 6 -#g:q 5 -#i:ii 6 -#k:kk 6 -#m:mm 6 -#n:nn 6 giver forkerte forslag -#s:ss 5 -#t:tt 8 -#u:uu 7 s:rs 4 diff --git a/tools/spellcheckers/words.default.txt b/tools/spellcheckers/words.default.txt index 4a1bb0c37..d30de05d2 100644 --- a/tools/spellcheckers/words.default.txt +++ b/tools/spellcheckers/words.default.txt @@ -1,10 +1,6 @@ # Add complete words here as misspelling:correct followed by a TAB and the # weight: -#=======================================================================# -# REMEMBER to also put in ~/langtech/regression/corpora/heur/JDspell.txt -#=======================================================================# - aapaariit:aappariit 5 aamam:aamma 8 amalu:aammalu 8 @@ -30,4 +26,4 @@ tamana:tamanna 4 taakkunnga:taakunga 6 taamanna:taamannak 2 tarrartut:tarratut 6 -usut:usuit 3 \ No newline at end of file +usut:usuit 3