Tute Feighty
A tiny UTF-8 encoder for C.
- As small and fast as possible
- Narrowly scoped to one-step UTF-8 encoding in C
- Link only what you need and use
- MIT licence
- iso-8859-1 Latin-1 Western European
- iso-8859-2 Latin-2 East European
- iso-8859-3 Latin-3 South European
- iso-8859-4 Latin-4 North European
- iso-8859-5 Part 5: Latin/Cyrillic
- iso-8859-6 Part 6: Latin/Arabic
- iso-8859-7 Part 7: Latin/Greek
- iso-8859-8 Part 8: Latin/Hebrew
- iso-8859-9 Latin-5 Turkish
- iso-8859-10 Latin-6 Nordic
- iso-8859-11 Part 11: Latin/Thai
- iso-8859-13 Latin-7 Baltic Rim
- iso-8859-14 Latin-8 Celtic
- iso-8859-15 Latin-9 Western European
- iso-8859-16 Latin-10 South-Eastern European
- windows-1250 Central European and Eastern European
- windows-1251 Cyrillic
- windows-1252 English
- windows-1253 Greek
- windows-1254 Turkish
- windows-1255 Hebrew
- windows-1256 Arabic
- windows-1257 Baltic
- windows-1258 Vietnamese
$ ./codegen.py
$ gcc src/* test/test.c -Iinclude
$ ./a.out
A quick brown fox jumps over the lazy dog
Nechť již hříšné saxofony ďáblů rozezvučí síň úděsnými tóny waltzu, tanga a quickstepu.
Pijamalı hasta yağız şoföre çabucak güvendi.
Põdur Zagrebi tšellomängija-följetonist Ciqo külmetas kehvas garaažis
В чащах юга жил бы цитрус? Да, но фальшивый экземпляр!
διαφυλάξτε γενικά τη ζωή σας από βαθειά ψυχικά τραύματα
עטלף אבק נס דרך מזגן שהתפוצץ כי חם
Pijamalı hasta yağız şoföre çabucak güvendi.
Flygande bäckasiner söka hwila på mjuka tuvor.
เป็นมนุษย์สุดประเสริฐเลิศคุณค่า กว่าบรรดาฝูงสัตว์เดรัจฉาน จงฝ่าฟันพัฒนาวิชาการ อย่าล้างผลาญฤๅเข่นฆ่าบีฑาใคร ไม่ถือโทษโกรธแช่งซัดฮึดฮัดด่า หัดอภัยเหมือนกีฬาอัชฌาสัย ปฏิบัติประพฤติกฎกำหนดใจ พูดจาให้จ๊ะๆ จ๋าๆ น่าฟังเอยฯ
Jeżu klątw, spłódź Finom część gry hańb!
11 passed, 0 failed tests
512 bytes + overhead per encoding.
$ for i in src/*; do gcc -c $i -O1; done
$ du -bhc *.o | grep total
32K total
$ for i in src/*; do gcc -c $i -O3; done
$ du -bhc *.o | grep total
32K total
$ for i in src/*; do gcc -c $i -Os; done
$ du -bhc *.o | grep total
28K total