Problém: Mám plain text v češtině. Plain text vznikal ve widlích a tak je nejspíš v CP 1250. Domníval jsem se, že plain text na požádání překóduje do Unicode editor, ale nepřekóduje. Ani gedit, ani gvim. Místo toho dostanu většinu znaků 80h - FFh jako binární kódy. Otázka: kdo to umí? Určitě nějaká taková utilita existuje, ale já nevím která. Stejný problém hrozí s plain textem z OS/2, ten bude pro změnu v CP 852. Nevadilo by mě tolik, kdybych musel konverzní tabulky dodělávat.
recode (http://packages.debian.org/lenny/recode) (doc (http://packages.debian.org/lenny/recode-doc))
Já osobně používám iconv:
$ iconv -f cp1250 -t utf8 vstup.txt vystup.txt
Dík, dopadlo to perfektně. Pokud by někdo hledal totéž, tak
- nainstalit recode a recode-doc, obojí je v repositáři
- recode CP1250..UTF8 < widle.txt > unicode.txt
další varianta je cstocs od Yenii Kasprzaka...
Citace od: Radek kdy 09. 08. 2009, 17:58:10
Dík, dopadlo to perfektně. Pokud by někdo hledal totéž, tak
- nainstalit recode a recode-doc, obojí je v repositáři
- recode CP1250..UTF8 < widle.txt > unicode.txt
Tento isty postup som pouzival v skole
btw, z editorů to umí minimálně kate/kwrite