De codering van tekst in digitale documentbestanden verwijst naar de manier waarop reeksen bytes worden toegewezen aan tekens in een taal. Er zijn veel verschillende coderingen voor verschillende talen. U kunt de codering van een tekstbestand bepalen met behulp van een aantal softwaretools.
Het is nodig
- - Microsoft Office Word;
- - KWrite;
- - Mozilla Firefox;
- - enca.
instructies:
Stap 1
Gebruik Microsoft Office Word, indien geïnstalleerd op uw computer, om de codering van het tekstbestand te bepalen. Voer deze applicatie uit. Selecteer in het hoofdmenu de items "Bestand" en "Open …" of druk op de sneltoets Ctrl + O. Navigeer in het dialoogvenster dat verschijnt naar de gewenste map en selecteer het bestand. Klik op de knop "Openen". Als de tekstcodering anders is dan die van de CP1251, wordt het dialoogvenster "Bestand converteren" automatisch geopend. Activeer daarin de optie "Overig" en selecteer de codering met behulp van de lijst aan de rechterkant. Als de juiste codering is geselecteerd, wordt leesbare tekst weergegeven in het veld "Voorbeeld".
Stap 2
Pas teksteditors toe waarmee de brontekstcodering kan worden geselecteerd. Een goed voorbeeld van zo'n applicatie is KWrite (draait op KDE op UNIX-achtige systemen). Laad het tekstbestand in een editor. Herhaal vervolgens de coderingen totdat er leesbare tekst wordt weergegeven (in KWrite wordt dit gedaan met behulp van de sectie Codering van het menu Extra).
Stap 3
Net als bij een teksteditor kunt u een browser gebruiken om de codering van een bestand te bepalen. Gebruik Mozilla Firefox. Voer deze applicatie uit. Als deze niet is geïnstalleerd, downloadt u de juiste distributie van mozilla.org en installeert u deze. Open een tekstbestand in uw browser. Selecteer hiervoor de items "Bestand" en "Bestand openen …" in het hoofdmenu of druk op Ctrl + O. Als de geladen tekst correct wordt weergegeven, vouwt u het gedeelte "Codering" van het menu "Bekijken" uit en ontdekt u de codering van de naam van het item waarop de markering is ingesteld. Selecteer anders deze parameter door verschillende items van hetzelfde menu te selecteren, evenals de sectie "Extra".
Stap 4
Pas gespecialiseerde hulpprogramma's toe om de codering van tekstbestanden te bepalen. Op UNIX-achtige systemen kunt u enca gebruiken. Installeer indien nodig dit programma met behulp van de beschikbare pakketbeheerders. Maak een lijst van de beschikbare talen door de opdracht uit te voeren:
enca --lijst talen
Bepaal de codering van het tekstbestand door de naam op te geven met de -g optie en de documenttaal met de -L optie. Bijvoorbeeld:
enca -L russisch -g /home/vic/tmp/aaa.txt.