Posts tagged ‘problèmes d’accents’

Comment convertir un fichier ISO en UTF-8 ?

Les soucis de chaïnes UTF-8 / Isos ont déja été évoqués dans un article traitant des serveurs de pages web.

Mais que faire d’un fichier existant qui serait en encodé avec des caractères en ISO ? C’est le cas par exemple des fichiers de localisation en français du forum punBB / FluxBB.

Soit on passe les page servies en ISO avec la commande addDefaultCharset, cf. les directives de bases d’Apache httpd (dommage quand même d’en arriver là!).
Soit on convertit notre fichier en UTF-8 a l’aide d’un utilisaire bien pratique.

Comment connaitre l’encodage d’un fichier ?

En premier lieu, nous pouvons vérifier le type d’encodage avec file sous Linux:


user@bécane:~> file /home/user/fichier.txt
/home/user/fichier.txt: ISO-8859 text

Comment convertir le fichier encodé en ISO-8859x en fichier UTF-8

iconv, va nous permettre de réaliser ce tour de magie. Il vous sauvera la vie plus d’une fois si vous jonglez avec les bases de données de clients multiples peu soucieux de l’encodage de leurs caractères…

user@bécane:~> iconv -f ISO-8859-1 -t UTF-8 /home/user/fichier.txt -o /home/user/fichierUTF-8.txt

Et voila, les accents et autres caractères spéciaux sont maintenant convertis en UTF-8
Ultra pratique !

17 octobre 2008 at 15 h 21 min Laisser un commentaire