Dilib, module CharSet

De Wicri Outils
Révision datée du 16 juin 2017 à 18:42 par imported>Jacques Ducloy (1 révision importée)
(diff) ← Version précédente | Voir la version actuelle (diff) | Version suivante → (diff)
LogoDilib.gif
Panneau travaux.png
Bibliothèque Dilib (ressources numériques)
Module CharSet

Le module CharSet contient un ensemble de fonctions et de commandes pour réaliser des transcodages élémentaires.

 

Jeux de caractères

Jeu de caractère CharSetO

Il s'agit d'un jeu de caractères à 7 bits (compatible avec tous les outils Unix même anciens), où tous les caractères sont lisibles.

Les conventions sont les suivantes :

  • Tous les caractères graphiques sur les 7 bits du code ASCII, sauf le back-slash et le croisillon (#)[1]sont inchangés.
  • Les caractères de l'ASCII étendu dont le premier bit est à 1 sont remplacés par des séquences octales (exemple : \202)
  • Les caractères non-graphiques, sauf le saut de ligne et la tabulation, sont également codés en octal.

Jeu de caractère CharSetX

Ce jeu de caractère est proche du précédent avec un remplacement des caractères non imprimables ou spéciaux par des séquences hexadécimales (exemple #23).

Commandes

CharSetTr

L'utilisation la plus usuelle consiste à utiliser les options -AtoO (ascii to octal) et -OtoA (octal to ascii)

Exemple :

CharSetTr a2o < monFichier          \
         | filtreUtilisateur          \
         | CharSetTr o2a

Fonctions

CharSetUrlBufferCatFromStr

char *CharSetUrlBufferCatFromStr(Buffer *b1, char *str);

Cette fonction concatène la chaîne strdans dans Buffer en convertissant les caractères interdits dans les url (par exemple l'espace est remplacée par des %20.

Voir aussi

Notes
  1. A partir de la version V0.5.92
Sur ce wiki
Autour de ce wiki