Codage Unicode dans un programme en langage C
De Wicri Outils
L'équipe Wicri a rencontré quelques difficultés pour insérer des caractères Unicode dans les constantes de type chaîne d'un programme en langage C.
Une convention utilise la convention suivante : Un commentaire inséré en début de code indique une codification Unicode dans les constantes de type chaînes de caractère.
/* -*- coding: utf-8 -*- */
Cette convention a notamment été vérifiée avec GNU Emacs sur MacBook (Mac OS X).
- Exemple d'emploi
- exemple de conversion d'entités HTML/SGML en unicode (UTF 8) réalisé avec lex.
/* -*- coding: utf-8 -*- */
%%
"é" printf("é");
"è" printf("è");
"à" printf("à");
"ç" printf("ç");
"ê" printf("ê");
"/" printf("/");
"&[a-zA-Z1-9]+;" printf("*** %s ***", yytext);
%%
main()
{
yylex();
}