Codage Unicode dans un programme en langage C

De Wicri Outils

L'équipe Wicri a rencontré quelques difficultés pour insérer des caractères Unicode dans les constantes de type chaîne d'un programme en langage C.


Une convention utilise la convention suivante : Un commentaire inséré en début de code indique une codification Unicode dans les constantes de type chaînes de caractère.

/*   -*- coding: utf-8 -*-  */

Cette convention a notamment été vérifiée avec GNU Emacs sur MacBook (Mac OS X).

Exemple d'emploi 
exemple de conversion d'entités HTML/SGML en unicode (UTF 8) réalisé avec lex.
/*   -*- coding: utf-8 -*-  */

%%
"é"      printf("é");
"è"      printf("è");
"à"      printf("à");
"ç"      printf("ç");
"ê"       printf("ê");
"/"         printf("/");   
"&[a-zA-Z1-9]+;" printf("*** %s ***", yytext);
%%
main()
{
  yylex();
}