Caractères spéciaux
Quelque soit votre choix, soyez constant dans la notation Pour suivre la norme orthographique utilisez la ligature oe minuscule (œ) et majuscule (Œ) en utilisant un codage propriétaire (Windows) comme le fait l'INSEE. Inconvénient : risque d'illisibilité du caractère en cas d'échanges avec certains environnements non-Windows
- Autre option :
- remplacez la ligature par «oe». Assure une communication minimum du mot Inconvénient : vous perdez une variété (richesse ?) orthographique et si vous souhaitez restaurer la ligature oe ce sera à faire à la main au cas par cas.
Le « Dénombrement de la population », publié par l'INSEE, est la source qui fixe la graphie officielle des noms des communes en France. C'est dans le « Code officiel géographique 2003 ». La liste des communes donnée par le fichier de l'INSEE donne deux écritures.
- 1. Nom en clair (majuscules) (NCC) - Libellé en lettres majuscules Dans ce cas le nom de la commune est entièrement en majuscule sans AUCUNE accentuation.
- 2. Nom en clair (typographie riche) (NCCENR) - « Libellé en typographie riche, majuscules, minuscules, accentuation. ». En ce cas majuscule et minuscule sont accentués.
- La « ligature oe minuscule » est utilisé dans 225 communes sur un total de 36 678.
- La « ligature OE majuscule » est utilisée dans 4 communes (code Insee): Œuilly (02565), Œuilly (51410) et Œting (57521) et Œuf-en-Ternois (62633)
- Le Y majuscule avec tréma n'apparait pas car aucune commune ne commence par ce caractère.
- [Le y tréma (ÿ) minuscule apparaît dans trois communes : Moÿ-de-l'Aisne (02532), Faÿ-lès-Nemours (77178), L'Haÿ-les-Roses (94038)]
La préconisation serait donc d'écrire le nom des communes avec cette ligature oe. C'est l'écriture officielle et normalisée . MAIS le problème commence avec l'échange des données et tout particulièrement pour transmettre le nom d'une commune contenant le caractère «ligature oe minuscule ». En effet ce caractère est inexistant dans plusieurs normes utilisés par les logiciels.
- ISO-8859-1 aussi nommée ISO-Latin-1
- Pour simplifier cette norme internationale est fiable et utilisée par la quasi-totalité des systèmes. Mais elle ne contient justement pas le caractère « ligature oe minuscule » (idem pour l'équivalent majuscule). Elle est utilisée sur Usenet et aussi pour la réaliser et visualiser un site Internet (pour simplifier, un internaute devra posséder sur son ordinateur la police de caractère appropriée pour visualiser correctement ce caractère). Risque : vous saisissez la commune de Vendouvres (code Insee 36232) avec la ligature. Au moment d'une transmission (via usenet ou sur un site ou même sur l'ordinateur d'un correspondant) vous n'avez plus que - par exemple - «Vend ?uvres».
- ISO-8859-15 aussi nommée ISO-Latin-9
- Définit quelques nouveaux caractères dont la « ligature oe minuscule » (idem pour l'équivalent majuscule). Mais elle est peu répandue (dans les logiciels et ordinateurs). Ce qui fera que le caractère « ligature oe minuscule » risque de ne pas être correctement visualisé ailleurs.
- US-ASCII
- Tout le monde le comprend mais cette norme ne compte aucun caractère accentué et donc pas les ligatures.
- ISO 10646 aussi nommé Unicode
- ( en savoir plus sur Unicode) Serait LA norme qui contient tous les caractères utilisé sur la planète. Acceptée explicitement en gedcom si les systèmes peuvent l'utiliser (contrairement aux jeux non-ANSEL). A noter que l'Ansel contient les ligatures o majuscule et minuscule. Est le standard officiel d'XML.
- ANSI 1252 extension de la norme ISO/CEI 8859-1
- Jeu de caractères disponible dans l'environnement WINDOWS. Permet la saisie des ligatures oe. A la réception, la ligature o e peut ne pas être restituée normalement dans les environnements non-WINDOWS. Elle ne contient pas le y tréma en majuscule.
- ISO-8859
- Cette norme spécifie au moins 9 jeux de caractères pour diverses langues. ISO-8859-1 est pour les langues ouest-européennes suivantes: allemand, anglais, danois, espagnol, feringien, finnois, français, islandais, irlandais, italien, néerlandais, norvégien, portuguais et suédois, ISO-8859-4 scandinavie et ISO-8859-6 arabe etc.
- A savoir :
- l'utilisation ou non de la ligature a une incidence phonétique au même titre que les accents. Liste des mots utilisant la ligatures « oe » en francais : boeuf, coeur, choeur, foetus, manoeuvre, moeurs, noeud, oecumenisme, oedeme, oedipien, oeil, oenologie, oesophage, oeuf, oeuvre, soeur, voeu, stoechiometrie, des noms propres et les derives de coelome et ceux de oeil.
Nom / valeur Unicode / représentation / code ASCII / Saisie / codage Microsoft (non normé)
- Ligature oe minuscule / U+0153 / œ / /250 / Alt+0156 / 9C
- Ligature OE majuscule / U+0152 / Œ / 234 / Alt+0140 /
- y minuscule avec tréma / ????? / ÿ / ??? / ???? / 0152 / Œ / 234 / Alt+0140 / FF
Autres Ressources
Pour mieux comprendre le codage
- http://www.olf.gouv.qc.ca/ressources/ti/evaluations/courriers/dossier.html
- http://www.faqs.org/faqs/fr/accents/
- http://www.uzine.net/article1785.html#nb5
- http://openweb.eu.org/articles/caracteres_illegaux/ Projet de norme ISO 14651
Code utilisé par l'INSEE pour son fichier des noms des communes : pas le Latin-1 puisqu'il y a des ligatures oe. Les ligatures oe et OE sont codés 214 et 234 (en octal) qui tombent dans les caractères de "contrôle" de ISO-8859 et qu'utilisent les codages "propriétaires" (comme les code-pages d'IBM, Microsoft, Apple, etc.). Si c'était le Latin-9 ces codes auraient pour valeur 274 et 275. Il ne s'agit pas non plus d'Unicode (ni codé en n'utilisant que les premiers 8 bits, ni en UTF-8). Donc, cette liste a été codée dans un pseudo Latin-1 sans doute le codage de Windows.
Les lettres considérées comme françaises sont très rarement explicitées et d'ailleurs, toute langue évoluant, il est difficile de dire ce qu'est une lettre française... L'imprimerie nationale (lexique des règles, page 102) donne : a...z àâèéêëîïôùüçæ oe auxquelles il faudrait donc ajouter ÿ