Il y a Base64 et Base64...
Vous connaissez tous ce fameux encodage dit "Base64", consistant à représenter des données binaires en utilisant un jeu de 64 caractères, en général définis comme étant composé de :
- la plage de 'A' à 'Z' (26 caractères)
- la plage de 'a' à 'z' (26 caractères)
- la plage de '0' à '9' (10 caractères)
- les symboles '+' et '/'
Un 65ème caractère, ne représentant pas une donnée, sert au padding en fin de chaîne : '='.
Les développeurs .NET l'utilisent souvent au travers de la méthode Convert.ToBase64String.
Du coup comme à chaque fois que des symboles sont utilisés en supplément de traditionnels caractères alphanumériques, c'est à dire des caractères susceptibles d'être interdit dans un système de fichier etc, une question se pose : tout le monde est censé utiliser ce jeu de caractères et seulement celui-là ?
Dans le cas de Base64 la réponse est non.
Il existe de manière "officielle" au moins 2 alphabets :
Base32 n'est guère mieux : Base 32 Encoding with Extended Hex Alphabet.
Pour les cas où la donnée d'origine doit être retrouvée ou ceux où la même chaîne doit être générée pour une entrée donnée, ça peut être problématique.
On peut citer comme exemple la synchronisation interprocessus de l'accès à une ressource (du genre système de fichier) au moyen d'un mutex : nous sommes limités en longueur de nom (MAX_PATH, voir CreateMutex) donc hors de question d'utiliser le chemin d'accès (un bon vieux hash SHA-2 du chemin fera donc l'affaire) et nous aurons besoin d'être certains que les 2 processus génèreront exactement la même chaîne pour un chemin d'accès donné.
Si nous choisissons Base64 pour encoder le hash nous aurons donc au minimum besoin de nous assurer que le même alphabet soit utilisé des 2 côtés, et ce de manière durable.
Peu de risque que l'implémentation de Convert.ToBase64String change mais je n'ai pas vu de garantie non plus.
Sinon, vu que dans le cas du mutex le besoin de compacter au maximum la longueur n'est pas forcément nécessaire (tant que nous ne dépassons pas les 260 caractères au total), un bon vieux Base16 (hex) ira très bien : SHA-512 = 64 bytes = 128 caractères (au lieu des 88 caractères obtenus avec Base64).
Ce post vous a plu ? Ajoutez le dans vos favoris pour ne pas perdre de temps à le retrouver le jour où vous en aurez besoin :