Codage des caractères et caractères spéciaux
Un article de Haypo.
Sommaire |
[modifier] Articles
- Démystifier Unicode : Comprendre la différence entre caractère, encodage, code et octet
- Faites la paix avec Unicode
- La fabuleuse histoire d'Unicode
- Codage des caractères
- Unicode et UTF-8
- Touche compose
- Caractères Unicode
- UTF-8 et Linux
- Écrire proprement une URL
- Polices de caractère
- Détecter un charset
[modifier] Unicode et sécurité
- International Components for Unicode Regular Expressions Vulnerabilities (2008-01-25)
- Deceptive file names under Vista (control characters)
- Unicode encoding can be used to bypass intrusion detection systems (full-width/half-width)
- Trolltech fixes vulnerability in Qt libraries (utf8)
- WordPress Charset SQL Injection Vulnerability (encodage Big5 et GBK)
- CVE-2006-4980 : Python "repr()" Function Unicode String Handling Buffer Overflow Vulnerability
[modifier] Liens externes
- ICU : Bibliothèque C++ d'IBM pour gêrer l'Unicode
- Ruby : Annotations aux dessus d'un caractère pour en donnant sa prononciation
- Vietnamese Unicode FAQs
- Charsets et encoding
- Convertir une chaîne Unicode en ASCII mais en essayant de conserver le maximum d'information : remplace « ü » par « u » par exemple (ß par ss, ø par o, ...).
- (en) Unicode in Python
- (en) Character Set Encylopedia
[modifier] Divers
Changer le charset d'un nom de fichier :
convmv -r --nosmart --notest -f iso-8859-1 -t utf8 *

