874 | Thai |
932 | Japanisch |
936 | Vereinfachtes Chinesisch |
949 | Koreanisch |
950 | Traditionelles Chinesisch |
1200 | Unicode UTF-16, little endian |
1201 | Unicode UTF-16, big endian |
1250 | Mitteleuropäisch |
1251 | Kyrillisch |
1252 | Westeuropäisch |
1253 | Griechisch |
1254 | Türkisch |
1255 | Hebräisch |
1256 | Arabisch |
1257 | Baltisch |
1258 | Vietnamesisch |
12000 | Unicode UTF-32, little endian |
12001 | Unicode UTF-32, big endian |
65000 | Unicode UTF-7 |
65001 | Unicode UTF-8 |
Windows-1251 (auch Codepage 1251, kurz cp1251) ist eine 8-Bit-Zeichensatztabelle zur Darstellung von Sprachen im kyrillischen Alphabet wie Russisch oder Ukrainisch. Sie wird auch häufig für Bulgarisch verwendet.
Windows-1251 und KOI8-R (oder seine ukrainische Variante KOI8-U) sind viel weiter verbreitet als ISO 8859-5. Zukünftig könnten sie durch UTF-8 (Unicode) verdrängt werden. Im März 2022 verwenden 0,6 % aller Websites Windows-1251, ISO-8859-5 wird von weniger als 0,05 % verwendet.
Tabelle
Code | …0 | …1 | …2 | …3 | …4 | …5 | …6 | …7 | …8 | …9 | …A | …B | …C | …D | …E | …F |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0… | NUL | SOH | STX | ETX | EOT | ENQ | ACK | BEL | BS | HT | LF | VT | FF | CR | SO | SI |
1… | DLE | DC1 | DC2 | DC3 | DC4 | NAK | SYN | ETB | CAN | EM | SUB | ESC | FS | GS | RS | US |
2… | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3… | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4… | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5… | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6… | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7… | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | DEL |
8… | Ђ | Ѓ | ‚ | ѓ | „ | … | † | ‡ | € | ‰ | Љ | ‹ | Њ | Ќ | Ћ | Џ |
9… | ђ | ‘ | ’ | “ | ” | • | – | — | ™ | љ | › | њ | ќ | ћ | џ | |
A… | NBSP | Ў | ў | Ј | ¤ | Ґ | ¦ | § | Ё | © | Є | « | ¬ | SHY | ® | Ї |
B… | ° | ± | І | і | ґ | µ | ¶ | · | ё | № | є | » | ј | Ѕ | ѕ | ї |
C… | А | Б | В | Г | Д | Е | Ж | З | И | Й | К | Л | М | Н | О | П |
D… | Р | С | Т | У | Ф | Х | Ц | Ч | Ш | Щ | Ъ | Ы | Ь | Э | Ю | Я |
E… | а | б | в | г | д | е | ж | з | и | й | к | л | м | н | о | п |
F… | р | с | т | у | ф | х | ц | ч | ш | щ | ъ | ы | ь | э | ю | я |
SP (space) auf Position 2016 ist das Leerzeichen, NBSP (no-break space, auch non-breaking space) auf Position A016 ist das geschützte Leerzeichen und SHY (soft hyphen) an Position AD16 ist der bedingte Trennstrich, der normalerweise nur am Zeilenende sichtbar ist.
Einzelnachweise und Quellen
- ↑ Roman Czyborra: The Cyrillic Charset Soup. 1998, abgerufen am 6. März 2022 (englisch).
- ↑ Comparison of the usage statistics of Windows-1251 vs. ISO-8859-5 for websites. In: W3Techs. 6. März 2022, abgerufen am 6. März 2022 (englisch).
Weblinks
- Microsoft Windows Codepage : 1251 (Cyrillic). Microsoft, archiviert vom am 7. Oktober 1999 (englisch).
- cp1251 to Unicode table. Unicode-Konsortium, 15. April 1998 (englisch).
- Petko Yotov: Universal Cyrillic decoder. (englisch, eine Anwendung, die helfen kann, verschieden codierte kyrillische Texte lesbar zu machen).