文字コード学習ツール
入力した文字列の Unicode コードポイントと、主要な 10 種の文字コードによるバイト列を表示します。
- コードポイント数
- 10
- UTF-16 code units
- 11
UTF-8
1〜4バイトの可変長。Unicode 全コードポイントを表現可能
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | E4 B8 96 | |
| 界 | U+754C | E7 95 8C | |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | F0 9F 8E 89 |
UTF-16 LE
2 or 4バイト固定幅。BMP外はサロゲートペア。BOM なし
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 00 | |
| e | U+0065 | 65 00 | |
| l | U+006C | 6C 00 | |
| l | U+006C | 6C 00 | |
| o | U+006F | 6F 00 | |
| ␠ | U+0020 | 20 00 | |
| 世 | U+4E16 | 16 4E | |
| 界 | U+754C | 4C 75 | |
| ␠ | U+0020 | 20 00 | |
| 🎉 | U+1F389 | 3C D8 89 DF |
UTF-16 BE
UTF-16 LE のバイトオーダー逆。BOM なし
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 00 48 | |
| e | U+0065 | 00 65 | |
| l | U+006C | 00 6C | |
| l | U+006C | 00 6C | |
| o | U+006F | 00 6F | |
| ␠ | U+0020 | 00 20 | |
| 世 | U+4E16 | 4E 16 | |
| 界 | U+754C | 75 4C | |
| ␠ | U+0020 | 00 20 | |
| 🎉 | U+1F389 | D8 3C DF 89 |
UTF-32 BE
常に 4バイト。コードポイントをそのまま big-endian で格納
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 00 00 00 48 | |
| e | U+0065 | 00 00 00 65 | |
| l | U+006C | 00 00 00 6C | |
| l | U+006C | 00 00 00 6C | |
| o | U+006F | 00 00 00 6F | |
| ␠ | U+0020 | 00 00 00 20 | |
| 世 | U+4E16 | 00 00 4E 16 | |
| 界 | U+754C | 00 00 75 4C | |
| ␠ | U+0020 | 00 00 00 20 | |
| 🎉 | U+1F389 | 00 01 F3 89 |
ASCII (7-bit)
U+0000..U+007F のみ。範囲外は表現不可
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | — | 7-bit ASCII では表現不可 |
| 界 | U+754C | — | 7-bit ASCII では表現不可 |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | — | 7-bit ASCII では表現不可 |
Latin-1 (ISO-8859-1)
U+0000..U+00FF を 1バイトに。西欧向け
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | — | ISO-8859-1 では表現不可 |
| 界 | U+754C | — | ISO-8859-1 では表現不可 |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | — | ISO-8859-1 では表現不可 |
Windows-1252
Latin-1 拡張。0x80-0x9F に €・“” 等 27文字を追加
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | — | Windows-1252 では表現不可 |
| 界 | U+754C | — | Windows-1252 では表現不可 |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | — | Windows-1252 では表現不可 |
Shift_JIS
JIS X 0208 を ASCII と干渉なく1〜2バイトに詰めた日本語エンコード
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | 90 A2 | |
| 界 | U+754C | 8A 45 | |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | 3F | Shift_JIS では表現不可 (0x3F '?' に置換) |
EUC-JP
JIS X 0208 を 2バイト、JIS X 0201 カナを 2バイト(0x8E+字形)
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | C0 A4 | |
| 界 | U+754C | B3 A6 | |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | 3F | EUC-JP では表現不可 (0x3F '?' に置換) |
ISO-2022-JP
ESC で ASCII / JIS X 0208 モードを切り替える 7-bit エンコード
| Char | Code Point | Bytes (hex) | Note |
|---|---|---|---|
| H | U+0048 | 48 | |
| e | U+0065 | 65 | |
| l | U+006C | 6C | |
| l | U+006C | 6C | |
| o | U+006F | 6F | |
| ␠ | U+0020 | 20 | |
| 世 | U+4E16 | 1B 24 42 40 24 33 26 1B | |
| 界 | U+754C | 28 42 | |
| ␠ | U+0020 | 20 | |
| 🎉 | U+1F389 | 3F | ISO-2022-JP では表現不可 (0x3F '?' に置換) |