文字コード学習ツール

入力した文字列の Unicode コードポイントと、主要な 10 種の文字コードによるバイト列を表示します。

コードポイント数
10
UTF-16 code units
11

UTF-8

1〜4バイトの可変長。Unicode 全コードポイントを表現可能

17 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E16E4 B8 96
U+754CE7 95 8C
U+002020
🎉U+1F389F0 9F 8E 89

UTF-16 LE

2 or 4バイト固定幅。BMP外はサロゲートペア。BOM なし

22 bytes
CharCode PointBytes (hex)Note
HU+004848 00
eU+006565 00
lU+006C6C 00
lU+006C6C 00
oU+006F6F 00
U+002020 00
U+4E1616 4E
U+754C4C 75
U+002020 00
🎉U+1F3893C D8 89 DF

UTF-16 BE

UTF-16 LE のバイトオーダー逆。BOM なし

22 bytes
CharCode PointBytes (hex)Note
HU+004800 48
eU+006500 65
lU+006C00 6C
lU+006C00 6C
oU+006F00 6F
U+002000 20
U+4E164E 16
U+754C75 4C
U+002000 20
🎉U+1F389D8 3C DF 89

UTF-32 BE

常に 4バイト。コードポイントをそのまま big-endian で格納

40 bytes
CharCode PointBytes (hex)Note
HU+004800 00 00 48
eU+006500 00 00 65
lU+006C00 00 00 6C
lU+006C00 00 00 6C
oU+006F00 00 00 6F
U+002000 00 00 20
U+4E1600 00 4E 16
U+754C00 00 75 4C
U+002000 00 00 20
🎉U+1F38900 01 F3 89

ASCII (7-bit)

U+0000..U+007F のみ。範囲外は表現不可

7 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E167-bit ASCII では表現不可
U+754C7-bit ASCII では表現不可
U+002020
🎉U+1F3897-bit ASCII では表現不可

Latin-1 (ISO-8859-1)

U+0000..U+00FF を 1バイトに。西欧向け

7 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E16ISO-8859-1 では表現不可
U+754CISO-8859-1 では表現不可
U+002020
🎉U+1F389ISO-8859-1 では表現不可

Windows-1252

Latin-1 拡張。0x80-0x9F に €・“” 等 27文字を追加

7 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E16Windows-1252 では表現不可
U+754CWindows-1252 では表現不可
U+002020
🎉U+1F389Windows-1252 では表現不可

Shift_JIS

JIS X 0208 を ASCII と干渉なく1〜2バイトに詰めた日本語エンコード

12 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E1690 A2
U+754C8A 45
U+002020
🎉U+1F3893FShift_JIS では表現不可 (0x3F '?' に置換)

EUC-JP

JIS X 0208 を 2バイト、JIS X 0201 カナを 2バイト(0x8E+字形)

12 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E16C0 A4
U+754CB3 A6
U+002020
🎉U+1F3893FEUC-JP では表現不可 (0x3F '?' に置換)

ISO-2022-JP

ESC で ASCII / JIS X 0208 モードを切り替える 7-bit エンコード

18 bytes
CharCode PointBytes (hex)Note
HU+004848
eU+006565
lU+006C6C
lU+006C6C
oU+006F6F
U+002020
U+4E161B 24 42 40 24 33 26 1B
U+754C28 42
U+002020
🎉U+1F3893FISO-2022-JP では表現不可 (0x3F '?' に置換)