Terdapat beberapa macam cara representasi karakter sebagai berikut
- ASCII (American Standard Code for Information Interchange)
- SBCDIC (Standard Binary Coded Decimal Interchanged Code)
- EBCDIC (Extended Binary Coded Decimal Interchanged Code)
- Unicode
ASCII
Terdapat dua macam ASCII, yaitu yang mempergunakan 7 bit dan 8 bit. Pada ASCII yang mempergunakan 7 bit, terdapat dua kelompok karakter, yaitu
- Karakter Kontrol, digunakan untuk mengontrol pengiriman atau transmisi data
- Karakter Informasi, merupakan karakter yang mewakili data
Terdapat beberapa macam karakter kontrol, yaitu
- transmission control, digunakan untuk mengendalikan arus data yang dikirimkan melalui media transmisi. Contoh : SOH (Start of Header), STX (Start of Text), EOT (End of Text), dll
- format effector, digunakan untuk mengatur susunan secara fisik dari informasi yang ditampilkan ke layar. Contoh : LF (Line Feed), CR (Carriage Return), FF (Form Feed), dll
- device control, digunakan untuk mengendalikan peralatan fisik di terminal
- information separator, digunakan sebagai elemen pembatas data yang ditransmisikan. Contoh : US (Unit Separator), RS (Record Separator), FS (File Separator), dll.
Unicode
Unicode menggunakan 16 bit untuk merepresentasikan karakter. Dengan demikian, banyaknya karakter yang dapat direpresentasikan adalah 216 atau 65.536 karakter. Keunggulan Unicode dari ASCII adalah kemampuannya untuk menyimpan simbol / karakter yang jauh lebih besar. Himpunan 256 karakter pertama dari Unicode merupakan pemetaan karakter ASCII 8 bit, sehingga Unicode tetap kompatibel dengan ASCII. Selain merepresentasikan seluruh karakter ASCII, Unicode dapat merepresentasikan juga berbagai macam simbol diluar ASCII, seperti huruf Arab, Kanji, Hiragana, Katakana, dan lain-lain.