Unicode



Unicode (täieliku nimetusega "Unicode Worldwide Character Standard) on "süsteem tänapäeva maailma erinevates keeltes kirjutatud tekstide vahetamiseks ja töötlemiseks".

Unicode kasutab iga tähemärgi kodeerimiseks mitte üht, vaid kaht baiti. See võimaldab kodeerida kuni 65536 erinevat märki (erinevate ühebaidiste kombinatsioonide arv on ainult 256). Seepärast nimetatakse Unicode’i ka kahebaidiseks märgistikuks (DBCS - Double Byte Character Set). ISO on defineerinud ka neljabaidise märgistiku, mille alamhulgaks on Unicode.

Unicode’i standard sisaldab praegu 34168 erinevat tähemärki, mis pärinevad 24 keelest.

Loe lähemalt www.unicode.org

Vt. ka ASCII