کد جهانی یک استاندارد ۱۶ بیتی کدگذاری برای نمایش حروف و علائم در بیشتر زبانهای جهان است.
اگر شما در Browser اینترنت اکسپلورر در صفحه راست کلیک کرده و روی Encoding قرار بگیرید Unicode را خواهید دید. از آنجائیکه Unicode از ۱۶ بیت استفاده می کند. بنابراین می تواند ۶۴۰۰۰ کاراکتر را نمایش دهد. یک کاراکتر در کد جهانی با ۱۶ بیت دودویی نمایش داده می شود که معادل ۴ رقم در سیستم اعداد در مبنای ۱۶ می باشد. مثلا کاراکتر B در روش کد گذاری Unicode معادل U0041H است که در آن U معرف Unicode می باشد.
سیستم کدگذاری اسکی شامل اعداد ۱۶ (۰۰) تا ۱۶(FF) می باشد. برای تبدیل کد اسکی به کد جهانی باید دو صفر (۰۰) به سمت چپ کد اسکی اضافه نمود. بنابراین کد جهانی، سیستم کد اسکی را با (۰۰۰۰)۱۶ تا (۰۰FF)16 نمایش می ده. برای مثال کاراکتر A با کد جهانی معادل U0041H می باشد. کد جهانی به بلوکهایی از کد تقسیم بندی می شود که هر بلوک آن اختصاص به یک زبان دارد.
یونیکد به هر نویسه یک اعداد یکتا اختصاص میدهد،
مستقل از محیط،
مستقل از برنامه،
و مستقل از زبان.
اصولاً کامپیوترها فقط با عددها کار میکنند و حروف و نویسههای دیگر را با تخصیص عددی به هر یک از آنها ذخیره میکنند. تا قبل از اختراع یونیکد، صدها سیستم کُدگذاری مختلف برای تخصیص این اعداد وجود داشت. نویسههای هیچ کُدگذاریای بهتنهایی کافی نبود: مثلاً اتحادیهٔ اروپا به چندین کُدگذاری مختلف برای در بر گرفته شدن همهٔ زبانهایش نیاز داشت. حتی برای زبانی مثل انگلیسی نیز هیچ کُدگذاریای بهتنهایی برای همهٔ حروف، علایم نقطهگذاری، و نمادهای فنی متداول کافی نبود.
این سیستمهای کدگذاری با هم تعارض نیز داشتند. یعنی دو کُدگذاری مختلف ممکن بود از اعداد یکسانی برای دو نویسهٔ مختلف، یا از اعداد مختلفی برای نویسههای یکسان استفاده کنند. با وجود این که هر کامپیوتری (بالاخص کارگزارهای شبکه) لازم است از کُدگذاریهای مختلف و متعددی پشتیبانی کند، هرگاه دادهها از کُدگذاریها یا محیطهای مختلف عبور کنند، در معرض خطر تحریف قرار میگیرند.