کد جهانی یک استاندارد ۱۶ بیتی کدگذاری برای نمایش حروف و علائم در بیشتر زبانهای جهان است.

اگر شما در Browser اینترنت اکسپلورر در صفحه راست کلیک کرده و روی Encoding قرار بگیرید Unicode را خواهید دید. از آنجائیکه Unicode از ۱۶ بیت استفاده می کند. بنابراین می تواند ۶۴۰۰۰ کاراکتر را نمایش دهد. یک کاراکتر در کد جهانی با ۱۶ بیت دودویی نمایش داده می شود که معادل ۴ رقم در سیستم اعداد در مبنای ۱۶ می باشد. مثلا کاراکتر B در روش کد گذاری Unicode معادل U0041H است که در آن U معرف Unicode می باشد.

سیستم کدگذاری اسکی شامل اعداد ۱۶­ (۰۰) تا ۱۶(FF) می باشد. برای تبدیل کد اسکی به کد جهانی باید دو صفر (۰۰) به سمت چپ کد اسکی اضافه نمود. بنابراین کد جهانی، سیستم کد اسکی را با (۰۰۰۰)۱۶ تا (۰۰FF)16 نمایش می ده. برای مثال کاراکتر A با کد جهانی معادل U0041H می باشد. کد جهانی به بلوکهایی از کد تقسیم بندی می شود که هر بلوک آن اختصاص به یک زبان دارد.

یونی‌کد به هر نویسه یک اعداد یکتا اختصاص می‌دهد،

مستقل از محیط،

مستقل از برنامه،

و مستقل از زبان.

اصولاً کامپیوترها فقط با عددها کار می‌کنند و حروف و نویسه‌های دیگر را با تخصیص عددی به هر یک از آنها ذخیره می‌کنند. تا قبل از اختراع یونی‌کد، صدها سیستم کُدگذاری مختلف برای تخصیص این اعداد وجود داشت. نویسه‌های هیچ کُدگذاری‌ای به‌تنهایی کافی نبود: مثلاً اتحادیهٔ اروپا به چندین کُدگذاری مختلف برای در بر گرفته شدن همهٔ زبان‌هایش نیاز داشت. حتی برای زبانی مثل انگلیسی نیز هیچ کُدگذاری‌ای به‌تنهایی برای همهٔ حروف، علایم نقطه‌گذاری، و نمادهای فنی متداول کافی نبود.

این سیستم‌های کدگذاری با هم تعارض نیز داشتند. یعنی دو کُدگذاری مختلف ممکن بود از اعداد یکسانی برای دو نویسهٔ مختلف، یا از اعداد مختلفی برای نویسه‌های یکسان استفاده کنند. با وجود این که هر کامپیوتری (بالاخص کارگزارهای شبکه) لازم است از کُدگذاری‌های مختلف و متعددی پشتیبانی کند، هرگاه داده‌ها از کُدگذاری‌ها یا محیط‌های مختلف عبور کنند، در معرض خطر تحریف قرار می‌گیرند.