جزء اصلی تشکیل دهنده XML ، عنصر یا المان  نام دارد که شامل نام و محتوی می‌باشد. محتوای یک عنصر بین دو علامت نشانه‌گذاری خاص با نام‌های برچسب شروع و برچسب پایان محصور می‌شود. روش برچسب‌گذاری XML همانند HTML است که در اصل HTML و XML این روش را از SGML به ارث برده‌اند.
برچسب شروع شامل نام عنصر است که بین دو علامت > و < قرار گرفته و برچسب پایان دارای علامت / اضافه شده قبل از نام عنصر می‌باشد. برای مثال رشته زیر نمایش دهنده عنصر tel در XML می‌باشد که محتوای آن شماره تلفن ۷۷۲۹۲۵۱۲-۲۱-۰۰۹۸ می‌باشد.
<tel>0098-21-77292512</tel> ‌
هر یک از عناصر می‌توانند دارای چندین صفت باشند که هر صفت از یک زوج نام و مقدار تشکیل شده است. در مورد صفت نیز نحوه نگارش همانند HTML می‌باشد به این صورت که صفات یک عنصر در داخل برچسب شروع آن عنصر قرار می‌گیرند و بین هر صفت و مقدار آن علامت “=” قرار گرفته و مقدار صفت نیز مابین کاراکترهای مشخص کننده رشته محصور شده است. برای مثال عنصر tel در مثال قبلی می‌تواند شامل صفتی با نام Preferred  به صورت زیر باشد که محتوای آن true  است.
<tel prefered=”true”>0098-21-77292512</tel> ‌
محتوای عناصر محدود به متن نیست و عناصر می‌توانند شامل عناصر دیگر باشند که آنها نیز می‌توانند شامل متن و عناصر دیگر باشند. به عبارت دیگر یک فایلXML درختی از عناصر است که محدودیتی برعمق آن وجود ندارد و عناصر می‌توانند در این درخت بطور دلخواه تکرار شوند.

هر سند XML، یک المان به عنوان المان بالاترین سطح (المان ریشه) خواهد داشت که بقیه المانها درون آن قرار دارند. برچسب‌های شروع و پایان همیشه باید با یکدیگر وجود داشته باشند و فرزندان یک عنصر همواره باید بطور کامل بین برچسب‌های شروع و پایان پدر خود محصور شده باشند. به عبارت دیگر نباید برچسب‌های پایان فرزند بعد از برچسب پایان پدر خود ظاهر شود.
باید توجه داشت که کاراکترها در یک فایل XML مطابق استاندارد Unicode 2 می‌باشند و بنابراین فایل‌های XML قادر به نمایش کاراکترهای تمام زبان‌های زنده دنیا می‌باشند که این یکی از مزایای XML برای کاربردهای مبادله داده می‌باشد. البته به این دلیل که کاراکترها در استاندارد Unicode  به صورت دوبایتی کد می‌شوند می‌توان برای جلوگیری از افزایش حجم فایلهای XML آنها را با استفاده از استانداردهای دیگر مانند UTF-8 و یا ISO 8859-1 که اولی مخصوص کاراکترهای انگلیسی و دیگری مخصوص کاراکترهای لاتین است، نیز کد کرد.