جزء اصلی تشکیل دهنده XML ، عنصر یا المان نام دارد که شامل نام و محتوی میباشد. محتوای یک عنصر بین دو علامت نشانهگذاری خاص با نامهای برچسب شروع و برچسب پایان محصور میشود. روش برچسبگذاری XML همانند HTML است که در اصل HTML و XML این روش را از SGML به ارث بردهاند.
برچسب شروع شامل نام عنصر است که بین دو علامت > و < قرار گرفته و برچسب پایان دارای علامت / اضافه شده قبل از نام عنصر میباشد. برای مثال رشته زیر نمایش دهنده عنصر tel در XML میباشد که محتوای آن شماره تلفن ۷۷۲۹۲۵۱۲-۲۱-۰۰۹۸ میباشد.
<tel>0098-21-77292512</tel>
هر یک از عناصر میتوانند دارای چندین صفت باشند که هر صفت از یک زوج نام و مقدار تشکیل شده است. در مورد صفت نیز نحوه نگارش همانند HTML میباشد به این صورت که صفات یک عنصر در داخل برچسب شروع آن عنصر قرار میگیرند و بین هر صفت و مقدار آن علامت “=” قرار گرفته و مقدار صفت نیز مابین کاراکترهای مشخص کننده رشته محصور شده است. برای مثال عنصر tel در مثال قبلی میتواند شامل صفتی با نام Preferred به صورت زیر باشد که محتوای آن true است.
<tel prefered=”true”>0098-21-77292512</tel>
محتوای عناصر محدود به متن نیست و عناصر میتوانند شامل عناصر دیگر باشند که آنها نیز میتوانند شامل متن و عناصر دیگر باشند. به عبارت دیگر یک فایلXML درختی از عناصر است که محدودیتی برعمق آن وجود ندارد و عناصر میتوانند در این درخت بطور دلخواه تکرار شوند.
هر سند XML، یک المان به عنوان المان بالاترین سطح (المان ریشه) خواهد داشت که بقیه المانها درون آن قرار دارند. برچسبهای شروع و پایان همیشه باید با یکدیگر وجود داشته باشند و فرزندان یک عنصر همواره باید بطور کامل بین برچسبهای شروع و پایان پدر خود محصور شده باشند. به عبارت دیگر نباید برچسبهای پایان فرزند بعد از برچسب پایان پدر خود ظاهر شود.
باید توجه داشت که کاراکترها در یک فایل XML مطابق استاندارد Unicode 2 میباشند و بنابراین فایلهای XML قادر به نمایش کاراکترهای تمام زبانهای زنده دنیا میباشند که این یکی از مزایای XML برای کاربردهای مبادله داده میباشد. البته به این دلیل که کاراکترها در استاندارد Unicode به صورت دوبایتی کد میشوند میتوان برای جلوگیری از افزایش حجم فایلهای XML آنها را با استفاده از استانداردهای دیگر مانند UTF-8 و یا ISO 8859-1 که اولی مخصوص کاراکترهای انگلیسی و دیگری مخصوص کاراکترهای لاتین است، نیز کد کرد.