XHTML, говорите?

Одна из самых печальных вещей, которую я замечаю, когда набредаю на русскоязычные веб-разработчицкие сообщества — это полное нежелание разбираться в сути вопросов. Когда что-то у кого-то не получается, он сначала спрашивает это в форуме, где куча самозванных "гуру" начинает ему рассказывать несусветную чушь. Потом, если повезет, кто-нибудь даст ссылку на какую-нибудь более-менее адекватную статью, которая может частично касаться вопроса. Совет же почитать первоисточник (например спецификацию языка) обычно воспринимается как издевательство, потому как по-английски все "свободно разговаривают" только в своих резюме.

Все это приводит к тому, что русское веб-сообщество полно совершенно странных мифов, пугающе противоречащих логике:

"надо верстать и таблицами, и div'ами"
"1 em = 16 px"
"надо писать на XHTML, а не на HTML"

Вот по поводу последнего — сегодняшняя статья.

"Ложки нет"

Во-первых, нужно четко понимать, что чисто технически никакого XHTML в современном вебе не существует. По той простой причине, что самый распространенный браузер, которым пользуются люди, XHTML отображать не умеет. Если IE скормить реальную XHTML-страницу, то он ее покажет как любой другой XML-документ — в виде дерева элементов.

Многие здесь подумают, что я объелся лебеды, и несу чушь, потому что вот же, например — известный сайт, у которого в сурсе сверху недвусмысленно написано, что это XHTML 1.0, и валидатор подтверждает, что так оно и есть. И IE его, разумеется, отображает.

Загвоздка тут в том, что браузеры выясняют тип документа не по DOCTYPE. Вместо этого они смотрят на то, что указано в заголовках HTTP-ответа, с которым пришел документ. А написано там в подавляющем большинстве случаев:

Content-type: text/html

... ну и еще кодировка, возможно. А это значит, что браузер для отображения документа использует HTML-ный парсер. Чтобы браузер начал отображать документ именно по правилам XHTML, нужны две вещи:

тип должен быть xml'ным: application/xml, text/xml или рекомендуемый именно для XHTML — application/xhtml+xml
элементы должны принадлежать зарегистрированному для XHTML пространству имен — это вот та штука xmlns="http://www.w3.org/1999/xhtml"

Если так сделать, то как я уже сказал, IE, у которого специального XHTML-парсера нет, будет просто показывать дерево элементов, а новые браузеры действительно включатся в XHTML-режим.

DOCTYPE

Стоит уточнить, зачем же все таки нужен DOCTYPE. Как я уже писал в статье про валидацию, теоретически, он указывает на отдельный документ — DTD — по которому можно формально проверить синтаксис XHTML. Но стандарт XML позволяет браузерам этого не делать и быть невалидирующими парсерами. Они и не делают. И единственная программа, которая таки использует DTD — это сам валидатор (мне это напоминает негласное требование к москвичам носить с собой паспорт только для того, чтобы милиция могла его наличие проверять :-) ).

Тем не менее, браузеры все-таки используют строчку DOCTYPE. Но исключительно для того, чтобы по совпадению этой строки с некими внутренними шаблонами включать разные режимы обратной совместимости. Например, будет ли IE6 считать размеры боксов по стандарту или в режиме совметимости с IE5, зависит от того, указать ли ему DOCTYPE строгого (X)HTML или нет. А в Gecko-браузерах таких режимов аж три: "загадочный", "как IE" и "стандартный".

Кстати, интересующимся сильно советую почитать свежую статью Тима Брея о том, чем вреден DOCTYPE. Тим Брей, между прочим, один из авторов XML.

А и не нужно

Думаю, я не ошибаюь сильно, считая, что призывы писать только на XHTML основаны исключительно на том, что это модно. Я помню, что многих людей в свое время издевательски (зная ответ) спрашивал, а зачем именно они вставляют слеш ("/") в теги <img/> и <br/> и зачем именно они пишут в начале документа DOCTYPE разных вариантов XHTML. Никакого внятного ответа я на свой вопрос не получал.

Потому что на практике использовать настоящий XHTML а) трудно и б) практически незачем.

Напомню, что кардинальное отличие XHTML от HTML состоит в том, что XHTML подчиняется жестким XML'ным правилам well-formed'ности. То есть, если в документе хоть чуть-чуть что-то неправильно, то браузер обязан бросить парсить документ и сообщить пользователю об ошибке.

Такая строгость нужна и удобна, если ваш пользователь — программа. Тогда, чем более просты и строги правила синтаксиса, тем проще она сама.

Но такое поведение не подходит на вебе. Ни одному пользователю не интересно знать, как там где-то ошибся автор страницы или автор его CMS. Они приходят пользоваться, а не отлаживать. А в современном вебе, где документы составляются из кучи разных несвязанных кусочков информации, синатксические ошибки, к сожалению, слишком часты. Что означает, что ваш правильный XHTML-сайт будет слишком много времени неюзабельным. Достаточно, например, просто перенести copy-paste'ом URL'ку из браузера в блог и, если в URL'ке есть амперсанды (&), то вы получаете сломанный XHTML, который требует, чтобы эти амперсанды были экранированы (&).

Пугалка

Если все вышенаписанное не убедило вас в бесполезности XHTML и вы вопреки здравому смыслу думаете, что "это все равно правильно", то я хочу вас еще немного попугать. Потому что эти настроения обычно подкрепляются мнением, что "обэксемелить" HTML — задачка все равно простая. Чего там, в общем-то: закрыть все теги, откавычить атрибуты, экранировать амперсанды и вставить слеши в одиночные теги. На самом деле все несколько сложнее. Вот небольшой и неполный список, во что это выливается:

Содержимое элементов <script> и <style> нельзя оставлять в том же виде, что и в HTML. Потому что любой значок ">" тут же все сломает. Если его экранировать через ">" или заключать в блоки CDATA, то тогда сломаются HTML'ные браузеры, которые таких страстей не ведают и парсят текст, предполагая, что он не экранирован. Кроме того, в XHTML браузер не обязан вообще парсить содержимое комментариев, а скрипты, как известно, часто так экранируются по историческим соображениям.

В итоге, чтобы удовлетворить и XHTML, и HTML, вам придется либо использовать такую вот конструкцию, учитывающую все синтаксисы:
```
<script>
<![CDATA[//><!]]>
</script>
```
Либо выносить скрипты и стили во внешние файлы. * document.write в скриптах в XHTML просто не работает. Придется переписать с использованием DOM-функций
В самих DOM-функциях нужно опустить все названия элементов в нижний регистр. То же для селекторов в стилях. В XHTML регистр букв имеет значение.
Также не работают удобные вещи: document.body, document.forms, document.images... Придется рисовать длинные вызовы вроде document.getElementsByTagName('body')[0] и document.getElementById('change_frm')
Если вы храните какой-нибудь текст внутри <input type="hidden" value="...">, то переводы строк внутри атрибута "value" в XHTML схлопнутся в пробелы. Чтобы этого не было придется их экранировать: "
".
Фоновый цвет body в XHTML не распространяется автоматически на все окно

Другими словами, в следующий раз, когда вам нужно будет сверстать страницу для веба, отриньте суету и начните ее так:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
<title>Страница</title>
<p>Текст

Это совершенно валидный HTML 4.01 strict. А если вам не нужна валидация, то и DOCTYPE можно сократить до минимума, чтобы только браузеры в стандартный режим включались:

<!DOCTYPE html>
<title>Страница</title>
<p>Текст

Смысл все же есть

Есть редкие случаи, когда применение XHTML оправдано и на вебе тоже.

Одна из областей применения — микроформаты (о которых я уже как-то писал). Поскольку они предлагаются как вещи и человекочитаемые, и машиночитаемые одновременно, то строгость XML'а для них уже полезна.

Другая, еще более редкая штука — смешанные документы. XML позволяет в одном и том же документе объединять элементы разных XML-языков (поскольку синтаксис общий). Чаще всего это используется для вставления в XHTML кусков математики на MathML и графики на SVG. Есть известный блог — Musings — который это широко использует.

Однако, наверное самый полезный эффект, который XHTML произвел, лежит отнюдь не в технических аспектах. Эта самая буква "X" сыграла в свое время важную роль, сделав из простого как бы всем известного и скучного HTML новую модную технологию. Не будь XHTML'а, наверное куда меньше людей заинтересовались бы идеями современной верстки CSS'ом, разделением содержимого и оформления и стали бы читать спецификации хотя бы и только для того, чтобы повесить на страницу бесполезную кнопочку валидации. Пусть... Главное — общий эффект :-)

Комментарии: 84

Fabler

"Достаточно, например, просто перенести copy-paste’ом URL’ку из браузера в блог и, если в URL’ке есть амперсанды (&), то вы получаете сломанный XHTML". Совершенно верно, тому, что ввел пользователь верить нельзя, иначе не только испорченный xhtml можно получить, но и много разных гадостей.
"Такая строгость нужна и удобна, если ваш пользователь — программа." А разве это в 99,999% случаев не так? Единственно что оправдывает xml - это то, что его удобно генерировать и парсить.

Иван Сагалаев

Совершенно верно, тому, что ввел пользователь верить нельзя, иначе не только испорченный xhtml можно получить, но и много разных гадостей.

Я тут не совсем про пользователей... Страницу может сломать сам автор, если набирает, скажем, текст поста в блоге и копирует URL из соседнего окна браузера.

“Такая строгость нужна и удобна, если ваш пользователь — программа.” А разве это в 99,999% случаев не так?

Нет, ну понятно, что в любом случае это программа :-). Я имею в виду, что одно дело, когда это браузер, который юзеру показывает страницы, а другое - когда это, скажем, поисковик или какой-нибудь другой парсер, который делает какой-то машинный анализ. В первом случае не совсем корректный парсинг имеет смысл.

uncle.f

Отличная статья! Давно пора было поведать миру об этом. Согласен с каждым словом (хотя сам пишу часто на XHTML - люблю порядок страшно! ;-)) )

Fabler

Движок блога должен проверять и нормализовывать то, что автор напечатал. В конце концов это реализуется элементарно.
Четкой границы между браузером и небраузером на самом деле нет. Вот rss-reader - это что? И почему, например, тот же wordpress создает одновременно отдельно корректный фид и отдельно html-страницы? Не говоря уже о том, что сами эти rss с atom'ом лишние сущности. Если можно упростить жизнь себе и другим используя формат более строгий чем html, то почему бы этого не делать.

agat

Я пишу на чистом XHTML из-за того, что это обеспечивает кроссбраузерную совместимость и существенно облегчает вёрстку сайтов.

sas171

Хм... жаль, что я прочитал эту статью: сразу испортилось впечатление об авторе. Могу оспорить каждый аргумент (времени и желания нет)

edgy

Непонятно, для чего эта статья.

Понимаю, что иногда хочется понизвергать основы, но ведь это прочитают и те, кто не будет видеть разницы между оправданным и неоправданным применением XHTML, и слепо возьмут на вооружение, будут использовать в качестве аргумента.

Напомнило статью Лебедева об экономии на кавычках, но он вроде бы стебался, здесь я этого не ощущаю.

Иван Сагалаев

Честно говоря, ожидаемая реакция :-).

Но это действительно не стеб, это низвергание тех заблуждений, которые укоренились до степени религии, и люди, к моему глубокому сожалению, готовы их рьяно защищать, даже не понимая, для чего. Я с удовольствием выслушаю любое несогласие, и готов с ним поспорить. Ведь в статье я привел чисто технические аргументы (хотя и с хорошей долей язвы :-) ).

Вот, Agat, например:

Я пишу на чистом XHTML из-за того, что это обеспечивает кроссбраузерную совместимость и существенно облегчает вёрстку сайтов.

Верстку облегчает разделение контента и стиля, а чем верстать контент - c X или без, неважно. Кроме того, как я писал, XHTML как раз обеспечивает полную несовместимость с IE. Кстати, сайт http://agat.in/ отдается браузерам в виде text/html, и парсится как HTML. А единственный, кто парсит его как XHTML — валидатор — находит там 2 ошибки. Кстати, довольно незначительных. И очень хорошо, что пользователи могут видеть сайт, а не обращать внимание на отсутсвие alt в двух местах.

edgy:

Понимаю, что иногда хочется понизвергать основы, но ведь это прочитают и те, кто не будет видеть разницы

Неправильно понять, в общем-то, можно все, что угодно. Я могу лишь стараться написать все доходчиво, но я не властен над нежеланием понять. Если написал не доходчиво, то по результатам комментариев напишу еще статью. Но пока я не вижу ни одного конкретного возражения, если честно.

Это, кстати, опять не я придумал :-).

Классическая статья Йена Хиксона: http://www.hixie.ch/advocacy/xhtml (даже более радикальная, он пишет, что XHTML через text/html не только бесполезно, но и вредно!)
Много об этом пишет голландец Анне ван Кестерен.

Эти люди — одни из самых известных евангелистов стандартов в мире, и тема эта, вообще-то, известна в англоязычном интернете очень давно, я лишь собрался у нас это все изложить.

Иван Сагалаев

А, вот забыл... Насчет того, что блогный софт должен следить за well-formed'ностью. Да, наверное должен. Но факт состоит в том, что большинство софта, которым пользуются люди, это не делают. Что в свою очередь тоже показывает отсутствие необходимости.

edgy

В общем то, конкретных возражений не возникает, поскольку собраны соответствующие истине вещи, вызывает неприятие общий настрой статьи.

Особенно "пугалка" и рекомендации в конце. Не было бы их, был бы хороший пост, провоцирующий на интересную, возможно, дискуссию по актуальному, как видим, вопросу.

Пугалка абсолютно не пугает, вот нисколько, честно. Это не сложно, и Вы это понимаете. Это даже полезно, нужен хоть какой-то порог вхождения, простота html уже сыграла свою вредную роль.

Если есть какие-то проблемы с написанием xhtml, может быть не стоит его вообще писать? Это не rocket science, но свои правила и здесь есть.

Пусть у xhtml очень мало плюсов на данный момент, но ведь они есть? А какие плюсы у html, кроме тех, что его "проще" писать, что тоже, я думаю, у многих уже не так?

Мне бы, для валидности HTML пришлось потом кавычки стирать специально и слэши убирать у одиночных тегов.

Алексей Захлестин

о! спасибо за статью :-) дам ссылку паре человек.. у самого всё руки не доходили до написания чего-то подобного.

Наш выбор: html 5 :)

Мне бы, для валидности HTML пришлось потом кавычки стирать специально и слэши убирать у одиночных тегов.

ну.. слеши — это понятно. а кавычки-то зачем?

Alena

Одна из самых печальных вещей, которую я замечаю, когда набредаю на русскоязычные веб-разработчицкие сообщества — это полное нежелание разбираться в сути вопросов. Когда что-то у кого-то не получается, он сначала спрашивает это в форуме, где куча самозванных “гуру” начинает ему рассказывать несусветную чушь.

Обычное дело, не только для форумов веб-разработчиков. Форум надо осторожно выбирать.

Иван Сагалаев

Ok, пугалка не страшная :-). Опишу в следующей статье случай, когда у одного и того же сурса в XHTML и HTML режимах получается разный DOM. Моя основная мысль в том, что эти вещи многим просто неизвестны, и поэтому если уж хочется писать именно XHTML, надо про них знать. И надо знать про то, что писать на чистом XHTML не получится (например сокращать парные пустые теги), придется писать XHTML, совместимый с HTML, что, опять-таки, дает больше работы.

У HTML есть один большой плюс — он рапространен. Большинство того, что сейчас самими авторами считается XHTML'ом, им не является с того момента, как сурс отдается браузеру. Поэтому вопрос не в том, стоит ли переходить с XHTML на HTML, а как раз наоборот: если у вас есть рабочий HTML, нет оснований прибавлять себе работы.

Tomaz

    <p>Может я чего-то не догоняю, но мне никак не удается заставить IE показать XHTML документ как XML.</p>

Пишу так:


Untitled

text

Но на ожидаемое дерево документа IE выдает строку "text".

Tomaz

Сорри, забыл скобки заменить.

Пишу так:
<?xml version="1.0" encoding="UTF-8"?> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="en" lang="en"> <head> <meta http-equiv="Content-Type" content="application/xhtml+xml"> <title>Untitled</title> </head> <body> <tag>text</tag> </body> </html>

Иван Сагалаев

Тут не в коде дело. Чтобы заставить IE воспринимать документ как XHTML, надо либо подкрутить на сервере, чтобы Content-type был "application/xhtml+xml", либо, если это файл на диске, дать ему расширение ".xml"

P.S. Кстати, насчет кода в комментариях. Если лень заменять < на <, то можно еще его вставлять прямо в первозданном виде, но с отступом слева на 4 пробела. Тогда он будет сам экранироваться и переводы строк соблюдать.

Иван Сагалаев

    <p>Вот, сделал тестовый документ. Один и тот же исходный код, который отдается с сервера с разными Content-type:</p>

[test.xml](/blog/wp-content/test.xml), Content-Type: application/xml
IE6 показывает в виде дерева.
[test.xhtml](/blog/wp-content/test.xhtml), Content-Type: application/xhtml+xml
IE6 у меня его вообще отказался показывать, предложил сохранить на диск.

Firefox оба документа показывает как веб-страницу. То есть пишет title в заголовке и применяет дефолтные стили к абзацу. Кстати, интересно, что несмотря на то, что в первом случае тип документа — "какой-нибудь XML вообще", он все равно опознается, как XHTML. Почему? По namespace. На него браузер смотрит, когда content-type'а недостаточно.

Michael Yakovis

Это даже полезно, нужен хоть какой-то порог вхождения, простота html уже сыграла свою вредную роль.
Вы, наверное, программист. Я почти уверен.

Простота создания сайтов — это лучшее, что есть в интернете. Какими бы кривыми и косыми они ни были. Благодаря этой простоте и низкому порогу вхождения интернет существует в том виде, в котором мы его знаем.

Автор редкой коллекции не должен бежать к профессионалу, чтобы показать ее миру.

Это я говорю как человек, который получает деньги от тех, кто до профессионалов все же добегает.

Не нужно путать свое благо и общественное.

edgy

http://softwaremaniacs.org/blog/wp-content/test.xhtml
IE6 показал также как FF :)

Владимир Яшников

Интересная статья, что-то подобное (но не столь обстоятельное и арументированное) я читал на 456 Berea Street.

Много об этом пишет голландец Анне ван Кестерен.

Вроде это женщина? :)

P.S. Очень бы хотелось, чтобы вы сделали подписку на комментарии. :)

Алексей Захлестин

Много об этом пишет голландец Анне ван Кестерен.

Вроде это женщина? :)

нет. это как раз "молодой человек"

Corwin

А мне кажется что весь геморой в работе браузеров как раз от того, что так фривольно начали трактовать html. Тут обязателен закрывающий тег, тут не обязателен ... И пошло поехало ...
Основная мысль твоей статьи должны была быть - "использование безполезно, т.к. никогда не использовали", а не то что это зло по определению.
Что то тебя в какие то крайности заносит последнее время :)

UGgallery » Архив журнала » XHTML скорее мертв, чем жив

[...] Иван Сагалаев о том, что такое XHTML на самом деле. Статья позволяет реалистично взглянуть на различия между XHTML и HTML (без X). А принципиальных различий, на сегодняшний день, нету. ” нужно четко понимать, что чисто технически никакого XHTML в современном вебе не существует” [...]

Иван Сагалаев

То, что IE6 показал application/xhtml+xml — это, сдается мне, на WinXP SP2? Они, вроде, хотели там чинить как раз обработку Content-type...

Corwin, да весь геморрой именно от этого. Но проблема в том, что не будь этого, веб никогда не дошел бы до такой степени популярности. Абсолютно чистых решений ведь не бывает. Это вот теперь, когда и браузеры доработаны, и технологии проверены, можно потихоньку начинать чинить веб. Но я бы поспорил, что это надо делать именно XHTML, потому что обратная совместимость с HTML, который уже написан за эти 15 лет, игнорировать нельзя.

Кстати, то что XHTML — зло, я и не писал :-). Основная мысль статьи там выше, в жирной красной рамке :-).

Подпиской на комментарии я, наверное, таки займусь... А feed не поможет?

vilky

В моём скромном мнении, статья запоздала года на три. Тогда некоторые авторы воевали против XHTML, а потом они начали разрабатывать микроформаты XHTML.

Редкие случаи, в которых полезен брат Икс, уже давно нередки, строгость синтаксиса и DOM-конструкции давно привычны, а как сектанты с горящим взором воспринимаются противники XHTML.

P.S. А Анне ван Кестерен лучше не упоминать. Вы на WHATWG-рекомендации смотрели?

Алексей Захлестин

[re: vilky]

DOM-конструкции замечательно работают и в HTML. А важным недостатком XHTML являются высокие требования к качеству продукта, который его использует.
К сожалению время от времени случаются ситуации, когда какой-либо сайт вследствии некорректного user-input начинает отображать вместо сайта ошибку "non well-formed xml" и до вмешательства разработчика (а вы ещё достучитесь до него) сайт простаивает и владелец теряет деньги…

Мораль-таки: XHTML — это не плохо, но использовать его нужно только если вы абсолютно уверены, что вам это нужно. XHTML не замена для HTML, а просто-напросто другой формат

HTML — низкий порог вхождения, быстрый старт, эффективная разработка

XHTML — удобство пост-процессинга

Tomaz

Не смотря на то, что DOM работает как для HTML так и для XHTML, я на практике часто использую специфичные для HTML DOM свойства и методы.

Ну нравится мне работать с атрибутами тегов как со свойствами объекта. Вместо того, чтобы вызывать функции getAttribute('attr') и setAttribute('attr', 'value') я просто использую = .

Мне также нравится сокращать объем кода в 2 - 3 раза и делать его более читабельным, используя методы HTML DOM для редактирования таблиц.

До тех пор, пока мне не нужно в моих проектах использовать MathML, SVG или другой XML язык, я останусь верен HTML.

Как правильно Иван заметил - пока самый распространенный браузер не будет воспринимать XHTML - для веба эта технология не востребованна. Как вы думаете, когда IE6 будет занимать меньше 2% рынка браузеров (чтобы можно было не принимать его во внимание)? Я думаю лет через 5 - 7.

Владимир Яшников

Фид был бы предпочтительнее.

Julik

У XHTML есть масса других достоинств, которые ты не упомянул (а может быть забыл). Одно из них - элементарная внятность кода. Ты же знаешь например, что три вложенных друг в друга списка без закрывающих тегов малочитаемы? Равно как малочитаема для твоего парсера ситуация что теги в нижнем регистре. Обычный HTML слабопригоден для машинного потребления.

И примеров кода приводить не хочу, потому что эти ваши питоновские четыре пробела мне впились :-) больно много печатать придется.

Иван Сагалаев

Ты же знаешь например, что три вложенных друг в друга списка без закрывающих тегов малочитаемы?

Если для человека, то читаемость управляется в основном отступами, а не закрывающими тегами. И ей богу, на мой вкус закрывающие читаемость скорее ухудшают.

Обычный HTML слабопригоден для машинного потребления.

Скажем так — менее пригоден, чем XML, тут не поспоришь. Но дело в том, что эта проблема во многом уже решена. Да, парсеры HTML куда более здоровы и витиеваты, но они есть, написаны.

И примеров кода приводить не хочу, потому что эти ваши питоновские четыре пробела мне впились :-)

Это markdown'овские 4 пробела :-). Я обычно пишу код в текстовом редакторе с любыми отступами, а потом двигаю на 4 пробела весь блок. Удобно.

Julik

Про 4 пробела я пошутил (сам маркдаун пользую), а что касается отступов это тоже питонизм! иметь закрывающие теги правильно и вкусно (на досуге подумай об этом).

Что же касается парсеров - ты издеваешься, да? Плюс - подумай об XML-шаблонах (не о тех которые XSLT а о тех которые XML + namespace шаблонера). Как ты их комфортабельно сделаешь на HTML?

Я считаю что XHTML даже в частичном варианте неплох, потому что меньше ambiguity и раздрая (+есть шанс обработать получившиеся документы в будущем ну хоть ЧЕМ нибудь кроме браузера).

Александр Вольф

Всё написанное в статье верно, но только взгляд на "проблему" получился несколько однобоким. Не понимаю, зачем циклиться на desktop-вариантах UA? Есть и мобильные UA, для которых парсить XHTML предпочтительнее HTML.

Иван Сагалаев

Я, в общем-то, и не имел в виду только десктопные браузеры. Но вопрос действительно интересный.

Насколько я понимаю, одним из вкусных плюсов, который виделся при создании XHTML'а, было то, что поскольку строгий парсер проще и меньше, этот язык даст толчок развитию чистых XHTML-браузеров как раз на мобильных устройствах, где простота и размер крайне важны.

Но есть одна очень неприятная проблема: огромное количество существующего HTML-контента. Браузер, который не может показывать текущий веб, никому не нужен. То, что именно эта проблема — Самая Главная Проблема Браузера, красочно доказывают первые 3-4 года развития Mozill'ы, когда этот самый на то время распродвинутый браузер не был никому известен, потому что из-за маниакального пристрастия к чистоте стандартов, он не показывал множества страниц. Зато потом они осознали свои ошибки, сделали quirks mode, и реализовали . И сразу браузер стал куда популярнее, даже несмотря на плохой UI, раздутый размер и медленную скорость.

Так вот, решить эту проблему можно только двумя способами: или переписать весь веб на XHTML, или впихнуть HTML-парсер в мобильные устройства. Большинству из нас здесь с инженерными мозгами первый вариант покажется, вероятно, лучшим. Потому что лучше иметь четкую технологию и управляемые инструменты, чем кашу тегов и перепатченные парсеры.

Но реальность отличается. Несмотря на многолетние усилия евангелистов, веб-мастеры не переделали веб в XHTML. А вот зато Мозилла и Опера таки умудрились засунуть свои движки на мобильные устройства: Minimo и Opera Mobile. Причем со стороны мозилловцев это вообще удивительно, учитывая неслабые размеры Gecko...

И чем дальше я про это думаю, тем больше понимаю, что и быть не могло по-другому. Что проще, заставить миллионы бизнесменов выложить деньги, чтобы починить то, что и так уже работает или двум-трем командам инженеров напрячься и совместить растущие мощности мобильных устройств и усилия по оптимизации кода?

Баранов Андрей

Неплохо все написано, однако проблема существует в большей степени из-за неповоротливости производителя широко распространенного браузера (вспомните, сколько ему уже лет).
Хотелось бы еще поправить:

Например, будет ли IE6 считать размеры боксов по стандарту или в режиме совметимости с IE5, зависит от того, указать ли ему DOCTYPE строгого (X)HTML или нет.

Это зависит от отсутствия/наличия какого-либо текста перед строкой DOCTYPE. Т.е. Standards mode можно включать как в xhtml strict, так и в transitional. В html4 для ие6 тоже можно с помощью doctype переключать режим quirks или standards, только немного иначе.

Фоновый цвет body в XHTML не распространяется автоматически на все окно

И не должен. Значение высоты body по умолчанию: auto, т.е. зависит от высоты содержимого, а не размеров окна браузера. В HTML4.01 фоновый цвет body тоже не заливает все окно. Заливка всего окна происходит лишь в ие6 если вовсе не указывать doctype, а в ие5-5,5 не зависимо от наличия все того же doctype.

Иван Сагалаев

В HTML4.01 фоновый цвет body тоже не заливает все окно.

Все же заливает. Несмотря на то, что высота его остается auto. Это легко проверить, указав фоновый цвет и рамку на body.

Это, насколько я понимаю, исторически сложилось. А сейчас закреплено в CSS 2.1: http://www.w3.org/TR/CSS21/colors.html#q2 (там весь четвертый абзац).

Баранов Андрей

    <ol>

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/1999/REC-html401-19991224/loose.dtd">

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">

[<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">](http://xhtml.ru/experiment/bodyheight/html401trnourl.html)

[<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">](http://xhtml.ru/experiment/bodyheight/html40trnourl.html)

как можно убедиться, заливка body зависит не от версии html, а от режима браузера: standards, quirks...

Добавить комментарий