98.7 procent af danske webforsider har HTML-fejl

Ud af 1000 tilfældigt udvalgte danske webforsider var kun 13 sider skrevet med korrekt HTML -- dvs. at kun sølle 1.3% (±0.4%) af alle forsider er fejlfri.

Metode

Domænenavnene blev udtrukket tilfældigt fra DK-Hostmasters liste over danske domæner. For hvert domæne blev URL'en http://www.domæne.dk/ forsøgt hentet med wget. For at finde 1000 forsider var det nødvendigt at afprøve 1519 domæner, dvs. at mindst 65.8% (±1.2%) af danske domæner har en webside tilknyttet.

Herefter blev siderne valideret med SGML-validatoren fra OpenJade.

Andre resultater

Doctype

Tabellen viser hvilken HTML-version siderne angiver: Diagram over fordelingen af doctype

Doctypeantal%
Sum1000100%
1. Ingen83183.1%
2. HTML 4.0(1)767.6%
3. HTML 3.2525.2%
4. HTML 2.0353.5%
5. Andre60.6%

Som det ses, mangler hovedparten af siderne den obligatoriske doctype-erklæring. Så allerede fra første linje overholder langt de fleste sider ikke HTML-standarden.


Generator

Næste tabel viser hvilket redigeringsværktøj siderne angiver at være fremstillet i: Diagram over fordelingen af generator

Generatorantal%
Sum1000100%
1. Ingen68068.0%
2. Microsoft Frontpage20120.1%
3. Adobe GoLive434.3%
4. Stone's WebWriter171.7%
5. NetObjects Fusion90.9%
6. Microsoft Publisher70.7%
7. Mozilla60.6%
8. Microsoft Visual Studio50.5%
9. Andre323.2%

Adskillige udbredte webredigeringsværktøjer er berygtede for ikke at producere korrekt HTML, hvilket kunne være en forklaring på den store fejlprocent. Men en overraskende stor procentdel af siderne er tilsyneladende ikke lavet i en WYSIWYG-editor, så det lader ikke til at man kan skyde hele skylden på dårlige værktøjer.

Konklusion

Forsider er på nogle punkter næppe repræsentative for alle websider -- mange forsider er meget korte, og en del af domænerne er ikke for alvor taget i brug. Jeg tror dog desværre ikke, der er nogen grund til at tro, at undersider skulle være væsentligt mindre fejlbehæftede end forsiderne.

Den sørgelige konklusion må være, at flertallet af folk der laver websider er inkompetente, og ikke har forstået HTML.

Min hovedside