- Rune Kaagaard: Konvertering af HTML til semantisk form
- Troels Knak-Nielsen: Hemmeligt projekt
Rune Kaagaard holder et oplæg under titlen "Konvertering af HTML fra u-semantisk til semantisk form baseret på visuelle cues."
Oplægget vil berøre:
1) Rendering af en webside i en headless version af webkit browseren.
2) Afvikling af javascript i webkit som indsamler information om dom elementer.
3) Analyse og transformation af HTML baseret på hvert dom elements position, størrelse, text-format, etc.
4) Generel oprydning af HTML v.h.a. HTML Tidy, HTML Purifier og phpQuery.
5) Praktiske erfaringer fået undervejs (entities, brug af de nye HTML5 tags, osv.).
Webkit delen bruger PyQt og analysen forgår i et drupal modul.
Metoden er Inspireret af denne bog.
Troels Knak-Nielsen har et hemmeligt projekt at vise frem. Det har noget med PEAR og github at gøre.
Comments