Filtrage du HTML de l'éditeur
Le plus grand danger vient sans doute de l'éditeur TinyMCE puisque le HTML généré doit être gardé pour ne pas perdre la mise en page. Le HTML est nettoyé par HTMLawed, qui filtre donc par défaut un certains nombre de choses dangereuses, notamment les balises: applet, audio, canvas, embed, iframe, object, script, video.
Une liste blanche d'éléments HTML peut-être utilisée pour renforcer le filtre, les balises susceptibles d'être créées par l'éditeur sont donc les seules autorisées:
h1, h2, h3, h4, h5, h6, p, br, s, em, span, strong, a, ul, ol, li, sup, sub, code, blockquote, div, pre, table, caption, colgroup, col, tbody, tr, th, td, figure, img, figcaption, iframe, small
Une liste noire d'attributs peut également être ajoutée. J'ai dû laisser style, src et href qui sont utilisés par l'éditeur, j'ai bloqué id et class.