Zum Inhalt springen

Wie im ursprünglichen Beitrag angesprochen, dürfen nur bestimmte Zeichen für URL-Fragmente verwendet werden. In der ersten Version der Extension wurde der Feldwert daher beim Speichern durch PHP geprüft. Falls notwendig, wurden dabei Ersetzungen durchgeführt. Ab sofort sorgt ein JavaScript dafür, dass sofort beim Verlassen des Feldes eine gleichwertige Evaluierung vorgenommen wird!

Die verschiedenen Schritte sind grundsätzlich ähnlich gehalten wie in PHP:

  1. Umwandeln in Kleinbuchstaben
  2. Entfernen von HTML-Elementen
  3. Ersetzen von Leerzeichen und Tabs durch Bindestriche
  4. Ersetzen diakritischer Zeichen und Währungen (z.B. àä€)
  5. Entfernen aller nicht kompatiblen Sonderzeichen
  6. Ersetzen mehrerer aufeinanderfolgender Bindestriche durch einen einzelnen
  7. Abschließendes erneutes Umwandeln in Kleinbuchstaben

Ersetzen diakritischer Zeichen

In PHP wird dazu die Klasse CharsetConverter mit einer Zeichentabelle verwendet, die unter typo3temp/var/charset/csascii_utf-8.tbl zu finden ist. Die ist aber etwas zu umfangreich für JavaScript.

Stattdessen habe ich im DataTables-Projekt eine JavaScript-Map mit diakritischen Zeichen und deren Ersetzungen finden können. Glücklicherweise ist dessen Lizenz mit GPL v2 kompatibel. Hier konnte ich die Großbuchstaben aus der Map entfernen und dafür ein paar gängige Währungen ergänzen.

Entfernen aller nicht kompatiblen Sonderzeichen

Wenn der Firefox Unicode property escapes beherrschen würde, wäre alles ganz einfach gewesen:

value = value.replace(/[^\p{L}\p{M}0-9\-_.]/ug, '');

Kann er aber aktuell noch nicht – daher musste ich eine andere Lösung finden. Mithilfe dieses Transpilers habe ich den regulären Ausdruck dann so umgewandelt, dass jeder Browser damit umgehen kann. Dadurch ist er leider deutlich angewachsen.

Durch die Arbeiten habe ich die Gelegenheit gefunden, mich mal etwas näher mit regulären Ausdrücken zu beschäftigen. Zwei Fliegen mit einer Klappe geschlagen!

Zur News-Übersicht