Hi,
ich hab hier schon ein paar Beiträge verfasst nicht weil ich in HTML Seiten erstelle sondern weil ich mir oft Bücher als PDF über eine OCR-Software in ePub wandeln lasse - und ePub ist ichts weiter als xHTML-Dateien in einem Archiv. Normalerweise nutze ich unter Linux Calibre Editor oder Sigil, was gegenüber HTML-Editoren den Vorteil hat, dass bestimmte nicht von eBook-Readern unterstützte HTML-Elemente, gar nicht genutzt werden können.
Aktuell habe ich ein umfangreiches Buch mit vielen Tabellen, die leider vom OCR-Tool alle sehr individuell erstellt wurden - die Quelle war nur mittel und Hintergrundbildchen und -muster führten zu teils krummen Ergebnissen. Ich will jetzt erstmal alle "Nicht-Tabellen-Elemente" (außer: table, tr und td) aus den Tabellen löschen. Teils sind das <p ....>, <span ....> oder CSS in tr und td. Über Suchen&Ersetzen komme ich auch mit Regex nicht weit.
Gibt es einen HTML-Editor der sowas kann? "Alles löschen innerhalb von <table> außer <tr> und <td>"?
Regulator
P.S. Ich nutze wie gesagt Linux (Ubuntu), die OCR-Software läuft nur unter Windows in einer VM. Auch Windows wäre also verfügbar.