PDA

Archiv verlassen und diese Seite im Standarddesign anzeigen : Suche Programm zur Massenkonvertierung des Zeichensatzes


dav133
2009-02-02, 15:27:10
Hallo,

ich habe hier ein komplettes Webprojekt bestehend aus ~1500 .php-Dateien, die alle recht schlampig mal in UTF-8, mal in ISO-8859-1 codiert sind. Zu allem Überfluss variiert dann auch noch die Art der Zeilenumbrüche zwischen dem Windows-Format (\r\n) und dem Unix-Format (nur \n). In Notepad++ lässt sich alles, was ich will toll verstellen:

http://img2.abload.de/img/charsetfyts.jpg

Allerdings bietet das Programm keine Möglichkeit zur Stapelverarbeitung von ganzen Verzeichnissen. Weaverslave kann mir zumindest schonmal mit den Zeilenumbrüchen per Suchen/Ersetzen mit Regular Expressions in mehreren Ordnern weiterhelfen, allerdings resigniert er bei Zeichencodierungsformaten.

Kann mir jemand weiterhelfen?

lg

/edit:

Gerade ist mir was über den Weg gelaufen (http://www.robinland.com/en/free-product/ansi2uni), was sich in einem ersten Test als sehr praktikabel herausgestellt hat. Konvertiert (mit Angabe der "Codepage" 1252 (was wohl ISO-8859-1 entspricht) ganze Verzeichnisse zu UTF-8 (und was ganz wichtig ist: auch zu UTF-8 ohne BOM). Dabei scheint es unerheblich zu sein, ob die Source-Files wirklich die angegebene Codepage 1252 haben, Ansi2Uni schafft's auch, UTF-8 mit BOM zu UTF-8 ohne BOM zu konvertieren.

lg