Seite 1 von 1
Webseiten in utf-8 konvertieren
Verfasst: 01.05.2008, 08:13
von chillmensch
Hey Guys (hey Milky

),
ich bin grad am Überlegen, ob ich meine Webseiten auf utf-8 umstelle, jedoch weiß ich nicht, was ich dabei beachten muss...? Kann ich einfach die Textdateien von iso-8859-1 in utf-8 konvertieren und das entsprechende Meta-Tag ändern?
Kennt ihr ein Windows-Programm (Linux ist grad nicht installiert), mit dem ich problemlos alle Textdateien eines Verzeichnisses und dessen Unterverzeichnissen in utf-8 konvertieren kann?
Danke schonmal

Verfasst: 01.05.2008, 10:12
von schmidtsmikey
http://de.selfhtml.org/html/kopfdaten/m ... nkodierung
Ich würde Dir aber empfehlen, auf ein Content Management System (Joomla, Typo3) umzusteigen. Je komplexer die Seite wird, desto schwieriger wird es, eine statische Webseite zu administrieren.
ich spreche mit PC-Erfahrung.de aus Erfahrung

Verfasst: 01.05.2008, 11:58
von chillmensch
schmidtsmikey hat geschrieben:http://de.selfhtml.org/html/kopfdaten/meta.htm#zeichenkodierung
Ich würde Dir aber empfehlen, auf ein Content Management System (Joomla, Typo3) umzusteigen. Je komplexer die Seite wird, desto schwieriger wird es, eine statische Webseite zu administrieren.
ich spreche mit PC-Erfahrung.de aus Erfahrung

Keine Sorge, meine Homepage basiert auf PHP, die News werden aus einer MySQL-DB generiert. Die einzelnen Seiten werden per include() eingebunden.
Hatte das ganze System auch mal komplett Datenbank-basiert programmiert, aber da bekam ich Probleme mit der Bildverwaltung...
Verfasst: 01.05.2008, 12:14
von schmidtsmikey
Schon mal mit Typo3 beschäftigt?
Verfasst: 01.05.2008, 14:54
von chillmensch
Ja kurzzeitig, aber das ist mir zu komplex und für meinen Geschmack auch zu überladen

Für mich muss etwas so einfach wie möglich und so aufgeblasen wie nötig programmiert sein. Viele Funktionen von Typo3 brauche ich einfach nicht...
P.S.: Seit wann bist du eigtl. wieder so viel im Forum aktiv?
Verfasst: 01.05.2008, 19:41
von schmidtsmikey
Hi, ich habe festgestellt, dass die Community stark nachgelassen hat und ich etwas den Kontakt zur Basis verloren habe. Sofern ich Zeit habe, werde ich mich blicken lassen...
Verfasst: 01.05.2008, 22:16
von chillmensch
Ja, das ist mir auch aufgefallen, deswegen bin ich auch immer seltener hier...
Ich erinner' mich noch an die Zeiten mit Dir, exclis0, Aod, maca, coolmann, holzarsch, czuk, lüfti und all' den Freaks
Ich muss diesbezüglich leider zugeben, dass damals das "Niveau" wesentlich höher war...
Verfasst: 02.05.2008, 07:58
von schmidtsmikey
Das ist richtig, aber ich muss auch sagen, dass ich mit PC-Erfahrung.de schon einen riesen Berg Arbeit habe. Ich erhoffe mir, dass durch das ...
... abgeschaltete Pruning
... das neue Design
... das bald erscheinende "neueste Forenbeiträge" auf PC-Erfahrung.de
... meiner im Vergleich zur Vergangenheit regelmäßigen Anwesenheit
das Niveau im Forum wieder gesteigert wird.
Verfasst: 02.05.2008, 08:46
von chillmensch
Ich glaub heut nachmittag wird wieder Linux auf meine Kiste gespielt, dort kann ich in einem Schritt alle Textdateien von iso-8859-1 in utf-8 konvertieren. Danach ändere ich den Meta-Tag und suche mir einen guten Editor, der mit utf-8 umgehen kann...
Zur Zeit benutze ich Weaverslave, meines Erachtens nach einer der besten (X)HTML-Editoren, doch leider unterstützt dieser kein utf-8 und die Weiterentwicklung wurde schon vor 3 Jahren eingestellt...
Verfasst: 02.05.2008, 09:33
von -AB-
chillmensch hat geschrieben:Ich erinner' mich noch an die Zeiten mit Dir, exclis0, Aod, maca, coolmann, holzarsch, czuk, lüfti und all' den Freaks

hey, ich bin auch noch da!

(auch wenn ich ja gar nicht zu der soo alten garde gehöre.....)
zu deinem problem: ich denke mal du hast zu viele seiten um die einfach manuell zu bearbeiten oder?
kannst du nicht einfach ein script (PHP, Java) schreiben was alle dateien öffnet (iso deutschland) (außer binaries

) und wieder abspeichert? (utf8) schätze mal in PHP wäre das eine sache von hmm, 10-15 minuten?
oder ja, machs einfach unter linux

Verfasst: 02.05.2008, 10:32
von chillmensch
wo du grade java sagst... keine schlechte idee, das kann ich ja auch programmieren...
aber ich hatte sowieso vor, heute mein system mit win xp sp3 und ubuntu 8.04 lts (ubuntu natürlich nach meiner methode:
http://computer-suite.de/Linux,Minimale ... ation.html) neu zu installieren...
P.S.: Sorry, dass ich dich vergessen hatte -AB-

Verfasst: 02.05.2008, 13:13
von chillmensch
so, ich habe soeben meinen rechner neu aufgesetzt, auch unter ubuntu läuft schon wieder alles... mein einziges problem: ich habe vergessen, wie der befehl hieß, um textdateien in utf-8 zu konvertieren..
ich hatte convert im gedächtnis, leider war das ein befehl von imagemagick zum maipulieren und umwandeln von bildern...
kann mir jemand auf die sprünge helfen?
EDIT: Sorry, ich hab den befehl grad wieder gefunden iconv
für meinen zweck lautet der Befehl:
Code: Alles auswählen
iconv -f latin1 -t utf-8 dokument.txt >> dokument_neu.txt
nun muss ich mir nurnoch eine funktion basteln, die mir alle textdateien automatisch konvertiert... mit java.. möglich, nur die bash liefert ja auch kontrollstrukturen / schleifen etc...
@meik: das wäre mal einen artikel auf pce wert finde ich... bash-programmierung fehlt noch... (ich weiß, die latte an artikeln, die du schreiben möchtest, ist noch lang.. ich kenne das problem auch recht gut

)
Verfasst: 02.05.2008, 13:57
von chillmensch
Nachdem ich nun an der Konsole gescheitert bin (ich sollte mich mal wieder mit Pipes und bash-Programmierung beschäftigen...) und nun nicht extra ein Java-Programm schreiben wollte, habe ich ein bisschen weitergegoogelt und folgendes gefunden
http://de.gentoo-wiki.com/Utf8#Dateiinhalte
Verfasst: 02.05.2008, 14:24
von chillmensch
Soweit so gut... alle php-Dateien sind konvertiert...
Jedoch werden alle Umlaute, die aus der MySQL-DB gezogen werden falsch angezeigt... ich habe die Kollation überall auf "utf8_unicode_ci" gestellt...
Kann mir da jemand weiterhelfen?
Verfasst: 02.05.2008, 14:34
von chillmensch
Und ich war mal wieder zu voreilig...
http://www.geek-blog.de/2006/11/03/mysq ... 1-problem/
Einfach dem MySQL-Server mitteilen, wie er die Inhalte zu übermitteln hat und alles läuft wie gewünscht...
Nun haben wir wenigstens eine komplette Übersicht, wie man latin1-codierte Webseiten in utf-8 umwandeln kann

Verfasst: 02.05.2008, 15:04
von -AB-
supi

hatte das problem auch schonmal, als ich von meinem arbeitgeber westeuropäische textdateien bekommen hab, und mit utf8 codierten neu geschriebenen seiten davon gelesen hab usw

aber bei mir wars eine überschaubare menge, und habe das per hand gemacht...
wie wärs eigentlich wenn wir ne TODO-liste für artikel hier im forum anlegen, und jeder der möchte einen artikel vorschlagen kann, der kann dann ja in kooperation hier im forum vollendet werden und dann auf die seite gestellt werden? dann könnte man eigentlich auch direkt für fragen auf den thread verlinken in dem der beitrag geschrieben wurde...... (wir brauchen auch noch einen glühbirnen-smiley!)
Verfasst: 03.05.2008, 17:08
von chillmensch
So meine Page habe ich nun erfolgreich auf UTF-8 konvertiert. Bisher habe ich nur einige Sonderzeichen gefunden, die falsch konvertiert wurden...
Einmal unten auf die Grafik klicken und ihr gelangt auf meine "brandneue" UTF-8-codierte Internetseite
P.S.: Im gleichen Zug bin ich auf die IDE Aptana (
http://www.aptana.com/) umgestiegen, da mein bisheriger Editor Weaverslave kein utf-8 unterstützt...
Verfasst: 04.05.2008, 11:00
von chillmensch
So ich habe nun aus den ganzen Erkenntnissen hier ein Tutorial erstellt, wie man Webseiten auf UTF-8 umstellt:
http://computer-suite.de/Sonstiges,Webs ... ellen.html
Vielleicht fallen jemandem ja noch Verbesserungsvorschläge oder Erweiterungen für den Artikel ein...