Autor |
Nachricht |
|
Titel: Zeichensatz von Dateien herausfinden & umbenennen
Verfasst am: 17.11.2006, 13:41 Uhr
|
|
Anmeldung: 24. Nov 2004
Beiträge: 95
Wohnort: Chemnitz
|
|
Hallo Kanoten,
gibt es eine Möglichkeit herauszufinden, mit welchen Zeichensatz eine Datei erstellt wurde? Ich habe das Problem, dass ich eine Festplatte mit Backups habe, die aus mehreren PCs mit unterschiedlichen Zeichsatzcodierungen (Win/Linux) stammen. Nun möchte ich diese von den Kästchen und Fragezeichen befreien und alle auf UTF8 umstellen. Da ich aber den Ursprungszeichensatz nicht weiss ist es schon etwas schwieriger...
Am besten wäre es, wenn es noch ein Programm gäbe was dies automatisch umstellt, a la convmv...
Hoffe nicht zu viel zu verlangen
Ciao, PaulchenPlump |
|
|
|
|
 |
|
Titel:
Verfasst am: 26.11.2006, 07:39 Uhr
|
|
Anmeldung: 12. Mar 2005
Beiträge: 368
|
|
Hi PaulchenPlump,
>>>gibt es eine Möglichkeit herauszufinden, mit welchen Zeichensatz eine Datei erstellt wurde?
Ja, mit 'file -i Datei'
>>>...und alle auf UTF8 umstellen
mit 'iconv'
http://www.tu-chemnitz.de/urz/linux/faq/unicode.html |
_________________ Gruss an alle Kanotix-Fans, blauweiss
|
|
|
|
 |
|
Titel:
Verfasst am: 27.11.2006, 11:24 Uhr
|
|
Anmeldung: 24. Nov 2004
Beiträge: 95
Wohnort: Chemnitz
|
|
Hallo blauweiss, Hallo fleißige Helfer
blauweiss hat folgendes geschrieben::
>>>gibt es eine Möglichkeit herauszufinden, mit welchen Zeichensatz eine Datei erstellt wurde?
Ja, mit 'file -i Datei'
Ok, das kannte ich noch nicht, nützt mir aber auch nichts - leider.
Es handelt sich zumeist nicht um Textdateien und es soll nur der Dateiname umbenannt werden. Leider liefert 'file -i' den Mime-Code und nur für Textdateien das charset.
Aber danke für die Info! Gibt's weitere Vorschläge?
Ciao, PaulchenPlump |
|
|
|
|
 |
|
Titel:
Verfasst am: 27.11.2006, 11:36 Uhr
|
|

Anmeldung: 05. Jul 2006
Beiträge: 127
|
|
|
|
 |
|
Titel:
Verfasst am: 27.11.2006, 20:42 Uhr
|
|
Anmeldung: 24. Nov 2004
Beiträge: 95
Wohnort: Chemnitz
|
|
Danke für den Tipp, aber das gleiche erreiche ich doch mit convmv?! Das Problem, was ich bei dieser Lösung immer noch habe ist, dass ich ja die Ursprungscodierung "nicht" kenne...
Oder habe ich was übersehen?
Ciao, PaulchenPlump |
|
|
|
|
 |
|
Titel:
Verfasst am: 27.11.2006, 21:27 Uhr
|
|
Anmeldung: 08. Feb 2004
Beiträge: 456
Wohnort: Berlin
|
|
@ PaulchenPlump
Ich habe bei mir alle Verzeichnisse mit
Code:
convmv --notest -r -f latin1 -t utf-8 /home/<user>
geändert.
Die Wahrscheinlichkeit, dass latin1 die Urprungscodierung ist, ist hoch. Wenn du den Parameter "--notest" weg läßt, dann gibt es zunächst einen Trockenlauf und du kannst das Ergebnis sehen.
Vgl auch
Code:
man convmv
Gruß
oduffo |
_________________ PC und Laptop: 2006-01 RC4 mit 2.6.18-kanotix-1 im Produktiveinsatz. Printer, Scanner, WLAN ok
|
|
|
|
 |
|
Titel:
Verfasst am: 27.11.2006, 21:38 Uhr
|
|
Anmeldung: 17. Dez 2003
Beiträge: 16792
|
|
Es ist nicht latin1 sondern iso-8859-15. |
|
|
|
|
 |
|
Titel:
Verfasst am: 28.11.2006, 00:01 Uhr
|
|

Anmeldung: 09. Apr 2005
Beiträge: 203
|
|
Habs mit con... probiert und iso-8859-15 statt latin1. Es kommt aber die Fehlermeldung: wrong/unknown "to" encoding. Das wäre ja utf-8. Walum? |
_________________ unsensibel, aber empfindlich
|
|
|
|
 |
|