24.04.2025, 04:44 UhrDeutsch | English
Hallo Gast [ Registrierung | Anmelden ]

Neues Thema eröffnen   Neue Antwort erstellen
Vorheriges Thema anzeigen Druckerfreundliche Version Einloggen, um private Nachrichten zu lesen Nächstes Thema anzeigen
Autor Nachricht
PaulchenPlump
Titel: Zeichensatz von Dateien herausfinden & umbenennen  BeitragVerfasst am: 17.11.2006, 13:41 Uhr



Anmeldung: 24. Nov 2004
Beiträge: 95
Wohnort: Chemnitz
Hallo Kanoten,

gibt es eine Möglichkeit herauszufinden, mit welchen Zeichensatz eine Datei erstellt wurde? Ich habe das Problem, dass ich eine Festplatte mit Backups habe, die aus mehreren PCs mit unterschiedlichen Zeichsatzcodierungen (Win/Linux) stammen. Nun möchte ich diese von den Kästchen und Fragezeichen befreien und alle auf UTF8 umstellen. Da ich aber den Ursprungszeichensatz nicht weiss ist es schon etwas schwieriger...
Am besten wäre es, wenn es noch ein Programm gäbe was dies automatisch umstellt, a la convmv...

Hoffe nicht zu viel zu verlangen


Ciao, PaulchenPlump
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
blauweiss
Titel:   BeitragVerfasst am: 26.11.2006, 07:39 Uhr



Anmeldung: 12. Mar 2005
Beiträge: 368

Hi PaulchenPlump,

>>>gibt es eine Möglichkeit herauszufinden, mit welchen Zeichensatz eine Datei erstellt wurde?
Ja, mit 'file -i Datei'

>>>...und alle auf UTF8 umstellen
mit 'iconv'

http://www.tu-chemnitz.de/urz/linux/faq/unicode.html

_________________
Gruss an alle Kanotix-Fans, blauweiss
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
PaulchenPlump
Titel:   BeitragVerfasst am: 27.11.2006, 11:24 Uhr



Anmeldung: 24. Nov 2004
Beiträge: 95
Wohnort: Chemnitz
Hallo blauweiss, Hallo fleißige Helfer

blauweiss hat folgendes geschrieben::

>>>gibt es eine Möglichkeit herauszufinden, mit welchen Zeichensatz eine Datei erstellt wurde?
Ja, mit 'file -i Datei'

Ok, das kannte ich noch nicht, nützt mir aber auch nichts - leider.
Es handelt sich zumeist nicht um Textdateien und es soll nur der Dateiname umbenannt werden. Leider liefert 'file -i' den Mime-Code und nur für Textdateien das charset.

Aber danke für die Info! Gibt's weitere Vorschläge?

Ciao, PaulchenPlump
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
p500xl
Titel:   BeitragVerfasst am: 27.11.2006, 11:36 Uhr



Anmeldung: 05. Jul 2006
Beiträge: 127

Zitat:

Es handelt sich zumeist nicht um Textdateien und es soll nur der Dateiname umbenannt werden

googlen oder gleich hier
http://groups.google.de/group/de.comp.o ... a5d42aab96

backup nicht vergessen

_________________
astalavista == BSD is dying
http://talks.dixongroup.net/nycbsdcon2006/
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
PaulchenPlump
Titel:   BeitragVerfasst am: 27.11.2006, 20:42 Uhr



Anmeldung: 24. Nov 2004
Beiträge: 95
Wohnort: Chemnitz
Danke für den Tipp, aber das gleiche erreiche ich doch mit convmv?! Das Problem, was ich bei dieser Lösung immer noch habe ist, dass ich ja die Ursprungscodierung "nicht" kenne... Cool

Oder habe ich was übersehen?

Ciao, PaulchenPlump
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
oduffo
Titel:   BeitragVerfasst am: 27.11.2006, 21:27 Uhr



Anmeldung: 08. Feb 2004
Beiträge: 456
Wohnort: Berlin
@ PaulchenPlump

Ich habe bei mir alle Verzeichnisse mit
Code:
convmv --notest -r -f latin1 -t utf-8 /home/<user>
geändert.

Die Wahrscheinlichkeit, dass latin1 die Urprungscodierung ist, ist hoch. Wenn du den Parameter "--notest" weg läßt, dann gibt es zunächst einen Trockenlauf und du kannst das Ergebnis sehen.

Vgl auch
Code:
man convmv

Gruß
oduffo

_________________
PC und Laptop: 2006-01 RC4 mit 2.6.18-kanotix-1 im Produktiveinsatz. Printer, Scanner, WLAN ok
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
Kano
Titel:   BeitragVerfasst am: 27.11.2006, 21:38 Uhr



Anmeldung: 17. Dez 2003
Beiträge: 16792

Es ist nicht latin1 sondern iso-8859-15.
 
 Benutzer-Profile anzeigen Private Nachricht senden  
Antworten mit Zitat Nach oben
Witwe_Bolte
Titel:   BeitragVerfasst am: 28.11.2006, 00:01 Uhr



Anmeldung: 09. Apr 2005
Beiträge: 203

Habs mit con... probiert und iso-8859-15 statt latin1. Es kommt aber die Fehlermeldung: wrong/unknown "to" encoding. Das wäre ja utf-8. Walum?

_________________
unsensibel, aber empfindlich
 
 Benutzer-Profile anzeigen Private Nachricht senden E-Mail senden  
Antworten mit Zitat Nach oben
Beiträge vom vorherigen Thema anzeigen:     
Gehe zu:  
Alle Zeiten sind GMT + 1 Stunde
Neues Thema eröffnen   Neue Antwort erstellen
Vorheriges Thema anzeigen Druckerfreundliche Version Einloggen, um private Nachrichten zu lesen Nächstes Thema anzeigen
PNphpBB2 © 2003-2007 
 
Deutsch | English
Logos and trademarks are the property of their respective owners, comments are property of their posters, the rest is © 2004 - 2006 by Jörg Schirottke (Kano).
Consult Impressum and Legal Terms for details. Kanotix is Free Software released under the GNU/GPL license.
This CMS is powered by PostNuke, all themes used at this site are released under the GNU/GPL license. designed and hosted by w3you. Our web server is running on Kanotix64-2006.