hallo!
ich stehe vor einem kleinem zeichenkodierungsdilemma. ich bekomme von linux/windows/aix systemen textfiles und will deren zeichenkodierung ermitteln. das muss nicht mal automatisch geschehen, also gerne auch per irgendeinem tool. es kann wohl immer entweder utf-8, unix oder ascii sein. nur wie erkenne ich die unterschiede?
mein ansatz war der zeilenumbruch, der laut wikipedia ja mit cr oder lf kodiert ist. (oder cr/lf). allerdings kann ich damit nicht direkt auf den zeichensatz schließen.
habt ihr einen weg um sicher die kodierung einer datei zu ermitteln? kann man das vielleicht auf basis eines zeichens machen, welches in allen zeichensätzen unterschiedlich ist? (in den hex-werten)
danke für die hilfe!
grüße,
pm