1. Weiterleitung zu NetzLiving.de
  2. Forum
    1. Unerledigte Themen
  3. zum neuen Forum
  • Anmelden
  • Suche
Dieses Thema
  • Alles
  • Dieses Thema
  • Dieses Forum
  • Seiten
  • Forum
  • Erweiterte Suche
  1. Informatik Forum
  2. Community
  3. Smalltalk

Datei encodierung

  • Keyser_Sozo
  • 22. August 2008 um 12:38
  • Unerledigt
Hallo zusammen,

das Informatik-Forum geht in den Archivmodus, genaue Informationen kann man der entsprechenden Ankündigung entnehmen. Als Dankeschön für die Treue bekommt man von uns einen Gutscheincode (informatikforum30) womit man bei netzliving.de 30% auf das erste Jahr sparen kann. (Genaue Infos sind ebenfalls in der Ankündigung)

Vielen Dank für die Treue und das Verständnis!
  • Keyser_Sozo
    Punkte
    1.165
    Beiträge
    163
    • 22. August 2008 um 12:38
    • #1

    hallo,

    kennt wer ein tool um die encodierung einer datei rauszufinden?


    danke,
    andi

  • Kampi
    Punkte
    7.828
    Beiträge
    1.468
    • 22. August 2008 um 12:59
    • #2

    'file' bzw 'enca'

  • Keyser_Sozo
    Punkte
    1.165
    Beiträge
    163
    • 22. August 2008 um 13:42
    • #3

    hi,

    is leider windows

  • MaxAuthority
    Punkte
    3.165
    Beiträge
    626
    • 22. August 2008 um 17:35
    • #4
    Zitat von Keyser_Sozo

    hi,

    is leider windows

    http://www.cygwin.com/

  • Keyser_Sozo
    Punkte
    1.165
    Beiträge
    163
    • 25. August 2008 um 17:54
    • #5

    hey cygwin kenn ich :)

    es muss doch auch für windows ein tool geben, das mir anzeigt, mit welchen zeichensatz eine datei abgespeichert ist.
    hat noch nie jemand sowas gebraucht?

  • hal
    Punkte
    11.122
    Beiträge
    2.208
    • 25. August 2008 um 18:20
    • #6

    Generell geht das gar nicht. Wenn man gewisse Dinge über eine Datei weiß (zB, in welcher Sprache sie verfasst wurde), kann man Heuristiken anwenden, die dann eine gewisse Wahrscheinlichkeit berechnen, dass eine Datei in einem bestimmten Encoding ist (durch Vergleichen der Häufigkeit von Codepunkten in der Datei mit der Häufigkeit von Zeichen in dieser Sprache).
    UTF-8 ist das einzige (übliche) Encoding, das auch fehlschlagen kann, weil es gewisse Bytefolgen gibt, die in diesem Encoding einfach nicht zulässig sind. Hilft einem aber auch nicht wirklich weiter.
    UTF-16 hat normalerweise eine BOM davor, das ist FFFE oder FEFF (je nach byte ordering), an dem kann mans ganz gut erkennen (weil das in anderen Encodings eine recht unübliche Bytefolge ist).

    Einmal editiert, zuletzt von hal (25. August 2008 um 18:24)

  • Keyser_Sozo
    Punkte
    1.165
    Beiträge
    163
    • 25. August 2008 um 19:08
    • #7

    ok, ich dachte bei jeder datei is explizit angeben in welchen zeichensatz die datei abgespeichert ist. so wie bei webpages fesgelegt wird welchen zeichensatz sie entsprechen.

    konkret gehts darum dass netbeans bei php-entwicklung immer die umlaute in unlesbare sonderzeichen umwandelt wenn ich netbeans schließe, ohne die datei vorher zu schließen. hatte das schonmal jemand?


    danke,
    andi

  • hal
    Punkte
    11.122
    Beiträge
    2.208
    • 26. August 2008 um 00:19
    • #8

    Viele Editoren (vim und emacs zumindest) erlauben es, ganz am Anfang der Datei als Kommentar anzugeben, welches encoding das file hat. Das ist zwar auch nicht 100% korrekt (der header an sich braucht ja auch schon ein encoding, und wo steht dieses dann?), aber funktioniert in der Praxis ganz gut.

    Manche Dateisysteme erlauben es, das encoding explizit als metadata anzugeben (speziell BeFS auf BeOS und HFS+ auf Mac OS X), aber das ist noch nicht sehr verbreitet.

    Meine Kurzrecherche zu Netbeans hat ergeben, dass man das irgendwo in den Projekteinstellungen einstellen kann.

  • Keyser_Sozo
    Punkte
    1.165
    Beiträge
    163
    • 26. August 2008 um 17:48
    • #9

    danke für die info - das hab ich studium wohl nicht ganz mitgekriegt.
    bei netbeans kann man bei den project settings die encodierung einstellen - das war auch korrekt auf utf-8 eingestellt, mittlerweile stellte sich raus, das ein bug in der serialisieren der selektierten datei ist

    http://www.netbeans.org/issues/show_bug.cgi?id=144694


    liebe grüße
    andi

  • Maximilian Rupp 29. Dezember 2024 um 15:56

    Hat das Thema aus dem Forum Sonstiges (Archiv) nach Off-Topic verschoben.

  1. Datenschutzerklärung
  2. Impressum