Off Topic 20.511 Themen, 227.862 Beiträge

Zeichenfolge, Sortierung

Amenophis IV / 9 Antworten / Baumansicht Nickles

mir gehts um folgendes: Wenn ich Verzeichnisse anlege, kommt A vor B - klar.

Meines Wissens kommen in (Inhalts)verzeichnissen u.Ä. aber die Zahlen noch vor den Buchstaben. Wenn also in einem (Inhalts)verzeichnis aus irgend einem Grund ein Stichwort "1285" hieße, müsste es noch vor "A" kommen; zumindest habe ich das so in Erinnerung: Zahlen vor Buchstaben. Viele Programme machen das automatisch, siehe z.B. hier: http://www.herber.de/forum/archiv/460to464/t461370.htm

Ich finde allerdings nirgendwo entsprechende Regeln (auch bei Google nicht). Wo steht, was RICHTIG ist? Weiß da jemand was?

bei Antwort benachrichtigen
The Wasp Amenophis IV „Zeichenfolge, Sortierung“
Optionen

Wird afaik vom ASCII-Standard bestimmt. Ist ja Basis jeder Programmierumgebung.

Ende
bei Antwort benachrichtigen
Borlander The Wasp „Wird afaik vom ASCII-Standard bestimmt. Ist ja Basis jeder Programmierumgebung.“
Optionen

Also eine Sortierung nach ASCII-Code ist mir bislang noch nicht untergekommen, fängt schon damit an, daß _ und ~ vor den Buchstaben und Ziffern auftauchen von Umlauten oder weiteren Sonderzeichen mal ganz abgesehen. Daneben gibt es auch noch andere verbeitete Zeichencodierungen wie z.B. EBCDIC (speziell im Großrechnerumfeld zu finden)...

bei Antwort benachrichtigen
The Wasp Borlander „Also eine Sortierung nach ASCII-Code ist mir bislang noch nicht untergekommen,...“
Optionen

Zitat aus dem unten stehenden Link der Wikipedia: "Computersysteme codieren die gespeicherten Zeichenketten meist mittels des ASCII-, seltener noch des EBCDIC-Codes und ordnen die Zeichen (einschließlich Leerzeichen, Satz- und Sonderzeichen) nach dem zugeordneten Zahlenwert dieses Codes."

Da ich zu faul war, genau nachzulesen, konnte ich es auch nicht exakt definieren, der Ansatz nach ASCII-Standard war aber 100% korrekt.

"fängt schon damit an, daß _ und ~ vor den Buchstaben und Ziffern auftauchen von Umlauten oder weiteren Sonderzeichen mal ganz abgesehen"

Diverse Sonderzeichen wie auch die Tilde sind für den Windows-Namenraum verboten. Hast du offensichtlich vergessen. Der Rest ordnet sich imo nach der ASCII Folge, sofern sie die Basis ist und bei Windows ist sie definitiv die Basis.

Ende
bei Antwort benachrichtigen
Borlander The Wasp „Zitat aus dem unten stehenden Link der Wikipedia: Computersysteme codieren die...“
Optionen
Da ich zu faul war, genau nachzulesen, konnte ich es auch nicht exakt definieren, der Ansatz nach ASCII-Standard war aber 100% korrekt.
Also ich habe noch keine (aufsteigende) Sortierung gesehen bei der Z vor a kommt...

Diverse Sonderzeichen wie auch die Tilde sind für den Windows-Namenraum verboten. Hast du offensichtlich vergessen. Der Rest ordnet sich imo nach der ASCII Folge, sofern sie die Basis ist und bei Windows ist sie definitiv die Basis.
So divers sind die auch nicht - verboten sind gerade mal \ / : * ? " | da diese u.A. für Pfadangen und Suchmasken verwendet werden. ~ ist und war schon immer erlaubt und kommt auch bei der 8+3 Repräsentation von lagen Dateinamen zum Einsatz...
bei Antwort benachrichtigen
out-freyn Borlander „ Also ich habe noch keine aufsteigende Sortierung gesehen bei der Z vor a...“
Optionen
Also ich habe noch keine (aufsteigende) Sortierung gesehen bei der Z vor a kommt...

Ich schon - z.B. wenn man sich mit dem Firefox Verzeichnisinhalte anzeigen lässt (FTP oder lokal). Dann kommen zunächst 0-9, A-Z, a-z.
The conspiracy theory of society [...] comes from abandoning God and then asking: »Who is in his place?« (Sir Karl Popper, Conjectures and Refutations, 1963)
bei Antwort benachrichtigen
The Wasp Borlander „ Also ich habe noch keine aufsteigende Sortierung gesehen bei der Z vor a...“
Optionen

Z sollte vor a kommen, sofern zwischen Groß- und Kleinschreibung unterschieden wird, es sei denn, die Folge wurde vom Programmierer in A a B b geändert.
Änderungen an der Reihenfolge dürften von den Entwicklern beabsichtigt sein, d.h. die Folge und die verbotenen Sonderzeichen ist auch programmabhängig.
Aber vielleicht findet sich hier ja noch ein Coder, der es genau weiß.

PS: Tilde ist nicht verboten, mein Fehler.

Ende
bei Antwort benachrichtigen
Borlander Amenophis IV „Zeichenfolge, Sortierung“
Optionen

Hallo A4,
Wikipedia scheint da mal wieder ein guter Anlaufpunkt zu sein. Hatte einfach mal aus Verdacht unter Telefonbuch reingeschaut und von dort aus kam ich dann weiter bis zu alphabetischen Sortierung. Am interessantesten dürfte da sicher die DIN 5007-1 sein, mit google sollte sich die doch hoffentlich auftreiben lassen...

Gruß
bor

bei Antwort benachrichtigen
Amenophis IV Nachtrag zu: „Zeichenfolge, Sortierung“
Optionen

Arg kompliziert für einfache Gemüter.

Ich komm noch mal zu meinem Ausgangspunkt zurück, einem Verzeichnis, in dem sowohl Begriffe mit Zahlen als auch mit Buchstaben enthalten sind. Es fängt mit Aa....an, so weit gut.

Dann kommt unter "D..." die Zahl "3" - auf Nachfrage hin wurde erklärt, das sei eben lautschriftlich und deshalb durchaus richtig. Es hat aber zur Folge, daß die Zahl "8", die auch vorkommt, unter "A" und somit beispielsweise VOR der "3" aufgeführt wird.

Mir ist diese Logik nicht recht nachvollziehbar, mir schiene, wenn schon, dann eine Sortierung

0,0...1
0,1
1
2
10
.
.
Aa

sinnvoller, übersichtlicher und deshalb besser nutzbar. Aber mag ja sein, daß das ein Irrtum ist?

bei Antwort benachrichtigen
Borlander Amenophis IV „Arg kompliziert für einfache Gemüter. Ich komm noch mal zu meinem...“
Optionen

Nabend A4...

Dann kommt unter "D..." die Zahl "3" - auf Nachfrage hin wurde erklärt, das sei eben lautschriftlich und deshalb durchaus richtig. Es hat aber zur Folge, daß die Zahl "8", die auch vorkommt, unter "A" und somit beispielsweise VOR der "3" aufgeführt wird.
Im Prinzip also wie bei unseren Umlauten, da er folgt auch eine Abbildung auf das lateinische Alphabet. Was die Übersichtlichkeit angeht stimmt ich Dir vollkommen zu - das ist ziemlich unsinnig, denn spätestens bei mehrstelligen Zahlen kracht es: Muß ich die Zahl Pi in endlicher Dezimalschreibweise vor oder nach dem Wort "Dreirad" suchn? Also lieber Zahlen lieber vor Buchstaben einsortieren, so wie das auch eigentlich von überall her kennt.

Bei einer größenmäßigen Sortierung ergeben sich allerdings neue Probleme: Wenn Wörter mit Zahlen auftauchen (z.B. der Firmenname "3com") - wo sollen die dann hin?

IMO bester kompromiss ist daher folgende Sortierung:

  1. Sonderzeichen (bei wenigen wäre hier die Sortierung nach Zeichencode noch praktikabel, besser wäre eine logische Gruppierung+Sortierung oder eine Gruppierung+Sortierung nach optischen Eigenschaften)
  2. Ziffen 1-9
  3. Buchstaben a-z (Groß-/Kleinschreibung ignorieren) und Umlaute in diesen Bereich abbilden wie bekannt



Gruß
Borlander
bei Antwort benachrichtigen