Hi,
ich hole mir Daten aus dem Netz und visualisiere diese anhand der Haeufigkeit eines Datenpunkts. D.h. haeufige Datenpunkte sollen groesse dargestellt werden in der Visualisierung als seltene Datenpunkte.
Die Skalierungsfaktoren laufen von 1-1000.
In seltenen Faellen sind die Datensets so verteilt, dass es wenige sehr grosse Datenpunkte gibt, wenige Mittelgrosse und sehr viele kleine. In der Visualisierung ist das ganz schlecht, weil man dann praktisch nur ein paar grosse Datenpunkte sieht und kaum das Kleinvieh.
Ich hab das schon ein bissl zu fixen versucht, aber meine rumskaliererei fuehrt oft dazu, dass zwar die groesseren Datenpunkte runterskaliert werden und die kleinen hochskaliert werden, aber manchmal ist das zu krass und der Unterschied zwischen gross und klein geht eher verloren.
Wenn ich jeden Datensatz per Hand skalieren wuerde, waere alles kein Problem, weil dann praktisch alle Punkte in die Skalierung einfliessen und die typischen Eigenschaften des Datensatzes beruecksichtigt werden. So schwankt z.B. die Anzahl der Datenpunkte stark von Datensatz zu Datensatz und einfach einen Mittelwert der Punkte eines Datensatzes zu bilden und auf Basis dessen alle Punkte zu skalieren fuehrt meistens zu einer schlechten Visualisierung.
Hat jemand eine Idee wie man sowas am besten machen sollte?
Danke,
sb
ich hole mir Daten aus dem Netz und visualisiere diese anhand der Haeufigkeit eines Datenpunkts. D.h. haeufige Datenpunkte sollen groesse dargestellt werden in der Visualisierung als seltene Datenpunkte.
Die Skalierungsfaktoren laufen von 1-1000.
In seltenen Faellen sind die Datensets so verteilt, dass es wenige sehr grosse Datenpunkte gibt, wenige Mittelgrosse und sehr viele kleine. In der Visualisierung ist das ganz schlecht, weil man dann praktisch nur ein paar grosse Datenpunkte sieht und kaum das Kleinvieh.
Ich hab das schon ein bissl zu fixen versucht, aber meine rumskaliererei fuehrt oft dazu, dass zwar die groesseren Datenpunkte runterskaliert werden und die kleinen hochskaliert werden, aber manchmal ist das zu krass und der Unterschied zwischen gross und klein geht eher verloren.
Wenn ich jeden Datensatz per Hand skalieren wuerde, waere alles kein Problem, weil dann praktisch alle Punkte in die Skalierung einfliessen und die typischen Eigenschaften des Datensatzes beruecksichtigt werden. So schwankt z.B. die Anzahl der Datenpunkte stark von Datensatz zu Datensatz und einfach einen Mittelwert der Punkte eines Datensatzes zu bilden und auf Basis dessen alle Punkte zu skalieren fuehrt meistens zu einer schlechten Visualisierung.
Hat jemand eine Idee wie man sowas am besten machen sollte?
Danke,
sb