xlsx Datei auslesen mit POI von Apache wirft seltsamen Fehler.

Diskutiere xlsx Datei auslesen mit POI von Apache wirft seltsamen Fehler. im Allgemeine Java-Themen Bereich.
O

osix

Hallo Freunde,

Ich möchte mit der Library POI von Apache die angehängte Datei mit Spiel-daten lesen.

Es kommt ein Fehler wegen Feld E2,
java.lang.IllegalStateException: Cannot get a STRING value from a NUMERIC cell
at org.apache.poi.xssf.usermodel.XSSFCell.typeMismatch(XSSFCell.java:1077)
at org.apache.poi.xssf.usermodel.XSSFCell.getRichStringCellValue(XSSFCell.java:395)
at org.apache.poi.xssf.usermodel.XSSFCell.getStringCellValue(XSSFCell.java:347)

Das verstehe ich nicht. Das Feld IST definitiv als TEXT-formatiert, die Datei wurde mit MS-Excel erzeugt.

Kann es sein, daß die POI Routinen fehlerbehaftet sind ?

Was könnte ich dann tun, ich muß xlsx-Dateien einlesen...

Danke für eure Antworten.
 

Anhänge

O

osix

Wieso ? Wenn ich die mit Libre-Office öffne, recht klicke und "Zellen formatieren" anwähle, dann kommt "Text".
Soll ja auch so sein, weil Postleitzahlen ja mit Null anfangen können. Ich kann doch ein Textfeld mit Zahlen auffüllen, wie kommst du drauf, daß die Zelle definitiv numerisch sei ?
 
mihe7

mihe7

Das Einstellen des Formats ändert nicht automatisch den Typ.

Probiers einfach aus:

E2 anwählen, in Formelleiste steht 10557, Format -> Zahlformat -> Allgemein, in Formelleiste steht immer noch 10557. Folglich war es ein numerischer Wert.

Um den Unterschied zu sehen, wandelst Du mal E3 zu Text um. Dazu Wert von 20148 zu 0148 ändern. Sofort wird der Text (der es nach der Bearbeitung nun ist, weil das Zellformat Text war) linksbündig angezeigt. In der Formelleiste steht immer noch 0148. Wenn Du jetzt Format -> allgemeine Zahl anwählst, steht in der Formelleiste '0148, also mit Hochkomma.

Nachtrag: Du kannst das auch anders prüfen. Dazu gibst Du in I2 die Formel =ISTTEXT(E2) ein und kopierst die über alle Zeilen runter. Da wird immer FALSCH erscheinen. Wenn Du jetzt einen Wert in Spalte E änderst, wirst Du sehen, dass sich der betreffende Wert in Spalte I zu WAHR ändert.
 
O

osix

Vielen Dank für deine ausführliche Antwort !

ok, kann ich alles soweit nachvollziehen.

Wie mach ich jetzt die ganze Spalte E zu Text ? also das quasi meine Postleitzahlen, die mit Null anfangen können gleich als Text aufgefasst werden.

In Libre-Office.

Bisher hab ich die Spalte markiert, rechtgeklickt und dann "Zellen formatieren" gewählt und dann "Text" gewählt, bei Format steht vordefiniert "@", das hab ich so gelassen.

Genauso hab ich es gemacht und abgespeichert. Was mach ich falsch ?
 
O

osix

Nur ein Trick hilft: ich mache einen Buchstaben vor die Zahl und gleich wieder weg, dann springt der Wert von ISTTEXT() auf WAHR

Was ist denn das ? Das kann ich doch nicht "händisch" bei jeder Zahl machen.
 
mihe7

mihe7

Die naheliegende Lösung wäre, die Spalte einfach als Zahl einzulesen :)

Was ist denn das ? Das kann ich doch nicht "händisch" bei jeder Zahl machen.
Ich habs jetzt nicht ausprobiert, aber was funktionieren könnte, wäre die Werte in der Spalte auszuschneiden (Strg+X) und dann per "Inhalt einfügen" (Strg+Shift+V) wieder einzufügen, sofern die Spalte als Text formatiert wurde.
 
O

osix

Ich kann die Spalte nicht als Zahl einlesen weil Postleitzahl en mit Null anfangen können, das ist dann keine Zahl sondern Text.

Sagt jemand "automatisch e Zahlenerkennung" was bei libre Office ? Die könnte schuld sein daß sich das Spaltenformat sofort wieder auf Zahl zurück stellt, aber ich finde dazu in libre Office nichts.
 
J

JustNobody

Also nur kurz am Rande: Postleitzahl ist eine Zahl.

Die führende 0 ist lediglich eine Frage, wie die Zahl dann später dargestellt wird. Es ist also durchaus üblich, Daten in der korrekten Form zu speichern und dann halt bei der Anzeige auf ein Format String zurück zu greifen. Und es ist natürlich kein Thema, eine Zahl mit 5 Stellen (also mit führenden 0en) anzuzeigen: %05d dürfte das doch machen (Ohne Kontrolle aus dem Kopf heraus - aber das kannst Du ja ggf. schnell validieren!)
 
mrBrown

mrBrown

Also nur kurz am Rande: Postleitzahl ist eine Zahl.

Die führende 0 ist lediglich eine Frage, wie die Zahl dann später dargestellt wird. Es ist also durchaus üblich, Daten in der korrekten Form zu speichern und dann halt bei der Anzeige auf ein Format String zurück zu greifen. Und es ist natürlich kein Thema, eine Zahl mit 5 Stellen (also mit führenden 0en) anzuzeigen: %05d dürfte das doch machen (Ohne Kontrolle aus dem Kopf heraus - aber das kannst Du ja ggf. schnell validieren!)
Würde ich widersprechen - sie besteht zwar auch Ziffern, sollte aber im Programm keine Zahl sein, es sei denn man will mit Postleitzahlen rechnen.
 
mihe7

mihe7

Prinzipiell lässt sich das Problem ja nur an zwei Stellen beheben, nämlich entweder in der Datenquelle oder im Code.

D. h. entweder man stellt sicher, dass die PLZ in der Eingabedatei einheitlich im gewünschten Format gespeichert ist oder man stellt sicher, dass das Einlesen mit den möglicherweise auftretenden Formaten umgehen kann. Da kann es dann durchaus sein, dass man Zahlen liest und mit %05d formatiert übernimmt.
 
J

JustNobody

Würde ich widersprechen - sie besteht zwar auch Ziffern, sollte aber im Programm keine Zahl sein, es sei denn man will mit Postleitzahlen rechnen.
Ja, da war der Hinweis nicht ganz angebracht, zumal Postleitzahlen Weltweit auch alphanumerisch sein können (z.B. UK und Irland).
 
Thema: 

xlsx Datei auslesen mit POI von Apache wirft seltsamen Fehler.

Passende Stellenanzeigen aus deiner Region:
Anzeige

Neue Themen

Anzeige

Anzeige
Oben