Image Crawler

vlido · 14. Jul 2012

Hallo!

Ich bin ein absoluter Java-Anfänger und habe von meinem Professor eine Aufgabe bekommen, die ich alleine nicht lösen kann. Ich sollte von 2 Internetseiten das Bildmaterial lokal in der SQL Datenbank abspeichern. Konkret, von der Olga's Gallery - Online Art Museum. alle Bilder vom Picasso abspeichern, wobei für jedes Bild die wichtigen Tags wie Name, Author, Größe usw in die Datenbank gespeichert werden sollten, zusammen mit dem Bild.
Ich sollte eine bestehende Lösung nehmen (und keine selbst programmieren!) und sie anpassen. Natürlich soll sie open source sein...

Ich habe versucht den crawler4j zu verwenden, aber irgendwie klappte mir es nicht. (crawler4j - Open Source Web Crawler for Java - Google Project Hosting)

Mit diesem Crawler konnte ich nur die ganzen Websites abspeichern, aber keine Bilder, obwohl die P-Sucker Applikation dafür gedacht war. (How to write a multi-threaded webcrawler in Java)

Ich bräuchte bitte Ihre Hilfe. Das ganze Projekt, das ich machen sollte, das als Ziel eine Basis für ein Virtual Museum zu schaffen. Nochmals kurz: das Bildmaterial von Webseiten samt wichtiger Tags in die SQL Datenbank abspeichern.

Ich hoffe ich habe es gut erklärt und danke für die Hilfe!

lg, Vladi

Aldimann · 14. Jul 2012

Hi,

naja also ne bestehende Lösung kenne ich für sowas nicht. Ich weiß ja nicht wie sich das dein Prof vorstellt, aber ich würde die HTML Seite runterladen, sie durch nen XML Parser jagen und dabei mit XPath nach bestimmten Pfaden suchen. Danach brauchst du dir eig nur noch die relevanten Infos zusammen suchen und in einzelne Variablen speichern und abdafür in die DB.

Ich würde mir an deiner Stelle erstmal nen Firebug installieren und dann das HTML analysieren was du da überhaupt braucht...

BTW: Wie sieht das überhaupt rechtlich aus? Nicht das es da schwierigkeiten gibt

...

vlido · 14. Jul 2012

Hallo!

Rechtlich schaut das ganze gut aus, wird das ganze aber so wie so nicht verwendet, es ist halt nur ein Pilotprojekt...alle Bilder auf dieser Seite sind nicht mehr Urheberrechtlich geschützt, da nach dem Tod des Malers mehr als 70 Jahre vergangen sind...

schaue dir mal das an, es sind Crawlers, die die Bilder abspeichern...aber ich habe schon 2 versucht zu verwenden und ist mir nicht gelungen, deswegen brauche ich die Hilfe hier...

Open Source Crawlers in Java

danke und lg!

Aldimann · 14. Jul 2012

Warum natürlich der Crawler nicht funktioniert kann ich so Ad-Hoc ohne weitere Infos nicht sagen...

Aber ich hab mir jetzt diesen Crawler4J angeschaut und wenn du den wirklich hernehmen möchtest müsstest du die Logik wie oben beschrieben implementieren. Bzw. du kannst den BasicCrawler nehmen und damit das HTML holen und parsen oder du implementierst einen eigenen Crawler so, dass das Ergebnis schon passt.

Sonst fällt mir gerade nichts mehr ein...

Problem ist halt das du beim BasicCrawler zu viel bekommst und beim ImageCrawler zu wenig (der gibt dir ja, wenn ich es richtig gesehen hab einfach alle Bilder der Seite zurück, wenn aber das Bild nicht mit Metainfos angereichtert ist fehlt dir ja der Name usw...)

	Titel	Forum	Antworten	Datum
E	Image aus PostGreSQL Datenbank in Report einfügen	Java Basics - Anfänger-Themen	2	17. Jan 2025
G	Area mit Teil-Image füllen	Java Basics - Anfänger-Themen	0	7. Jan 2024
B	Image Matching in Memory Minigame	Java Basics - Anfänger-Themen	7	21. Mrz 2023
J	JLabel bzw. Image Icon mit KeyEvent bewgen	Java Basics - Anfänger-Themen	9	2. Jun 2022
	Image Loader lädt nicht alle Bilder:	Java Basics - Anfänger-Themen	4	7. Mrz 2022
	Nur bestimmte Bilder aus einem Array auf Image Button anzeigen lassen	Java Basics - Anfänger-Themen	3	3. Nov 2021
T	Image Icon	Java Basics - Anfänger-Themen	3	16. Dez 2020
K	File (png) in Image laden	Java Basics - Anfänger-Themen	3	7. Sep 2020
M	Image löschen	Java Basics - Anfänger-Themen	2	4. Feb 2020
G	Image in Vordergrund	Java Basics - Anfänger-Themen	3	31. Jan 2020
B	InputStream (PDF) nach Image (PNG / JPG) konvertieren?	Java Basics - Anfänger-Themen	2	10. Sep 2019
S	Image Datei selektieren und in Projekt Verzeichnis abspeichern/kopieren	Java Basics - Anfänger-Themen	16	27. Jun 2019
N	Best Practice Image recognition fuzzy Superhash berechnen	Java Basics - Anfänger-Themen	1	12. Jun 2018
H	Image laden	Java Basics - Anfänger-Themen	4	20. Sep 2017
R	Image drehen	Java Basics - Anfänger-Themen	1	30. Aug 2017
R	Image Teilen	Java Basics - Anfänger-Themen	3	30. Aug 2017
B	Image laden im GridBagLayout	Java Basics - Anfänger-Themen	3	5. Jan 2017
N	Image von Resource wird nicht geladen	Java Basics - Anfänger-Themen	2	31. Dez 2016
N	Datentypen Image zu Byte-Array	Java Basics - Anfänger-Themen	4	11. Dez 2016
F	Image wird nicht gezeichent?!	Java Basics - Anfänger-Themen	21	2. Jul 2016
N	Hintergrund image mit .setContentPane	Java Basics - Anfänger-Themen	6	6. Mai 2016
W	aus Methode auf JLabel zugreifen und Image verändern	Java Basics - Anfänger-Themen	1	30. Apr 2016
S	buffered image	Java Basics - Anfänger-Themen	18	26. Mrz 2016
V	Scale displayed Image via JCheckBox	Java Basics - Anfänger-Themen	1	5. Jun 2015
I	Resize Image - Einlesen von InputStream	Java Basics - Anfänger-Themen	3	9. Jan 2015
M	Image Download klappt nicht mehr	Java Basics - Anfänger-Themen	4	15. Aug 2014
	Testprojekt.Text.Image.Button	Java Basics - Anfänger-Themen	4	25. Jun 2014
S	Image nach MausMotion rotieren	Java Basics - Anfänger-Themen	7	22. Mrz 2014
L	Erste Schritte Java Image und Video-Slideshow GUI	Java Basics - Anfänger-Themen	3	23. Sep 2013
D	Kleinere Positionsangabe als einzelne Pixel bei Image?	Java Basics - Anfänger-Themen	28	29. Dez 2012
S	Image in Panel laden	Java Basics - Anfänger-Themen	12	20. Okt 2012
H	Prüfen, ob jpg image schon vorhanden ist, bevor es geladen wird	Java Basics - Anfänger-Themen	13	4. Okt 2012
P	Erste Schritte Buffered Image splitten und darstellen	Java Basics - Anfänger-Themen	2	20. Jun 2012
P	Erste Schritte Image anzeigen in ausführbarer jar mit der Toolkit class	Java Basics - Anfänger-Themen	8	18. Jun 2012
T	udp -> bytearray -> image -> ausgabe via frame	Java Basics - Anfänger-Themen	6	6. Jun 2012
A	Image (Bitmap) in String (für XML)	Java Basics - Anfänger-Themen	7	17. Apr 2012
F	Buffered Image über Socket versenden	Java Basics - Anfänger-Themen	6	5. Nov 2011
T	Image ist Null - warum?	Java Basics - Anfänger-Themen	18	11. Sep 2011
V	Image -> 2D Array (int [][])	Java Basics - Anfänger-Themen	4	18. Aug 2011
L	Image laden und auf jPanel ausgeben	Java Basics - Anfänger-Themen	7	6. Aug 2011
V	FileInputStream auf ein swt.Image	Java Basics - Anfänger-Themen	6	23. Jun 2011
A	Wie kann man etwas von Typ Image wieder löschen?	Java Basics - Anfänger-Themen	7	22. Mai 2011
F	Image übertragen und zeichnen	Java Basics - Anfänger-Themen	8	21. Apr 2011
G	Problem mit Image.IO.read( File )	Java Basics - Anfänger-Themen	3	20. Apr 2011
G	Image spiegeln	Java Basics - Anfänger-Themen	17	17. Apr 2011
Y	Trotz add wird Image in GradBagLayout nicht angezeigt	Java Basics - Anfänger-Themen	5	6. Apr 2011
	Image helper	Java Basics - Anfänger-Themen	6	3. Apr 2011
M	Image Metadaten setzen	Java Basics - Anfänger-Themen	2	25. Feb 2011
	Backgrond Color von Image ermitteln	Java Basics - Anfänger-Themen	2	4. Dez 2010
C	Image draw...	Java Basics - Anfänger-Themen	7	20. Nov 2010
M	Image-Icon Ändern	Java Basics - Anfänger-Themen	15	3. Nov 2010
J	Image upload auf ImageShack,TinyPic usw.	Java Basics - Anfänger-Themen	11	2. Okt 2010
R	Image laden die Zweite	Java Basics - Anfänger-Themen	4	20. Sep 2010
R	Image laden	Java Basics - Anfänger-Themen	10	19. Sep 2010
M	Image zeichenen mit Double Werten	Java Basics - Anfänger-Themen	4	1. Aug 2010
B	polyline auf buffered image malen	Java Basics - Anfänger-Themen	2	1. Jul 2010
G	Image to File	Java Basics - Anfänger-Themen	4	18. Jun 2010
T	Image Position erkennen	Java Basics - Anfänger-Themen	6	13. Jun 2010
	Image skalieren	Java Basics - Anfänger-Themen	2	23. Mai 2010
	Background Image	Java Basics - Anfänger-Themen	2	22. Mai 2010
K	Image / drawImage	Java Basics - Anfänger-Themen	2	8. Mrz 2010
P	Buffered Image, Bereich ausschneiden	Java Basics - Anfänger-Themen	3	8. Jan 2010
F	Image Editor	Java Basics - Anfänger-Themen	2	1. Jan 2010
R	Image aus jar laden (dieses mal awt)	Java Basics - Anfänger-Themen	19	14. Nov 2009
B	Image flimmert	Java Basics - Anfänger-Themen	4	4. Nov 2009
	Image exakt erzeugen	Java Basics - Anfänger-Themen	5	28. Okt 2009
B	Teile einer Image in neue Image kopieren	Java Basics - Anfänger-Themen	4	22. Okt 2009
X	ARGB Werte auslesen aus Image	Java Basics - Anfänger-Themen	2	20. Aug 2009
O	Image Loader laedt bild nicht	Java Basics - Anfänger-Themen	11	16. Aug 2009
H	String to image!	Java Basics - Anfänger-Themen	6	30. Jul 2009
	image beim awt frame wegmachen	Java Basics - Anfänger-Themen	2	2. Jul 2009
M	Probleme mit Manifest und Image	Java Basics - Anfänger-Themen	2	22. Apr 2009
T	Java Bilderverwaltung - Image Fetcher Problem	Java Basics - Anfänger-Themen	4	28. Feb 2009
E	Image in Datei speichern bzw anzeigen	Java Basics - Anfänger-Themen	5	9. Feb 2009
G	Image laden	Java Basics - Anfänger-Themen	16	2. Jan 2009
O	Drag & Drop mit Image?	Java Basics - Anfänger-Themen	2	8. Dez 2008
G	Image/-Icon wird nicht auf JPanel angezeigt	Java Basics - Anfänger-Themen	4	24. Nov 2008
M	Image aus JPanel	Java Basics - Anfänger-Themen	2	21. Nov 2008
G	Kompletten (image) Array löschen	Java Basics - Anfänger-Themen	14	26. Okt 2008
P	Fileinputstream to image?	Java Basics - Anfänger-Themen	3	8. Sep 2008
G	Image Problem	Java Basics - Anfänger-Themen	5	12. Aug 2008
G	Image	Java Basics - Anfänger-Themen	3	7. Aug 2008
M	draw.Image	Java Basics - Anfänger-Themen	11	2. Jul 2008
O	Image laden	Java Basics - Anfänger-Themen	6	26. Nov 2007
G	Image	Java Basics - Anfänger-Themen	2	12. Nov 2007
S	Image-Datei mit relativem Pfad angeben	Java Basics - Anfänger-Themen	3	28. Okt 2007
S	Botton und Image kombinieren	Java Basics - Anfänger-Themen	3	5. Okt 2007
S	import javax.image.io.*; funktioniert nicht	Java Basics - Anfänger-Themen	28	30. Jul 2007
D	Image drehen	Java Basics - Anfänger-Themen	6	27. Jun 2007
	Uncaught error fetching image	Java Basics - Anfänger-Themen	2	24. Jun 2007
A	Image erstellen	Java Basics - Anfänger-Themen	3	19. Jun 2007
N	Grösse eines Image ändern?	Java Basics - Anfänger-Themen	4	24. Mai 2007
I	Image Dateinformationen auslesen	Java Basics - Anfänger-Themen	7	15. Mai 2007
A	image uploader applet	Java Basics - Anfänger-Themen	10	6. Apr 2007
S	image speichern	Java Basics - Anfänger-Themen	12	22. Jan 2007
D	ImageIO metadata auslesen aus png image	Java Basics - Anfänger-Themen	2	22. Dez 2006
G	Ausmaße eines Image-Object herrausfinden	Java Basics - Anfänger-Themen	4	4. Nov 2006
R	Einem Image-Object Alpha-Transparenz hinzufügen	Java Basics - Anfänger-Themen	3	2. Nov 2006
S	Image in byte[] umwandeln?	Java Basics - Anfänger-Themen	2	26. Jun 2006
G	Ein Image langsam einblenden und nach 5 Sekunden ausblenden?	Java Basics - Anfänger-Themen	10	7. Jun 2006

Image Crawler

vlido

Neues Mitglied

Aldimann

Bekanntes Mitglied

vlido

Neues Mitglied

Aldimann

Bekanntes Mitglied

Ähnliche Java Themen

Aktuelle Jobs

Neue Themen