Info eines Webseites kopieren

Status
Nicht offen für weitere Antworten.
G

Gast

Gast
Guten Tag,

also ich wollte wissen, ob es möglich ist die Information die in einer Webseite steckt kopieren und irgendwo anders es einfügen?

Danke
 
G

Guest

Gast
Wildcard hat gesagt.:

Könntest du bitte mir ein bisschen mehr Information geben über wie ich das machen könnte. Ich finde ähnliche Sachen, aber nicht was ich brauche.
Ich will teil des Webseites kopieren und z.B. im ein .txt datei speichern.

Ich bedanke mich
 
G

Guest

Gast
Wildcard hat gesagt.:
Strg+A
Strg+C
Strg+P

habe ich mich falsch ausgedrückt?
Es soll durch eine Java Quellcode erreicht werden.
Nach dem aufrufen eines URLs
z.B.
URL url = new URL("www.google.com")

soll dann die information was an dieser Seite steht, gespeichert werden, also:
Google Web Images Video ......
was im textbox steht...
Advance Search, Preferences, Language Tools, etc.

Danke
 
G

Guest

Gast
Wildcard hat gesagt.:
bekommst du über einen InputStream den Quell-Code der Seite.
Ist es das was du willst?

neh... dass hab ich grad bekommen mit

Code:
InputStream in = url.openStream();
...
Scanner s = new Scanner( in );
...
System.out.println( s.useDelimiter( "" ).next() );

also ich will nicht dass das Quell-code der Seite angezeigt wird... wie kann man die Information "filtern"... und dann im ein .txt Datei speichern...
 
G

Guest

Gast
AlArenal hat gesagt.:
Welche "Information"? Die ganze Seite ÍST Information.

z.B. ich will alles was im diesen Thread steht, copieren und in ein .txt Datei speichern... durch Java!
 
G

Guest

Gast
AlArenal hat gesagt.:
Und warum sagst du dann, dass du den Quelltext der Seite nicht willst?

weil es besteht aus alle die HTML programmierung die benutzt wurde und das brauche ich nicht. Deswegen habe ich auch gefragt, ob man die Inhalt des Webseites von diese HTML programmierung "filtern" konnte.
 

masta // thomas

Bekanntes Mitglied
Kannst du mir einen Gefallen tun, und versuchen, sich vernünftig zu artikulieren? Man versteht nur Bahnhof.
Was genau ist dein Vorhaben? Nenn doch mal ein konkretes Beispiel, evtl. mit Vorgabe der Eingabe und deine Wunsch-Ausgabe.

*edited* :oops:
 
G

Guest

Gast
als Beispiel:

<tr><td colspan="2"><span class="postbody"></span><table width="90%" cellspacing="1" cellpadding="3" border="0" align="center"><tr> <td><span class="genmed">AlArenal hat folgendes geschrieben::</span></td> </tr> <tr> <td class="quote">Und warum sagst du dann, dass du den Quelltext der Seite nicht willst?</td> </tr></table><span class="postbody">





weil es besteht aus alle die HTML programmierung die benutzt wurde und das brauche ich nicht. Deswegen habe ich auch gefragt, ob man die Inhalt des Webseites von diese HTML programmierung "filtern" konnte.</span><span class="gensmall"></span></td></tr></table></td></tr>

<tr><td class="row1" width="150" align="left" valign="middle" colspan="2">
<span class="nav">Nach oben</span> </td></tr>
<tr><td width="150" align="left" valign="top" class="row2"><span class="name"><a name="285740"></a>HoaX
</span><span class="postdetails"></span>
<span class="postdetails"></span></td>
<td class="row2" width="100%" height="28" valign="top"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr><td width="100%"> <span class="postdetails">Verfasst am: 21. 04. 2007, 17:40<span class="gen">&</span>& &Titel: </span></td>
<td valign="top" nowrap="nowrap" align="center">& <span class="mainmenu">Zitieren</span>
<span class="mainmenu">Druckversion downloaden (dieser Post)</span></td></tr>

<tr><td colspan="2"><hr/></td></tr>
<tr><td colspan="2"><span class="postbody">nimm den quellcode und schmeiß alles zwischen den & und & weg?</span><span class="gensmall"></span></td></tr></table></td></tr>

<tr><td class="row2" width="150" align="left" valign="middle" colspan="2">
<span class="nav">Nach oben</span> </td></tr>
<tr><td width="150" align="left" valign="top" class="row1"><span class="name"><a name="285746"></a>masta // thomas
</span><span class="postdetails"></span>
<span class="postdetails"></span></td>
<td class="row1" width="100%" height="28" valign="top"><table width="100%" border="0" cellspacing="0" cellpadding="0">
<tr><td width="100%"> <span class="postdetails">Verfasst am: 21. 04. 2007, 18:32<span class="gen">&</span>& &Titel: </span></td>
<td valign="top" nowrap="nowrap" align="center">& <span class="mainmenu">Zitieren</span>
<span class="mainmenu">Druckversion downloaden (dieser Post)</span></td></tr>

<tr><td colspan="2"><hr/></td></tr>
<tr><td colspan="2"><span class="postbody">Kannst du mir einen Gefallen tun, und sich versuchen, vernünftig zu artikulieren? Man versteht nur Bahnhof.


Was genau ist dein Vorhaben? Nenn doch mal ein konkretes Beispiel, evtl. mit Vorgabe der Eingabe und deine Wunsch-Ausgabe.</span><span class="gensmall"></span></td></tr></table></td></tr>

<tr><td class="row1" width="150" align="left" valign="middle" colspan="2">
<span class="nav">Nach oben</span> </td></tr>

<table width="100%" cellspacing="2" cellpadding="2" border="0" align="center"><tr>
<td align="left" valign="buttom" colspan="3"><span class="nav">Seite 1 von 1</span>

<span class="gensmall"></span></td>
<td align="right" valign="buttom" nowrap="nowrap"><span class="nav">
Druckversion downloaden (ganzer Thread)
</span></td></tr>

<tr><td colspan="3" align="left" valign="middle" width="100%"><span class="nav">java-forum.org Foren-Übersicht -> Netzwerkprogrammierung mit Java</span></td>
<td align="right" valign="middle" nowrap="nowrap"><span class="nav"><u>Neue Antwort erstellen</u></span></td></tr>

<tr><td valign="top" nowrap="nowrap" align="left"><span class="gensmall"></span></td></tr>
</table>

Dies hier ist Teil des Quellcode dieser Seite. Ich will nur, dass das was im schwarz geschrieben ist, in ein .txt Datei kopiert und gespeichert wird.
 

Jango

Gesperrter Benutzer
@ masta // thomas: Schon mal dran gedacht, dass Gast es nicht besser kann, aus welchen Gründen auch immer?


masta // thomas hat gesagt.:
Kannst du mir einen Gefallen tun, und sich versuchen, vernünftig zu artikulieren?

...klingt auch nicht gerade hochschulreif. :roll:
 

masta // thomas

Bekanntes Mitglied
:oops: Im Eifer des Gefechts vertippt und edit Button nicht gedrückt...
Ich glaube schon, dass er es kann, wenn er sich einfach ein bisschen Mühe beim Schreiben gibt.


Zu deiner Frage, Gast:
In deinem Beispiel-Text möchtest du also den Text eines jeden Posts in eine Datei speichern. In diesem Fall bzw. gerade in diesem Forum hier wird ein Post von einem <span> eingeschlossen, und zwar von <span class="postbody">. Da ein <span> auch geschlossen werden muss, kannst du die beiden Elemente als Grenzen sehen, die du dafür benutzen kannst, deinen Text zu filtern.
Zunächst mal musst du die Seite in ein String (o.ä.) einlesen. Um die gewünschten Passagen zu filtern, kannst du dann entweder reguläre Ausdrücke nutzen (schau mal in die FAQ oder such mal hier im Forum, es gibt jede Menge Beispiele dazu), oder du läufst den Text Zeile für Zeile / Zeichen für Zeichen durch. Dafür könntest du eine for-Schleife benutzen die z.B. bei Zeile.indexOf("<span class=\"postbody\">"); mit der Iteration anfängt und bis zum x-ten Vorkommen von </span> weiterläuft.
 
M

MartinRuopp

Gast
Im Swing (packages javax.swing.text, javax.swing.text.rtf, javax.swing.text.html)
gibt es Klassen, um in verschiedenen Markup-Formaten formatierte Texte anzuzeigen.

Sie benutzen eine Document-Abstraction, die aber immer auch Klartext "kann".
Damit kann man den Markup entfernen.

Ich hab das mal für RTF gemacht und das sah so aus:

Code:
String rtf=... // RTF-Text einlesen
EditorKit ekit=new RTFEditorKit();
Reader in=new StringReader(rtf);
Document doc=new DefaultStyledDocument();
ekit.read(in,doc,0);
in.close();
String plaintext=doc.getText(0,doc.getLength());

Mit einem HTMLEditorKit statt einem RTFEditorKit kann man eventuell auch die HTML-Tags "wegbefördern".

Gruß,

Martin


http://www.mruopp.de
 
Status
Nicht offen für weitere Antworten.
Ähnliche Java Themen
  Titel Forum Antworten Datum
Z Debug-Info einer JavaSE Applikation auf Webserver Netzwerkprogrammierung 0
M SocketError bei Aufruf eines SOAP-Servers Netzwerkprogrammierung 8
G seite nach posten eines html-forms laden Netzwerkprogrammierung 0
J Protokolle innerhalb eines Heimnetzwerks Netzwerkprogrammierung 6
V Kann man mit Hilfe eines Java-Programms den Zugriff auf bestimmte Internetseiten verhinden? Netzwerkprogrammierung 3
N Name eines Attributes aus einem festen String und einer Variablen generieren Netzwerkprogrammierung 5
X Response eines RESTful-Service mit JSON Netzwerkprogrammierung 8
F Neuer Json aus teilen eines vorhandenen Json Netzwerkprogrammierung 0
N Client Identifikation eines Servers Netzwerkprogrammierung 1
R Problem beim Programmieren eines Chatprogramms Netzwerkprogrammierung 5
K Multiplayer eines Spiels Netzwerkprogrammierung 21
K Ansprechen eines Remote Druckers Netzwerkprogrammierung 2
L Erstellen eines Online Multiplayer Apps Netzwerkprogrammierung 10
eLogic Download eines Links Netzwerkprogrammierung 2
U Socket Abhören eines Sockets/Ports in extra Thread Netzwerkprogrammierung 8
2 Schliessen eines Serversockets Netzwerkprogrammierung 2
Hindi93 Abbruch eines Programmes abfangen Netzwerkprogrammierung 8
1 SSH-Kommunikation - Ende eines Streams nicht erkenntlich Netzwerkprogrammierung 2
C Alle Computer eines Netzwerkes finden Netzwerkprogrammierung 32
N Senden eines Arrays Netzwerkprogrammierung 6
U Name eines Netzlaufwerks ermitteln Netzwerkprogrammierung 5
L Body eines http Request auslesen Netzwerkprogrammierung 2
K Ende eines HTTP Response/Request Netzwerkprogrammierung 6
aze Tcp Verkehr eines Applets simulieren Netzwerkprogrammierung 10
J Socket Erreichbarkeit eines Java Servers (Socket-Lösung) über das Internet Netzwerkprogrammierung 3
M Socket Leistungsfähigkeit eines xSocketservers, wieviele Verbindungen max? Netzwerkprogrammierung 4
clupus Exception beim Schließen eines Sockets Netzwerkprogrammierung 6
cowabunga1984 Transferierte Datenmenge eines SOAP Clients (JAX-WS) anzeigen Netzwerkprogrammierung 2
K TrafficClass eines UDP Pakets kommt beim Empfänger nicht an Netzwerkprogrammierung 5
musiKk Problem bei bidirektionaler Nutzung eines Socket Netzwerkprogrammierung 2
J Machbarkeit eines Bluetooth-Servers? Netzwerkprogrammierung 2
S Realisierung eines Netzwerkcodes für ein Strategiespiel Netzwerkprogrammierung 7
K "Ende eines Sockets" Netzwerkprogrammierung 9
A Broadcast - senden eines Packetes an alle rechner im netz Netzwerkprogrammierung 15
P problem beim schließen eines Streams Netzwerkprogrammierung 6
K Mit Java-MailAPI dir Verfügbarkeit eines SMTP-Servers prüfen Netzwerkprogrammierung 4
J while-Schleife / Abbruchbed. beim Einlesen eines Streams Netzwerkprogrammierung 4
U Ende eines Inputstreams ermitteln Netzwerkprogrammierung 3
J Länge eines Streams Netzwerkprogrammierung 4
T Timeout eines KSOAP-Calls Netzwerkprogrammierung 5
J Antwort eines Soaprequests parsen mittels org.apache.soap Netzwerkprogrammierung 2
E Möglichkeit zum Timeout eines Process Netzwerkprogrammierung 7
T Erstellung eines Proxy Netzwerkprogrammierung 11
T Pfad eines Servlets rausfinden Netzwerkprogrammierung 2
O Einbinden eines java-servers Netzwerkprogrammierung 9
C Übergabe eines Datensatzes (Übergabestruktur) Netzwerkprogrammierung 12
G Verzeichnis eines Rechners übers Netzwerk auslesen Netzwerkprogrammierung 5
B Problem mit der Ausgabe eines Strings an SocketOut Netzwerkprogrammierung 4

Ähnliche Java Themen

Neue Themen


Oben