- Mitglied seit
- 24.06.2004
- Beiträge
- 739
- Reaktionen
- 0
hi
ich suche schon ne weile nach einer methode, einige webseiten
zu speichern. ja genau. so wie wenn ich mit irgendeinem browser alle seiten nacheinander aufmache und speichere, nur hätte ich das ganze per kommandozeilen parameter, um es von einem script durchführen lassen zu können
ich habs mit wget versucht hinzukriegen
aber das hab ich nicht gebacken bekommen, da ich zwar alle
auf der page vorkommenden bilder, flashs etc speichern will
aber keinen links folgen möchte.
egal was ich probiert hab... entweder fehlten die bilder oder
es wurden links verfolgt. (ich habe es mit der startseite von www.alltheweb.com probiert, da im gegensatz zu www.google.de die bilder nichtauf dem gleichen server liegt)
danach hab ich mir ein programm geschrieben welches
die webseiten aus meiner liste in opera tabs öffnet, nachdem ich den cache geleert hab.
das hat auch einigermassen gefunzt (sämtliche dateien befanden sich dann im cache order)
der nachteil war aber, dass 1. alle dateien umbenannt wurden in op12345.*, damit ging die ordnerstruktur verloren (ich würde die gespeicherten seiten dann gerne offline öffnen können) und 2. sich opera bei 10+ tabs totgeladen hat.
also es geht um mehrere linklisten die ich schon seit ner weile habe,
alle einzeln anklicken und speichern kommt nicht in frage.
die liste per script abzuarbeiten is kein problem.
ausserdem befinden sich unter den links auch forenthreads und pages mit vielen links darauf, woran ich mit wget scheiterte.
ich hoffe jetz einfach drauf dass hilfsbereite wget pros oder
browser-kommandozeilenparameter-kenner mir helfen können
und flamed mich nicht - stfw und rtfm wurde exzessiv durchgeführt.
ich suche schon ne weile nach einer methode, einige webseiten
zu speichern. ja genau. so wie wenn ich mit irgendeinem browser alle seiten nacheinander aufmache und speichere, nur hätte ich das ganze per kommandozeilen parameter, um es von einem script durchführen lassen zu können
ich habs mit wget versucht hinzukriegen
aber das hab ich nicht gebacken bekommen, da ich zwar alle
auf der page vorkommenden bilder, flashs etc speichern will
aber keinen links folgen möchte.
egal was ich probiert hab... entweder fehlten die bilder oder
es wurden links verfolgt. (ich habe es mit der startseite von www.alltheweb.com probiert, da im gegensatz zu www.google.de die bilder nichtauf dem gleichen server liegt)
danach hab ich mir ein programm geschrieben welches
die webseiten aus meiner liste in opera tabs öffnet, nachdem ich den cache geleert hab.
das hat auch einigermassen gefunzt (sämtliche dateien befanden sich dann im cache order)
der nachteil war aber, dass 1. alle dateien umbenannt wurden in op12345.*, damit ging die ordnerstruktur verloren (ich würde die gespeicherten seiten dann gerne offline öffnen können) und 2. sich opera bei 10+ tabs totgeladen hat.
also es geht um mehrere linklisten die ich schon seit ner weile habe,
alle einzeln anklicken und speichern kommt nicht in frage.
die liste per script abzuarbeiten is kein problem.
ausserdem befinden sich unter den links auch forenthreads und pages mit vielen links darauf, woran ich mit wget scheiterte.
ich hoffe jetz einfach drauf dass hilfsbereite wget pros oder
browser-kommandozeilenparameter-kenner mir helfen können
und flamed mich nicht - stfw und rtfm wurde exzessiv durchgeführt.