Eiskaltmacher.de
Software => Windows => Thema gestartet von: Materialist am 15. November 2006, 07:15:25
-
Hi,
ich habe ne größere Menge text aus dem ich die URLs herausfiltern muss.
Kennt jemand ein Tool oder ähnliches um mir die Aufgabe abzunehmen?
Oder weiß jemand wie ich das mit Office hinbekomme?
-
in die suche eingeben: "www." oder "http://www."
:kratz:
-
lol na du bist witzig dann muss ichs ja doch von Hand filtern.
Ich brauch ne Lösung um am Ende eine Liste mit URLs zu haben.
Möglichst ohne das ich jede einzeln kopieren muss.
-
mit word als html abspeichern und dann mit den FireFox öffnen, dort gehst du dann auch seiten-eigenschaften (oder so ähnliche) und hast dort dann eine liste aller linkst auf der seite ;)
-
lol na du bist witzig dann muss ichs ja doch von Hand filtern.
wieso witzig, wieso von hand filtern? schau doch mal in deine fragestellung....
die suche spuckt dir alle www's aus... ergo hast du somit eine liste aller URLs.
-
http://eiskaltmacher.de/portal/index.php?option=com_smf&Itemid=26&topic=1285.0;topicseen (http://eiskaltmacher.de/portal/index.php?option=com_smf&Itemid=26&topic=1285.0;topicseen)
nicht jede URL hat "www" aber die meisten haben "http://" bzw. ":-//" (<- ohne Bindestrich of course..) ,also wenn danach suchen :cool:
-
Ich glaub ich versteh nich ganz was mit "Suche" gemeint ist.
Wenn ich unter Office, Wordpad oder sonst nem Editor suche werden doch die Ergebnisse entweder hervorgehoben oder es wird einzeln von
Ergebnis zu Ergebnis gesprungen.
Das dauert ewig es sind hunderte URLs!
Was ich brauche ist ein Tool das mir wirklich die URLs auflistet.
Also am Ende eine Liste in der nur die URLs stehen und sonst nichts...
-
Also ein fertiges Tool habe ich jetzt auch nicht parat. Aber mit nem Perlscript bekommt man sowas recht einfach zusammengestrickt.
Den Interpreter bekommst Du hier (http://www.activestate.com/)
-
Uff danke für den Tip erstmal aber ne neue Programmiersprache wollte ich dafür eigentlich nicht lernen :D
Ein Bekannter Programmierer hat mir was empfohlen TextHarvest http://www.allworldsoft.com/software/14-033-textharvest.htm (http://www.allworldsoft.com/software/14-033-textharvest.htm)
einfach in der KeepList "/http://*" ohne quotes eingeben und die liste wird ausgespuckt!