Homepage selbermachen 7.848 Themen, 35.566 Beiträge

automatisch Inhalt von Webseiten extrahieren

derian / 1 Antworten / Flachansicht Nickles

Hi,


allwinterlich steh ich vor dem Problem, paar Skireisen für die Kumpels zu organisieren. Jetzt gibt es zwar Unterkunftsverzeichnisse und auch jede Menge Online-Auftritte, aber es immer noch viel Handarbeit, Adressen, Tel, Fax und E-Mail zu sammeln. Jetzt hab ich mir vor zwei Jahren mal die Mühe gemacht, über per Offline-Browser Homepages von Hotels, Pensionen usw. runterzuladen, durch diverse Word und Excel-Makros zu jagen um am Ende ein Excel-Blatt mit 20.000 Adressen zu erhalten. Ganz toll, bin heut noch stolz drauf, nur hat es trotz Makro richtig Arbeit gekostet und es ist halt ziemlich veraltet. Lange Rede ....,


Gibt es nicht irgendein Analyseprogramm, was mir nach bestimmten Stichworten ne bestimmte Internetseite durchsucht und Bereiche (ähnlich der Block-Befehle - "alles bis Zeilenende") in ein TXT oder gar Excel-Format kopiert. Die gewünschten Textbausteine sehen aus wie am Ende dargestelllt, umrahmt von diversen Werbung-Frames.


Würd mich freuen, wenn jemand ne Idee hat


Ciao


>> Anfang






Gasthof Kunterbunt

Betten und Zimmer
22 Betten
2 Einzelzimmer
7 Doppelzimmer
2 Mehrbettzimmer

Kontakt


Andre Kunz

Trierer Strasse 5
K-678822 Petershein, Österreich

Tel. +42(5544)73357
Fax +46(5774)7125745

>> Ende
bei Antwort benachrichtigen
xafford derian „automatisch Inhalt von Webseiten extrahieren“
Optionen

Ist machbar, wenn diese Angaben im Großen und Ganzen einem bestimmten Schema folgen. Das wäre ein klassischer Fall für Perl und Regular Expressions, allerdings nicht-trivial.

Pauschalurteile sind immer falsch!!!
bei Antwort benachrichtigen