hallo forum,
ich kenne mich leider mit programmierung so gut wie nicht aus und wollte mal fragen ob ihr mir ein script empfehlen koennt oder wisst wo es sowas gibt.
Fuer ein projekt wuerde ich gerne informationen dieser seite hier crawlen: infojobs.net. nun will ich erstens natuerlich nicht alle daten auf der seite sondern es geht mir um die anzeigen. und zwar alle diejenigen die aus einer bestimmten region kommen.
zweitens reicht es mir natuerlich icht aus nur den lnk zu haben (a la "rss") sondern ich wil den link und die dazugehoerende information (also beschreibung)der 2. ebene.
das ganze soll mir die information in ein textfile oder in ein excel oder sowas schreiben.
am besten jeden tag einmal, bzw so das ich nicht jeden tag die komplette seite(n) durchsuchen, sondern nur die aktuellen anzeigen bekomme.
kennt jemand sowas, ich denk das ist sowas wie java, javascript oder aehnliches. vieleicht wisst ihr ja da mehr als ich *gg*
danke fuer eure hilfe und tipps
Programmieren - alles kontrollieren 4.941 Themen, 20.708 Beiträge
Hi.
Ich hoffe, du harvestest nicht ;)
Außerdem mögen es Admins und Server überhaupt nicht, von so einem Robot "heimgesucht" zu werden..
Einen guten Crawler auf deutsch gibt's aber zB hier:
http://www.aspseek.org/
Lönie