Internet-Software, Browser, FTP, SSH 4.687 Themen, 38.714 Beiträge

Internetseiten teilautomatisch auswerten?

mainframer / 10 Antworten / Flachansicht Nickles

Hallo,
ich suche als Internet-Laie einen Tipp für folgende Problemstellung:

1) Der öffentlich-rechtliche Betreiber einer großen Internetplattform bietet auch eine (recht primitive) Suchmaske (max. 5 Parameter, die ich täglich in 3 gleich bleibenden Versionern eingesetze) zur Volltext-Recherche in seinen Datenbeständen.

2) Es resultieren daraus täglich dreimal 0 - n Treffer (max. 200), die auf 0 - n Bildschirmseiten (max. 20) aufgelistet werden.

3) Diese Treffer gilt es nach bestimmten, stets gleich bleibenden Kriterien auszuwerten. D.h. mit Trefferadresse/Link lesen und nachgucken, ob darin diese Kriterien stehen. Endresultat dieser täglich 1-2 Stunden erfordernden "manuellen" Arbeit ist eine Tabelle.

Fragen:
a) Gibt es ein Standardprogramm, dem man solche Auswertungen zumindest teilweise übertragen kann?
b) Welche Sprache (JavaScript etc) wäre geeignet für eine Individuallösung dieser Aufgabe, deren Realisierung ich ggf. einem Programmierer übertragen würde.

Ein direkter Zugriff auf die Datenbestände mit intelligenter Programmierung/Auswertung wäre nicht möglich. Es muß die Internetplattform genutzt werden.


bei Antwort benachrichtigen
mainframer mawe2 „ Wie meinst Du das? Warum ist es rechtlich bedenklich, wenn man Inhalte, die der...“
Optionen

Rechtliche Bedenken sind unbegründet, zumal die manuellen Auswertungen auf Grundlage der öffentlich zugänglichen Daten ja auch nicht beanstandet werden!

@xafford
Was stört dich bei "vollständiger Programmierung", falls es tatsächlich kein Auswertesystem auf PC/Internetbasis geben sollte, wie es seit Jahrzehnten (!) im Großrechner-Umfeld bekannt ist?
Null Probleme gäbe es z.B. mit undokumentierten Datenstrukturen in einer DB2-Datenbank.

Screen Scraping ist im vorliegenden Problemfall leider auch nicht möglich, da etliche für die Statistik entscheidenende Daten gar nicht angezeigt werden. Übrigens mit eine Eigenschaft dieser verkorksten, mit vielfachen Millionenaufwand (!) von "umgeschulten Metzgergesellen" und gefeuerten Projektleitern aufgebauten Informationsquelle aus der BA...

Hat hier wer Erfahrung mit dem mir zur Verfügung stehenden Natural/Ajax der SAG?

bei Antwort benachrichtigen
Danke! mainframer