Krautkanal.com

Veröffentlicht am 2015-02-19 02:38:07 in /prog/

/prog/ 6657: Wie könnte Bernd von http://www.zertifikate.boe...

clementc Avatar
clementc:#6657

Wie könnte Bernd von

http://www.zertifikate.boerse-frankfurt.de/de/warrants/optionsschein-auf-lvmh-commerzbank-ag-DE000CR6QXP9

und

http://www.onvista.de/optionsscheine/snapshot.html?ISIN=DE000CR6QXP9

die Daten am besten extrahieren, z.B. Bewertungstag, Fälligkeit, Basispreis usw.?

Macht man das über eine DOM-Library? Mit sed und awk? Vornehmlich sollte es in der bash funktionieren, ist aber nicht zwingend.

xarax Avatar
xarax:#6658

>>6657
>Macht man das über eine DOM-Library? Mit sed und awk?
Sollte beides gehen. Kommt darauf an was du vorhast.
In >>6522 gab es ein paar Anhaltspunkte dazu.

mylesb Avatar
mylesb:#6660

Weil auf >>6522 verwiesen wurde, liefert Bernd mal doch ein Beispiel, wie es ohne jenes Werkzeug gehen sollte.

<stylesheet version="2.0" xmlns="http://www.w3.org/1999/XSL/Transform">
  <template match="/">
    <value-of select="normalize-space(//table[@id='ProductDetailRealtime']//tr[2]/td[1]/div[2])"/>
    <text>&#x09;</text>
    <value-of select="normalize-space(//table[@id='ProductDetailRealtime']//tr[2]/td[contains(@class,'realtime_bid')]/div)"/>
    <text>&#x09;</text>
    <value-of select="normalize-space(//table[@id='ProductDetailRealtime']//tr[2]/td[contains(@class,'realtime_ask')]/div)"/>
  </template>
</stylesheet>


xsltproc frankfurtwirdmichhartficken.xsl http://www.zertifikate.boerse-frankfurt.de/de/warrants/optionsschein-auf-lvmh-commerzbank-ag-DE000CR6QXP9 2>/dev/null | tail -n 1

puzik Avatar
puzik:#6661

Perl + Mechanize
Gibt aber auch equivalente python screen scraping libraries.

dpg Avatar
dpg:#6726

I've used BeautifulSoup (Python) before. It's easy to use, but I don't think it can go through logins like Mechanize.