FrontierWeb.de

Weil das Web zum Schreiben ist...

Suchen in:
Suche:
In Partnerschaft mit Amazon.de
Daily Link Icon Mittwoch, den 26. Juli 2006
Website-Scraping mit UserTalk

Manchmal gibt es ganz profane Gründe, warum man eine Webseite scrapen muß — und wenn es die eigene Seite ist. Grins So habe ich zum Beispiel einen Kunden, der seine Werbung als PHP-Script ausliefert. Aber nun gibt es ja bekanntlich auch noch andere Möglichkeiten, Webseiten auszuliefern, es müssen ja nicht unbedingt PHP-Seiten sein. Und iFrames kommen auch nicht immer in Frage. Der Schockwellenreiter besteht aus statischen Seiten, PHP ist hier nicht.

Was liegt also näher, als die entsprechende Anzeige auf eine sonst leere (unter PHP laufende) Webseite zu plazieren und diese dann mit einem Spider immer dann auszulesen, wenn die Seiten des Schockwellenreiters aktualisiert werden und die Anzeige dann im »Klartext« einzubinden. In UserTalk, Frontiers integrierter Scriptsprache, ist das ein Fünfzeiler:

A picture named scrapeBanner.png

Die Funktion tcp.examples.httpGet() spidert die Seite und packt den kompletten Inhalt in einen String. Da die Seite ansonsten fast leer ist , gibt es neben den notwendigen Header- und Body-Elementen nur die Tabelle, in der die Anzeige eingeschlossen ist. Mit string.patternMatch() finden wir den Anfang und das Ende unseres gewünschten HTML-Schnipsels und mit string.mid() lesen wir es aus. Wenn wir diese Funktion nun an passender Stelle in unser Template packen, dann haben wir immer dann den neuesten Anzeigen-Code, wenn wir unsere Seiten neu herausschreiben. UserTalk Rulez!

Technorati-Tags:

Posted by Jörg Kantel | Permalink | | |

Daily Link Icon Donnerstag, den 20. Juli 2006
Ankündigung: Neue Webseite

Nachdem Frontier nun schon so lange Open Source ist und meine Seiten nun auch schon anderthalb Jahre lang damit erstellt werden, dachte ich mir, daß es Zeit wird, meine Frontier-Aktivitäten zu bündeln. Ähnlich wie Pythonmania.de für Python (Icon Icon Icon) habe ich nun auch Frontier (Icon Icon Icon) eine eigene Website verpaßt: FrontierWeb.de. Hier sollen alle meine Weblogeinträge, Tutorials und Artikel zu Frontier gesammelt werden. Schaut vorbei und habt Spaß.

cowskull picture

Technorati-Tags:

Posted by Jörg Kantel | Permalink | | |

Daily Link Icon Sonntag, den 16. Juli 2006
Der Schockwellenreiter hat wieder einen Kalender

Nach meinem Update auf die Frontier Developer Preview 2 (wir berichteten) hatte ich auch wieder Zugriff auf die Funktionen der Komponenten des mainResponders und damit auch wieder auf die Kalenderfunktion. Und so habe ich ihn einfach eingebaut. Grins

So ganz traue ich dem Braten aber nicht. Die Kalenderfunktion ist eigentlich für dynamische Seiten und nicht für statische Seiten gebaut. Wenn also jemand irgendwelche Probleme mit dem Kalender hat, bitte ich um eine kurze Mitteilung in meinen Kommentaren zu diesem Beitrag.

Und wer auch mit Frontiers Kalender rumspielen will: Hier ist die Doku auf Userlands DocServer.

Technorati-Tags:

Posted by Jörg Kantel | Permalink | | |

Daily Link Icon Dienstag, den 11. Juli 2006
Frontier.root-Update: Notiz an mich

Nach Installation einer frischen Frontier.root sind folgende Einträge aus der alten Root in die neue zu kopieren: Die Tabelle scratchpad komplett überschreiben und aus user die Einträge user.amazon und user.google (wegen der API-Keys) übernehmen.

Das braucht keiner zu verstehen, das ist wirklich nur eine Notiz an mich. Grins

cowskull picture

Posted by Jörg Kantel | Permalink | | |

Daily Link Icon Sonntag, den 9. Juli 2006
Yepp! Klappt!

Wenn diese Meldung erscheint habe ich erfolgreich auf die Frontier Developer Preview 2 umgestellt. In diesem neuen Release gibt es wieder viele schöne neue Möglichkeiten zum Basteln. Wir werden sehen.

Very Cool!

Technorati-Tags:

Posted by Jörg Kantel | Permalink | | |