

boilerpipe: "boilerpipe provides algorithms to detect and remove the surplus "clutter" (boilerplate, templates) around the main textual content of a web page."

Bruker denne i kombinasjon med https://www.changedetection.com/ for å overvåke xxl's tilbud på innebandykøller uten og få varsel hver gang de endrer layout på sidene sine. Genialt!

Ove B-)

Ingen kommentarer:

Legg inn en kommentar