[relug] Re: greppare contenuto di pagina html

  • From: "Alberto Basso" <info@xxxxxxxxxxxx>
  • To: relug@xxxxxxxxxxxxx
  • Date: Thu, 12 Jan 2006 16:02:59 +0100

Vladimir Nicola Chersi <vladimir.nicola@xxxxxxxx> ha scritto

> In bash IMHO e` un po` un macello, forse anche perche` io conosco
poco
> la shell (e soprattutto conosco poco sed ed awk, che probabilmente
> potrebbero facilitare il tutto).
> 

<CUT>
...
</CUT>

Ok, idea n.2 usando la shell:

- ti cucchi il file con un semplice wget
- fai leggere il file carattere per carattere tramite un ciclo
- alla corrispondenza della stringa "<div id='non-ricordo'>" inizi a
memorizzare il contenuto in una variabile
- ...fino a quando non trovi il primo "</div>"
- quando lo trovi esci dal ciclo perchè del resto non ti frega piu'
niente
- ...hai quindi il contenuto della variabile che puoi usare come ti
pare

Questa è a mio avviso la soluzione piu' liscia, senza tagli o cose
troppo contorte.

Buona fortuna,
Alb.



Other related posts: