[relug] Re: greppare contenuto di pagina html + domani confermo che non ci sono

  • From: matteo acerbi <matteo.acerbi@xxxxxxxxx>
  • To: relug@xxxxxxxxxxxxx
  • Date: Thu, 12 Jan 2006 10:23:11 +0100

Il 12/01/06, Daniele Menozzi<menoz@xxxxxx> ha scritto:
> Il problema e': come lo posso fare? Perche' questo div, ovviamente,
> ocntiene altri div e quindi e' un pacco riuscire a capire dove
> finisce (con i comandi che conosco io di shell).
> Quindi mi chiedevo: conoscete qualche libreria (magari php, bash?, java) o
> qualche programma che giri solo da console, che riesca a "capire" il
> formato di una pagina html(o almeno, mi permetta di capire facilmente dove
> finisce il <div>), e mi permetta di selezionare solo le parti che
> mi servono a me?

Quando l'HTML à XHTML puoi usare XSLT, ma in generale non à sempre
cosà (magari perà potresti provare a farlo passare per HTML Tidy, o
attraverso un tuo programma che usi la TidyLib, e poi usare sempre lo
stesso "foglio" XSLT, sempre che la traduzione dia risultati
deterministici... ma dovrebbe).

Cià comporta imparare XSLT: non à proprio diretto ma secondo me Ã
interessante... Poi vedi tu, probabilmente in Perl o simili fai prima
ma non conosco nulla.

Adesso che ci penso bisognerebbe proprio fare qualcosa per firefox per
potergli fare capire che se per certi mime-type non ha il plugin
dovrebbe svilupparsi un pochino e chiederti di aprirlo con un tuo
programma... Questo si potrebbe fare in javascript, probabilmente. Ma
non c'entra.

VabbÃ
Ciao
Matteo

PS: Ã ufficiale: domani *non ci sono*. Non posso tornare da Bologna in
un momento come questo (ho due esami la settimana prossima e sono
messo *male* nonostante effettivamente non siano niente di
esoterico...).

Mi spiace molto, spero che si facciano grandi passi avanti ma che ci
sia spazio per discuterne anche altre volte, in ogni caso non
rallentate il processo di nostra costituzione come associazione solo
perchà ci saranno varie assenze (credo io, Billo, Bova...
confermate!).

Mi fido di voi quindi buona riunione! :-)

Other related posts:

  • » [relug] Re: greppare contenuto di pagina html + domani confermo che non ci sono