[Linuxtrent] Re: aiuto con python

  • From: Marco Ciampa <ciampix@xxxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Thu, 30 Oct 2014 22:30:50 +0100

On Wed, Oct 29, 2014 at 08:03:14PM +0100, Lele Gaifax wrote:
> Come ha detto Daniele, spesso quando hai un problema e pensi di
> risolverlo con le regular expression... ti ritrovi con *due* problemi
> :-)

eh..

> Per aiutarti, sarebbe utile avere uno spezzone del file in ingresso,
> perché solo così si può avere un'idea precisa del dove andare a parare.
> 
> Con lo snippet che hai incluso ad esempio, non è chiaro se dopo il tag
> "<img" ci sia un "a capo":

No, è una riga sola luuuuunga...

> se così fosse, tutta la logica che hai usato
> cade, perché leggendo una riga alla volta non puoi venircene fuori. Se
> quei tag fossero effettivamente "spezzati" su più righe, hai bisogno
> dell'opzione MULTILINE.

non è il mio caso.

> Se il file in ingresso non è esagerato (cioè, centinaia di megabytes),

Può essere esagerato, visto che contiene tutte le immagini. In ogni caso
storco il naso ogniqualvolta vedo dei programmi che caricano tutto il
file in memoria....

> io lo leggerei tutto d'un fiato, e userei un search/replace[*]
> passandoci una funzione che estrae il "src", ne decodifica il base64,
> scrive nel file e lo sostituisce con il path del file.

con tutto il rispetto, come soluzione a me non piace.

> [*] https://docs.python.org/3.4/library/re.html#re.sub

In ogni caso, grazie!

-- 


Marco Ciampa

I know a joke about UDP, but you might not get it.

+--------------------+
| Linux User  #78271 |
| FSFE fellow   #364 |
+--------------------+

-- 
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: