Grande Claudio! Per la cronaca, ho appena confezionato il primo numero in formato djvu (con gscan2pdf); a prima vista non si notano differenze rispetto al pdf, ma il file è qualche mega in meno ;) Quanti ricordi! 'notte! Antonio Claudio Di Cesare wrote: Salve gente,Ma non c'e' modo di scaricare nulla, vero?C'e', c'e'... :-) Allora issuu funziona cosi': archivia le pagine come singole .JPG chiamate progressivamente 1, 2, ... n dove n e' il numero massimo delle pagine della copia del "noto giornaletto" che ci interessa. Le pagine sono archiviate in una struttura di directory dove ogni gruppo di pagine e' in una directory il cui nome e' "uno stringone" assolutamente NHR (non human readable) (in realtà e' un un hash http://it.wikipedia.org/wiki/Hash). Comunque una volta che abbiamo questo "stringone" (da adesso in poi chiamatodocumentID) e il numero massimo delle pagine del numero "del noto giornaletto" (eh si', perche' col passare degli anni le pagine sono aumentate) e il mio script a seguire (senza dimenticare una Linux-box :-) abbiamo tutti gli ingredienti per la "frittata"! NOTA i: la linux-box deve avere ImageMagick e Pdftk presenti (se siete su ubuntu il solito apt-get install...) NOTA ii: lo script e' poco elegante, non e' assolutamente user-friendly e uso mischiare bash e C senza tanti complimenti, ma visto che mi interessa il risultato... sono pero' ben accetti suggerimenti e miglioramenti NOTA iii: io non vi ho detto nulla e non vi conosco Recupero del documentID 1) Aprire il sito del "noto giornaletto" e selezionare il numero in oggetto 2) In modalità visualizzazione delle pagine "scoprite" il sorgente della pagina (okkio che e' un iframe, usate la funzione tasto DX di firefox "Questo riquadro" -> "Visualizza sorgente riquadro") 3) Cercate adesso (Ctrl+F) la parolina documentId 4) Troverete una porcheria del genere: [...] documentId=090903194353-ce762db96ba946409f6c94c8bbcd65f1&docName=mc003& [...] Ci interessa tutto quello tra documentId= e prima di & quindi copiatelo 5) Vedete un po' (sfogliando) quante pagine compongono il numero Scarichiamo! 1) Adesso prepariamo una bella directory sulla scrivania e mettiamoci dentro scarica.sh 2) Lanciate la shell e posizionativi nella directory in oggetto 3) Date a scarica i permessi di esecuzione (chmod +x scarica.sh) 4) digitate ./scarica.sh <documentID> <numeropagine> 5) preparate il caffe' :-) 6) sfogliate il "giornaletto" pronto (all.pdf) mentre sorseggiate il vostro caffe' Per un altro giro, mettete al sicuro (e rinominate) all.pdf, pulite tutto (meno scarica.sh) e trovate un nuovo documentID Script ---------COPIA INCOLLA DA QUI ------------ #!/bin/bash # scarica.sh # Recupero informazioni dalla linea di comando # il parametro $1 contiene il documentID e il # parametro $2 il numero totale delle pagine da scaricare if [[ $# != 2 ]]; then echo echo ATTENZIONE !!! echo Hai dimenticato i parametri documentID e il numero di pagine totali echo ES. scarica 090902193817-572dbb8f3b2b43d6be14154b848a31fb 100 echo exit 1 fi # OK parametri presenti, inizializzo le variabili di lavoro document_id=$1 n_page=$2 # Download delle pagine # NOTA il nome deve essere nella forma page_XXX.jpg # per evitare un successivo problema con la routine per la creazione # dei PDF (insomma per farli incollare in ordine giusto!) for ((i=1;$i<=n_page;i=$(($i+1)))); do pagenum=`printf "%03d" $i` wget -O page_$pagenum.jpg http://image.issuu.com/$document_id/jpg/page_$i.jpg done # Adesso grazie all'aiuto di convert, alias ImageMagick e Pdftk # (che devono quindi essere presenti nel sistema), si provvede # al recupero dei file .JPG nella directory corrente, alla loro # conversione in .PDF e unione A=$(ls *.jpg); for file in ${A[@]}; do convert $file $file.pdf done pdftk *.pdf cat output all.pdf ---------COPIA INCOLLA FIN QUI ------------ OK e' tutto DePrisco perdonali perche' non sanno quello che fanno... Che la banda (adsl) sia con voi Ciao Cla |