[zxspectrum] Re: [semi-ot] MC-Microcomputer on-line

From: AntonioS <skiantoz@xxxxxxxx>
To: zxspectrum@xxxxxxxxxxxxx
Date: Thu, 12 Nov 2009 01:54:02 +0100

Grande Claudio!

Per la cronaca, ho appena confezionato il primo numero in formato djvu (con gscan2pdf); a prima vista non si notano differenze rispetto al pdf, ma il file è qualche mega in meno ;)

Quanti ricordi!

'notte!

Antonio

Claudio Di Cesare wrote:

Salve gente,

Ma non c'e' modo di scaricare nulla, vero?

C'e', c'e'... :-)

Allora issuu funziona cosi': archivia le pagine come singole .JPG
chiamate progressivamente 1, 2, ... n dove n e' il numero massimo
delle pagine della copia del "noto giornaletto" che ci interessa.
Le pagine sono archiviate in una struttura di directory dove ogni
gruppo di pagine e' in una directory il cui nome e' "uno stringone"
assolutamente NHR (non human readable) (in realtà e' un un hash
http://it.wikipedia.org/wiki/Hash).
Comunque una volta che abbiamo questo "stringone" (da adesso in poi
chiamatodocumentID) e il numero massimo delle pagine del numero "del
noto giornaletto" (eh si', perche' col passare degli anni le pagine
sono aumentate) e il mio script a seguire (senza dimenticare una
Linux-box :-) abbiamo tutti gli ingredienti per la "frittata"!

NOTA i: la linux-box deve avere ImageMagick e Pdftk presenti (se siete
su ubuntu il solito apt-get install...)
NOTA ii: lo script e' poco elegante, non e' assolutamente
user-friendly e uso mischiare bash e C senza tanti complimenti, ma
visto che mi interessa il risultato... sono pero' ben accetti
suggerimenti e miglioramenti
NOTA iii: io non vi ho detto nulla e non vi conosco

Recupero del documentID
1) Aprire il sito del "noto giornaletto" e selezionare il numero in oggetto
2) In modalità visualizzazione delle pagine "scoprite" il sorgente
della pagina (okkio che e' un iframe, usate la funzione tasto DX di
firefox "Questo riquadro" -> "Visualizza sorgente riquadro")
3) Cercate adesso (Ctrl+F) la parolina documentId
4) Troverete una porcheria del genere:
[...]  documentId=090903194353-ce762db96ba946409f6c94c8bbcd65f1&amp;docName=mc003&amp;
[...]
Ci interessa tutto quello tra documentId= e prima di &amp; quindi copiatelo
5) Vedete un po' (sfogliando) quante pagine compongono il numero

Scarichiamo!
1) Adesso prepariamo una bella directory sulla scrivania e mettiamoci
dentro scarica.sh
2) Lanciate la shell e posizionativi nella directory in oggetto
3) Date a scarica i permessi di esecuzione (chmod +x scarica.sh)
4) digitate ./scarica.sh <documentID> <numeropagine>
5) preparate il caffe' :-)
6) sfogliate il "giornaletto" pronto (all.pdf) mentre sorseggiate il
vostro caffe'

Per un altro giro, mettete al sicuro (e rinominate) all.pdf, pulite
tutto (meno scarica.sh) e trovate un nuovo documentID

Script
---------COPIA INCOLLA DA QUI ------------
#!/bin/bash
# scarica.sh
# Recupero informazioni dalla linea di comando
# il parametro $1 contiene il documentID e il
# parametro $2 il numero totale delle pagine da scaricare
if [[ $# != 2 ]]; then
    echo
    echo ATTENZIONE !!!
    echo Hai dimenticato i parametri documentID e il numero di pagine totali
    echo ES. scarica 090902193817-572dbb8f3b2b43d6be14154b848a31fb 100
    echo
    exit 1
fi
# OK parametri presenti, inizializzo le variabili di lavoro
document_id=$1
n_page=$2
# Download delle pagine
# NOTA il nome deve essere nella forma page_XXX.jpg
# per evitare un successivo problema con la routine per la creazione
# dei PDF (insomma per farli incollare in ordine giusto!)
for ((i=1;$i<=n_page;i=$(($i+1)))); do
    pagenum=`printf "%03d" $i`
    wget -O page_$pagenum.jpg
http://image.issuu.com/$document_id/jpg/page_$i.jpg
done
# Adesso grazie all'aiuto di convert, alias ImageMagick e Pdftk
# (che devono quindi essere presenti nel sistema), si provvede
# al recupero dei file .JPG nella directory corrente, alla loro
# conversione in .PDF e unione
A=$(ls *.jpg);
for file in ${A[@]}; do
    convert $file $file.pdf
done
pdftk *.pdf cat output all.pdf
---------COPIA INCOLLA FIN QUI ------------

OK e' tutto

DePrisco perdonali perche' non sanno quello che fanno...
Che la banda (adsl) sia con voi

Ciao
Cla

Follow-Ups:
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Enrico Maria Giordano
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Fabio Rizzo
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Massimo Raffaele

References:
- [zxspectrum] [semi-ot] MC-Microcomputer on-line
  - From: Francesco S.
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: mentore.siesto
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Francesco S.
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Gennaro Montedoro
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Claudio Di Cesare
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: mentore.siesto
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Giovanni Lagorio
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Claudio Di Cesare
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Claudio Di Cesare
- [zxspectrum] Re: [semi-ot] MC-Microcomputer on-line
  - From: Claudio Di Cesare

[zxspectrum] Re: [semi-ot] MC-Microcomputer on-line

Other related posts: