[Linuxtrent] Re: Problema con lettere accentate in nomi file di windows

  • From: Antonio Galea <antonio.galea@xxxxxxxxx>
  • To: linuxtrent@xxxxxxxxxxxxx
  • Date: Thu, 3 May 2012 01:19:13 +0200

2012/5/2 Marco Ciampa <ciampix@xxxxxxxxx>:
>
> No, sono sicuro di no. Windows _non_ usa utf-8 altrimenti non ci
> sarebbero un sacco di problemi di porting del software... Salva un file
> .reg e poi dimmi con che codifica lo ha salvato...
> Siccome so che sei pigro lo faccio io... ;-)

Certo, vorrai mica che accenda un pc solo per
verificare ;-)

> $file prova.reg
> prova.reg: Little-endian UTF-16 Unicode text, with CRLF line terminators
> Visto?

Grazie, oggi ho imparato una cosa in più.

>> Una valanga di software però sa  usare solo la codifica ad 1 byte
>> per carattere - supporre di poter usare solamente una codifica wide
>> è andare in cerca di rogne.
> Per certe app. non hai scelta.

Sicuro - è sempre un bel casino. Su Windows hai applicazioni
che conoscono solo le API Ansi, altre che parlano solo Wide,
e poche che capiscono entrambi. Nello specifico dei nomi di
file, il default di NTFS è certamente Unicode (codificato in
UTF-16, tu mi insegni) - e Windows "traduce" in automatico
i caratteri per tutte le applicazioni che usano le API Ansi.

Lato Linux, i tools di ntfs-3g fanno una cosa simile: se il mount
viene fatto con l'opzione utf8, il driver converte tutto in quella
codifica - si tratta solo di vedere se l'opzione è attiva, in caso
non lo fosse basta aggiungerla.

Rimane ancora una fonte di rogne: NTFS _accetta_ i nomi in
Unicode - ma non _verifica_ che le sequenze di caratteri siano
valide nella sua codifica. Quindi se un programma fa porcherie
con l'encoding (non spesso oramai, ma succede ancora) ti può
capitare di dover correggere a mano i nomi.

Antonio
--
Per iscriversi  (o disiscriversi), basta spedire un  messaggio con OGGETTO
"subscribe" (o "unsubscribe") a mailto:linuxtrent-request@xxxxxxxxxxxxx


Other related posts: