[okfn-it] un mashup con i dati del portale

a.furieri a lqt.it a.furieri a lqt.it
Mar 4 Gen 2011 09:06:07 UTC


On Tue, 04 Jan 2011 08:55:38 +0100, Raffaella Ventaglio wrote 
>> UTF-7: posso chiedere come mai? Non è meglio e 
>> più standard UTF-8?
>
> Sul perché... non è ho idea, bisognerebbe chiedere a 
> chi ha reso disponibile i dati 
>

Attenzione, perchè questo che è emerso in modo
abbastanza casuale è invece un fattore decisamente 
importante ed assolutamente critico, che può
mettere a rischio la reale fruibilità e condivisione
dei dati.

Non possiamo dare per scontato che esista un
charset encoding "normale" o "più standard" 
degli altri: ok, UTF-8 è sicuramente un'ottima 
scelta universale (specie su Linux). 
ma su WinOZ UTF-8 può anche dare qualche 
grattacapo agli utenti più sempliciotti.
E dopo tutto qualsiasi encoding può essere
facilmente trasformato in un altro, non
mancano certo gli strumenti, le librerie etc.

Quindi il problema vero a me pare un altro:
quando si pubblicano e si offrono in download
dei dati (txt, csv, xls, dbf, shp ...), è 
assolutamente necessario INDICARE IN MODO 
CHIARO ED ASSAI EVIDENTE quale charset è 
stato utilizzato.

Se questa informazione vitale viene omessa,
poi di fatto utilizzare quei dati diviene 
assai difficile, e quindi viene meno la 
possibilità di una facile condivisione. 

Noto invece che purtroppo in moltissimi casi
anche "blasonati" (Nazioni Unite, agenzie
federali US etc) invale il malvezzo di non
specificare mai questa informazione (oppure
di scriverla piccola piccola in fondo a
qualche tonnellata di medati assortiti).

Insomma, non sarebbe male "fare pressione"
perchè invalga la buona pratica di
specificare sistematicamente il charset 
quando si pubblicano dei dati 'open'.

ciao Sandro




Maggiori informazioni sulla lista okfn-it