[okfn-it] un mashup con i dati del portale

Christian Morbidoni christian.morbidoni a gmail.com
Lun 3 Gen 2011 17:57:33 UTC


On Jan 3, 2011, at 6:21 PM, Raffaella Ventaglio wrote:

> On 01/03/2011 05:11 PM, Stefano Costa wrote:
>> 
>> Una buona parte della spiegazione è dedicata a come è stato possibile
>> estrarre i dati in una forma "sensata". Mentre per utenti più smaliziati
>> questo può essere facilmente aggirabile, è effettivamente un ostacolo
>> non da poco per chi, alle prime armi con la ripulitura di dati, vuole
>> comunque cimentarsi con la loro elaborazione come in questo caso. Mi
>> domando se non sia fuorviante indicare "CSV" come formato, e se non sia
>> possibile fornire i dati "puliti" (anche nell'ottica di fornire metadati
>> machine-readable). Questo tipo di delimitazioni sono frequenti anche nei
>> dati elettorali del Ministero dell'Interno, e sono ugualmente noiosi. 
>> 
> Mi permetto di aggiungere una nota (che ho indicato anche qualche giorno fa nei commenti presenti qui: http://dati.piemonte.it/casi-duso.html).
> 
> In realtà, i dati in questione, non sono "da ripulire", ma da aprire con l'encoding corretto: UTF-7 (poco conosciuto forse, però esiste ;)).
> Se si utilizza OpenOffice l'operazione è piuttosto semplice, perché in fase di apertura di un file csv permette di selezionare facilmente il separatore di campo (in questo caso tab) e l'encoding da utilizzare (UTF-7) per aprire il file.
> In Excel (almeno fino all'ultima versione che ho avuto occasione di usare: Excel 2003), l'operazione è un po' meno "immediata", ma comunque possibile: nella procedura di importazione guidata dei file, è necessario modificare il parametro Origine (Excel 2003 in italiano, potrebbe essere diverso in altre versioni) impostando il valore "65000: Unicode (UTF-7)".
> 
> Spero che l'informazione vi sia utile.

Utilissima grazie :-) UTF-7: posso chiedere come mai? Non è meglio e più standard UTF-8?

Christian


> 
> Ciao e buon inizio anno a tutti.
> 
> -- 
> Raffaella Ventaglio 
> ventaglio a celi.it 
> tel: +39.011.562.71.15 
> skype: vraffy 
> http://www.celi.it 
> La teoria è quando si sa tutto ma non funziona niente.
> La pratica è quando funziona tutto ma non si sa il perché.
> In ogni caso si finisce sempre con il coniugare la teoria con la pratica: non funziona niente e non si sa il perché.
> A. Einstein
> 
> _______________________________________________
> okfn-it mailing list
> okfn-it a lists.okfn.org
> http://lists.okfn.org/mailman/listinfo/okfn-it





Maggiori informazioni sulla lista okfn-it