[okfn-it] Rif: Re: un mashup con i dati del portale
Christian Morbidoni
christian.morbidoni a gmail.com
Lun 10 Gen 2011 15:18:07 UTC
Scusate la mail precedente era vuota ... eccone il contenuto :-)
Salve Claudia,
perchè sia più standard non te lo so dire :-)
Però UTF-8 e 16 sono di gran lunga più supportati come encoding e anche le specifiche Unicode non lo listano tra gli encoding standard.
Non sono un super esperto di encoding...ti posso riportare quello che dice wikipedia:
"UTF-7 was first proposed as an experimental protocol in RFC 1642, A Mail-Safe Transformation Format of Unicode. This RFC has been made obsolete by RFC 2152, an informational RFC which never became a standard. As RFC 2152 clearly states, the RFC "does not specify an Internet standard of any kind". Despite this RFC 2152 is quoted as the definition of UTF-7 in the IANA's list of charsets. Neither is UTF-7 a Unicode Standard. The Unicode Standard 5.0 only lists UTF-8, UTF-16 and UTF-32. There is also a modified version, specified in RFC 2060, which is sometimes identified as UTF-7."
e ancora: "UTF-7 is generally not used as a native representation within applications as it is very awkward to process"
che mi pare un buon motivo per non usarlo :-)
una discussione su stackoverflow: http://stackoverflow.com/questions/1454952/dummys-guide-to-unicode
saluti
Christian
On Jan 10, 2011, at 2:58 PM, claudia.secco a csi.it wrote:
>
> ciao a tutti,
> sono la persona che gestisce la redazione del portale dati.piemonte.it. Tramite il portale ho risposto al commento e suggerimento di Raffaella, e aggiornato le faq di conseguenza. Ebbene sì, bastava scorrere il menù a tendina della finestra di dialogo excel, e con un po' di pazienza si trova anche l'unicode UTF 7..... Avevo fatto alcune prove e cercato informazioni su blog tematici, ma da nessuna parte avevo trovato questo semplice (a saperlo) suggerimento, anzi mi pare che ci sia molta gente che "brancola" cercando di ripulire le stringhe in più con i metodi più vari.
>
> Per quanto riguarda la domanda di Christian, perchè Unicode UTF 7e non UTF 8, come redazione posso dire semplicemente che questo è lo standard che viene proposto da Calc salvando una tabella, e quindi abbiamo usato quello.
> Ribalto la domanda, perché è "più standard" l'UTF 8? Potete darmi dei suggerimenti per approfondire la tematica?
>
> Grazie e buon anno a tutti!
>
> Claudia Secco
>
> CSI-Piemonte - Direzione servizi Territoriali e Ambientali
> Corso Enrico Tazzoli 215/12B - 10137 Torino
> Tel. +39 011.3169694 - Fax +39 011.3169560
>
> e-mail: claudia.secco a csi.it
> www.csipiemonte.it
> ___________________________________________________________
> Il presente messaggio, corredato degli eventuali allegati, contiene informazioni da considerarsi strettamente riservate e confidenziali.
> Ne è vietato l'uso improprio, la diffusione, la distribuzione o la riproduzione da parte di altre persone e/o entità diverse da quelle specificate.
> Qualora lo abbiate ricevuto per errore, vi preghiamo di distruggere il messaggio, comunicando l'errata ricezione tramite il reply all'indirizzo mittente.
>
>
>
>
> Christian Morbidoni <christian.morbidoni a gmail.com>
> Inviato da: okfn-it-bounces a lists.okfn.org
> 03/01/2011 18.57
>
> Per
> ventaglio a celi.it
> CC
> okfn-it a lists.okfn.org
> Oggetto
> Re: [okfn-it] un mashup con i dati del portale
>
>
>
>
>
>
> On Jan 3, 2011, at 6:21 PM, Raffaella Ventaglio wrote:
>
> > On 01/03/2011 05:11 PM, Stefano Costa wrote:
> >>
> >> Una buona parte della spiegazione è dedicata a come è stato possibile
> >> estrarre i dati in una forma "sensata". Mentre per utenti più smaliziati
> >> questo può essere facilmente aggirabile, è effettivamente un ostacolo
> >> non da poco per chi, alle prime armi con la ripulitura di dati, vuole
> >> comunque cimentarsi con la loro elaborazione come in questo caso. Mi
> >> domando se non sia fuorviante indicare "CSV" come formato, e se non sia
> >> possibile fornire i dati "puliti" (anche nell'ottica di fornire metadati
> >> machine-readable). Questo tipo di delimitazioni sono frequenti anche nei
> >> dati elettorali del Ministero dell'Interno, e sono ugualmente noiosi.
> >>
> > Mi permetto di aggiungere una nota (che ho indicato anche qualche giorno fa nei commenti presenti qui: http://dati.piemonte.it/casi-duso.html).
> >
> > In realtà, i dati in questione, non sono "da ripulire", ma da aprire con l'encoding corretto: UTF-7 (poco conosciuto forse, però esiste ;)).
> > Se si utilizza OpenOffice l'operazione è piuttosto semplice, perché in fase di apertura di un file csv permette di selezionare facilmente il separatore di campo (in questo caso tab) e l'encoding da utilizzare (UTF-7) per aprire il file.
> > In Excel (almeno fino all'ultima versione che ho avuto occasione di usare: Excel 2003), l'operazione è un po' meno "immediata", ma comunque possibile: nella procedura di importazione guidata dei file, è necessario modificare il parametro Origine (Excel 2003 in italiano, potrebbe essere diverso in altre versioni) impostando il valore "65000: Unicode (UTF-7)".
> >
> > Spero che l'informazione vi sia utile.
>
> Utilissima grazie :-) UTF-7: posso chiedere come mai? Non è meglio e più standard UTF-8?
>
> Christian
>
>
> >
> > Ciao e buon inizio anno a tutti.
> >
> > --
> > Raffaella Ventaglio
> > ventaglio a celi.it
> > tel: +39.011.562.71.15
> > skype: vraffy
> > http://www.celi.it
> > La teoria è quando si sa tutto ma non funziona niente.
> > La pratica è quando funziona tutto ma non si sa il perché.
> > In ogni caso si finisce sempre con il coniugare la teoria con la pratica: non funziona niente e non si sa il perché.
> > A. Einstein
> >
> > _______________________________________________
> > okfn-it mailing list
> > okfn-it a lists.okfn.org
> > http://lists.okfn.org/mailman/listinfo/okfn-it
>
>
> _______________________________________________
> okfn-it mailing list
> okfn-it a lists.okfn.org
> http://lists.okfn.org/mailman/listinfo/okfn-it
>
Maggiori informazioni sulla lista
okfn-it