Am biruit un cvs (dat tot as mai vrea si ods)

Dan Matei Dan la cimec.ro
Dum Feb 2 08:44:16 UTC 2014


Mersi de comentarii și de semnalarea erorilor. Le trimit celor 1,5 arheologi ai mei (sper să nu se spele pe cap cu ele :-)

De îndată ce corectează, republicăm.

Dan Matei

PS1. Majusculele alea se trag din SIRUTA. Dracu' știe de ce le-am păstrat așa ! Huo !

PS2. Chestia cu 404: nu mă pricep, dar pun sistemistul nostru să sape. Nu mă aștept să fie rocket science.

------------------------------------------------------------------
Dan Matei
director, Direcția Patrimoniu Cultural Mobil, Imaterial și Digital [Movable, Intangible and Digital Heritage Department] (aka CIMEC)
Institutul Național al Patrimoniului [National Heritage Institute], București [Bucharest, Romania]
Piața Presei Libere nr. 1, CP 33-90
tel. 0725 253 222, (+4)021 317 90 72; fax (+4)021 317 90 64, www.cimec.ro


-----Original Message-----
From: Strainu <strainu10 la gmail.com>
To: Date deschise & guvernare deschisă <date-deschise la liste.ceata.org>
Date: Sun, 2 Feb 2014 03:32:04 +0200
Subject: Re: Am biruit un cvs (dat tot as mai vrea si ods)

> În data de 30 decembrie 2013, 20:21, Dan Matei <Dan la cimec.ro> a scris:
> > http://data.gov.ro/dataset/repertoriul-arheologic-national-2013-12-30
> 
> 
> Bună seara,
> 
> Cum weekendurile din februarie sunt mai pline decât metroul la ora de
> vârf, am zis să pun mâna să parsez datele astea până nu apare
> versiunea următoare :D
> 
> Câteva observații la cald (mai ales în comparatie cu ce am avut la
> dispoziție când am introdus prima dată datele în Wikipedia), scrise
> chiar în timp ce codez:
> 
> 0. DISCLAIMER: de la 1 încolo s-ar putea să devin foarte tehnic
> 
> 1. Câmpurile sunt mult mai bine delimitate și multe mai clar grupate.
> În plus, fiecare element are cod RAN, chiar dacă acestea nu-s unice.
> 
> 2. Coordonatele zecimale fac toți banii!
> 
> 3. Cineva de pe la Wikipedia găsise un URL standard în care variai
> codul RAN și putea fi folosit pentru invocarea directă a paginii ce
> descria situl. Care este motivul pentru care URL-urile de aici includ
> și numele?
> 
> 4. Din punct de vedere al automatizării ar fi mai OK ca atunci când un
> URL este greșit (nu este găsit codul), serverul să întoarcă codul HTTP
> "404 Not Found" sau măcar un "303 See Other" în loc să dea "200 OK" și
> să-ti arate lista.
> 
> 5. Nu înțeleg de ce unele intrări au 2 coduri RAN (de ex linia 24713
> are la cod "43420.22 43420.21"). N-ar trebui să existe 2 intrări
> pentru aceste cazuri? După cum era de așteptat, nici URL-ul
> corespunzător nu merge.
> 
> 6. Existența unui id de complex nu ar trebui să presupună existența
> unui id de ansamblu? În 2012 așa era...
> 
> 7. De ce există intrări cu id de ansamblu dar fără cod RAN ansamblu?
> (de ex. linia 5802)
> 
> 8. UAT-urile nu au diacritice și sunt cu majuscule; localitățile și
> județele în schimb sunt OK.
> 
> 9. Există erori (dar puține totuși):
> 9.1 Județele Caraș-Severin și Bistrița-Năsăud se scriu cu cratimă
> 9.2. Sunt niște coduri LMI cu erori sau care nu mai sunt valide. Lista
> este mai jos (nu reușesc s-o trimit ca atașament):
> 
> Andrei
> 
> Codul BN-I-s-A-20380 nu a fost găsit în baza de date LMI
> Codul B-I-s-B-17885 nu a fost găsit în baza de date LMI
> Codul NT-I-m-B-10537.07 nu a fost găsit în baza de date LMI
> Codul NT-I-m-B-10540.04 nu a fost găsit în baza de date LMI
> Codul IS-I-s-B-03664 nu a fost găsit în baza de date LMI
> Codul BN-I-s-B-20377 nu a fost găsit în baza de date LMI
> Codul BN-I-s-B-20378 nu a fost găsit în baza de date LMI
> Codul BN-I-s-B-20383 nu a fost găsit în baza de date LMI
> Codul Bn-I-m-A-01283.02 conține erori de formatare
> Codul BN-I-s-B-20379 nu a fost găsit în baza de date LMI
> Codul CT-I-s-A-02600.01 nu a fost găsit în baza de date LMI (7 apariții)
> Codul TL-I-m-B-05898.06 nu a fost găsit în baza de date LMI
> Codul BV-I-s-B-11272 nu a fost găsit în baza de date LMI
> Codul NT-I-m-B-10516.01 nu a fost găsit în baza de date LMI
> Codul NT-I-m-B-10516.02 nu a fost găsit în baza de date LMI
> Codul NT-I-s-B-10525 nu a fost găsit în baza de date LMI
> Codul NT-I-m-B-10528.01 nu a fost găsit în baza de date LMI
> Codul NT-I-m-B-10528.02 nu a fost găsit în baza de date LMI
> Codul CV-I-m-B-13079.01 nu a fost găsit în baza de date LMI
> Codul CV-I-m-B-13079.02 nu a fost găsit în baza de date LMI
> Codul SB-I-s-B-11958 nu a fost găsit în baza de date LMI
> Codul MM-I-m-B-04378.02 nu a fost găsit în baza de date LMI
> Codul TL-I-m-B-05780.02 nu a fost găsit în baza de date LMI
> Codul TL-I-m-B-05764.02 nu a fost găsit în baza de date LMI
> Codul TL-I-m-B-05764.01 nu a fost găsit în baza de date LMI
> Codul VS-I-s-B-20218 nu a fost găsit în baza de date LMI
> Codul HR-I-m-B-12689.03 nu a fost găsit în baza de date LMI
> Codul SB-I-s-A-11947 nu a fost găsit în baza de date LMI
> Codul IF-I-s-B-15168 nu a fost găsit în baza de date LMI
> Codul IF-I-s-B-15168 nu a fost găsit în baza de date LMI
> Codul IF-I-m-B-15168.01 nu a fost găsit în baza de date LMI
> Codul IF-I-s-B-15168 nu a fost găsit în baza de date LMI
> Codul IF-I-m-B-15168.02 nu a fost găsit în baza de date LMI
> Codul GJ-I-m-B-09135.01 nu a fost găsit în baza de date LMI
> Codul GJ-I-m-B-09135.02 nu a fost găsit în baza de date LMI
> Codul TL-I-m-A-05803.02 nu a fost găsit în baza de date LMI
> Codul PH-I-s-B-16163 nu a fost găsit în baza de date LMI (3 apariții)
> Codul HD-I-s-B-03203 nu a fost găsit în baza de date LMI
> Codul PH-I-m-B-16187.02 nu a fost găsit în baza de date LMI
> Codul PH-I-s-B-16187 nu a fost găsit în baza de date LMI
> Codul CV-I-m-B-13079.01 nu a fost găsit în baza de date LMI
> Codul CV-I-m-B-13079.02 nu a fost găsit în baza de date LMI
> Codul TL-I-m-A-05803.01 nu a fost găsit în baza de date LMI
> Codul HR-I-s-B-12653.03 nu a fost găsit în baza de date LMI
> Codul HR-I-s-B-12653.01 nu a fost găsit în baza de date LMI
> Codul HR-I-s-B-12653.02 nu a fost găsit în baza de date LMI
> Codul MS-II-m-A-15667 nu a fost găsit în baza de date LMI
> Codul BT-II-m-A-01855.01 nu a fost găsit în baza de date LMI (2 apariții)
> Codul "  NT-II-m-B-10694" conține erori de formatare (5 apariții)
> Codul CJ-I-s-A-07110.03 nu a fost găsit în baza de date LMI
> Codul CJ-I-s-A-0711.01 nu este valid
> Codul CJ-I-s-A-07110.02 nu a fost găsit în baza de date LMI
> Codul CJ-I-s-A-07110.04 nu a fost găsit în baza de date LMI
> _______________________________________________
> Date-deschise mailing list
> Date-deschise la liste.ceata.org
> https://liste.ceata.org/listinfo/date-deschise





Mai multe informații despre lista de discuții Date-deschise