update OKF si Mozilla Foundation - hackathon

stefan candea stefancandea la yahoo.de
Vin Apr 20 08:52:01 UTC 2012


ok, inteleg in mare problemele. 

legat de copyright - publicarea actionariatului unei societati comerciale este o masura de protectie pentru cei care vor sa faca afaceri cu o societate sau alta si dupa parerea mea sunt date publice. nu vad de ce sa discut despre copyright pe datele de actionariat la companii, mai ales ca ideea e sa le extragem si reorganizam. 

legat de arhiva media - atat timp cat sunt online arhivele ziarelor, baza de date va trimite la site-ul original. dar daca nu mai sunt online si firma nu mai exista, mi se pare un serviciu public sa le mentinem undeva active (pe modelul web archive / google ?). o institutie media are privilegii (acces la info, protectie in constitutie etc) tocmai pt ca sustine ca indeplineste un serviciu public - asta ar trebui sa vina si cu niste obligatii 
- restul de operatiuni gen analiza parcursului unei info se face in interiorul bazei de date, nu prin publicarea intregii baze de date. 

legat de crowdsourcing - ok, nu astept de la o comunitate larga sa participe, dar stiu ca ziaristi de investigatie din diverse retele ar adauga info si n-au o platforma sa o faca. ar fi un inceput. 

bani - pai lasam atunci discutia asta deocamdata si ne concentram pe open data. putem sa ne jucam cu moduri de diseminare a info dupa ce se produc info astea

stefan 


--- Alex Morega <alex la grep.ro> schrieb am Fr, 20.4.2012:

Von: Alex Morega <alex la grep.ro>
Betreff: Re: update OKF si Mozilla Foundation - hackathon
An: "Date deschise & guvernare deschisă" <date-deschise la liste.ceata.org>
CC: "Catalin Francu" <cata la francu.com>
Datum: Freitag, 20. April, 2012 10:11 Uhr


On 19 Apr 2012, at 23:59, stefan candea wrote:

> pai cred ca e f bine sa fie gica-contra fiecare pe rand, ca sa ne definim un pic directiile in care putem colabora ca grup. nu o sa fie tot timpul ceva la fel de important sau relevant pentru toata lumea, mai ales ca venim fiecare din zone diferite. 
> 
> raspund mai jos:
> 
> --- Alex Morega <alex la grep.ro> schrieb am Do, 19.4.2012:
> 
> Von: Alex Morega <alex la grep.ro>
> Betreff: Re: update OKF si Mozilla Foundation - hackathon
> An: "Date deschise & guvernare deschisă" <date-deschise la liste.ceata.org>
> Datum: Donnerstag, 19. April, 2012 21:28 Uhr
> 
>> Sună interesant proiectele. Comentarii mai jos. Detest să fiu gică-contra, dar dacă ne apucăm de o treabă, să știm că merită efortul.
>> 
>> On 19 Apr 2012, at 17:35, stefan candea wrote:
>> 
>>> noi mai avem cateva idei in cap:
>>> 
>>> reorganizare, trecere in open source, re-codare si gandire noua functionare la unelte existente: 
>>> 
>>> - www.mediaindex.ro + www.5secunde.ro (harta proprietarilor media din romania, a asociatilor lor + o arhiva a media online cu posibilitati de analiza si urmarire sursa informatie)
>>> 
>> media index: ar trebui să fie o resursă importantă, dar pare că sunt date vechi și incomplete, e vreo perspectivă să se repare asta cumva? Există modele de astfel de site-uri prin alte țări?
>> 
> - eu nu stiu de alt site.

Ar trebui să mergem după modele existente, măcar la început; mi-e greu să cred că o să inventăm o roată nouă și bună.

> - sunt date vechi si incomplete pt ca am fost 2 oameni care le-am scos de la recom si le-am bagat de mana intr-un format de baza de date greoi si rudimentar. la care n-am mai avut acces dupa. si pt care n-am mai avut bani si timp sa facem update-uri. 
> - exista surse pt datele astea: CNA pentru toti detinatorii de licenta pana la persoana fizica (radio+TV) // monitorul oficial pt editorii de ziare (listati in diverse baze de date gen CRP sau mediaindex original)
> - ma gandeam daca exista o solutie de programare pentru extragerea entitatilor automat (nume firme, nume asociati) din monitorul oficial

E bună ideea cu extras date din monitorul oficial. Cătălin (în CC) lucrează la asta, ar trebui să ne coordonăm. Ar fi mișto să existe o bază de date online cu toată informația din monitoarele oficiale, digitizată, categorisită și indexată.

> - ma gandeam ca se pot spatializa informatiile din adresa firmelor editoare sau proprietare de licenta radio/tv
> 
>> 5secunde: arată ca un agregator de titluri de știri. Realizat frumos, dar e nevoie de el?
> 
> - din cate inteleg de la cei care l-au facut ei indexeaza/parseaza info si o stocheaza, nu stiu pe altcineva care face asta. ma gandesc la o solutie tehnica pt crearea unei arhive a media online, asa cum apare ea initial, din cauza ca ne-am lovit de disparitia arhivelor in cazul foarte multor ziare: evz, gardianul, ziua, academia catavencu etc. 

Ok, dar sunt probleme de copyright, nu poți să republici conținutul articolelor, dacă nu ai acordul ziarului.

>>> - open corporates: sa agregam diverse baze de date din regiune (online, offline) despre companii si proprietate societati comerciale si alte structuri. de adaugat o pagina wiki pt resurse unde comunitatea poate aduce info si resurse pe actionariate in mod dinamic (exista deja opencorporates.com)
>> 
>> Avem surse cu date suficiente? Ce încredere avem în calitatea datelor? Cum putem verifica corectitudinea contribuțiilor din comunitate?
> 
> - daca ne concentram pe estul europei, da, avem baze de date destule. noi am tot adunat baze de date din regiune, unele sunt deja libere (vezi cehia, slovacia), altele sunt partiale pe CD-uri oficiale (vezi VARO in moldova), altele au fost agregate semi-legal (vezi radarix.ru sau cronos in ucraina). in tot spatiul sovietic au aparut baze de date vandute la chioscurile de ziare, tocmai pt ca guvernele incearca sa secretizeze cat mai multa informatie, sau sa castige din vandut informatia pe sub mana. 
> - calitatea datelor: e o intrebare legitima, cred ca datele trebuie prezentate cu titlu orientativ, de verificat mai departe. nu dam certificat de garantie ca registrul comertului, pentru ca nu avem cum, dar e un punct de pornire, atata timp cat mentionam sursa. bazele astea de date sunt oricum pe piata si sunt folosite, dar nu sunt agregate si cautabile. 

Din nou problema de copyright, putem să adunăm bazele de date doar dacă avem drept de publicare. Avem?

> - cred ca depinde cum definim comunitatea, dar aici as vrea sa aflu de la voi cum am putea face sa functioneze. nu prea stiu toti pasii pt a face sa functioneze o pagina de wikipedia, dar mi se pare ca putem urmari aceeasi structura? fiecare postare poate fi discutata, validata, invalidata. e o pagina de resurse unde spam-ul o sa iasa in evidenta, ma gandesc eu.

Pe Wikipedia este esențial faptul că articolele au linkuri la bibliografie. Nu e vreun procedeu magic prin care spamul este eliminat :) Dacă adaugi un paragraf fără sursă, cineva probabil că o să-l șteargă, și o să dea ca motiv (în comentariul atașat editării) că lipsește citarea.

> - ma gandesc ca pot pune toate locurile unde caut informatie din rutina, ca ziarist (reg com, romarhiva, paginialbe, registru de site-uri, cadastru, monitor oficial etc), si daca la asta se mai adauga info specializata de la altii, ai o unealta destul de puternica sa gasesti informatie, organizata si updatata pe tari. 
> 
>>> - open maps: apps cu info relevante pt oras/comunitate. spre ex un coleg de-al nostru lucreaza la o aplicatie pe mapping populatia canina de pe strazile orasului, sau despre gunoaiele aruncate in strada, despre reactia (sau lipsa de reactie) a politiei, sau despre poluare/poluatori  
>> 
>> Aceeași întrebare: ce surse de date avem, care e calitatea?
> - aici ai strict ce-ti trimit oamenii. verificabila probabil prin geo-tag? (am vazut criteriul asta de validare la witness.org). si prin munca ziarist (info confirmata/infirmata/verificata)

Eu sunt pesimist când e vorba de platforme de croudsourcing. Oamenii, în mod normal, nu o să vină să contribuie cu informație.

>>> - strict legat de media, modalitati de impachetare intr-o aplicatie pt tablete (html5 ?) a unor proiecte de genul asta http://theblacksea.eu/en/arhiva, dupa finalizare. ele pot fi distribuite la conferinte sau pot genera venit pentru ong-uri si comunitati independente de ziaristi+programatori+designeri
>> 
>> În ce scop?
> 
> - ma gandesc ca e util sa experimentam cu felul in care impachetam/diseminam informatie, pentru ca daca gasim niste moduri "de succes" putem sa facem proiecte de genul asta auto-sustenabile si dpdv financiar, pentru toti cei implicati (ziaristi, programatori, designeri). problema proiectelor oengistice, chiar daca interesante, este ca mor din lipsa de finantare. iar munca voluntara functioneaza pana la un punct si in anumite conditii. 

Dacă e vorba de bani, trebuie ca cineva să îi administreze, de exemplu o asociație. De unde aveam o problemă (cum să încurajăm open data) o să avem și pe a doua (cum facem bani și cum îi cheltuim). :)

-- Alex


-----Integrierter Anhang folgt-----

_______________________________________________
Date-deschise mailing list
Date-deschise la liste.ceata.org
http://liste.ceata.org/listinfo/date-deschise
-------------- partea următoare --------------
Un atașament HTML a fost eliminat   
URL: <http://lists.okfn.org/pipermail/date-deschise/attachments/20120420/5e4c6524/attachment-0002.html>


Mai multe informații despre lista de discuții Date-deschise