[okfn-br] Digest okfn-br, volume 55, assunto 28

Quinta Fevereiro 25 18:20:38 UTC 2016

Prezados,

Acredito que o Brasil está melhor que muitos países na questão da
Informação para a Pesquisa. Estamos muito adiantados no desenvolvimento de
repositórios institucionais Digitais. Segundo o Registry of Open Access
Repositories – ROAR, o Brasil é o sexto país do mundo em número de
repositórios institucionais digitais de acesso aberto:
http://roar.eprints.org/ <http://roar.eprints.org/>

Entre as iniciativas brasileiras destaco as ações do Instituto Brasileiro
de Informação em Ciência e Tecnologia (IBICT) como o lançamento do
Manifesto Brasileiro de Apoio ao Acesso Livre (
http://livroaberto.ibict.br/Manifesto.pdf), a construção do Portal
Brasileiro Acesso Aberto à Informação Científica - Portal Oasis.Br (
http://oasisbr.ibict.br/vufind/) , o apoio às universidades e instituições
públicas na construção de repositórios institucionais, temáticos e
publicações eletrônicas e de incubadora de repositórios e publicações
eletrônicas (
http://www.ibict.br/informacao-para-ciencia-tecnologia-e-inovacao%20/repositorios-digitais),
 a absorção, customização e transferência de pacotes de software *open
source* (DSpace, SEER e outros softwares que atendem aos padrões para
publicações científicas) e a criação da Rede Brasileira de Serviços de
Preservação Digital – Rede CARINIANA.

Aproveitando a oportunidade, faço um comercial: Sou diretora da
InnovaGestão – Consultoria em Informação, empresa especializada em serviços
e produtos de informação que utiliza exclusivamente softwares abertos.
Divulgo o link para o nosso próximo curso: Desenvolvimento de repositórios
institucionais e bibliotecas digitais utilizando o Dspace (
http://www.innovagestao.com.br/)

Caso esta ação de divulgação seja contra as normas desta lista. Peço
desculpas, mas este curso, aberto ao público, só é encontrado aqui.

Abraços

Neide De Sordi

Em 25 de fevereiro de 2016 11:37, <okfn-br-request em lists.okfn.org> escreveu:

> Enviar submissões para a lista de discussão okfn-br para
>         okfn-br em lists.okfn.org
>
> Para se cadastrar ou descadastrar via WWW, visite o endereço
>         https://lists.okfn.org/mailman/listinfo/okfn-br
> ou, via email, envie uma mensagem com a palavra 'help' no assunto ou
> corpo da mensagem para
>         okfn-br-request em lists.okfn.org
>
> Você poderá entrar em contato com a pessoa que gerencia a lista pelo
> endereço
>         okfn-br-owner em lists.okfn.org
>
> Quando responder, por favor edite sua linha Assunto assim ela será
> mais específica que "Re: Contents of okfn-br digest..."
>
>
> Tópicos de Hoje:
>
>    1. Re: relação entre a abertura de dados e a Reprodutibilidade
>       em Ciências (Peter Krauss)
>
>
> ----------------------------------------------------------------------
>
> Message: 1
> Date: Thu, 25 Feb 2016 11:37:09 -0300
> From: Peter Krauss <ppkrauss em gmail.com>
> To: "Grupo de interesse em conhecimento livre no Brasil, especialmente
>         dados abertos // Open Knowledge discussion list for Brazil"
>         <okfn-br em lists.okfn.org>
> Subject: Re: [okfn-br] relação entre a abertura de dados e a
>         Reprodutibilidade em Ciências
> Message-ID:
>         <CAHEREtsczwRnWqgziou=Hc6NQWLZdPvbcm1DdAX4Yj57tC=
> fjg em mail.gmail.com>
> Content-Type: text/plain; charset="utf-8"
>
> Oi Daniela, obrigado oferecer ao publico slides relevantes de forma mais
> aberta!  Poderia acrescentar licença <https://creativecommons.org/choose/
> >?
>
>
> Não pude ler tudo, chamaram atenção os comentários sobre estudo do Van
> Noorden <http://dx.doi.org/10.1038/nature.2015.17694>  (não vi links para
> dados e detalhes metodológicos, voce tem isso?)
>
> - - -
> Retomando o assunto de 2015...
>
> No geral, acho que já há uma boa dose de consciência da relevância e dos
> desafios da comunidade científica brasileira, mas pouquíssimos deram o
> passo seguinte que é conhecer e *usar os padrões*... Enquanto não houver
> aderência aos padrões nada cresce de forma sustentável, e continuaremos
> interagindo mais com os gringos do que entre nós... Padronizar e cooperar
> são sinônimos nesse contexto.
>
> Fica a sugestão de aproveitar o seu público, já conscientizado dos
> conceitos e problemas, e oferecer a eles uma  apresentação ou workshop
> complementar,  sobre padrões essenciais...
>
> - - - -
>
> ... Pessoalmente, para dados pulverizados (que depois formam uma massa
> coerente de *big data* conforme uso),  acho que são esses dois:
>
> * *JATS* - https://en.wikipedia.org/wiki/Journal_Article_Tag_Suite
> * *CSV com semântica* - https://www.w3.org/TR/tabular-data-model/
>
> No caso de padrões específicos de uma base mais especializada, como as
> bases já clássicas de astronomia e genoma, a solução aberta para fomentar o
> uso, é oferecer descrição dos metadados via padrões da Web Semântica, tais
> como  JSON-LD <http://json-ld.org/> e  Microdata
> <https://www.w3.org/TR/microdata/> (ex. SchemaOrg
> <http://schema.org/docs/gs.html>), que vêm se consolidando.
>
> PS: existem também iniciativas de *big-data* de uso científico e apoio do
> publico (*crowdsourcing*) e pesquisadores (vide bases cartográficas PostGIS
> <http://postgis.org/> nas universidades), o exemplo mais importante creio
> que seja o OpenStreetMap
> <http://wiki.openstreetmap.org/wiki/Databases_and_data_access_APIs>.
>
>
> Em 25 de fevereiro de 2016 10:32, Daniela Brauner <danibrauner em gmail.com>
> escreveu:
>
> > Olá Peter e demais integrantes da lista,
> >
> > Desculpem me pela demora pra responder o email de setembro 2015.
> > Obrigada por todas as informações (muito legal!)
> >
> > Eis o link dos slides, da apresentação que fiz sobre compartilhamento de
> > dados científicos em 2015:
> >
> https://docs.google.com/presentation/d/1ZpvQ_7_9CuqmLpCrY2X25kekVgIbsL7nnPcsmhfHzN4/edit?usp=sharing
> >
> > Gostaria de saber se vcs tem um grupo para discutir mais ativamente (por
> > hangout ou ferramentas online). Estou no RS e gostaria de participar de
> > forma remota. ;) Não só das atividades relacionadas à dados abertos
> > cientificos, mas dados abertos no geral.
> >
> > Obrigada
> >
> > Abs
> > Dani
> >
> >
> >
> > Em 12 de setembro de 2015 08:39, Peter Krauss <ppkrauss em gmail.com>
> > escreveu:
> >
> >> Olá Daniela,
> >>
> >> Na minha visão o JATS em OpenAccess  já é uma iniciativa revolucionária
> >> de dados abertos (!).
> >> Claro, sempre há potencial para fazer mais, porém há necessidade de
> >> seguir passo-a-passo a evolução, consolidar as coisas... consolidar a
> >> cultura.
> >>
> >> O SciELO SPS
> >> <
> http://docs.scielo.org/projects/scielo-publishing-schema/pt_BR/1.2-branch/>
> é
> >> como um "JATS ABNT", ou seja, é de fato o padrão brasileiro para
> registrar
> >> artigos científicos.
> >>  PS: as editoras e o governo (ex. FAPESP) já vem investindo nisso desde
> >> 2013.
> >>
> >> Comentei do *Material Suplementar* pois ele faz parte desse padrão, e os
> >> recursos oficiais (esquema de "depósito legal
> >> <https://en.wikipedia.org/wiki/Legal_deposit>" do artigo científico),
> >> como o acervo SciELO, permitem o depósito casado do artigo com o seu
> >> material suplementar.
> >> ... Este artigo da descoberta das cores do camaleão
> >> <http://dx.doi.org/10.1038/ncomms7368> tem bons exemplos de material
> >> suplementar, e está também disponível no repositório PubMed Central
> >> <http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4366488/> (para obter o
> >> JATS ver links FTP
> >> <http://www.ncbi.nlm.nih.gov/pmc/utils/oa/oa.fcgi?id=PMC4366488>)...
> >> Exemplo de revista rica em tabelas e materiais suplementares JATS, tem
> a PLOS
> >> ONE <http://www.ncbi.nlm.nih.gov/pmc/journals/440/> e a brasileira GMB
> >> <http://www.ncbi.nlm.nih.gov/pmc/journals/1440/>.
> >>
> >> O incrível, que chama atenção, é que a cultura das revistas e dos
> autores
> >> é uma barreira: não existem barreias técnicas atualmente, pelo contrário
> >> (!).  É preciso ensinar a comunidade científica a usar os recursos mais
> >> simples, nem sequer o mais simples vem sendo usado.
> >>   PS: as estatísticas de uso de material suplementar nas revistas são
> >> baixíssimas (inferior a 1% dos artigos com tabelas), e editores
> brasileiros
> >> insistem em publicar tabelas de dados imensas em PDF ao invés de focar
> no
> >> conteúdo (ex. tabelas com estatísticas e sumarizações), e exigir que
> >> autores usem o recurso do material suplementar.
> >>
> >> Enfim, JATS XML é o que temos de melhor e de mais amplamente usado nos
> >> dias de hoje para "Compartilhar dados científicos"...
> >> É ainda um  "compartilhar" restrito à publicação de artigos científicos
> >> (conteúdo, metadados do conteúdo, e dados suplementares do artigo).
> >>
> >> Perceba o quanto isso é importante, e o quanto ainda estamos patinando
> na *barreira
> >> cultural*...
> >> Veja o exemplo dos seus slides
> >> <
> http://www.slideshare.net/DanielaBrauner/apresentacao-forumrnp-2015-daniela-brauner
> >:
> >> não posso copiar/colar trechos de texto, não posso seguir links, pois
> estão
> >> no formato imagem... É um conteúdo aberto, mas com apenas uma estrela
> >> <http://5stardata.info/en/>. A aderência a uma "nova cultura" precisa
> >> ser ampla...
> >>
> >>  - - -
> >>
> >> Já o compartilhamento de dados em bancos de dados eu vejo como uma
> >> evolução, que dependeria um pouco de termos essa cultura mais sólida.
> >> De qualquer forma, como iniciativa, os *bancos de dados compartilhados*
> correm
> >> em paralelo,
> >> não podem ser confundidos como uma "obrigação do pesquisador"
> >> (ao contrário do JATS que hoje é uma exigência do SciELO, do PubMed
> >> Central e diversos outros repositórios sérios).
> >>
> >> Algumas áreas possuem padrões, ferramentas, etc. que permitem o uso de
> >> bancos de dados compartilhados e *big data*: OpenStreetMaps
> >> <http://www.openstreetmap.org/> é um exemplo onde cientistas e pessoas
> >> comuns compartilham dados...
> >> A cada área (física de partículas, genética, análise climática, etc.
> >> etc.) pode ou não haver oportunidade de uso de grandes bancos de dados.
> A
> >> maior parte ainda não tem seu *big data* padronizado e compartilhado.
> >>
> >> Além do *big data*, existem os casos intermediários, entre "material
> >> suplementar" (ex. planilhas em formato CSV) e o banco de dados, que são
> os
> >> chamados *datasets*, promovidos pela OKFN no projeto *Data Packaged Core
> >> Datasets* <https://github.com/datasets/>.
> >>
> >> Esses bancos de dados (dos *datasets* ao *big data*), para terem
> >> sucesso, exigem uma certa democracia para que sejam de fato atrativos,
> >> confiáveis, transparentes.... É o que chamam de *curadorias digitais*.
> >> Além disso o critério de *veracidade* (inerente à questão da
> >> reprodutibilidade científica) de cada área do conhecimento requer uma
> certa
> >> "intuição coletiva", que só uma curadoria ampla e igualmente aberta pode
> >> assegurar.
> >> No Brasil ainda estão nascendo as curadorias e as bases de dados
> >> compartilhadas... são pouquíssimos os exemplos pois, novamente, há uma
> >> cultura acadêmica arraigada do "meus dados", como você bem lembrou.
> >>
> >>
> >> (respondendo *inline* os detalhes)
> >>
> >> Em 11 de setembro de 2015 11:05, Daniela Brauner <danibrauner em gmail.com
> >
> >>  escreveu:
> >>
> >>> Oi Peter e amigos
> >>>
> >>> Pois então.... As editoras, agências de financiamento e quem sabe até
> as
> >>> próprias universidades e outros, que obtém resultados de P&D, deveriam
> ter
> >>> repositórios ou exigir que os dados utilizados em artigos fossem
> >>> compartilhados de forma aberta.
> >>>
> >>
> >> tentei expressar acima, fique a vontade para replicas ;-)
> >>
> >>
> >>> Já existem plataformas que permitem isso como o Dataverse criado em
> >>> Harvard.
> >>>
> >>>
> >> Dei uma olhada mas nunca havia usado... Existem exemplos brasileiros?
> >> Qual a vantagem em relação a uma base especializada, ou em relação aos
> >> repositórios JATS genéricos?
> >>
> >>
> >>> Mas temos alguns desafios importantes para resolver para garantir o
> >>> reuso a longo prazo desse tipo de dados (IDs persistentes das coleções,
> >>> proveniência etc. Coisas que sabemos como fazer basta colocar em
> prática).
> >>>
> >>
> >> Bem lembrado, e acredito que "identificar" é o primeiro passo para
> >> qualquer iniciativa... Conheço a fundo três exemplos de IDs
> persistentes,
> >>
> >> * *DOI*: de longe o mais difundido, apesar do custo não ser irrisório.
> >>
> >> * *ISSN*: difundido apenas para revistas, mas poderia estar acoplado ao
> >> DOI (além de igualmente custoso), é mau usado nesse sentido, tenho um
> >> projeto OKBr para isso, https://github.com/okfn-brasil/ISSN-L-Resolver
> >>
> >> * LexML e as *URNs LEX*: o único exemplo 100% brasileiro, sem custo,  e
> >> transparente. Gosto muito dele, ver http://www.lexml.gov.br/     Para
> >> apoiar outros usos tem o projeto OKBr
> >> https://github.com/okfn-brasil/getlex
> >>
> >>
> >>
> >>> Existe uma variedade muito grande de formatos, tipos e metadados, que
> >>> dificultam a interoperabilidade mas acredito que as barreiras culturais
> >>> ainda são o maior impedimento... "Os MEUS dados".
> >>>
> >>>
> >> Discuti acima a solução que se consolidou em artigos científicos: *JATS*
> >> (e CSV para materiais suplementares).
> >>
> >>
> >>
> >>> Fiz uma apresentação sobre isso outro dia onde tentei listar os
> desafios
> >>> e falei sobre uma iniciativa que apoia discussões sobre
> compartilhamento e
> >>> reuso de dados científicos, chamada RDA.
> >>>
> >>> Checkout:
> >>>
> http://www.slideshare.net/DanielaBrauner/apresentacao-forumrnp-2015-daniela-brauner
> Apresentacao
> >>> ForumRNP 2015 - Daniela Brauner
> >>>
> >>>
> >> Parece muito boa (!), tem como nos passar em formato aberto?
> >> ;-)
> >>
> >>
> >>
> >>
> >>> Abs
> >>> Daniela
> >>>
> >>>
> >>
> >>
> >>
> >>>
> >>> Em 11/09/2015, às 06:14, Peter Krauss <ppkrauss em gmail.com> escreveu:
> >>>
> >>> Um dos pilares do método científico e do "fazer Ciência" é a
> >>> Reprodutibilidade <https://en.wikipedia.org/wiki/Reproducibility>...
> >>>
> >>> Quando falamos de *publicações científicas* abertas (muito da produção
> >>> brasileira está hoje concentrada nos acervos do SciELO
> >>> <https://en.wikipedia.org/wiki/SciELO>),
> >>> ou seja, de OpenAccess <https://en.wikipedia.org/wiki/Open_access>,
> >>> esquecemos da relação que isso tem com o conceito de *reprodutibilidade
> >>>  *-- e não só com *transparência* e *direito de acesso ao
> conhecimento*.
> >>>
> >>> Um bom exemplo de aplicação prática do conceito é a publicação de
> >>> tabelas em artigos.
> >>> A *reprodutibilidade* é o que de fato explica o porquê, quando o
> >>> pesquisador publica seu artigo científico numa revista,
> >>> de *não* ser recomendado publicar *tabelas* em formato imagem (!), e de
> >>> não ser suficiente a revista oferecer apenas o PDF do artigo:
> >>>
> >>> * o ideal é enviar como materal suplementar
> >>> <
> http://jats.nlm.nih.gov/publishing/tag-library/1.1d3/element/supplementary-material.html
> >
> >>>  uma tabela CSV <http://www.w3.org/standards/techs/csv#w3c_all> ou
> >>> planilha aberta, (um "conteudo pelo menos 4 estrelas
> >>> <http://5stardata.info/en/>") para que *outros pesquisadores
> >>> possam reproduzir as contas*, reutilizando operacionalmente a  tabela
> >>> publicada.
> >>>
> >>> * o correto, dentro dos padrões atuais, é a tabela estar expressa em
> >>> HTML, com dados linha a linha
> >>> <
> http://jats.nlm.nih.gov/publishing/tag-library/1.1d3/chapter/tag-tables.html>
> para
> >>> podermos copiar/colar do acervo online para uma  planilha.
> >>>
> >>> As revistas dos principais acervos, como SciELO e PubMed Central, são
> >>> obrigadas hoje a entregar cada artigo, enquanto obra e documento
> oficial,
> >>> em ambos formatos, PDF e XML JATS
> >>> <https://en.wikipedia.org/wiki/Journal_Article_Tag_Suite> -- é o XML
> >>> que dá origem à indexação, ao HTML, EPUB, etc. automaticamente.
> >>>
> >>> - - -
> >>> O link abaixo veio de uma dica da Carol aqui na Lista (desculpem perdi
> o
> >>>  *thread* de onde cliquei o bookmark essa semana),
> >>> muito bom, sobre esse assunto de "reprodutibilidade dos resultados do
> >>> pesquisador",
> >>>
> >>>
> >>>
> http://www.ibtimes.com/scrutinizing-scientific-method-researchers-massive-open-access-study-fail-replicate-2071483
> >>>
> >>> *A publicação científica* se torna de fato *conhecimento* depois dos
> >>> pares terem *reproduzido*, que na prática é uma auditoria ;-)
> >>> não é muito diferente das contas públicas do governo.
> >>>
> >>> _______________________________________________
> >>> okfn-br mailing list
> >>> okfn-br em lists.okfn.org
> >>> https://lists.okfn.org/mailman/listinfo/okfn-br
> >>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
> >>>
> >>>
> >>> _______________________________________________
> >>> okfn-br mailing list
> >>> okfn-br em lists.okfn.org
> >>> https://lists.okfn.org/mailman/listinfo/okfn-br
> >>> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
> >>>
> >>>
> >> _______________________________________________
> >> okfn-br mailing list
> >> okfn-br em lists.okfn.org
> >> https://lists.okfn.org/mailman/listinfo/okfn-br
> >> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
> >>
> >>
> >
> > _______________________________________________
> > okfn-br mailing list
> > okfn-br em lists.okfn.org
> > https://lists.okfn.org/mailman/listinfo/okfn-br
> > Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
> >
> >
> -------------- Próxima Parte ----------
> Um anexo em HTML foi limpo...
> URL: <
> http://lists.okfn.org/pipermail/okfn-br/attachments/20160225/0c5c06f6/attachment.html
> >
>
> ------------------------------
>
> Subject: Legenda do Digest
>
> _______________________________________________
> okfn-br mailing list
> okfn-br em lists.okfn.org
> https://lists.okfn.org/mailman/listinfo/okfn-br
> Unsubscribe: https://lists.okfn.org/mailman/options/okfn-br
>
>
> ------------------------------
>
> Fim da Digest okfn-br, volume 55, assunto 28
> ********************************************
>
-------------- Próxima Parte ----------
Um anexo em HTML foi limpo...
URL: <http://lists.okfn.org/pipermail/okfn-br/attachments/20160225/549484c4/attachment-0004.html>