[Gastosabertos-dev] Respondendo ao Lucas sobre "Semantic Web"

Edgar Zanella Alvarenga e em vaz.io
Quinta Fevereiro 5 03:33:14 UTC 2015


(11:01:31 PM) lpirola_: http://eping.governoeletronico.gov.br/
(11:01:37 PM) lpirola_: whois aivuk

Aivuk == Edgar == http://github.com/aivuk

(11:03:16 PM) lpirola_: tem algum motivo para n?o seguirmos o padr?o do 
governo federal para disponibilizar os dados para os componentes 
javascript?

Qual padrão? Do que exatamente está falando? Em termos concretos eu 
digo. Você chegou a ler o link que
passou? Sério, é um documento inútil atualmente (pro nosso caso, pro 
nosso caso, pro governo e pra ter
algum documento oficial a ser seguido ok, daí é outra história).

Primeiro, várias coisas que estão aí já estamos seguindo. Veja 
exemplos:

3.1. Especificações Técnicas para Meios de Publicação

  Conjunto de caracteres => Sim, estamos usando UTF8
  Formato de intercâmbio de hipertexto  => Sim, usamos HTML5.
  Arquivos do tipo “banco de dados” para estações de trabalho => Usamos 
txt, mas que pena que PostgreSQL não é nem citado. Recomendam o MySQL... 
yeap.

4.1.Especificações Técnicas

  Linguagem para intercâmbio de dados => Yeap, JSON.
  Formato para intercâmbio de dados geoespaciais => Well, ainda estão 
estudando pra ver o uso de GeoJSON...

Tabela 17 – Web Service

  Protocolo para acesso a Web Service => Yeap, usamos HTTP / REST

E assim por diante, numa boa, não tem nada aí que vai nos ajudar no 
momento, mas quem sabe mais tarde pegar alguém pra
seguir ítem por ítem pra finalmente falar: yeap, seguimos essa lista, 
ganhamos "seal of approval", mas nessas
alturas isso não é relevante.

(11:03:56 PM) lpirola_: ou seja, a api seguir as ontologias j? criadas

Qual ontologia está se referindo? Qual já criada para o nosso cenário 
atual? Pros dados de planejamento? Execução?
Receita?

Cheguei a comentar sobre o padrão internacional COFOG das Nações 
Unidas, que possui suporte
no OpenSpending mas os dados brasileiros não o seguem aparentemente. 
Então deixamos qualquer
trabalho nessa linha para um segundo momento.

http://data.okfn.org/data/core/cofog#readme

Fazer a conversão dos dados disponibilizados pelo governo brasileiro 
pro COFOG é um
trabalho imenso e que está fora do nosso cronograma e meta.

(11:04:44 PM) lpirola_: tem a ver com big data e sem?ntica na web
(11:04:45 PM) lpirola_: http://eping.governoeletronico.gov.br/
(11:04:50 PM) lpirola_: https://www.freebase.com/
(11:05:16 PM) lpirola_: o freebase faz isso com a wikipedia
(11:06:52 PM) lpirola_: os grandes portais utilizam rdf para descrever 
as noticias e mais facilmente conseguir apresentar propagandas e 
noticias mais relacionadas
(11:07:04 PM) lpirola_: http://www.w3.org/2010/02/rdfa/sources/rdf-api/

Cara, semantic web é um ninho de vespa/assunto complexo. A promessa do 
futuro mirabolante que continua como promessa a
mais de dez anos. Na minha opinião, semantic web vai existir, mas vai 
ser fruto de algoritmos muito melhores
do que os atuais para classificação semântica, sentimental analysis, 
clustering de documentos e NLP.

Pra mim a batalha pela classificação semântica manual é análoga ao 
trabalho no estudo de linguagem/algoritmos de tradução
só baseado em cima da hierarquia de Chomsky. No final, os algoritmos 
sem um modelo a priori linguístico se sairam melhor
pelo menos no quesito tradução computacional. Veja:

http://www.norvig.com/chomsky.html

Pra mim trabalhos como:

"Learning semantic representations using convolutional neural networks 
for web search"
http://www.researchgate.net/publication/261961342_Learning_semantic_representations_using_convolutional_neural_networks_for_web_search

"Learning Deep Structured Semantic Models for Web Search using 
Clickthrough Data"
http://research.microsoft.com/apps/pubs/default.aspx?id=198202

"Unsupervised Learning of Word Semantic Embedding using the Deep 
Structured Semantic Model"
http://research.microsoft.com/apps/pubs/default.aspx?id=226586

http://nlp.stanford.edu/sentiment/

E os trabalhos de pessoas no Google:

https://github.com/jiyfeng/ParagraphVector
https://code.google.com/p/word2vec/

São bem mais promissores para pensar no futuro de uma web mais 
"semântica".
Mas uma discussão muito boa com céticos e defensores da Semantic Web é 
essa aqui:

https://news.ycombinator.com/item?id=8510401

E quanto ao Freebase, eles vão para de operar em breve, não dizendo que 
não tenha sido um trabalho interessante.

E.




Mais detalhes sobre a lista de discussão Gastosabertos-dev