[Gastosabertos-dev] Respondendo ao Lucas sobre "Semantic Web"
Edgar Zanella Alvarenga
e em vaz.io
Quinta Fevereiro 5 03:33:14 UTC 2015
(11:01:31 PM) lpirola_: http://eping.governoeletronico.gov.br/
(11:01:37 PM) lpirola_: whois aivuk
Aivuk == Edgar == http://github.com/aivuk
(11:03:16 PM) lpirola_: tem algum motivo para n?o seguirmos o padr?o do
governo federal para disponibilizar os dados para os componentes
javascript?
Qual padrão? Do que exatamente está falando? Em termos concretos eu
digo. Você chegou a ler o link que
passou? Sério, é um documento inútil atualmente (pro nosso caso, pro
nosso caso, pro governo e pra ter
algum documento oficial a ser seguido ok, daí é outra história).
Primeiro, várias coisas que estão aí já estamos seguindo. Veja
exemplos:
3.1. Especificações Técnicas para Meios de Publicação
Conjunto de caracteres => Sim, estamos usando UTF8
Formato de intercâmbio de hipertexto => Sim, usamos HTML5.
Arquivos do tipo “banco de dados” para estações de trabalho => Usamos
txt, mas que pena que PostgreSQL não é nem citado. Recomendam o MySQL...
yeap.
4.1.Especificações Técnicas
Linguagem para intercâmbio de dados => Yeap, JSON.
Formato para intercâmbio de dados geoespaciais => Well, ainda estão
estudando pra ver o uso de GeoJSON...
Tabela 17 – Web Service
Protocolo para acesso a Web Service => Yeap, usamos HTTP / REST
E assim por diante, numa boa, não tem nada aí que vai nos ajudar no
momento, mas quem sabe mais tarde pegar alguém pra
seguir ítem por ítem pra finalmente falar: yeap, seguimos essa lista,
ganhamos "seal of approval", mas nessas
alturas isso não é relevante.
(11:03:56 PM) lpirola_: ou seja, a api seguir as ontologias j? criadas
Qual ontologia está se referindo? Qual já criada para o nosso cenário
atual? Pros dados de planejamento? Execução?
Receita?
Cheguei a comentar sobre o padrão internacional COFOG das Nações
Unidas, que possui suporte
no OpenSpending mas os dados brasileiros não o seguem aparentemente.
Então deixamos qualquer
trabalho nessa linha para um segundo momento.
http://data.okfn.org/data/core/cofog#readme
Fazer a conversão dos dados disponibilizados pelo governo brasileiro
pro COFOG é um
trabalho imenso e que está fora do nosso cronograma e meta.
(11:04:44 PM) lpirola_: tem a ver com big data e sem?ntica na web
(11:04:45 PM) lpirola_: http://eping.governoeletronico.gov.br/
(11:04:50 PM) lpirola_: https://www.freebase.com/
(11:05:16 PM) lpirola_: o freebase faz isso com a wikipedia
(11:06:52 PM) lpirola_: os grandes portais utilizam rdf para descrever
as noticias e mais facilmente conseguir apresentar propagandas e
noticias mais relacionadas
(11:07:04 PM) lpirola_: http://www.w3.org/2010/02/rdfa/sources/rdf-api/
Cara, semantic web é um ninho de vespa/assunto complexo. A promessa do
futuro mirabolante que continua como promessa a
mais de dez anos. Na minha opinião, semantic web vai existir, mas vai
ser fruto de algoritmos muito melhores
do que os atuais para classificação semântica, sentimental analysis,
clustering de documentos e NLP.
Pra mim a batalha pela classificação semântica manual é análoga ao
trabalho no estudo de linguagem/algoritmos de tradução
só baseado em cima da hierarquia de Chomsky. No final, os algoritmos
sem um modelo a priori linguístico se sairam melhor
pelo menos no quesito tradução computacional. Veja:
http://www.norvig.com/chomsky.html
Pra mim trabalhos como:
"Learning semantic representations using convolutional neural networks
for web search"
http://www.researchgate.net/publication/261961342_Learning_semantic_representations_using_convolutional_neural_networks_for_web_search
"Learning Deep Structured Semantic Models for Web Search using
Clickthrough Data"
http://research.microsoft.com/apps/pubs/default.aspx?id=198202
"Unsupervised Learning of Word Semantic Embedding using the Deep
Structured Semantic Model"
http://research.microsoft.com/apps/pubs/default.aspx?id=226586
http://nlp.stanford.edu/sentiment/
E os trabalhos de pessoas no Google:
https://github.com/jiyfeng/ParagraphVector
https://code.google.com/p/word2vec/
São bem mais promissores para pensar no futuro de uma web mais
"semântica".
Mas uma discussão muito boa com céticos e defensores da Semantic Web é
essa aqui:
https://news.ycombinator.com/item?id=8510401
E quanto ao Freebase, eles vão para de operar em breve, não dizendo que
não tenha sido um trabalho interessante.
E.
Mais detalhes sobre a lista de discussão Gastosabertos-dev