[okfn-ar] Fwd: Cuantificando la desmesura

alejandro baranek alejandrobaranek at gmail.com
Sun Feb 15 13:40:23 UTC 2015


Comparto el artículo que publicamos el viernes en LNdata. Abajo están las
fuentes de datos y el código está disponible para reproducir el ejercicio a
partir de la información oficial.

Se agradecen comentarios y feedback.


http://blogs.lanacion.com.ar/data/argentina/cuantificando-la-desmesura-del-indec/



<http://blogs.lanacion.com.ar/data/files/2015/02/INDEC-humor.jpg>

*- Cuatro , – No, tres.*

Autor desconocido. Fuente: @therealbansky
<https://twitter.com/thereaIbanksy/status/563084184772947968>

Por Alejandro Baranek (*)

“El maquillaje de las cifras devaluó toda palabra pública”

Enero, 2010

“En mi modesta opinión el falseamiento de los datos
del IPC es más grave que el propio fenómeno inflacionario”.

Mayo, 2014

Horacio Verbitsky

Hace tiempo que la Argentina se encuentra en sordas y sórdidas discusiones
sobre cualquier tema de interés público. Dependiendo cuál es la fuente en
la que se abreva, la descripción de un mismo hecho puede diverger de modo
violento e irreconciliable. La saga que comenzó con la denuncia y posterior
muerte del fiscal Nisman, continuando con versiones y desmentidas es un
hito insoslayable, pero no deja de pertenecer a una tendencia preexistente.
Es tarea de la psicología social intentar entender la afición por la
desmesura que existe en la Argentina, quedando fuera del presente artículo.
Pero si nos interesa que este comportamiento conduce a la incapacidad de
lograr síntesis, conclusiones, planificar y proyectar un futuro. Como la
antigua Babilonia, Argentina parece condenada a transitar un presente
perpetuo hace varios años.

El 29 de Enero de 2015 se cumplieron 8 años del comienzo de la etapa más
negra en la historia de la estadística pública en Argentina, antecedente
único en el mundo. En estos 8 años hemos sido testigos, como anticipó el
periodista Horacio Verbitsky, a un progresivo deterioro de la palabra
pública, las argumentaciones y de la calidad de los debates. Simplemente,
porque éstos suelen naufragar en intercambios relativos a la órbita de la
confiabilidad de la información. Es posible trazar un origen a la
divergencia, justamente al momento en que el gobierno cedió a la tentación
de manipular las cifras de inflación oficiales, interviniendo de hecho el
INDEC. Si bien no puede calificarse como política de estado a una conducta
que no puede ser explicada ni argumentada, hay consenso en que la confusión
es una política de estado: de ”desintoxicación de información falsa”
defienden sus acólitos y de desinformación, denuncian sus detractores. Pero
la desmesura es una magnitud y en algunos casos puede cuantificarse, sobre
todo cuando se trata de mediciones producidas por institutos oficiales de
estadística. Dado que el Estado es también consumidor de la información que
genera, se introduce un grado de confusión en su interior específicamente
vinculado a la distorsión generada por la intervención del INDEC.

[image: Imágenes integradas 1]

*fuente: *elaboración propia en base a datos de INDEC y DPEyC San Luis.

En el este texto se propone cuantificar la evolución de esa divergencia.
Como Indice testigo de las estimaciones alternativas se utiliza el Indice
oficial de la provincia de San Luis ya que es el único Indice oficial que
continúa aplicando sostenidamente la metodología de IPC desde Octubre de
2005 diseñada por el INDEC, cuando comenzó la publicación del Indice
Nacional de Precios (1), discontinuado por la intervención a comienzos de
2008.

El resultado del ejercicio no puede considerarse como un evidencia, sino
como una aproximación: la vandalización del INDEC impide conocer el
Indicador real de inflación en los últimos 8 años (2). Para el caso del
IPC-INDEC se utilizan los distintos datos oficiales desde Octubre de 2005
(IPC-GBA base 1999=100, IPC-GBA base Abr/2008=100 e IPCNu) (3).

El Indicador propuesto, llamado coeficiente de confusión (4), se define
como la relación entre las variaciones medidas con 2 Indices alternativos.

coeficiente confusión (CC) = (Indice Testigo-100)/(Indice Auditado-100)

Y se calcula tanto para la evolución acumulada respecto a la base, como la
evolución acumulada durante cada año.

La interpretación del Indicador es bastante simple: Para cada período, el
CC nos apróxima al grado de divergencia máximo derivado de utilizar como
insumo al Indicador auditado, en nuestro caso el IPC-INDEC. Esta medida,
otorga un “crédito estadístico” aplicable a discreción de funcionarios
estatales.

Por ejemplo, sabemos que hasta que dejó de publicarse en 2014, la línea de
indigencia para la estimación de la pobreza por ingresos se actualizaba con
la valorización de la CBA del INDEC intervenido.  En este caso la
divergencia es cercana al máximo (5).

Otro ejemplo, las oficinas de compras de cualquier ministerio tienen que
optar entre elaborar un presupuesto realista utilizando Indices
alternativos, realizar ajustes periódicos  del presupuesto o cualquier otra
solución arbitraria y poco transparente, como llevar una contabilidad
paralela (6).

Resultado

[image: Imágenes integradas 2]

*fuente: *elaboración propia en base a datos de INDEC y DPEyC San Luis.

El ejercicio permite observar que luego de 8 años de intervención, el
coeficiente de confusión a diciembre de 2014 es 3,89. Si bien en promedio,
cada año el coeficiente finalizó en un valor cercano a 2,5, el efecto
acumulativo de las divergencias y su magnitud hizo crecer el CC
ininterrumpidamente hasta el año 2013, cuando se observa una acumulación
anual mayor que los 4 años previos (explicado por una aceleración del
proceso inflacionario no registrado por el INDEC- Ver gráfico 1), casi
llegando a un valor de 3 al finalizar el año. A partir de 2014 y el IPCNu,
el cambio es cualitativo: se verifica un CC anual acumulado que promedia un
valor cercano a 1,5. No obstante, vemos que a largo plazo, la corrección de
2014 solamente sostiene la brecha en un valor levemente menor que a fines
2013 (3,92).

Considerando el ejercicio, la trampa de “maquillar indices” radica en que
si el INDEC y su IPCNu redujera la brecha a valores cercanos a 1, la serie
de largo plazo tardaría varios años en converger a ese valor (7) (en caso
de existir todavía indicadores testigos, como el de San Luis y otras
provincias). Más allá del tema estrictamente estadístico y de quienes
consideran que el problema del INDEC “no es tan grave” es urgente dejar de
mentir, porque es solo el primer paso para dimensionar el daño producido,
comprender la real situación del país, y decidir libre y democráticamente
en elecciones hacia dónde se quiere ir, más allá de declamaciones
escindidas de la realidad.

El código para generar la información del artículo se publicará en Github
en lenguaje R, con el objetivo que el ejercicio pueda reproducirse.


*Notas al Pie*

   1. Si bien el operativo de San Luis es pequeño comparado con el
   operativo de Gran Buenos Aires (GBA) u otros aglomerados, este programa se
   distingue en la capacidad para mantener la metodología de cálculo diseñada
   por el INDEC para el IPC-Nacional  durante más de 9 años. En la estadística
   pública es tan importante sostener una metodología en el tiempo como su
   diseño. De las provincias participantes en el IPC Nacional base 2003=100
   primera etapa, San Luis es la única que no cedió a las presiones respecto a
    su medición de IPC .
   2. El bache estadístico del INDEC es un pasivo al que Verbitsky
   consideró en 2014 más grave que el propio proceso inflacionario y cuya
   resolución no estará regida por lineamientos técnicos, sino jurídicos,
   políticos e institucionales.
   3. Hasta comienzos de 2014, cuando el INDEC empezó a publicar el IPCNu,
   el IPC oficial consideraba como población de referencia a los habitantes
   del GBA. A partir de 2014, el IPC oficial es un Indicador cuya población de
   referencia es la urbana en el territorio nacional.
   Respecto  los empalmes de series, en el caso del IPC se realizó un
   empalme básico en el nivel general. En el caso del San Luis no corresponde
   ya que es un único indicador.
   4. No confundir con el factor de confusión
   <http://en.wikipedia.org/wiki/Confounding> que suele aplicarse para
   caracterizar variables ocultas en estudios estadísticos.
   5. Recordar cuando el INDEC informaba en Octubre de 2013
   <http://www.lanacion.com.ar/1629315-el-indec-cumple-un-ano-informando-que-se-puede-comer-con-6-por-dia>que
   una persona podía comer con $6,25 pesos por día mientras que en el mismo
   mes de 2012 el valor era $5,80. En Octubre de 2013, como el CC era de
    3,81, INDEC debería haber publicado aproximadamente $23,60. En Octubre de
   2012, el CC era de 3,43 entonces deberían haber publicado aproximadamente,
   que $19,90 era el dinero necesario para alimentar a un adulto tipo por día
   según la metodología vigente. Metodológicamente, lo adecuado es aplicar una
   apertura más cercana a la Canasta Básica, el capítulo alimentos o bebidas
   por ejemplo. Al no disponer de esa información en el trabajo se realiza la
   aproximación con el nivel general, pero eventualmente el ejercicio se puede
   replicar para toda apertura con información pública disponible.
   6. En este caso se aplica un CC más parecido al acumulado anualmente que
   al total ya que los presupuestos proyectados se ajustan al efectivamente
   ejecutado el año anterior a su formulación, es decir un año y medio antes
   de empezar a devengarse, aplicando el subestimado IPC del INDEC para su
   actualización. Es decir que una porción mínima de los aumentos
   presupuestarios participan del proceso de deliberación parlamentario, para
   una de las funciones básicas del congreso: representar en el presupuesto
   los intereses y las prioridades políticas de los ciudadanos, ejecutadas
   luego por el gobierno.
   7. Como menciona este artículo
   <http://www.lanacion.com.ar/1048868-el-chile-de-pinochet-un-antecedente-de-manipulacion-de-datos>de
   2008, un antecedente conocido de manipulación estadística del IPC ocurrió
   en los primeros años del gobierno de Pinochet en Chile (Entre 1973 y
   1978).  El trabajo
   <http://www.cieplan.org/media/publicaciones/archivos/82/Capitulo_4.pdf> se
   denomina  “los Dos Chiles, o la importancia de revisar las estadísticas
   oficiales” y los autores son René Cortázar y Patricio Meller. Manuel Riesco
   Larraín, del Cenda, señaló: “Significó rebajar los salarios reales a la
   mitad y sólo en diciembre de 1999, casi 26 años después del golpe,
   recuperaron su poder adquisitivo anterior”.


*FUENTES:*

   - *código fuente:*
   https://github.com/kenarab/coeficiente-confusion-indec.git
   - *datos:* http://datahub.io/dataset/ipc-ar



-- 
 alejandro baranek
@ken4rab <https://twitter.com/ken4rab>
qbotics <http://qbotics.tumblr.com/> | surferinvaders
<http://surferinvaders.tumblr.com> | algebraic-soundscapes
<http://imaginary.org/content/algebraic-soundscapes> | surfer-shuffle
<http://imaginary.org/program/surfer-shuffle>



-- 
 alejandro baranek
@ken4rab <https://twitter.com/ken4rab>
qbotics <http://qbotics.tumblr.com/> | surferinvaders
<http://surferinvaders.tumblr.com> | algebraic-soundscapes
<http://imaginary.org/content/algebraic-soundscapes> | surfer-shuffle
<http://imaginary.org/program/surfer-shuffle>
-------------- next part --------------
An HTML attachment was scrubbed...
URL: <http://lists.okfn.org/pipermail/okfn-ar/attachments/20150215/72bad137/attachment-0002.html>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: ipc-indec-sanluis-coeficiente_confusion.png
Type: image/png
Size: 73981 bytes
Desc: not available
URL: <http://lists.okfn.org/pipermail/okfn-ar/attachments/20150215/72bad137/attachment-0004.png>
-------------- next part --------------
A non-text attachment was scrubbed...
Name: ipc-indec-sanluis-variaciones.png
Type: image/png
Size: 106996 bytes
Desc: not available
URL: <http://lists.okfn.org/pipermail/okfn-ar/attachments/20150215/72bad137/attachment-0005.png>


More information about the okfn-ar mailing list