La Big Data desde la utilización de los gobiernos centralizados

0

La oficina Australiana de Estadísticas (ABS) pronto anunciará los tipos de información que recopilará en el próximo censo nacional en 2021. Si las tendencias internacionales son una guía, la Big Data comprenderán una parte creciente de la recopilación y análisis de datos de ABS.

Esto puede prometer mayor ahorro de energía y eficiencia en comparación con el censo tradicional basado en el papel, pero el uso de la ciencia de los datos para medir poblaciones y variables económicas no está exento de desafíos.

Los debates sobre como los gobiernos, democráticos al menos, deben contar a las personas, a las que sirven al menos están en curso en todas partes del mundo, y especialmente en Australia, los Estados Unidos y la India. El uso de las tecnologías digitales como herramientas de medición estatal parece intensificar estos debates a medida que surgen preguntas significativas en torno a la práctica.

La recopilación de los datos públicos tiene una gran importancia en la política actual:


Durante siglos, los estados han contado y categorizado a las personas para las que trabajan, o dentro del territorio que ocupan. Los datos del censo y otras estadísticas oficiales se utilizan para la planificación y presupuesto del gobierno, para determinar los distritos políticos para las elecciones y para muchos otros propósitos. Las estadísticas oficiales también ayudan a moldear el sentido de sí mismo de una población. Por estas razones, las prácticas de conteo del estado a menudo han sido controvertidas, ya que se utilizan para fines oscuros y hasta veces ilegales en beneficio de la gente que está en el gobierno u ocultando data para no dar una mala imagen.

En Australia, cambiar la práctica del censo ha sido parte del debate en curso sobre garantizar que las personas de las “Primeras Naciones, nativos australianos estén representadas adecuadamente. El recuento histórico de los aborígenes y los isleños del estrecho de Torres se corrigió con el abandono del lenguaje en el censo que se refería a los “números de sangre”, que ahora son ampliamente aceptados como racistas, junto con otros factores.

En los Estados Unidos por su parte, El conteo estatal es igualmente una cuestión de intensa disputa. California se encuentra entre los estados que actualmente demandan al gobierno federal de los Estados Unidos. Debido a una pregunta que solo aquellos que tenían el estado de ciudadanía legal, que la administración de Trump propuso agregar al Censo de 2020. California argumenta que un menor número de “no ciudadanos legales” completará el censo si se incluye la pregunta. Esto llevaría a un recuento de población más bajo y a una reducción de la financiación federal para los estados con un alto número de no ciudadanos.

India también ha visto un acalorado debate nacional sobre la recopilación de datos de casta y la categorización de “amas de casa” como no trabajadoras. Recordemos que en India no hay estratos sociales como la mayoría de países occidentales, sino que es un sistema de familias y apellidos, llamadas Castas.

El uso de la Big Data en las estadísticas oficiales está creciendo:


Es probable que surjan nuevos problemas de este tipo a medida que las oficinas de estadísticas del gobierno de todo el mundo introduzcan datos digitales, ciencia de los datos y la Big Data en su trabajo.

La ONU actualmente encabeza los esfuerzos de los estados miembros para explorar el uso de nuevas fuentes de datos digitales y tecnologías para las estadísticas oficiales. El ABS está involucrado en este esfuerzo. Desde fines de 2017, por ejemplo, el ABS ha estado analizando los datos de los escáneres de supermercados para tratar de mejorar la medición del IPC (inflación), ya que cada vez los datos oficiales que dan los estados miembros están alterados para dar una mejor imagen y posición.

Otras posibilidades que se están explorando para el uso de La Big Data para mejorar la medición del estado incluyen:


  • El uso de datos anónimos de teléfonos móviles, comprados o donados por proveedores comerciales para estadísticas de turismo, para comprender el movimiento interno, los flujos de pasajeros y la distribución de la población y para tratar de estimar las características de sectores de la población en particular.
  • web scraping (extracción de información pública disponible de los sitios web) para estimar la participación de la fuerza laboral, o usar Google Trends para tratar de “difundir” (obtener información actualizada de inmediato) sobre el desempleo.
  • analizar imágenes de satélite y datos de sensores remotos para estimar la siembra de cultivos y predecir el rendimiento de la cosecha.

 

Las promesas y los problemas:


El objetivo de estos esfuerzos es hacer que las estadísticas oficiales sean más precisas, asequibles y más atentas a las comunidades geográficamente remotas o marginadas. Si bien puede haber un enorme potencial para mejorar las estadísticas oficiales de estas maneras, el uso de la Big Data para la medición del estado plantea problemas espinosos que no muchos gobiernos comentan.

El primero de ellos es la dificultad de auditar dichas fuentes de datos. Todos los conjuntos de datos vienen con puntos ciegos y sesgos. Dada la polémica del conteo del estado y la posibilidad de que el conteo incorrecto sea alto, es importante que el público mantenga un sentido general de, y la capacidad de consultar, cómo, dónde y por qué se recopilan los datos. Esto puede ser difícil de asegurar cuando los datos utilizados para las medidas oficiales son de origen privado.

Si bien el ABS tiene el derecho legal de exigir el suministro de información, incluso de proveedores de datos, la comprensión de cómo las empresas privadas recopilan y procesan datos puede ser difícil de obtener y puede no compartirse públicamente.

La confianza en las fuentes de datos comerciales también podría dejar a los estadísticos oficiales dependientes de la infraestructura privada, por ejemplo, la infraestructura de la torre celular. La distribución y el mantenimiento de esta infraestructura está impulsado por intereses comerciales, lo que potencialmente puede contrarrestar las necesidades de la recopilación de datos públicos responsables.

Otro problema con el uso de la Big Data en las estadísticas oficiales es que los datos recopilados a menudo no son adecuados para el tipo de propósitos que persiguen los estados. Los datos de este tipo son desordenados y desestructurados, y puede ser difícil separarlos.

Los estadísticos son muy conscientes de estas limitaciones, pero enfrentan desafíos al comunicarse con los responsables políticos y el público en general sobre ellos.

El entusiasmo no debe superar el compromiso público:


Existe el riesgo de que, dado que los datos digitales son relativamente abundantes, los responsables de las prácticas de medición del estado hagan uso de esos datos sin tener en cuenta las preguntas sobre qué se debe medir, y qué no, para fines específicos.

Sin saber cuándo y cómo se están contando, el público no puede ser parte de esa discusión. Incumbe a los gobiernos cerrar esa brecha, y corresponde a todos los australianos tomar un interés activo en estas prácticas a medida que se desarrollan.