Ya sea que te dediques al urbanismo, seas propietario de una pequeña empresa o desarrollador de software, obtener información útil a partir de tus datos puede ayudarte a mejorar tus servicios. Pero sin protecciones de privacidad sólidas, corres el riesgo de perder la confianza de tus conciudadanos, clientes y usuarios.
La privacidad diferencial es una técnica matemática que ayuda a las organizaciones a aprender de la gran mayoría de sus datos mientras se asegura de que las personas no puedan ser reconocidas a partir de los resultados de su análisis. Este tipo de análisis puede implementarse en una amplia variedad de formas y para muchos propósitos distintos. Por ejemplo, si eres un investigador en el sector de la salud, pudieras querer comparar el tiempo promedio que permanecen internados los pacientes en una variedad de hospitales para determinar si existen diferencias en los cuidados que se ofrecen. La privacidad diferenciada es una forma muy certera y analítica de asegurarse que casos como este son abordados de tal modo que se preserve la privacidad.
Hoy estamos lanzando la versión de código abierto de la
biblioteca de privacidad diferencial, misma que utilizamos en algunos de los principales productos de Google. Para ayudar a los desarrolladores a usar esta librería de forma sencilla, nos enfocamos en funcionalidades que son particularmente difíciles de ejecutar desde cero, como calcular automáticamente los límites sobre las contribuciones del usuario. Ya está disponible de manera libre para cualquier organización o desarrollador que quiera utilizarla.
Una mirada más profunda a la tecnología
Nuestra librería de código abierto fue diseñada para satisfacer las necesidades de los desarrolladores. Además de ser accesible de manera libre, quisimos que fuera útil y fácil de implementar.
Estas son algunas de las características clave de la librería:
- Funciones estadísticas: esta versión tiene soporte para las operaciones más usadas en la ciencia de datos. Los desarrolladores pueden calcular recuentos, sumas, promedios, medianas y percentiles utilizando nuestra biblioteca.
- Pruebas rigurosas: Utilizar la privacidad diferencial de manera adecuada es todo un desafío. Además de un extenso conjunto de pruebas, hemos incluido una amplia 'Librería de comprobación estocástica del modelo de privacidad diferencial' para ayudar a prevenir errores.
- Listo para usarse: la verdadera utilidad de una biblioteca es responder la pregunta "¿Puedo usar esto?" Por eso hemos incluido una extensión PostgreSQL junto con recetas de implementación comunes para comenzar. Describimos los detalles de nuestro enfoque en un artículo técnico que publicamos hoy.
- Modular: diseñamos la librería para que pueda ampliarse para incluir otras funcionalidades como mecanismos adicionales, funciones de agregación, o administración de presupuesto de privacidad.
Invirtiendo en nuevas tecnologías de privacidad
Hemos impulsado la investigación y desarrollo de técnicas prácticas de privacidad diferencial desde que
lanzamos RAPPOR para ayudar a mejorar Chrome en 2014, y hemos seguido liderando su aplicación en el mundo real.
Hemos usado métodos de privacidad diferencial para crear funciones útiles en nuestros productos, como la de determinar qué tan lleno está un negocio durante el día o qué tan popular es un plato particular de un restaurante en Google Maps, y para
mejorar Google Fi.
Este año anunciamos varias tecnologías de privacidad de código abierto, como
Tensorflow Privacy,
Tensorflow Federated y
Private Join y Compute, y el lanzamiento de hoy alimenta esta creciente lista. Estamos entusiasmados por hacer que esta biblioteca esté ampliamente disponible, y esperamos que los desarrolladores consideren aprovecharla como parte de una estrategia más amplia de privacidad de datos. Desde la industria médica, al gobierno, los negocios y más allá, esperamos que estas herramientas de código abierto ayuden a generar ideas que beneficien a todos.
Agradecimientos
Ingenieros de software: Alain Forget, Bryant Gipson, Celia Zhang, Damien Desfontaines, Daniel Simmons-Marengo, Ian Pudney, Jin Fu, Michael Daub, Priyanka Sehgal, Royce Wilson, William Lam.
Publicado por Miguel Guevara, Gerente de producto, Oficina de privacidad y protección de datos