El “big data” es un término utilizado para referirse a conjuntos de datos muy grandes que tienen una estructura más variada y compleja. Estas características generalmente se correlacionan con dificultades adicionales en el almacenamiento, análisis y aplicación de procedimientos adicionales o extracción de resultados. La “analítica de big data” es el término utilizado para describir el proceso de investigar cantidades masivas de datos complejos con el fin de revelar patrones ocultos o identificar correlaciones secretas.
Sin embargo, existe una clara contradicción entre la seguridad y privacidad del “big data” y su uso generalizado. Este artículo se centra en las preocupaciones de privacidad y seguridad en el “big data”, diferenciando entre los requisitos de privacidad y seguridad en el “big data”. Cubre el uso de la privacidad mediante la aplicación de métodos existentes como HybrEx, k-anonimato, T-cercanía y L-diversidad, así como su implementación en el ámbito empresarial.
Se han desarrollado varios mecanismos de preservación de la privacidad para proteger la privacidad en diferentes etapas (por ejemplo, generación de datos, almacenamiento de datos y procesamiento de datos) del ciclo de vida del “big data”. El objetivo de este artículo es proporcionar una revisión importante de los mecanismos de preservación de la privacidad en el “big data” y presentar los desafíos para los mecanismos existentes. Además, se presentan técnicas recientes de preservación de la privacidad en el “big data” como ocultar una aguja en un pajar, anonimización basada en la identidad, privacidad diferencial, publicación de “big data” preservando la privacidad y anonimización rápida de flujos de “big data”. El artículo también hace referencia a aspectos de privacidad y seguridad en la atención médica relacionados con el “big data”. Se realiza un estudio comparativo entre varias técnicas recientes de privacidad en el “big data”.
El siguiente documento PDF, titulado ‘Big data privacy: a technological perspective and review’ y elaborado por Priyank Jain, Manasi Gyanchandani y Nilay Khare, ofrece una perspectiva tecnológica y una revisión exhaustiva sobre la privacidad en el ámbito del big data.