Che cos'è l'integrità dei dati e perché è importante

Immaginiamo che una casa farmaceutica faccia sfoggio della sicurezza del suo nuovo farmaco miracoloso. Quando però l'FDA conduce un'ispezione presso lo stabilimento all'estero, la produzione viene arrestata immediatamente: mancano importanti dati sul controllo della qualità. Questo esempio, tratto dalla vita reale, riguarda la compromissione dell'integrità dei dati e purtroppo non rappresenta un caso inconsueto. La scarsa accuratezza e coerenza dei dati è una realtà in tutti i settori e può causare problemi di varia entità, dall'inconveniente facilmente rimediabile al grave incidente aziendale.

In questa era di big data, in cui la quantità di informazioni elaborate e memorizzate non conosce precedenti nel passato, è sempre più importante implementare misure volte a preservare l'integrità dei dati raccolti. Il primo passo per garantire la sicurezza dei dati è comprendere le basi e i principi di funzionamento dell'integrità dei dati. Di seguito spiegheremo che cos'è l'integrità dei dati, perché è essenziale e che cosa si può fare per garantirla.

Che cos'è l'integrità dei dati

Per integrità dei dati si intende l'accuratezza, la completezza e la coerenza dei dati nel loro complesso. Si riferisce anche alla salvaguardia e alla sicurezza dei dati in termini di conformità alle norme, come il regolamento GDPR. Viene garantita da una serie di processi, regole e standard implementati in fase di progettazione. Quando l'integrità dei dati è sicura, le informazioni memorizzate in un database rimangono complete, accurate e affidabili, indipendentemente dalla durata di conservazione o dalla frequenza degli accessi. L'integrità dei dati assicura inoltre la protezione dei dati da forze esterne.

Tipi di integrità dei dati

Esistono due tipi di integrità dei dati: quella fisica e quella logica. Entrambe si compongono di processi e metodi volti al rispetto dell'integrità nei database sia gerarchici che relazionali.

Integrità fisica

L'integrità fisica è la protezione dell'interezza e dell'accuratezza dei dati nei metodi di memorizzazione e recupero. Quando un disastro naturale, un'interruzione di energia elettrica o l'attacco di un hacker pregiudicano le funzionalità del database, l'integrità fisica è compromessa. Errori umani, danni ai sistemi di archiviazione e tanti altri inconvenienti possono impedire a chi gestisce l’elaborazione dei dati, a programmatori di sistema, sviluppatori di applicazioni e revisori interni di ottenere dati accurati.

Integrità logica

L'integrità logica garantisce l'inalterabilità dei dati durante i diversi utilizzi in un database relazionale. Anch'essa protegge i dati da errori umani e attacchi di hacker, ma in modo diverso rispetto all'integrità fisica. Esistono quattro tipi di integrità logica.

Integrità dell'entità

L'integrità dell'entità si basa sulla creazione di chiavi primarie, ossia valori univoci che identificano ciascun dato, per garantire che le informazioni non siano elencate più di una volta e che nessun campo di una tabella abbia valore pari a null. È una caratteristica dei sistemi relazionali, i quali memorizzano i dati in tabelle che possono essere collegate e usate in svariati modi.

Integrità referenziale

L'integrità referenziale riguarda la serie di processi che assicurano che i dati siano memorizzati e usati in modo uniforme. Nella struttura del database vengono incorporate regole che controllano come sono usate le chiavi esterne e garantiscono che i dati siano sottoposti solo a modifiche, aggiunte o eliminazioni appropriate. Le regole possono includere vincoli che eliminano l'immissione di duplicati, garantiscono l'accuratezza dei dati e/o impediscono l'inserimento di dati non applicabili.

Integrità del dominio

L'integrità del dominio si riferisce all'insieme di processi che assicurano l'accuratezza di ogni dato in un dominio. In questo contesto, il dominio rappresenta una serie di valori accettabili che una colonna può contenere. Può includere vincoli o altre misure che limitano il formato, il tipo e la quantità di dati inseriti.

Integrità definita dall'utente

L'integrità definita dall'utente prevede regole e vincoli creati dall'utente per soddisfare esigenze particolari. A volte l'integrità dell'entità, referenziale e del dominio non sono sufficienti a garantire la salvaguardia dei dati. Spesso, è necessario formulare specifiche regole aziendali e incorporarle nelle misure finalizzate all’integrità dei dati.

Che cosa non è integrità dei dati

Si parla talmente tanto di integrità dei dati che è facile travisarne il vero significato. Spesso si confonde con sicurezza e qualità, ma ciascuno di questi termini ha un significato distinto.

L’integrità dei dati non coincide con la sicurezza dei dati

La sicurezza dei dati è la serie di misure adottate per impedirne la corruzione, fra le quali rientrano l'uso di sistemi, processi e procedure che prevengono l'accesso ai dati da parte di utenti che potrebbero utilizzarli in modo dannoso o diverso da quello previsto. Le violazioni della sicurezza possono essere minime e facili da contenere, oppure possono essere estese e causare danni significativi.

Mentre l'integrità dei dati mira a conservare le informazioni intatte e accurate per la loro intera esistenza, l'obiettivo della sicurezza è proteggerle da attacchi esterni. La sicurezza dei dati è solo uno dei tanti aspetti dell'integrità e non arriva a includere i numerosi processi necessari a conservare i dati inalterati nel tempo.

L’integrità dei dati non coincide con la qualità dei dati

I dati nel database soddisfano gli standard definiti dall'azienda e le sue esigenze di business? La qualità dei dati risponde a queste domande con una varietà di processi che misurano l'età, la pertinenza, l'accuratezza, la completezza e l'affidabilità dei dati.

Analogamente alla sicurezza, la qualità, benché essenziale, è solo una delle diverse componenti dell'integrità dei dati. L'integrità comprende tutti gli aspetti intrinseci della qualità dei dati e oltre, implementando una serie di regole e processi che controllano il modo in cui i dati vengono inseriti, memorizzati, trasferiti, ecc.

Integrità dei dati e conformità GDPR

L'integrità dei dati è essenziale per poter rispettare le normative sulla protezione dei dati, come il regolamento GDPR. La mancata conformità a queste leggi può rendere le aziende passibili di ingenti sanzioni e in alcuni casi esporle anche al rischio di azioni legali. Quando poi le violazioni si ripetono nel tempo, le aziende possono persino essere costrette a chiudere i battenti.

Per fortuna, esiste il modo per assicurare l'integrità dei dati necessaria per la conformità al GDPR e ad altre leggi sulla protezione dei dati. La nostra serie sulle Misure concrete per la conformità GDPR tratta appunto di questo.

Rischi per l'integrità dei dati

Sono svariati i fattori che possono incidere sull'integrità dei dati memorizzati in un database. Eccone alcuni esempi:

  • Errore umano. Quando si inseriscono informazioni errate, si duplicano o eliminano i dati, non si seguono i protocolli appropriati o si commettono errori durante l'implementazione delle procedure volte a salvaguardare le informazioni, si mette a repentaglio l'integrità dei dati.   
  • Errori di trasmissione. Quando il trasferimento dei dati da un’ubicazione nel database a un'altra non avviene correttamente, si verifica un errore di trasmissione, ossia una discrepanza tra i dati nella tabella di destinazione e quelli nella tabella di origine del database relazionale.
  • Bug e virus. Spyware, malware e virus sono codici software che possono invadere un computer e alterare, eliminare o rubare dati.
  • Guasti hardware. Improvvisi arresti anomali di computer o server e problemi di funzionamento di computer o altri dispositivi sono esempi di guasti rilevanti che possono indicare la compromissione dell'hardware in uso. I guasti hardware possono riprodurre i dati in modo errato o incompleto, limitarne o impedirne l'accesso o renderne difficile l'utilizzo.

I rischi per l'integrità dei dati possono essere facilmente ridotti o eliminati adottando le seguenti misure:

  • Limitare l'accesso ai dati e impostare le autorizzazioni in modo da impedire agli utenti non autorizzati di modificare le informazioni
  • Convalidare i dati per garantire che siano corretti sia durante la raccolta che durante l'utilizzo
  • Effettuare il backup dei dati
  • Usare registri per tenere traccia di qualsiasi aggiunta, modifica o eliminazione
  • Condurre regolari audit interni
  • Usare software di rilevamento degli errori

Introduzione all'integrità dei dati

Proteggere l'integrità dei dati dell'azienda adottando metodi tradizionali può sembrare un compito irrealizzabile. Le piattaforme di integrazione dei dati basate sul cloud sono sicure e rappresentano un'alternativa moderna in grado di fornire una visione di tutti i dati in tempo reale. Con strumenti di integrazione cloud leader del settore, è possibile collegare molteplici sorgenti di informazioni e accedere a tutti i dati dell'azienda da un unico luogo.

Consulta la nostra Migliore guida alla governance dei dati per scoprire come stabilire un framework per l'integrità dei dati.

Sei pronto a iniziare con Talend?