Una piccola introduzione Cos'è una migrazione dati legacy e perché va fatta con un metodo
Una migrazione di dati legacy è il processo con cui si spostano dati da un sistema vecchio (database, gestionale, fogli Excel storici, vecchio CMS) verso un sistema nuovo (CMS moderno, e-commerce, CRM, gestionale nuovo), trasformando il formato dove serve, riconciliando le anagrafiche, validando i risultati, in modo che il nuovo sistema parta con dati corretti, completi e affidabili. È una delle attività più sottostimate dei progetti aziendali.
Errore comune: trattare la migrazione come "un'esportazione e un'importazione" da fare l'ultima settimana del progetto. La realtà è che i dati legacy sono quasi sempre più sporchi del previsto: anagrafiche duplicate, codici incoerenti, campi liberi pieni di note, formati di data misti, valori "NULL" testuali al posto di null reali. Senza un metodo, il nuovo sistema parte rotto e il cliente ci sta dentro per mesi.
Da Vicenza dal 2008 abbiamo realizzato oltre 50 migrazioni dati per progetti di rifacimento sistemi aziendali. Approccio sistematico: inventario completo, mapping documentato, dry-run validato, riconciliazione finale. Niente sorprese il giorno dopo il go-live.
Esempi tipici Tre esempi di intervento, in settori diversi
Esempio · settore servizi B2B Sito istituzionale di una società di servizi (settore consulenza)
Migrazione di anagrafica clienti e storico progetti da un gestionale dismesso verso un CRM moderno. Inventario di oltre 50.000 record, identificazione di duplicati per partita IVA, mapping verso nuova tassonomia di servizi. Dry-run validato prima del go-live, riconciliazione finale quadrata.
50k+ record migrati
Esempio · settore e-commerce Sito di un negozio online (settore retail)
Migrazione catalogo prodotti, ordini storici e anagrafica clienti da una piattaforma e-commerce vecchia a WooCommerce. Gestione di SKU duplicati, normalizzazione di categorie, recupero dello storico fatturato per analisi. Riconciliazione totali fatturato 2023 quadrata.
0 ordini persi nella migrazione
Esempio · settore manifatturiero B2B Sito di un produttore industriale (settore manifatturiero)
Migrazione di archivi tecnici (schede prodotto, distinte base, listini) da fogli Excel storici verso un nuovo sistema di gestione articoli. Pulizia dei dati durante il mapping, normalizzazione di categorie merceologiche, lookup verso nuove tassonomie.
10 anni storico recuperato
Cosa includiamo Cosa contiene il nostro processo di migrazione
Inventario, mapping, dry-run, riconciliazione finale.
Inventario completo del sistema vecchio
Cosa c'è davvero, non cosa pensavi.
Prima di muovere un dato facciamo l'inventario reale del sistema sorgente: numero di record per tabella, range temporali, campi obbligatori e opzionali, integrità referenziale (rispettata o no), duplicati per chiave naturale, valori anomali. Il documento di inventario è il punto di partenza per il mapping. Niente migrazione fatta sui presupposti del cliente, sempre sui dati reali.
- Conteggio record per tabella
- Range temporali e volumi
- Campi obbligatori e opzionali
- Integrità referenziale verificata
- Duplicati per chiave naturale
- Valori anomali identificati
Mapping documentato sorgente / destinazione
Ogni campo sorgente al suo campo destinazione.
Per ogni tabella sorgente costruiamo un documento di mapping che descrive a quale tabella e campo destinazione finisce ogni campo sorgente, quali trasformazioni si applicano (es. data in formato testo italiano al campo data ISO, codice 0/1 al boolean, lookup di un codice a una tassonomia nuova), come si gestiscono i casi di anagrafiche duplicate. Il mapping è versionato Git, modificabile in modo controllato.
- Documento di mapping per ogni tabella
- Trasformazioni descritte per ogni campo
- Lookup verso nuove tassonomie
- Gestione anagrafiche duplicate
- Mapping versionato Git
- Sign-off del cliente sul mapping
Dry-run completo su staging
Prova vera, non test su un campione.
Prima del go-live eseguiamo una migrazione completa su ambiente di staging: tutti i dati, tutti i mapping, tutte le trasformazioni. Sul risultato facciamo validazione automatica (numeri quadrati, integrità referenziale, sample di record verificati) e validazione manuale (il cliente controlla un campione di anagrafiche e ordini chiave). Niente go-live senza dry-run validato.
- Migrazione completa su staging
- Validazione automatica dei numeri
- Verifica integrità referenziale
- Sample di record verificato manualmente
- Sign-off del cliente sul dry-run
- Niente go-live senza dry-run validato
Riconciliazione finale
Numeri quadrati, niente record fantasma.
Dopo il go-live facciamo la riconciliazione: numero di record sorgente uguale a numero di record destinazione (al netto delle trasformazioni concordate, es. duplicati uniti), totali finanziari quadrati (somma fatturato 2023 sul vecchio = somma fatturato 2023 sul nuovo), audit dei record che non hanno fatto il salto. Documento di riconciliazione consegnato al cliente.
- Numero record sorgente vs destinazione
- Totali finanziari quadrati
- Audit dei record non migrati
- Documento di riconciliazione consegnato
- Sign-off finale del cliente
- Storico migrazione mantenuto
Il problema Perché tante migrazioni dati partono male e non si recuperano più
Pattern ricorrenti che vediamo prendendo in carico migrazioni fatte male da altri:
- Niente inventario: si scopre il volume reale dei dati l'ultima settimana
- Mapping non documentato: nessuno sa più cosa è andato dove
- Niente dry-run: il go-live è la prima volta che la migrazione gira sui dati veri
- Niente gestione duplicati: anagrafiche moltiplicate sul nuovo sistema
- Caratteri speciali rotti: encoding non gestito, accenti diventano simboli
- Niente riconciliazione: il cliente scopre i record persi sei mesi dopo
- Niente piano di rollback: se il go-live va male, settimane di disastro
Approccio pro: inventario reale, mapping documentato, dry-run validato, riconciliazione finale, piano di rollback.
I vantaggi Cosa ti porta affidare la migrazione a chi ha un metodo
Quello che ti porti a casa
Risultati concreti per chi sta cambiando un sistema aziendale:
- Nuovo sistema parte con dati corretti e completi
- Mapping documentato: traccia di cosa è andato dove
- Dry-run validato: niente sorprese il giorno del go-live
- Riconciliazione finale: numeri quadrati, niente record fantasma
- Anagrafiche pulite: duplicati gestiti, niente moltiplicazione
- Piano di rollback in caso di emergenza
- Documentazione consegnata al cliente
Come lavoriamo Le 4 fasi del nostro processo di migrazione
1. Discovery e inventario
Settimana 1-2.
- Accesso ai dati sorgente
- Conteggio record e analisi qualità
- Identificazione duplicati e anomalie
- Documento di inventario consegnato
2. Mapping documentato
Settimana 2-3.
- Mapping campo sorgente al campo destinazione
- Trasformazioni descritte
- Gestione duplicati definita
- Sign-off del cliente sul mapping
3. Dry-run e validazione
Settimana 3-N.
- Migrazione completa su staging
- Validazione automatica
- Sample manuale validato dal cliente
- Sign-off del cliente sul dry-run
4. Go-live e riconciliazione
Giorno X.
- Migrazione finale in produzione
- Riconciliazione numeri e totali
- Audit dei record non migrati
- Documentazione finale consegnata
Strumenti Stack che usiamo per la migrazione
Best-in-class per migrazioni dati robuste:
- Python per ETL e data wrangling
- Node.js per pipeline ad alto volume
- SQL per estrazioni e validazioni dirette
- Pandas per analisi qualità dati
- Git con repository di proprietà del cliente
- Hub di gestione proprietario per log e progress
Tecnologie Stack migrazione dati
Python
Node.js
PHP
MySQL
GitHub
Python
Node.js
PHP
MySQL
GitHub Risultati Cosa garantiamo come output
Quello che ti consegniamo come standard:
- Documento di inventario dei dati sorgente
- Documento di mapping sorgente / destinazione
- Dry-run completo validato dal cliente
- Migrazione finale con riconciliazione numeri
- Piano di rollback in caso di emergenza
- Documentazione consegnata
Quanto costa una migrazione dati? +
Il piano è dimensionato sul tuo sito: tipologia (vetrina, e-commerce, multisite), traffico atteso, livello di SLA e backup desiderati cambiano il quadro. Niente listini standard: prima cosa che facciamo è una breve call di scoping, poi mandiamo un preventivo scritto entro 48 ore.
Quanto tempo richiede? +
Per la maggior parte dei casi: 2-4 settimane (inventario, mapping, dry-run, go-live, riconciliazione). Per migrazioni grandi (centinaia di migliaia di record, qualità dati molto sporca, integrazioni multiple) si arriva a 6-8 settimane. Tempi precisi dopo l'inventario iniziale.
Cosa succede se i dati sono sporchi? +
Lo è quasi sempre, almeno in parte. Durante l'inventario identifichiamo le anomalie e proponiamo strategie di pulizia: alcune cose si possono normalizzare in automatico (formati di data, encoding, codici 0/1), altre richiedono decisioni del cliente (es. due anagrafiche dello stesso cliente che vanno unite, criteri di scelta dei valori). Le decisioni vengono documentate nel mapping.
Posso fare un piccolo test prima di decidere? +
Sì. Il dry-run è esattamente questo: una migrazione completa su ambiente di staging, dove validi tu il risultato prima di andare in produzione. Per casi specifici possiamo fare anche dry-run preliminari su sotto-insiemi (solo anagrafiche, solo ordini di un anno) per dare al cliente la sensazione concreta del risultato.
Cosa succede se il go-live va male? +
Per ogni migrazione predisponiamo un piano di rollback: come tornare al sistema sorgente in caso di emergenza, cosa fare con i dati creati nel nuovo sistema dopo il go-live. Il dry-run validato riduce drasticamente la probabilità di sorprese, ma il piano di rollback è sempre pronto.
Il codice della migrazione è mio? +
Sì. Repository Git intestato al cliente, mapping documentato consegnato, niente codice offuscato. Per migrazioni una tantum il codice spesso non serve mantenerlo dopo il go-live, ma è disponibile per audit e per eventuali pulizie successive.