Dabei sollte eine Backup-Lösung für virtualisierte Umgebungen auf jeden Fall eine Deduplikation enthalten, da viele Daten häufig redundant gehalten werden und die Deduplikationseffekte somit erheblich sind. Denn solche Lösungen teilen den Datenstrom in Segmente auf und suchen nach Redundanzen. Bereits bestehende Segmente schreibt das System nicht mehr neu, sondern legt nur noch einen Verweis auf das erste ab. So entstehen über die entsprechende Backup-Retention beachtliche Einsparungen an physischer Plattenkapazität.
Es existieren inzwischen zahlreiche Deduplikationslösungen, die sich technisch unterscheiden. So führen manche Systeme die Deduplikation „on the Fly“ beim Schreiben aus. Andere schreiben die Daten im „PostProcessing“-Verfahren erst auf Platte, und die Deduplikation (Dedup) erfolgt später. Diese Variante benötigt mehr Plattenplatz im System, kann aber unter Umständen die Daten etwas schneller wegschreiben. Doch dieser Effekt macht sich kaum bemerkbar, wenn das System mit dem On-the-Fly-Verfahren über eine hohe Prozessorleistung und schnelle Dedup-Algorithmen verfügt. Dann erfolgt auch hier die Deduplizierung in vergleichbarer Geschwindigkeit, und der Anwender benötigt deutlich weniger Plattenkapazität. Dies wirkt sich wiederum positiv auf die Stromkosten aus. Ein Anbieter solcher On-the-Fly-Lösungen ist zum Beispiel Data Domain. Dieser arbeitet mit einem Inline-Dedup-Verfahren, während Lösungen wie EMC Avamar oder Symantec Netbackup Pure Disk mit verteilten Client-Agenten arbeiten. Beide haben einen ähnlichen Ansatz und führen die Deduplikation auf verteilten Geräten, etwa in Außenstellen durch, sodass sie nur neue Backup-Daten übertragen und so für eine geringe Belastung der LAN- und WAN-Verbindungen sorgen. Darüber hinaus findet eine zentrale Deduplikation mit den Serverkomponenten der Lösungen statt.