Umnožavanje podataka u sustavu Windows Server 2012

Windows Server 2012 uvodi novu značajku podaci deduplication (Umnožavanje podataka). Što je deduplikacija? Odvajanje podataka općenito, to je postupak pronalaženja i brisanja dupliciranih podataka na mediju za pohranu bez ugrožavanja integriteta podataka. Svrha umnožavanja je pohraniti podatke u male blokove (32-128 Kb), identificirati iste (duplikat blokova) i spremiti samo po jedan primjerak za svaki blok, te zamijeniti duplicirane blokove vezama do jedne kopije.

Prije toga morali ste upotrijebiti proizvode treće strane da biste organizirali deduplikaciju (postoje i rješenja hardverske deduplikacije na razini diskovnih nizova, kao i softver na razini datoteke). Trošak takvih rješenja bio je prilično visok, jer su prvenstveno usmjereni prema bogatim korporativnim kupcima. Sada je ova značajka apsolutno besplatna za sve korisnike sustava Windows Server 2012.

Postoji mali hack koji vam omogućuje omogućavanje deduplikacije u klijentskim operacijskim sustavima (Windows 8 i Windows 8.1). Pojedinosti u članku: Kako omogućiti odvajanje podataka u sustavu Windows 8.1

U sustavu Windows Server 2012 deduplikacija se implementira kao dvije komponente:

  • Vozač filtra, koji kontrolira funkcije ulaza / izlaza
  • Usluge udvostručavanja - kontrolira tri operacije ("Skupljanje smeća", "Optimizacija" i "Čišćenje").

Ove su komponente odgovorne za pronalaženje odgovarajućih podataka, organiziranje njihove pohrane u jednini i pravilno pružanje pristupa njima.

Prije toga, deduplikacija u Microsoftovim proizvodima pronađena je na poslužitelju pošte Exchange 200/2003/2007 - u komponenti pohrane u jednoj instanci (samo je jedna kopija poruke spremljena na poslužitelju u poštanskom sandučiću jednog od primatelja, a ostali primatelji dobivaju samo vezu do njega).

Razdvajanje podataka u sustavu Windows Server 2012 pokreće se u pozadini i započinje zadano svakih sat vremena. Proces započinje kada je učitavanje poslužitelja malo i ne smanjuje ukupne performanse poslužitelja. Također se, prema zadanim postavkama, datoteke kojima nije pristupljeno duže od 30 dana udvoje u kopiji. Povrh toga, postupak se ne izvodi za sljedeće vrste datoteka: aAC, AIF, AIFF, aSF, ASX, au, avi, fLAC, jPEG, m3u, srednji, midi, mov, MP1, MP2, mp3, mp4, MPa, MPE, mPEG, MPEG2, mpeg3, mpg, OGG, qt, qtw, ovan, rm, RMI, RMVB, snd, swf, VOB, WAV, vosak, WMA, Wmv, WVX, accdb, accde, accdr, accdt, docm, docx, dotm, dotx, pptm, potm, potx, ppam, pPSX, PPTX, sldx, sldm, thmx, xlsx, xlsm, xltx, xltm, xlsb, xlam, XII, as, luk, ARJ, bhx, b2, taksi, gz, gzip, HPK, hqx, staklenka, LHA, LZH, lzx, Pak, jama, rar, more, sit, sqz, tgz, uu, uue, z, zip, zoološki vrt.

Funkcija upravljanja udvostručavanjem dostupna je od GUI-ja i putem PowerShell-a. Razmotrimo obje mogućnosti.

Windows Server 2012 GUI za udvostručavanje podataka

Da biste omogućili deduplikaciju podataka, morate instalirati komponentu podaci Deduplicaion uloge Usluge datoteka i pohrane. To možete učiniti s konzole server Manahger.

Nakon što instalirate komponentu, otvorite Upravitelj poslužitelja -> Servis datoteka i skladištenja -> Količine -> konzola i desnom tipkom miša kliknite odjeljak za koji želite omogućiti deduplikaciju i odaberite Konfigurirajte umnožavanje podataka.

U sljedećem prozoru označite "Omogući razdvajanje podataka". Ovdje možete odrediti direktorije koje ne trebaju biti duplicirane i postavke planera deduplikacije.

U stupcu će se prikazati trenutna razina deduplikacije. deduplication brzina (ažurirano za nekoliko sati).

Za analizu korištenja prostora na disku i mogućih ušteda od omogućavanja deduplikacije za ovaj svezak, razvijen je uslužni program DDPEVAL.eXE. Možete procijeniti koliko prostora na disku možete uštedjeti nakon uključivanja dedukcije podataka pomoću sljedeće naredbe (imajte na umu da za velike količine može stvoriti značajno opterećenje na CPU-u)

c: \ windows \ system32 \ ddpeval.exe e: \

U mom slučaju ušteda bi bila oko 57%.

Moćno podvajanje

Proces dedukcije se također može kontrolirati od Powershell-a. Da biste to učinili, instalirajte funkciju Data-deduplication pomoću naredbi:

Uvoz-modul ServerManager
FS-Data-Deduplication-Add-WindowsFeature-ime-udvajanje podataka
Umnožavanje modula uvoza

Nakon što je omogućena funkcija deduplikacije, mora se konfigurirati. Da biste omogućili deduplikaciju za pogon D:, pokrenite naredbu:

Omogući-DedupVolume D:

Prema zadanim postavkama datoteke kojima se ne može pristupiti (Last Access) dulje od 30 dana udvostručuju se. Ova se vrijednost može promijeniti, na primjer, 2 dana, da biste to učinili, pokrenite naredbu:

Set-DedupVolume D: -MinimumFileAgeDays 2

Postupak deduplikacije pokreće Windows planer, ali može se pokrenuti i ručno:

Start-DedupJob D: Optimizacija tipa

Aktuelna statistika može se vidjeti pomoću naredbe:

Get-DedupStatus

Popis trenutnih zadataka može se pronaći pomoću naredbe:

Get-DedupJob

Svi rezultati za glasnoću mogu se prikazati pomoću naredbe PoSH:

Get-DedupMetadata -Volumen D:

I na kraju, naredbom možete potpuno otkazati deduplikaciju za volumen:

Start-DedupJob -Volum D: -Type Unoptimization

Snimak zaslona pokazuje da je nakon omogućavanja deduplikacije na pogonu E: (za test sam u njega stavio 4 identična ISO-a s Windows 8), veličina korištenog prostora na disku smanjila se s 12 GB na 3 GB.

Usluga deduplikacije pohranjuje svoju bazu podataka i udvojene dijelove u imenik Informacije o količini sustava. Stoga ni u kojem slučaju ne smijete ručno intervenirati u njegovu strukturu.

Najbolje prakse za korištenje umnožavanja podataka u sustavu Windows Server 2012

Microsoft je objavio sljedeće rezultate studije o učinkovitosti kopiranja različitih vrsta podataka.

Vrste podatakaMoguće uštede prostora
Opći podaci50-60%
dokumenti30-50%
Biblioteka aplikacija70-80%
VHD knjižnica (X)80-95%

Ključne karakteristike umnožavanja podataka u sustavu Windows Server 2012:

  • Radi samo na NTFS količinama i ne podržava ReFS datotečni sustav.
  • Nije podržano za dizanje i količinu sustava
  • Ne radi sa komprimiranim i šifriranim NTFS datotekama
  • Podržava keširanje i BITS
  • Ne podržava datoteke manje od 32 KB
  • Nije konfigurirano putem grupnih pravila
  • Ne podržava zajednički svezak klastera
  • Deduplikacija - postupak nije trenutačan i treba neko vrijeme