Windows Server

Windows Server 2012 Data Deduplication ( Veri Tekilleştirme )

 

Microsoft’un 2012 yılı içerisinde çıkarmayı planladığı yeni nesil sunucu işletim sistemi olacak olan Windows Server 8 ile gelecek yenilikleri Developer Preview sürümünden itibaren incelemeye ve detayları sizlerle paylaşmaya başlamıştık. Bu konuda portalımızda şu ana kadar aşağıdaki makaleleri yayınlamıştık.

 

Windows Server 8 Kurulumu
Windows Server 8 Active Directory Kurulumu
Windows Server 8 Yenilikleri
Windows Server 8 Active Directory Yenilikleri
Windows Server 8 ve Hyper-V 3.0 – Hızlı Bakış
Windows Server 8 Failover Clustering Yenilikler ve Cluster Kurulumu
Windows Server 8 Active Directory Recycle Bin (Geri Dönüşüm Kutusu)
Windows Server 8 Grafiksel Arayüzün (GUI) Devre Dışı Bırakılması/Etkinleştirilmesi
Windows Server 8 Fine Grained Password Policies
Windows Server 8 DHCP Failover

 

Sistem yöneticileri için çok sayıda özelliği beraberinde getiren Windows Server 8 ile gelen önemli geliştirmelerden bir tanesi de Veri Tekilleştirme (Data Deduplication).  Veri tekilleştirme (data deduplication) özellikle depolama üniteleri, yedekleme yazılımları ve WAN optimizasyon cihazları ile son yıllarda öne çıkan ve kurum ve kuruluşlar için depolama alanından tasarruf sağlama ve eldeki kaynakları daha verimli kullanma gibi katma-değerleri ile önemli bir özellik olarak sunulan özelleştirilmiş bir veri sıkıştırma tekniğidir. Tekilleştirme analiz sürecinde benzersiz veri blokları ya da byte örnekleri tanımlanır ve tekilleştirme alanına depolanır. Veri Tekilleştirme sayesinde NTFS volume yapılarında çalışacak Windows Server 8 sunucular üzerinde depolama alanlarından tasarruf sağlanabiliyor olacak. Windows Server 8 üzerinde veri tekilleştirmeyi gerçekleştiren bir motor (engine) geliyor. Bu motor sayesinde veri tekilleştirmeyi NTFS-volume’ler üzerinde etkinleştirebiliyoruz.  Veri tekilleştirme farklı üreticilerin ürünlerinde farklı şekillerde çalışan bir özellik. Windows Server 8 üzerinde işlem-sonrası tekilleştirme yapacak şekilde ve volume seviyesinde PowerShell komutları ile aktifleştirilebilecek ve tetiklenecek şekilde dizayn edilmiş durumda.

 

Windows tekilleştirmenin temel yapısına baktığımızda boyutu 32 KB ile 128 KB arasında değişken yığınlardan (chunk) oluşuyor. Yığınlar Windows tarafından yönetilen ve bir yığın deposunda toplanan kopyalardır ve diskin System Volume Bilgisi alanında saklanır. Yani bizim görmediğimiz bir şekilde arka planda tekilleştirme motoru işlevini yerine getirir.  Aşağıdaki şekilde Windows tarafından iki dosya üzerinde veri tekilleştirme durumu resmedilmiştir.

 

 

image001

 

 

Şekilde görüldüğü gibi A,B,C veri blokları tekilleştirme için aday bloklardır. Tekilleştirme motoru çalıştığında, tekilleştirmeye aday dosya kendi tekilleştirme bloklarını yığın deposu alanına kopyalar. Bu alandaki dosya verilerinin iki boyutu vardır: benzersiz veri bölgesi ve tekilleştirilmiş veri bölgesi. Tekilleştirilmiş bölge yığın deposundaki ortak yığınların ya da tekilleştirilmiş verilerin erişimini sağlar. Tekilleştirme süreci Windows zamanlanmış görevleri ile çalıştırılabileceği gibi PowerShell komutları ile de interaktif olarak çalıştırılabilme,  volume seviyesinde tekilleştirme yüzdelerinin görüntülenmesi gibi işlevler gerçekleştirilebilir. Bu zamanlanmış görevlerle volume tekilleştirme süreci tetiklenir ve yığın deposuna taşımalar koordine edilir.

 

Windows Server 8 veri tekilleştirmenin sistem ve boot sürücüsü olmasından dolayı C: sürücüsü üzerinde aktifleştirilmesi desteklenmiyor.

 

Yapılan testlerde görülen tekilleştirme deneyimlerinde; tamamen tekilleştirilen bir dosyanın diskte 4 KB yer kapladığı görülmüştür. Bu da zaten dosyaya ait metadata bilgileri ve tekilleştirme verilerinin saklandığı yığın deposu içerisindeki tekilleştirilmiş bölge bilgilerinden oluşmaktadır.

 

 

 

Veri tekilleştirme ile ilgili özellikleri sıralayacak olursak:

 

·         Volume seviyesinde uygulanabilir.

·         Sadece Windows Server 8 işletim sisteminde destekleniyor. Şu anda Windows 8 client tarafında desteği yok.

·         Boot ve System Volume’ler üzerinde etkinleştirilemez.

·         Sadece NTFS dosya sistemi ile formatlanmış volume’lerde kullanılabilir.

·         Clustered Shared Volume (CSV) yapısında çalışan Hyper-V yapılarında desteklenmez. CSV kullanmayan Hyper-V konfigürasyonlarında ise desteklenmektedir.

·         Veri tekilleştirme kriptolanmış dosyalarda desteklenmez.

·         Veri tekilleştirme arka plan modunda çalıştırılabileceği gibi, zamanlanmış görevlerle de çalıştırılabilir. Yapacağınız seçime göre de I/O etkisi 2 kata kadar fark etmektedir.

 

Veri tekilleştirme özelliği GUI arayüzünden etkinleştirilebildiği gibi, komut satırından Windows Server 8 ile beraber gelen PowerShell 3.0 komutları kullanılarak da etkinleştirilmesi, devre dışı bırakılması ve yönetilmesi sağlanabilir.

 

Data Deduplication Feature Kurulumu

 

Data deduplication özelliğini kullanabilmek için öncelikle kullanacağınız dosya sunucuları (file servers) ya da Hyper-V host sunucularınız üzerine Data Deduplication özelliğinin yüklenmesi gerekir. Bu kurulumu da yine GUI-grafiksel arayüzden Server Manager konsolunu kullanarak “Add Roles and Features” seçeneği ile yükleyebileceğiniz gibi, PowerShell 3.0 komut satırından da yüklenmesini tetikleyebilirsiniz.

 

Grafiksel Arayüzden Data Deduplication özelliğini eklemek için aşağıdaki adımları gerçekleştiriyoruz:

 

Server Manager konsolunu açıyoruz. Ve ister aşağıdaki şekilden de görüldüğü gibi dasbboard panosundan Add Roles kullanılarak isterseniz de sağ üst köşede gelen Manager menüsü içerisinden Add Roles and Features bağlantısına tıklayarak da kurulumu başlatabilirsiniz.

 

 

image002

 

 

Before You Begin ekranını Next ile geçiyoruz.

 

 

image003

 

 

Select Installation Type ekranında “Role-based or Feature-based Installation” seçeneği seçili iken Next ile devam ediyoruz.

 

 

image004

 

 

Select Destination Server ekranında DataDeduplication özelliğini yükleyeceğiniz sunucuyu alttak sunucu havuzundan seçiyorsunuz.

 

 

image005

 

 

Next İle sonraki adıma geçiyoruz.  Karşımıza gelen Select Server Roles ekranında rol listesinden File Services rolünü seçip Next ile sonraki adıma geçiyoruz.

 

 

 

image006

 

 

Karşımıza  gelen “Introduction to file services” ekranını Next ile devam ediyoruz.

 

 

image007

 

 

Select Role Services ekranında DataDeduplication özelliğine ait kutucuğu doldurduktan sonra Next ile sonraki aşamaya geçiyoruz.

 

 

image008

 

 

Confirm Installation Selections ekranında “Install” butonuna basarak kurulumu başlatıyoruz.

 

 

image009

 

 

Installation Progress ekranında kurulumun tamamlanmasını bekleyebilir ya da Close ile kapatıp Server Manager konsolunda sağ üst kısımda Manage bağlantısının yanındaki arka plandaki yükleme görevlerini ve bunların ilerleyişini gösteren bayrak(flag) simgesine tıklayarak da kurulumu sürecinin hangi aşamada olduğunu ya da tamamlanıp tamamlanmadığını kontol edebilirsiniz.

 

 

image010

 

 

Kurulum tamamlandıktan sonra artık DataDeduplication özelliğini kullanmak istediğimiz volume’ler üzerinde aktifleştirerek kullanabilirsiniz.

 

PowerShell komut satırını kullanarak Data Deduplication özelliğini yüklemek için aşağıdaki PowerShell komutunu çalıştırmanız yeterlidir:

 

“Add-WindowsFeature -name FS-Data-Deduplication

 

DataDeduplication Özelliğinin Etkinleştirilmesi

 

Datadeduplication özelliğini yükledikten sonra bunu kullanabilmek için istediğiniz NTFS volume’ler üzerinde aktifleştirmeniz gerekir. Bu etkinleştirmeyi GUI arayüzünden yapabileceğiniz gibi, komut satırından da PowerShell komutları ile gerçekleştirebilirsiniz.

 

Grafiksel arayüzden veri tekilleştirme özelliğini aktifleştirmek için aşağıdaki adımları gerçekleştirmeniz gerekir:

 

Server Manager konsolunu açıp sol menüden File Services kısayoluna tıklıyoruz.

 

 

image011

 

 

Karşımıza aşağıdaki şekilde gördüğünüz File Services kategorisindeki alt menü gelecektir.

 

 

image012

 

 

Bu ekranda sağda açılan alt menüden Volumes tıklayarak sunucu üzerindeki volumelerin listesini göreceksiniz. Bu listeden deduplication(veri tekilleştirme) özelliğini hangi volume üzerinde aktifleştirecekseniz bunu seçili hale getirip sağ tuş “Configure Deduplication” tıklamanız gerekir.

 

 

image013

 

 

Gelen ekranda “Enable data deduplication on this volume” seçeneğini aktifleştirdikten sonra “Deduplicate files older than (in days)” seçeneği ile  kaç günden önceki dosyalar için veri tekilleştirme yapılacağını ayarlıyoruz.

 

 

image014

 

 

OK ile işlemi onaylayarak tamamlamış oluyoruz.

Böylece grafiksel arayüzden volume’ler üzerinde datadeduplication özelliğini nasıl etkinleştirdiğimiz gördük.

 

Şimdi de bu özelliği PowerShell komut satırından nasıl devreye aldığımızı görelim:

 

PowerShell komut satısını açıyoruz.

 

 “HELP DEDUP”  komutunu verirseniz veri tekilleştirme komutlarının listesini görebilirsiniz.

 

 

image015

 

 

Benzer şekilde veri tekilleştirme komutlarının listesini Deduplication modülünü göstererek de alabilirsiniz.

 

 

image016

 

 

Get-CommandModule Deduplication

 

Veri tekilleştirme komutlarını kullanabilmek  için Import-Module   Deduplication komutu ile veri tekilleştirme modülünü aktifleştiriyoruz.

 

 

image017

 

Veri tekilleştirme özelliğini bir volume üzerinde aktifleştirmek için Enable-DedupVolume komutunu kullanıyoruz.

 

 

image018

 

 

Enable-DedupVolume E:

 

Veri tekilleştirmeyi volume üzerinde etkinleştirildikten sonra sıra geldi tekilleştirme sürecini tetiklemeye. Bunun için de aşağıdaki komutu çalıştırmanız yeterlidir:

 

 

image019

 

 

Start-DedupJobType Optimization –Volume E:

 

E volume üzerinde disk optimizasyonu modunda veri tekilleştirme görevini tetiklemiş olduk.

 

Bu aşamadan sonra tekilleştirmenin hangi oranda yapıldığını, tamamlanıp tamamlanmadığını ya da hangi volume üzerinde etkinleştirildiğinizi yine PowerShell komutları ile kontrol edebilirsiniz.

 

 

image020

 

 

Get-DedupVolume komutu ile veri tekilleştirmenin hangi volume’ler üzerinde etkinleştirildiği ve disk alanından ne kadarlık tasarruf sağladığı bilgisini alabilirsiniz.

 

 

image021

 

 

Get-DedupJob komutu ile arka planda çalıştırılmış bir tekilleştirme işinin olup olmadığı, çalışan bir tekilleştirme işi varsa bu işin ne kadarının tamamlandığı ve State kolonunda da durum bilgisini alabilirsiniz. Eğer arka planda çalışan bir veri tekilleştirme işi çalışmıyorsa herhangi bir çıktı gelmeyecektir.

 

 

image022

 

 

Get-DedupMetadata komutu ile de veri tekilleştirme yapılmış volume’lere ait metadata bilgilerini detaylı olarak alabilirsiniz.

 

 

image023

 

 

Get-DedupSchedule komutu ile de Windows Server 8 üzerinde hazır olarak gelen tekilleştirme işlerine ait zamanlanmış görevlerin listesini almış olacaksınız. Bu varsayılan olarak gelen görevlerin dışında sizde kendiniz New-DedupSchedule komutu ile kendi zamanlanmış görevlerinizi oluşturmanız mümkün.

 

 

image024

 

 

Update-DedupStatus komutu ile de önceden veri tekilleştirmenin etkinleştirildiği bir volume üzerinde (bizdeki örnekte E volume) tekilleştirme durum güncellemesi yaparak son durum ile ilgili bilgileri alabilirsiniz.

 

 

image025

 

 

Disable-DedupVolume komutu ile veri tekilleştirmenin aktif olduğu bir volume üzerinde veri tekilleştirme özelliğini devre dışı bırakabilirsiniz.

 

LAB Uygulaması:

 

Yukarıdaki detaylı bilgilerden sonra şimdi de örnek bir uygulama ile adım adım deduplication özelliğinin nasıl kullanıldığını gösteriyor olacağız:

 

Öncelikle Disk Management konsolunu açıyoruz.

 

Bölümlenmemiş elimizdeki 4 GB kapasitesindeki alanı bir simple volume olarak NTFS formatında biçimlendiriyorum.

 

 

image026

 

 

image027

 

 

Bu 4 GB kapasitesindeki E: volume içerisinde bir tane 500 MB boyutunda bir sanal disk oluşturuyorum. Bunun için Action menüsünden “Create VHD” komutunu kullanmanız yeterlidir.

 

 

image028

 

 

image029

 

 

image030

 

 

500 MB boyutunda bir sanal disk oluşturdum. Bu sanal diskten Copy-Paste yöntemi ile iki ilave kopya daha oluşturuyorum.

 

 

image031

 

 

Böylece E: volume içerisinde toplamda 1500 MB yani 1.5 GB yer kaplamış olacaktır. Şu anda E: volume üzerinde veri tekilleştirme yani data deduplication henüz aktif değil.

 

 

image032

 

 

image033

 

 

Şimdi E: volume üzerinde veri tekilleştirmeyi aktifleştirmek için PowerShell komut satırına geçerek sırayla aşağıdaki komutları çalıştırıyoruz.

 

 

image034

 

 

 

image035

 

 

 

image036

 

 

Bu aşamadan sonra tekilleştirmenin hangi oranda yapıldığını, tamamlanıp tamamlanmadığını aşağıdaki komutla öğrenebilirsiniz.

 

 

image037

 

 

Tekilleştirme sürecinin tamamlandığını gördükten sonra volume üzerinde ne kadarlık kazanım sağladığını görmek için de aşağıdaki komutu çalıştırmanız yeterlidir.

 

 

image038

 

 

Şimdi de kopya olarak oluşan VHD sanal disklerden bir tanesinin Properties’ine girdiğimizde aşağıdaki ekran karşımıza gelecektir:

 

 

image039

 

 

Görüldüğü gibi tekilleştirmeden sonraki kazanım net bir biçimde görülmektedir.

 

Sonuç Olarak;

 

Windows Server 8 ile buluta giden yolda katma-değerli çok sayıda önemli yenilikler geliyor. Bu makalemizde de sizlerle bu yeniliklerden dosya sunucuları ve depolama alanında gelen Data-Deduplication (Veri-Tekilleştirme) özelliğini detaylarıyla inceledik. Önceki makalelerimizde de belirttiğimiz gibi tabiiki şu anda size Developer Preview ile gelen ve şu ana kadar incelediğimiz özelliklerle ilgili detayları şu anki kapsamda ele alarak sizlerle paylaşıyoruz. Ürünün beta, release candidate (RC) sürümlerinde de gelecek ilaveleri ve yeni değişiklikleri sizlerle paylaşmaya devam edeceğiz. 

 

Bir başka makalemizde görüşmek üzere hoşçakalın.

Mesut ALADAĞ
Microsoft MVP, MCT
[email protected]

 

İlgili Makaleler

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

Başa dön tuşu