熱錠

    克里斯·克蘭茲 2010年03月11日,根據大會

    打擾的存在和職位的情況下。 這是過去一年過山車人身傷害和平了工作日程,所以我很少有時間或動機到博客或顯示我的臉,周圍的社區。 我向你道歉,我決心要打破這種習慣,並再次進入回事情! 但足夠的喋喋不休,著作...

    這不是我常看的很,但是當我這樣做,這是有趣的統計為自己說話。 我幾年前了他們的NetApp房地產的腳本部署與客戶,它沒有過多的照顧或注意(我要討論的另一天)設計或交付。 與SQL,Exchange和其他的事情,他們有一個VMware的房地產。 這一切都貫穿共有超過100 15K FC紗錠。 與其他網站相比,它不是一個巨大的房地產,所以我到他們為什麼有這樣的性能問題感興趣。

    現在,當您通過“SYSSTAT-U”運行,你可以看到,文件管理器本身做的很少,很樂意應該做些什麼。 但磁盤往往達到100%。 立刻,這表明磁盤問題。 他們需要更多的紗錠,很明顯嗎?

    首先是主軸不平衡。 他們有一個夥伴控制器,只有測試卷上的第二個總。 我得到的許可,以消除和熱,我重新分配這些其他控制器和擴大現有的總和。 這雙打主軸計數,但我知道它不會做任何現有的業績(在該數據將不會自動重新分配本身!)。

    如果我通過“:*:統計顯示磁盤disk_busy”跑,我可以看到很明顯的。 達到100%,在整個系統中,有一個單一的磁盤,其餘的都沒有。 還有一堆其他磁盤(約10),正在運行的50-60%,然後滴答作響在20-30%左右,其餘的磁盤。 因此,這裡發生了什麼事情? NetApp技術應防止任何形式的熱系統中的主軸。

    這是我的理論。 被折磨的文件管理器和堆疊的開箱,但總沒有增長(3磁盤聚合,1數據2校驗)。 一些存儲配置和數據遷移。 他們跑出來的空間,因此增長的總和(少許),然後複製到磁盤一束更多的數據。 這一切後,他們再加入其餘的磁盤。 現在,因為數據不會自動重新分配上的蒼蠅,任何數據不變(VM系統磁盤,舊的Exchange電子郵件,和老數據倉庫數據會發生),那麼他們仍坐在原來的主軸,甚至作為他們第一次安裝時的主軸。

    所以我現在就盼著週末。 我們將它們升級至Data ONTAP 7.3.2,然後我就可以運行一些再分配,掃描,不影響整個系統的快照空間使用情況(巨額獎金,感​​謝你NetApp的!)。 我希望,這將消除熱主軸問題。 我之前統計,我拉出後統計下週。 我會更新這個職位。

    從這個故事的教訓? 設置存儲系統完全,徹底,然後再開始扔在它的數據。 不要使用新的存儲玩具興奮,立即拋出數據。 我看過多次的上述情況,現在,和前ONTAP的7.3,它是一個痛苦的修復。

    快速快照的統計輸出。 請記住,在集群,這將顯示所有磁盤,使所有磁盤的統計是完全相關的。 只是在這裡忙碌的磁盤,不添加到實際系統中的磁盤數量,你可以清楚地看到一個忙碌的磁盤。

    > SYSSTAT-U 1
    CPU總淨kb / s的磁盤kb / s的磁帶kb / s的Cache緩存CP CP的磁盤
    OPS /在輸出讀寫,讀寫年齡命中時間TY UTIL
    3220 6942 3270 4232 0 0 0 12 95%0% - 60%11%
    2898 7385 4030 4892 0 0 0 11 94%0%11% - 69%
    3547 1820 3496 3920 24 0 0 11 93%0%9% - 89%
    2329 1160 3048 3892 0 0 0 11 93%0%7% - 81%
    3173 2055 4851 4644 8 0 0 11 93%0% - 67%10%
    2491 1860 4547 4568 24 0 0 11 91%0%9% - 98%
    2523 2960 4404 5372 0 0 0 11 90%0%9% - 89%
    5136 8173 4465 3352 0 0 0 11 95%0% - 81%​​14%

    >統計顯示盤:*:disk_busy
    ......喀嚓......














    ......喀嚓......

    釩氮:女[1.9.11_1134]
    此留言:
    評分:8.0 / 10(1票)
    based on 1 rating 熱紗錠 ,10 8.0基於1個評分


    15此條評論

    • 湯家驊

      另外很重要的一點是,你不應該只有一個單一的磁盤添加當您調整總,如果它幾乎是全面的,大多數新的數據被寫入添加的磁盤。 因此,表現實在是太差了!
      我的建議:創建許多小的,而不是少數大團聚。 總使用率超過80%時,添加磁盤。 是的,使用性能顧問和閾值來監控你的表現!

    • dwarburton

      感謝克里斯 - 有一些很好的技巧! 高興你寫了 :)

    • 克里斯·克蘭茲

      反饋的歡呼聲,感覺很好,其實有機會寫東西了!!

      是的,增加單個磁盤是一件可怕的事情要做。 我知道有人買1磁盤一個月,因為這是他們的預算是如何工作的。 我恨這一點,並試圖讓它們來存儲,並至少添加散裝。 不幫助他們的客戶經理鼓勵他們這樣做可以調用存儲需求! :( 令人震驚!

    • 里克·羅茲

      你提到的“快照空間,而不會影響整個系統運行的一些再分配掃描”作為一個7.3.2的新功能。 另一個博客條目的想法也許會是一些解釋,以及為什麼它很重要。 我明白(以前),再分配將轉儲到快照的所有工作,但我不知道你提到的在7.3.2的變化,修正/改變這個。

    • 克里斯·克蘭茲

      希望我將通過這個運行在上週末,這樣我就能給這是如何工作的一些真實世界的例子。

    • 埃里克·謝里爾

      當然,你可以總是槽成一個架子的新單身每個月驅動器,但離開他們作為備用的閒置,直到你得到一個完整的新RAID組的價值...只是不告訴他們, ;-)

    • 安東

      _AT_里克·羅茲
      在7.3.x的新的再分配,是物理再分配(再分配-P,請參閱手冊頁)。 即使你擴大與整個貨架或以上合計,你可能仍然需要做物理重新分配總額中的所有卷,即使你沒有熱磁盤。 這樣,可以條紋橫跨更紗錠的數據,所以它會產生性能以及現有的數據(讀)。

    • 克里斯·克蘭茲

      其實說再分配-P“”不應該被用來散佈在磁盤中的數據手冊頁。 它建議對每卷在擴大總量中重新分配。

      不知道這個實際影響是什麼,我還沒有一個系統嘗試會看到大量的改善。

    • erlendur

      嗨,

      這是一個美妙的文章

      只是一個小問題

      磁盤:88922F61:C2026AF9:E5D68A17:B49415B1:00000000:00000000:00000000:00000000

      我如何才能找到這個磁盤屬於其中的聚合?

      我試圖用磁盤顯示和儲存顯示盤,AGGR狀態-R

      但無法找到任何

      的問候,

    • 克里斯·克蘭茲

      不幸的是,我不是100%肯定。 這是我的“待辦事項清單”,我還沒有弄清楚如何翻譯的“統計”命令給你一些實際的磁盤地址或位置上的可用地址空間。 對不起,這不幫你出多少 :(

    • 弗拉基米爾。

      我很好奇什麼必要運行“再分配”的跡象,除了繁忙的99%的磁盤?

      謝謝

    • 弗拉基米爾。

      湯家驊
      是的,使用性能顧問和閾值來監控你的表現!

      究竟是什麼在Perf.monitor尋找? 延遲,OPS /秒​​?

    • 克里斯·克蘭茲

      您好弗拉基米爾

      運行“再分配”正在考慮各種各樣的LUN相當好的做法。 任何將獲得一個大型連續讀取的利益是一個定期計劃重新分配的很好的候選人,但也有許多不同的LUN常見的類型,將有利於反正。

      雖然NetApp磁盤子系統放置在整個磁盤的大塊和條紋的數據做了很好的工作,只能做這麼多要么因為系統非常繁忙,或因為磁盤是非常充分的。 運行再分配之後是後處理,因此可以利用的時間,以確保數據是完全均勻。

      我可能會重新分配,如果磁盤已有99%繁忙的運行持謹慎態度,重新分配將投入更大的負載一段時間的數據時重新分配他們。 我建議你這樣做,在維護窗口,或小時了。

    發表評論

    不良行為已阻止了在過去的7天29737訪問嘗試。

    ©2009-2012 克里斯·克蘭茲保留所有權利
    本網站不隸屬於或NetApp或任何其他公司內提到反正贊助。