Strona główna > Ogólne > Hot Wrzeciona

Hot Wrzeciona

Przepraszam za brak w obecności i postów. To był roller-coaster ubiegłym roku z ciała i flat-out harmonogramy pracy, więc miałem mało czasu i motywacji do blogu lub pokazać twarz wokół społeczności. Przepraszam, i jestem zdecydowana złamać ten zwyczaj i wrócić do sprawy po raz kolejny! Ale dość gadania, dostać się z pism ...

To nie jest coś widzę bardzo często, ale gdy ja, to ciekawe, statystyki mówią same za siebie. Jestem z klientem, który miał scenariusz rozmieszczenia ich nieruchomości NetApp kilka lat temu, i nie został zaprojektowany lub dostarczane z za dużo opieki i uwagi (coś chcę omówić kolejny dzień). Mają nieruchomości VMware z SQL, Exchange i innych rzeczy. Wszystko przebiega w sumie ponad 100 15k FC wrzeciona. Nie jest to ogromny majątek w porównaniu z innymi stronami, tak jestem zaintrygowany, dlaczego mają takie problemy z wydajnością.

Po uruchomieniu przez "sysstat-u", widać, że filer się robi bardzo mało, dość dobrze radzi z tym, co powinna zrobić. Ale dysk jest trafienie 100% dość często. Natychmiast pokazuje to problem dysku. Potrzebują więcej wrzecion, oczywiście?

Po pierwsze istnieje nierównowaga wrzecion. Mają drugi agregat na kontrolerze partnera, który ma tylko ilości testów. Uzyskać zgodę na usunięcie tego i gorące, I ponownie przydzielić je do innego kontrolera i rozszerzenie istniejących kruszywa. Podwaja to liczyć wrzeciona, ale wiem, że nie zamierza nic zrobić dla istniejących wydajności (w tym danych nie będzie automatycznie redystrybucji się!).

Jeśli uruchomić przez "dysk statystyki pokazują: *: disk_busy" Widzę coś całkiem oczywiste. Nie ma jednego dysku w całym systemie, który uderza w 100%, reszta nie. Istnieje kilka innych dysków (o 10), które są uruchomione 50-60%, a następnie pozostałych dyskach tyka się na poziomie około 20-30%. Więc co tu się wydarzyło? NetApp technologia powinna zapobiec postaci gorącej wrzeciona w systemie.

Moja teoria jest następująca. Filer był trójkąt i ułożone po wyjęciu z pudełka, ale suma nie była uprawiana (3 dysku kruszywa, 1 danych, 2 parzystości). Niektóre przechowywania został zabezpieczony i dane migracji. Zabrakło miejsca, więc wzrosła kruszywa (trochę), a następnie skopiować kilka więcej danych na dyskach. Po tym wszystkim, to następnie dodaje pozostałe dyski. Teraz, ponieważ dane nie zostaną automatycznie ponownie przeznaczyć na bieżąco, wszelkie dane, które pozostaje bez zmian (jak stanie się z VM dyskach systemowych, stare wiadomości e-mail Exchange oraz starych danych hurtowni danych), a następnie są one nadal siedział na oryginalne wrzeciona, a nawet wrzeciona kiedy zostały zainstalowane po raz pierwszy.

Więc jestem teraz z niecierpliwością na weekend. Będziemy modernizacji im Data ONTAP 7.3.2 i można następnie uruchomić niektórych ponownego skanowania całego systemu bez wpływu na wykorzystanie miejsca zrzutu (ogromny bonus, dziękuję NetApp!). Mam nadzieję, że usunie to gorący temat wrzeciona. Mam przed statystyki, a ja wyciągnąć pewne po statystyki w przyszłym tygodniu. Będę aktualizacji tego posta odpowiednio.

Lekcja z historii? Konfiguracja systemu pamięci masowej całkowicie i dokładnie, zanim zaczniesz rzucać dane na niego. Nie denerwować się na temat korzystania z nowej zabawki przechowywania i rzucać się na nim danych natychmiast. Widziałem powyższego scenariusza wielokrotnie teraz, i przed ONTAP 7.3, to był ból do naprawienia.

Szybka migawka wyjście statystyki. Należy pamiętać, że w klastrze pokaże wszystkie dyski, więc wszystkie statystyki dysku są całkowicie właściwe. Zajęty dysków tutaj po prostu nie sumują się do rzeczywistej liczby dysków w systemie, i widać na jednej zajęty dysku.

> Sysstat-u 1
CPU netto ogółem kB / s Disk kB / s Tape kB / s Cache Cache CP CP dysku
ops / s na read write read write wieku hit czasu ty util
11% 3220 6942 3270 4232 0 0 0 12 95% 0% - 60%
11% 2898 7385 4030 4892 0 0 0 11 94% 0% - 69%
9% 3547 1820 3496 3920 24 0 0 11 93% 0% - 89%
7% 2329 1160 3048 3892 0 0 0 11 93% 0% - 81%
10% 3173 2055 4851 4644 8 0 0 11 93% 0% - 67%
9% 2491 1860 4547 4568 24 0 0 11 91% 0% - 98%
9% 2523 2960 4404 5372 0 0 0 11 90% 0% - 89%
14% 5136 8173 4465 3352 0 0 0 11 95% 0% - 81%

> Pokaz dysku statystyki: *: disk_busy
... Ciach ...














... Ciach ...

VN: F [1.9.11_1134]
Oceń ten post:
Ocena: 8.0 / 10 (1 głos)
based on 1 rating Hot Wrzeciona, 8,0 z 10 na podstawie 1 Ocena

Ogólne , , , , ,

  1. Ronny
    11 marca 2010 na 08:03 | # 1

    Innym ważnym punktem jest to, że nie należy dodawać tylko jednego dysku przy zmianie rozmiaru kruszywa jeśli jest prawie pełny, większość nowych danych jest zapisywane na dysku dodał. Dlatego wydajność jest naprawdę źle!
    Moja rekomendacja: utwórz kilka dużych agregatów zamiast wielu najmłodszych. Dodaj dyski do łącznej gdy obciążenie jest ponad 80%. I tak, należy użyć Doradca wydajności i progi do monitorowania wydajności!

  2. 11 marca 2010 o 10:25 | # 2

    Dzięki Chris - kilka naprawdę dobrych rad tam! Cieszę się, że piszesz ponownie :)

  3. 11 marca 2010 na 10:39 | # 3

    Cheers za opinie, czuje się dobrze, aby faktycznie szansę napisać coś znowu w dół!

    I tak, dodanie dwóch dyskach to straszna rzecz. Wiem, że ktoś kupuje 1 dysku w miesiącu, z racji sposobu ich budżetu działa. Nienawidzę tego, i postarać się je przechowywać je i dodać je luzem przynajmniej. Nie pomaga z account manager zachęcanie ich do tego może nazywając ją przechowywania na żądanie! : ( Shocking!

  4. rick rhodes
    11 marca 2010 na 17:01 | # 4

    Wspomnieć, że "wykonać jakieś skany realokacji w całym systemie bez wpływu na przestrzeń snapshot" jako nowość z 7.3.2. Być może pomysł na kolejny wpis w blogu byłoby wyjaśnić to trochę więcej, i dlaczego jest to ważne. Rozumiem (wcześniej), że przesunięcie będzie zrzutu wszystkich prac do zdjęć, ale nie jestem świadoma zmiana w 7.3.2 wspomnieć, że poprawki / zmiany tego.

  5. 11 marca 2010 na 21:43 | # 5

    Mam nadzieję, że będę działać poprzez ten w weekend, więc będę w stanie dać kilka przykładów jak to działa.

  6. 24 marca 2010 o 17:04 | # 6

    Oczywiście zawsze może gniazdo nowych pojedynczych napędów do półce każdego miesiąca, ale pozostawić je w stanie spoczynku części zamiennych, aż do uzyskania pełnej nową grupę RAID warto ... po prostu nie mów im, że ;-)

  7. Anton
    10 czerwca 2010 o godzinie 14:00 | # 7

    @ Rick rhodes
    Nowa realokacji w 7.3.x jest fizyczne przesunięcie (realokacji-p, zajrzyj do strony man). I nawet jeśli rozszerzyć łącznie z całą półkę lub więcej, może nadal chcesz zrobić fizycznego przesunięcia wszystkich wielkości łącznie, nawet jeśli nie ma ciepłej dysków. W ten sposób można pasek danych w jeszcze bardziej wrzeciona, więc będzie to wydajność wyższa (odczyt), wydajność istniejących danych, jak również.

  8. 13 czerwca 2010 na 16:15 | # 8

    Faktycznie na stronie podręcznika mówi, że "przesunięcie-p" nie powinny być wykorzystywane do rozprzestrzeniania danych na dyskach. Zaleca się robi realokacji przed każdym woluminem w ramach rozszerzonego agregatu.

    Nie wiesz, co do faktycznego wpływu to, nie miałem systemu, aby spróbować tego, na którym widzieli ogromny ulepszeń.

  9. Erlendur
    08 kwietnia 2011 na 11:24 | # 9

    Witam,

    Jest to wspaniały post

    Tylko małe pytanie

    dysk: 88922F61: C2026AF9: E5D68A17: B49415B1: 00000000:00000000:00000000:00000000

    Jak można dowiedzieć się, która z tych wartości tego dysku należy do?

    Próbowałem z pokazem dysku i dysk pokazać przechowywania, aggr status-r

    Ale nie znaleźliśmy żadnych

    Pozdrawiam,

  10. 11 kwietnia 2011 na 12:04 | # 10

    Niestety nie jestem 100% pewny. To na mojej "liście rzeczy do zrobienia", a ja jeszcze dowiedzieć się, jak przełożyć długo przestrzeni adresowej "statystyki" command daje do czegoś co działa w warunkach rzeczywistego adresu dysku lub lokalizacji. Niestety to nie pomaga się znacznie : (

  11. Joe Ropar
  12. 20 kwietnia 2011 na 09:25 | # 12

    To jest doskonałe! Dziękujemy!

  13. Vladimir
    01 sierpnia 2011 na 18:35 | # 13

    Ciekaw jestem, jakie są oznaki konieczności biegania "przesunięcia", poza tym, że dysk zajęty 99%?

    Dzięki

  14. Vladimir
    01 sierpnia 2011 na 18:36 | # 14

    Ronny :
    I tak, należy użyć Doradca wydajności i progi do monitorowania wydajności!

    Co dokładnie szukasz w Perf.monitor? Opóźnienie, ops / s?

  15. 11 sierpnia 2011 na 08:29 | # 15

    Hi Vladimir,

    Running "przesunięcie" jest obecnie uważany za dość dobrych praktyk na różnych jednostek LUN. Wszystko, co zyska korzyści z dużych kolejne odczyty jest dobrym kandydatem na regularne zaplanowane przesunięcia, ale także wielu różnych popularnych typów jednostek LUN i tak skorzystają.

    Mimo, że podsystem dyskowy NetApp ma bardzo dobrą robotę danych umieszczanie w duże kawałki i paski na dyski, to może zrobić tylko tyle albo dlatego, że system jest bardzo zajęty, albo dlatego, że dyski są bardzo pełne. Prowadzenie realokacji potem jest post-procesu, tak może to potrwać nadszedł czas, aby zapewnić danych jest określone całkowicie równomiernie.

    I może być ostrożni prowadzenia realokacji jeśli dyski są już 99% zajęty, przesunięcia stworzy większe obciążenie na nich czas, gdy dane są przeniesione. Polecam ten sposób w oknie konserwacji, lub poza godzinami pracy.

  1. Brak trackbacków.



Ta strona nie jest powiązana lub sponsorowana w żaden sposób przez NetApp lub jakiekolwiek inne przedsiębiorstwo, o których mowa w.

Bad Behavior zablokował dostęp próby 1352 w ciągu ostatnich 7 dni.

© 2009-2012 Chris Kranz Wszystkie Prawa zastrzeżone
Ta strona nie jest powiązana lub sponsorowana w żaden sposób przez NetApp lub jakiekolwiek inne przedsiębiorstwo, o których mowa w.