Posts Tagged ‘TBSM’

ETTC 2011 in Prague

Tuesday, June 21st, 2011

Last week I returned from European Tivoli Technical Conference in Prague. It was a very good event, lot of technical sessions and labs, including self-paced and custom labs. I was presenting on TBSM practices in mobile telco industry and gave 2 labs myself, but also attended a lot of interesting sessions, like one about smarter building (given by Senior Technical Staff Member from IBM US), another about Tivoli Integrated Portal TIP future (TIP development/product manager) and another one, about IBM software development laboratory in Kraków, Poland (I’m part of it, so it was my duty to be there and show off a little bit 😉
But sessions were numerous. Due to my responsibilities I couldn’t attend all of them, even if I wanted to do so. What I liked the most, was probably the self-paced labs section, where with some assistance from all-the-time-available instructors, you could go through one of selected IBM Tivoli product excercise/lab yourself, anytime during the conference, anyone! As far as I know it was the first time at ETTC, the idea itself comes from Pulse conference and is very popular there in Vegas. I’m sure it’ll be not the less popular at europeans events! It is a great chance for customers, partners, also us – IBMers, to learn many technical details directly from real specialists, and get answers on sometimes tricky questions. I strongly recommend you attending at least one SPL next time, however ask for SPL difficulty level, not all of them may meet your expectations.
I gave 2 labs myself, as I mentioned, and it was about integrating TBSM with Soap web services via WS DSA. I’m glad that many people came and they liked it, I promised to share more about what we did, so please stay in tune. I will try to share some of my thoughts also in this blog.
Meanwhile, you may want to browse the event pages, here it is:
All of you who attended the conference, you should have received an URL, that would contain all the conference resources – slides (not sure about labs, but I haven’t receive anything yet so it may be still pending). And I’m strongly recommending everybody else attending ETTC next year!

TBSM in telco industry

Tuesday, April 12th, 2011

After months of break in posting on my blog, I’m coming back and publishing again. After spending a few months in one, bigger project for one of our bigger customers in Europe I’m full of different thoughts on TBSM and its technical use scenarios, as well as on business perspectives of getting this kind of tools to work. I will do my best to present all the interesting aspects and observations and share some of my experience.
First thing to mention is definitely form of my blog. Still the same, maybe will change the layout, but I’m definitely switching to English. Reasons can be justified by business, I believe that english publications remain valuable for polish engineers who may be looking for an interesting content in my blog, and who mostly speak english anyway, and remove the natural language barrier for audience from all over the world. I also believe in delivering more interesting content from now on and rely on your feedback more.
Like I mentioned, I’ve been participating in large TBSM project for telecommunications company in role of implementer and solution co-designer. It’s been very interesting time, lot of experience to gain, long hours and evenings spent over business services design, status and KPI rules, and dashboards. Product such as TBSM, which is highly customizable, and can basically be used in so many ways, may give you both lot of fun and trouble. Up to how open is your solution scope, TBSM design itself can take regular project time or way longer.
There are many things to say how to deal with such project requirements, how to address customer’s suggestions, how to translate use scenarios to TBSM service model, rules and dashboards. But I think it’s better to start from, say, “demythologization” of what TBSM can do and is for.
TBSM is not a network manager tool, or if you prefer – network topologies or hierarchies visualization tool. It’s rather obvious, but service models design may confuse you especially when you try to show dependency of some devices functions on other devices functions. Like you know, everything in TBSM is a service, or business service, even if representing a device, an application or a process. So presenting those objects in TBSM, named after their real, original name, like BSC or SGSN, and links connecting them in Service Viewer portlet, may confuse people less familiar with the tool and drive their minds to think that graphical link represents a physical link between devices, so has a critical meaning for signalling or data flow. Also naming services after devices doesn’t help here. Like I said, TBSM is not network manager or monitor, it just doesn’t have the right tools, like ping, telnet or cgi scripts, even though can present network objects with nice icons, KPI results and SLA violations. For network manager, you’re recommended to learn more about ITNM (IBM Tivoli Network Manager, former Micromuse Precision), if speaking about Tivoli. For open source, they’re writing interesting stuff on op5 in Linux magazine (at least recently in polish edition). For simple visualization of links between locations, I encourage to try Netcool Webtop Maps (new Webtop version was named WebGUI).
Second thing, TBSM can show many services in a tree or relationships view, but there’s a reasonable limit. They say 50’000-100’000 is fair limit nowadays. And 50 child services per parent. But watch out the product role again. It’s business services manager. Are you really running 50’000 business services in your company? So services that you make money on and their components? If yes, you must be IBM! 🙂
Of course I’m kidding, you may run many services, much more than that and I don’t know how many services they could identify in IBM in WW total. It’s not the point. It’s rather a question: which services are important to you enough to spend weeks on analysis and workshops, identifying their dependencies, collecting technical details, establishing the missing and reconfiguring the existing monitoring and performing all tests? It still can be many, like hundreds top level services plus 10 levels of key components. But all the key components presence in TBSM service models should be justified and reasonable, and preferably: pre-documented, in order to deploy and implement a working solution on time. So TBSM shall be the last place where unverified and unconfirmed service topologies come in.
Last but not least, TBSM audience. I’ve done many projects after which TBSM box landed on shelf. So many customers order it, pay for it (maybe was volume price), are interested in it, after then just one enthusiast remain engaged and all the other personell switch back to old good monitoring tools they know from a decade. Or worse for both IBM and the customer: project slows down, become a critsit and even gets fixed, but bad impression remains. I’m that lucky that my recent project has been done by many enthusiastic people and also the customer, one among a few, has had a realistic vision of and need for TBSM use. It’s a pleasure to work with such mature customer, who is aware of TBSM place in their infrastructure and plans TBSM to be part of their information flow. Likely real life issues and obstacles, usually coming up during every implementation, are way easier to solve if there’s common understanding of what TBSM can and cannot do, and the only question remains open: when this all will be ready?
I hope to share some more interesting thoughts soon. I also encourage you to share your opinions on TBSM projects in different companies and industries, in general or in particular. Topic doesn’t really matter, can be about TBSM or Tivoli. Tivoli’s competition in monitoring or open source. Feel free to post your thoughts. I’m looking forward to hear from you about your bad experience with TBSM, Tivoli or IBM, as well as well done projects and what you’ve learned from them. Welcome and post you soon.

Instalacja TBSM 4.2.1 na Windows 2008 R2 64bit

Thursday, August 19th, 2010

Wątek niby oczywisty – TBSM 4.2.1 jest wspierany na platformach 64-bitowych, również na Windows 2008, ale w dokumentacji nie jest jasno wyjaśnione, czy także R2? O tym, oraz parę innych grepsów poniżej.
Zdarzyło mi się, że musiałem zainstalować TBSM na rzeczonym Windows 2008 Server Standard Edition R2 64bit (uff..). Oczywiście startuję instalator i bardzo szybko zostaję poinformowany o niechodzących usługach Windows. Bułeczka z masłem…
1) Greps dot. usług windows
Wejdź do Narzędzia Administracyjne->Usługi i włącz usługi: Server oraz Secondary Logon. Następnie najlepiej zacznij instalację od nowa, choć powinno się udać także z klikaniem Dalej (mi się udało).

No i dobrze, teraz pójdzie z płatka. Nic bardziej mylnego, instalacja bardzo szybko wywraca się, a w logu TBSMInstall-00.log, który wygenerowany został w katalogu domowym naszego dzielnego użytkownika, czytamy: UnrecognizedOSException. Cóż to? Dlaczego instalator stwierdził obecność 32-bitowej Visty? Może jednak R2 nie jest wspierane? Otóż jest, ale dopiero przez FP1, nie wersję GA.
2) Greps dot. wspieranej wersji Windows 2008
Ściągnij FP1 lub FP2 do TBSM i skopiuj sobie plik /TBSM/DE/.data/setup.jar a następnie użyj go zamiast oryginalnego w instalce podstawki TBSM. Cała sztuczka jest opisana w readme do FP1/FP2.

Uff.. ruszyło. Czy aby na pewno? Zaraz rozbijemy się bowiem o kolejną rafę: Postgres. Po pierwsze uwaga na to, w jaki sposób podłączyłeś się do swojego ukochanego Windows 2008. Jeśli siedzisz przy maszynie fizycznie, nic Ci nie grozi (tym razem). Ale zapewne Windows jest gdzieś dalej a Ty używasz Remote Desktop. Zaleca się w takim wypadku połączenie w trybie konsolowym.
3) Greps dot. Postgres – po raz pierwszy
Podłącz się do Windows RDP w trybie konsoli, np. wywołując mstsc /console (wersja 6.0) lub mstsc /admin (wersja 6.1).

Postgres to jeszcze conajmniej jedno wyzwanie. Użytkownik pgservice, domyślnie używany do uruchomienia usługi Tivoli Postgres Database, powinien spełniać kilka kryteriów. Nie może być Administratorem ani Super użytkownikiem. Powinien mieć przypisane prawa Log on Locally oraz Log on as a service. Uwaga, zdaje się, że domyślnie Log on Locally nie jest prawem zwykłych użytkowników, oraz jest prawem objętym polityką, więc może nie być łatwo to zmienić. Można za to spróbować dodać pgservice do grupy Backup Operators, która takie prawo posiada. Ostatnia sprawa to uprawnienie zapisu do katalogu %TBSM_HOME% – domyślnie użytkownicy takiego prawa nie posiadają i należy je dodać. Ogólnie polecam utworzenie użytkownika pgservice ręcznie w panelach administracyjnych Windows, dodać uprawnienia itp. a następnie, podczas instalacji, podać jedynie nazwę i hasło, zatem ominąć opcję “Create Windows user”.
4) Greps dot. Postgres – po raz drugi
Stwórz ręcznie użytkownika pgservice, dodaj prawa Log on Locally oraz Log on as a service, prawo zapisu do %TBSM_HOME%

Niestety życie jest brutalne, i powyższy greps może nie pomóc. W takim wypadku należy przyjrzeć się uważniej zawalonej instalacji postgres. Czy został utworzony katalog %TBSM_HOME%\pgsql8\data ? Jeśli nie, a w logach powtarza się zapis, że nie można znaleźć pg_hba.conf w tymże katalogu, znaczy to, że postgres się nie zainicjował do końca i nie zostały utworzone pliki bazodanowe. Można zrobić to samemu ręcznie, zalecam lekturę Install Guide, rozdział poświęcony nieudanej instalacji postgres, jest tam jednak błąd, jeden z parametrów pwfile należy podawać z dwoma myślnikami, nie jednym. A więc:
5) Greps dot. Postgres – po raz trzeci
Utwórz C:\temp\pfile.txt zawierający hasło użytkownika wewnętrznego bazy postgres, np. netcool (to co zostało podane podczas instalacji)
Wykonaj: runas /user:pgservice “C:\IBM\tivoli\tbsm\pgsql8\bin\initdb.exe –locale=C -U postgres -A md5 –pwfile C:\temp\pfile.txt -D C:\IBM\tivoli\tbsm\pgsql8\data”
Uruchom usługę Windows: Tivoli Postgres Database
Wykonaj: C:\IBM\tivoli\tbsm\bin\rad_db setupinit
Zaloguj się do rad_db log i sprawdz, czy tabele zostały utworzone poprawnie (\d+).

Życie byłoby jednak zbyt piękne gdyby to okazało się już być wszystkim co trzeba. Niestety, nawet powyższe kroki mogą nie spowodować, że TBSM da się uruchomić. Nawet jeśli usługa Windows TBSMDataServer będzie uruchomiona, na porcie 17310 może nie być nasłuchu, a więc de facto TBSM może nie działać. Jeśli przyjrzysz się uważnie, dziać się tak może, ponieważ usługa działa niestabilnie – pracuje, po czym samoczynnie wchodzi w tryb uruchomienia ponownie. Dlatego na koniec jeszcze jedno rozwiązanie, które okazało się w moim przypadku powodować problem: IP v6. Oczywiście było włączone i zorientowałem się w tym po 24 godzinach od napotkania problemu po raz pierwszy, po dziesiątkach prób, obejść, stosowania powyższych rad w praktyce. Nic nie działało, TBSM dalej psuł się na etapie instalacji Postgresa, a po zainicjowaniu serwera ręcznie jak w grepsie 5, usługa windows TBSM dataserver była niestabilna a w trace.log widniał wpis, że nie można nawiązać połączenia JDBC z bazą danych postgres. IP v6 teoretycznie jest przez TBSM 4.2.1 GA wspierane, ale prawdopodobnie nie działa dla sterownika JDBC Postgresa i należy je wyłączyć. Oprócz wyłączenia, pomocne może się okazać stosowanie lokalnej tablicy hostów w formacie IP v4 w C:\Windows\system32\drivers\etc\hosts. Instalowanie wszystkiego lokalnie na 1 komputerze pod adresem localhost powinno zadziałać mimo IPv6.
6) Greps 6. dot IPv6
Sprawdź czy jest używane i wyłącz, a następnie zgłoś problem pracownikom wsparcia z IBM.

To już wszystko. Po powyższych krokach (udało mi się nawet pominąć 5) zainstalowałem TBSM 4.2.1 na dwóch serwerach Windows 2008 R2 pomyślnie. Jeśli są jakieś pytania, postaram się zatem pomóc. Tymczasem – powodzenia!

Integracja TBSM i TADDM – filmik

Wednesday, June 16th, 2010

W sieci pojawiła się informacja nt. dostępności filmiku prezentującego integrację pomiędzi TBSM 4.2.1 i TADDM 7.2. W związku z wieloma pytaniami i problemami z integracją, które docierają do mnie, polecam zapoznanie się z materiałem, a w razie dalszych pytań zapraszam na blog.
Prezenterem jest architekt rozwiązań Phil Riedel z laboratorium IBM w Raleigh, USA. A oto odsyłacz:

TBSM 4.2.1 i OMNIbus 7.3?

Thursday, May 6th, 2010

Instalator TBSM 4.2.1, tak jak 4.2.0, umożliwia nam zainstalowanie od razu także serwer zdarzeń, jakim jest Netcool OMNIbus w wersji 7.2.1. Tymczasem od pół roku jest już dostępne nowe wydanie OMNIbusa, numerowane jako 7.3.0. Ponadto, pojawiły się już również oficjalne pakiety poprawek: FP1 oraz WebGUI IF2, zatem można zacząć zastanawiać się, czy aby nie warto zaktualizować nasz ObjectServer.
Jeśli już się na to zdecydujemy, warto wiedzieć najważniejsze: takie połączenie jest wspierane przez IBM. Zatem jak się zabrać do pracy i od czego zacząć?
Bazowy kod TBSM 4.2.1 nie jest gotowy do współpracy z OMNIbusem 7.3, musimy dołożyć zestaw poprawek Fix Pack 1. Jest to więc pierwszy krok, nie obędzie się zatem bez przerwy serwisowej również dla TBSMa. Instalacja FP1 wnosi zgodność bibliotek TBSM odpowiedzialnych za komunikację z ObjectServerem z wersją 7.3.
Drugi krok to migracja samego OMNIbusa z 7.2.1 do 7.3. Należy uruchomić instalator i postępować zgodnie z zaleceniami instrukcji. Po instalacji standardowo powstaje kopia dotychczasowego katalogu OMNIHOME a w miejsce dotychczasowego kopiowane są nowe pliki. Zatem z punktu widzenia TBSM, dzięki nowym własnym bibliotekom, komunikowanie się z nowszym ObjectServerem przebiega bez zmian. Nie wszędzie jednak podniesienie wersji OMNIbusa zostaje odnotowane, np. ekran zwracany przez $TBSM_HOME/bin/versioninfo nadal będzie informował o tym, że zainstalowano OMNIbus 7.2.1.
Na tym można by w zasadzie poprzestać, jednak OMNIbus 7.3 to również ulepszony Webtop, odtąd zwany WebGUI. Aby uzyskać dostęp do poprawionych map i widoków, należy jeszcze zainstalować WebGUI 7.3 kod bazowy oraz IF2, oba “na” istniejący TIP.

Ostatnią rzeczą, o której należy wspomnieć dla porządku, jest możliwość podniesienia wersji również agenta do monitorowania ObjectServera, kodowanego oznaczeniem KNO. Jest to krok obowiązkowy, jeśli zintegrowaliśmy wcześniej ITM i Netcool OMNIbus i monitorujemy nasz serwer zdarzeń a zarchiwizowane pomiary przechowujemy w hurtowni Warehouse. I to już w zasadzie wszystko… jeśli chodzi o podnoszenie wersji 😉 Oto bowiem, skoro zainstalowaliśmy nowy OMNIbus 7.3 i zaktualizowaliśmy TBSM, może warto poznać bliżej ich nowe funkcje? Miłej zabawy!
Jeszcze raz lista rzeczy do zainstalowania:
0) TBSM 4.2.1 – base
1) 4.2.1-TIV-BSM-FP0001-
2) Netcool OMNIbus 7.3 – base
3) (opcjonalnie) 7.3.0-TIV-NCOMNIbus--FP0001
4) Netcool OMNIbus 7.3 – Web GUI
5) Webtop-7300--InterimFix002
6) Netcool OMNIbus 7.3 Monitoring Agent

Impact Policy Language – cz.1 ?

Thursday, April 29th, 2010

Być może będzie to pierwszy artykuł w temacie języka IPL, użytym w oprogramowaniu Netcool Impact i TBSM. Wtajemniczeni wiedzą, że możliwości ma szerokie, a w połączeniu z możliwościami łączenia się z usługami sieciowymi poprzez WSDL lub wywoływaniem skryptów i programów z linii poleceń to już bardzo szerokie. Niewtajemniczonych odsyłam zasadniczo do dwóch źródeł, oryginalnej dokumentacji oraz wiki TBSM. Ogólnie – chodzi o wewnętrzny mechanizm oraz swoisty język skryptowy Impacta i TBSMa, który umożliwia podłączanie się do baz danych przez JDBC, bazy zdarzeń ObjectServer, usług sieciowych, wywoływanie skryptów i programów z linii poleceń oraz, w końcu, wykonywanie standardowych obliczeń liczbowych i operacji na łańcuchach tekstowych, zatem wzbogacanie kontekstu istniejącej informacji, np. zdarzenia, albo też np. korelowanie ze sobą zdarzeń i wartości zadanych metryk.

Nie chcę omawiać na niniejszym blogu całego języka IPL, jest to zbyt szeroki temat jak i istnieją już dobre przykłady na w/w stronach. Postaram się za to skupić na ciekawych zagadnieniach, nie poruszonych w istniejących publikacjach.

No to zaczynamy. Zostałem dziś zapytany o możliwość operowania na obiektach DataItems i DataItem, które są zwracane przez funkcję DirectSQL. Działanie takie jak to poniżej spotka się z błędem wykonania:

DirectSQL(“NCOMS”, “select Node from alerts.status”, false);
log(“See this: “+DataItem.Node);
DataItem.Node = “moja nowa wartosc”;
log(“and this: “+DataItem.Node);

Dzieje się tak, ponieważ zmienne DataItem i DataItems są zmiennymi pre-definiowanymi w Impact i nie ma możliwości ich aktualizowania inaczej, niż poprzez ponowne wywołanie zapytania w DirectSQL. Cóż zatem uczynić? Ano można utworzyć kopię obiektu DataItem, załóżmy że poprzez taką oto funkcję:

function ConvertToReadWrite(AnyDataItem) {
ReturnedDataItem = NewObject();
fields = keys(AnyDataItem);
count = 0;
while (count < length(fields)) {
ReturnedDataItem[fields[count]] = AnyDataItem[fields[count]];
count = count +1;
AnyDataItem = ReturnedDataItem;

Powyższa funkcja pobiera tylko 1 argument i jest nim kopia obiektu DataItem (lub DataItems[i]). Jest to ważne z powodu późniejszej aktualizacji tej zmiennej przy zwracaniu jej nowej wartości przez funkcję, a pamiętamy, że DataItem ani DataItems nie można aktualizować. Najistotniejsza część powyższego przykładu zawiera się w pętli while. Pole po polu, obiekt wejściowy, tu nazwany AnyDataItem, który w tym wypadku został potraktowany jak tablica, jest kopiowany do nowego obiektu, który będzie można już edytować. Na koniec, obiekt wejściowy, który stanie się dostępny z zewnątrz funkcji jako wartość zwrócona, zostaje nadpisany przez nowy obiekt.

Na koniec wpisu prezentuję przykład użycia powyższej funkcji, jest raczej oczywisty:

DirectSQL(“NCOMS”, “select Node from alerts.status”, false);
MyItem = DataItem;
log(“See this: “+MyItem.Node);
MyItem.Node = “Krakow”;
log(“and this: “+MyItem.Node);

Życzę udanego skryptowania i czekam na ciekawe przykłady oraz oczywiście pytania!

Energy Management

Sunday, September 13th, 2009

W poprzednim wpisie pisałem o tym, że w TBSM 4.2.1 został udostępniony pakiet integracyjny Energy Management Dashboards. Jest to pakiet zawierający definicje modelu usług, szablonu nawigatora oraz instrukcji dotyczących łączenia TBSM z funkcjonalnością pakietów ITM for Energy Management (ITMfEM) oraz dodatkiem do ITMfEM – Reporting & Optimization.

Czym jest Energy Management Dashboards w TBSM? Funkcjonalność pakietu sprowadza się do skonfigurowania strony TIP, która gromadzi w sposób mash-up następujące dane:
– wykres wydajności infrastruktury Data Center, mierzonej w %
– wykres obciążenia systemów chłodzenia, mierzonego w tonach
– wykres pojemności urządzeń podtrzymywania napięcia UPS, w zakresie do 80%, 80-90% i powyżej 90%, per urządzenie
– portlet typu szablon nawigacyjny (tree template) dla modelu usług kategorii urządzeń (np. Computing, Cooling, Power, Metering itp) do powiązania z urządzeniami zgłoszonymi przez xmltoolkit
– standardowy trójzakładkowy portlet typu Szczegóły usługi (Service details)

Aby tablica (dashboard) zadziałała, należy zasilić ją danymi. Podstawowe dane pomiarowe są wyciągane z hurtowni danych TDW, która w tym wypadku jest zasilana danymi zebranymi przez agentów ITM z pakietu Energy Management (kod ke9). Zdarzenia standardowo są przekierowywane z sytuacji ITM przez sondę EIF do serwera ObjectServer w OMNIbusie. Model może być zbudowany z modelu usług wykrytego przez  TADDM lub z książki IDML poprzez adapter DLA. Aby zadziałały wykresy, należy zainstalować pakiet ITMfEM – Reporting & Optimization, którego są częścią. Wraz z instalacją pakietu ITMfEM-R&O dostaniemy też nowe raporty BIRT w TCR.

Jaka jest wartość tablicy Energy Management? Ostatnio bardzo popularnym, ale i mającym realne znaczenie ekonomiczne tematem, jest zarządzanie zużyciem energii, kontrolowanie pracy urządzeń oraz poszukiwanie oszczędności w obliczu rosnących kosztów energii oraz zwiększanej dbałości o ochronę środowiska naturalnego. Szablon nawigacyjny (tree template), prócz modelu usług i urządzeń związanych z energią zawiera dwie dodatkowe kolumny – zapotrzebowanie na energię (Power demand [kW]) oraz bieżąca temperatura (Temperature [C]). Możemy więc na bieżąco śledzić konsumpcję mocy oraz wydzielane ciepło urządzeń pracujących w serwerowni. Przy odrobinie wyobraźni i dodatkowej pracy można również dodać przelicznik kW / PLN, a na podstawie zdarzeń wygenerowanych przez TBSM przesłać sygnał do urządzeń równoważących obciążenie systemów.

Słowem – bardzo obiecujący pakiet. Myślę, że możemy spodziewać się kolejnych pomysłów na tablice, z dziedziny zarządzania aktywami (assets), bezpieczeństwem (security), jakością (service level) lub finansów (financial), być może autorstwa IBM, a być może partnerów działających w Tivoli OPAL.

TBSM 4.2.1 ogólnie dostępny

Tuesday, September 1st, 2009

W piątek 21 sierpnia br. została udostępniona finalna wersja Tivoli Business Service Manager oznaczona numerem 4.2.1. Nowe wydanie w stosunku do poprzedniego 4.2 oferuje całkiem sporo nowych ciekawych możliwości. Oto najważniejsze z nich:

  • poprawiona wydajność i wsparcie przeglądarek FF 3.x i IE 7.x
  • ulepszony interfejs użytkownika – więcej możliwości konfigurowania portletów, niezależne konfigurowanie instancji portletu Service Viewer i Service Editor, nowe wskaźniki, odnowiony portlet Service Navigator
  • usprawnienia agenta ITM – monitorowanie Discovery toolkita i modułu Process Control
  • wbudowany ITMWebService, który pojawił się w fixpacku do wydania 4.2.0.
  • usprawnienia pakietu Discovery toolkit – jednoczesne nasłuchiwanie TADDM i IDML
  • usprawnienia w zakresie szyfrowania komunikacji pomiędzy komponentami TBSM
  • nowość! wsparcie dla modułu ITM for Energy Management – Reporting & Optimization – teraz pulpit do zarządzania zużyciem energii i monitorowania kosztów energii urządzeń IT
  • nowość! nowy moduł – Time Window Analyzer – do analizy porównawczej wydajności usług oraz krótkoterminowej analizy trendu zmian wartości pomiarów
  • nowość! możliwość upgrade’u z wersji 4.2.0 – do tej pory możliwa była tylko migracja z wersji poprzedniej do następnej
  • moim zdaniem lepsza dokumentacja – lepiej udokumentowane niektóre ustawienia i przykłady

To tyle z głównych zmian. Najbardziej interesująco dla mnie prezentują się oczywiście nowe funkcjonalności, a więc wsparcie dla ITM4EMRO oraz TWA. Rozpoznanie w toku.

Czego potrzebuję do zarządzania moją infrastrukturą IT?

Monday, August 31st, 2009

Ostatni weekend sierpnia 2009, dość gorąca niedziela i odchodzący powoli do historii letni sezon – w domu, w pracy, w biznesie. Czas powrotu z pięknych plaż, urokliwych gór, działki, namiotu i przyjemnego spowolnienia i rozluźnienia. Czas podsumowań i oglądania zdjęć, pojawiania się z urlopu kolegów z pracy, przyjaciół, kontrahentów. Czas powrotu do koncentracji na projektach, sprawach, kontraktach, wdrożeniach. Czas podsumowania: to na czym stanęliśmy w projekcie?

W branży IT jak zwykle ciekawie. Niedługo pojawi się w sprzedaży nowy Windows 7, Google planuje wypuszczenie swojej wersji systemu operacyjnego Chrome OS, Intel pracuje nad rewolucyjnym procesorem graficznym Larabee, mającym odebrać część rynku Nvidii i ATI. Z mojego podwórka – IBM nadal rozwija swe głowne aktualnie idee Smarter Planet oraz Cloud Computing, wpisując się w ogólnorynkowy trend mający na celu tworzenie rozwiązań IT, które zaspokoją potrzeby biznesowe z jednej strony i oszczędzą środowisko naturalne z drugiej. To na razie tyle w świecie, pozostaje grom tematów wewnętrznych: modernizacja serwerowni, rozbudowa data center, zarządzanie energią i redukcja jej zużycia, rozwiązanie problemów wydajnościowych naszych aplikacji i usług, dokończenie wdrożeń, spotkania, spotkania, spotkania…

Biznes IT, jak cały świat, ulega ciągłej komplikacji. Ponieważ aplikacji, serwerów aplikacji, typów baz danych, sposobów komunikacji oraz platform uruchomieniowych jest obecnie bez liku, przed dyrektorami d/s IT stoi odwieczny problem: jak to wszystko zliczyć, podliczyć, ogarnąć, zmierzyć, połączyć, rozłączyć i pokazać na wykresie szefowi, że mamy najlepszy sprzęt i soft na świecie? Dla osób ciągle pozostających w kontakcie z nowymi technologiami oraz trendami nie ma z odpowiedzeniem na te pytania najmniejszego problemu, zdarza się jednak, że klocków IT zaczyna być zbyt wiele. Chciałbym tym wpisem spróbować podsumować i stworzyć wyobrażenie odpowiedniej strategii zarządzania infrastrukturą IT, niezależnie od brandów, firm programistycznych oraz polityki. Taka strategia, która może nie od razu kompletnie, ale w końcu zawsze będzie wdrażana za każdym razem, gdy mamy na celu stworzenie sprawnego multisystemu komputerowego. Specjalnie używam słowa multisystem na określenie systemu systemów, czyli razem wszystkiego co mamy. W terminologii BSM nazwałbym to super usługą i umiejscowiłbym ją na samym szczycie hierarchii i nazwał właśnie: IT, wszystko, multisystem.

A więc cóż mamy w serwerowni: routery, switche, UNIXy, Windowsy, bazy Oracle, DB2, serwer pocztowy, DHCP, domeny, LDAP, Tomcaty, Apache, JBossy, stuff z HP, BMC, IBM Tivoli, jakieś MySQL i dziesiątki usług WebService, setki serwerów, tysiące stacji roboczych itp., itd. O, ktoś włączył jeszcze jednego LPARa na AIX. Dużo tego. Przyda się z pewnością jeszcze jeden rodzaj oprogramowania, tym razem żeby ogarnąć to wszystko i wiedzieć co mamy: wykrywanie elementów sieciowych i aplikacji. W Tivoli do tego celu, mając do dyspozycji różne funkcje, można użyć trzech programów: ITNM (Network Manager, dawniej Netcool Precision), TADDM (Tivoli Application Dependency Discovery Manager) oraz Netcool Proviso.

Powiedzmy, że wszystko jest wykryte, znamy wszystkie MIBy, IP, porty itp. Można zeskładować te informacje w bazie danych konfiguracji, zwanej potocznie CMDB (Configuration Management Data Base). Można również pokusić się o zarządzanie sprzętem – przypisywanie odpowiedzialności itp., z ang. Asset Management oraz zmianą, aby dopilnować by tylko zatwierdzone do użytku maszyny i aplikacje miały wstęp do firmowej sieci. W Tivoli służy do tego obecnie platforma Maximo i CCMDB. W bazie konfiguracji możemy również przechowywać katalog usług, SLA, zdarzeń – słowem wszystkiego co może pojawić się w sieci, co chcemy monitorować, w jakich zakresach, pod groźbą jak wysokich kar finansowych, cokolwiek zostało zdefiniowane w ITIL, a nawet więcej.

Skoro już wiemy co mamy, należałoby to obmonitorować. Obecnie tendencje są dwie: przy użyciu agentów (oprogramowanie do zainstalowania na zdalnej maszynie) lub bezagentowo (probowanie zdanej maszyny bez instalowania na niej czegokolwiek dodatkowo). Niektórych rzeczy nie da się zrobić bezagentowo, np. ze względu na politykę bezpieczeństwa w firmie. Niemniej wachlarz możliwości jest spory, w Tivoli: ITM for Applications i for Transactions, ITCAM oraz monitorowanie zdarzeń Netcool OMNIbus. Na osobną uwagę zasługuje monitorowanie zużycia energii: ITM for Energy Management. Oczywiście wszystkie dane pomiarowe należy gdzieś przechować, zsumaryzować, skonfrontować z progami katalogowymi, wszcząć alarm, jeśli progi zostaną przekroczone oraz opisać w raporcie. Do tego celu przyda się szybka hurtownia danych, katalog SLA, QLA i KPI bądź KQI, system do korelacji, eskalacji i wizualizacji zdarzeń oraz dobry system raportowy. Tivoli dostarcza takie narzędzia, np. Netcool Impact, Webtop, TBSM i TCR. Analizę biznesową danych umożliwia pakiet Cognos a zarządzanie jakością: TSLA, TNSQM i Maximo SLA Manager.

Na koniec, mając już raport na temat kiepskich czasów odpowiedzi, ilości transakcji, długości kolejek i temperatur w serwerowni, a w związku z tym uszczerbku jakości naszych usług można spokojnie przystąpić do poprawy sytuacji, czyli… otworzyć zgłoszenie serwisowe (Tivoli Service Request Manager) i otrzymać bilecik (ticket). I upewnić się, że wszystkie zmiany, resety i awarie przebiegną obsłużone automatycznie (Tivoli Systems Automation). I to już wszystko – mniej więcej. Bo oczywiście sprawę można skompikować jeszcze bardziej. Np. a czy oprogramowanie do zarządzania moją infrastrukturą jest wydajne? Może by je obmonitorować? Uff…

Tak jak napisałem we wstępie: jest czas na powrót do spraw sprzed wakacji. Mimo, iż lista oprogramowania do monitorowania i zarządzania infrastrukturą IT jest długa i sprawa wygląda na skomplikowaną, prawidłowe rozpoznanie wszystkiego w środowisku IT i zarządzanie tą wiedzą jest obecnie kluczowym czynnikiem sukcesu działu informatycznego, a więc i całej firmy, poprzez redukcję kosztów działu, zakupów, zwiększenie wykorzystania wolnych zasobów, podniesienie bezpieczeństwa, uzyskanie wartości dodanej z integracji i opanowanie wciąż bytujących tu i ówdzie “białych plam” na mapie naszego systemu informatycznego. Ale najważniejsze – moim zdaniem – na początek to by sobie wyobrazić proces zarządzania IT jako całość, która nie kończy się tylko na zintegrowaniu dwóch-trzech systemów i zaprezentowaniu jakichkolwiek raportów. Chodzi o to, by zbudować spójne rozwiązanie o szerokich możliwościach, począwszy od stwierdzenia stanu faktycznego infrastruktury, przez rozpoznanie wąskich gardeł wydajności, na pełnym raportowaniu i zarządzaniu jakością skończywszy. I także aby takie rozwiązania projektować od samego początku wdrożeń, doskonale rozumiejąc miejsce i rolę każdego z elementów, do której został powołany. Tylko wtedy uda uzyskać się działający kompleksowo, zgodnie z oczekiwaniami i przyszłościowy multisystem zarządczy IT. Nawet jeśli nie obejdzie się bez godzin spotkań, konsultacji, korekt i telefonów do serwisu – efekt powinien zadowolić każdego, i firmę i klientów.