LINUXZONE






 >> Hlavní stránka

(408, poslední 22.11.2002)


 >> Administrace

(60, poslední 20.11.2002)


 >> Literatura

(18, poslední 19.11.2002)


 >> Bezpečnost

(48, poslední 18.11.2002)


 >> Programování

(97, poslední 22.11.2002)


 >> Distribuce

(19, poslední 14.11.2002)


 >> Síťování

(32, poslední 19.11.2002)


 >> Lokalizace

(3, poslední 25.06.2002)


 >> Aplikace

(65, poslední 12.11.2002)


 >> Multimedia

(11, poslední 07.10.2002)


 >> Hardware

(28, poslední 13.11.2002)


 >> Začínáme

(105, poslední 22.11.2002)


 >> Aktuálně

(98, poslední 21.11.2002)


 >> Jinde vyšlo

přehled ostatních serverů



 Přihlášení




Login:
Heslo:
 uložit v prohlížeči


Nejste-li ješte zaregistrováni, můžete tak učinit zde.





 Vyhledávání




Hledaný výraz:
v klíčových slovech
v titulku
v anotaci
v textu








 Reklama









 Servis




*   Vaše náměty a připomínky
Máte k Linuxzone.cz nějaké připomínky nebo náměty? Našli jste na stránkách chybu? Dejte nám o tom vědět pomocí formuláře nebo v diskuzi.
Komentářů: 19
*   Podpořte Linuxzone.cz
Chcete podpořit náš server umístěním odkazu nebo zveřejněním backendu? Zde najdete vše potřebné.
*   Pište pro Linuxzone.cz
Máte zájem podílet se na obsahu Linuxzone.cz ať už jako redaktoři nebo i jinak? Dejte nám o sobě vědět!





 SOUTĚŽ: listopadová soutěž




*   V pátém kole soutěžíme opět o dvě knihy: tou první je "Rozumíme Unixu" (autorem je Jon Lasser) a tou druhou je titul "Hardware pro úplné začátečníky" (autorem je Pavel Roubal). Ceny do soutěže věnovalo již tradičně nakladatelství Computer Press.

15) K čemu slouží soubor modules.dep?
  obsahuje seznam jaderných modulů a jejich závislosti
  obsahuje seznam modulů jádra s parametry, které mají být modulu při natažení předány
  obsahuje seznam dostupných modulů pro PAM (Pluggable Authentication Modules) a jejich výchozí nastavení

Momentálně nejste přihlášen. Buď se přihlašte nebo zde jednorázově vyplňte Váš login nebo email a heslo.
Login:
Heslo:
 







 Aktuálně z bezpečnosti




-- 
21.11.2002, 23:58
Opravené balíčky fetchmailu jsou k dispozici pro Open Linux (SCO). Opravy řeší již starší chybu týkající se mutlidrop režimu. Více informací na linuxsecurity.com. (lz)

-- 
21.11.2002, 23:53
SCO vydalo opravené balíčky tcpdump pro svůj Open Linux. Detaily na linuxsecurity.com. (lz)

-- 
21.11.2002, 23:48
Nové balíčky Samby pro SuSE Linux odstraňují potenciálně závažný problém v PAM modulu pam_smbpass. Díky přetečení bufferu je možné lokálně (ale zřejmě i zvenčí) způsobit pád smbd a vyvolat tak DoS, v horším případě i získat přístup k serveru. Další informace na linuxsecurity.com. (lz)

-- 
19.11.2002, 23:15
Mandrakesoft vydal opravené balíčky ypserv, které odstraňují memory leak (možnost vyvolání DoS). Detaily na linuxsecurity.com. (lz)

-- 
19.11.2002, 23:12
Nové balíčky mhonarc (mail -> html konvertor) jsou k dispozici pro Debian. Opravené balíčky odstraňují chybu umožňující cross site scripting. Více na linuxsecurity.com. (lz)

další >>





 Aktuálně o software




-- 
21.11.2002, 11:11
Dôvody dominancie RedHatu na poli linuxu dnes rozoberá newsfactor.com. (Milan Gigel)

-- 
21.11.2002, 11:09
Svetlo sveta uzrel sqlDESKTOP 1.0, vynikajúci prostriedok pre efektívnu organizáciu dát na pracovnej ploche. Viac prináša desktoplinux.com. (Milan Gigel)

-- 
21.11.2002, 11:01
UnitedLinux predstavuje prvé plody svojej práce. Viac prináša vnunet.com. (Milan Gigel)

-- 
19.11.2002, 9:33
UnitedLinux debutuje na COMDEXE 2002 s plným uvedením. Viac prináša zdnet.com.com. (Milan Gigel)

-- 
19.11.2002, 9:30
LindowsOS 3.0 pomaly začína valcovať trh s novými PC. Viac prináša news.com.com. (Milan Gigel)

další >>





 Aktuálně z IT




-- 
21.11.2002, 11:06
Spoločnosť SuSE rozširuje svoj partnerský backend aj na americký kontinent. Viac prináša zdnet.com.com. (Milan Gigel)

-- 
21.11.2002, 11:04
Vynikajúce vlastnosti nového PDA Zaurus od Sharpu podporujúceho Linux dnes rozoberá zdnet.co.uk. (Milan Gigel)

-- 
21.11.2002, 11:02
O úspechu Lindowsu zaznamenanom vo Wallmarte sa dnes dočítate na osopinion.com. (Milan Gigel)

-- 
19.11.2002, 9:43
Rozhovor s Klausom Knopperom, vývojárom Knoppixu dnes prináša distrowatch.com. (Milan Gigel)

-- 
19.11.2002, 9:42
Jednoduchosť inštalačného procesu Xandrosu 1.0 dnes približuje linuxworld.com. (Milan Gigel)

další >>





 Nejčtenější články




-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (1)

-- 
Překládáme jádro

-- 
ICQ v Linuxu - SIM

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (2)

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (3)

-- 
Lout - alternativa TeXu

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (4)

-- 
Lonix - LIVE distribúcia nielen pre študentov a experimentátorov

-- 
Zveřejňování chyb, etika, ISS a ISC: kauza pokračuje (BIND)

-- 
BASH & jak se v něm neztratit






 Nejlepší články




-- 
Phillip Rhoades nielen o clusteri zo starých laptopov

-- 
BASH & jak se v něm neztratit

-- 
Efektívne zálohovanie na CD pre každého

-- 
Překládáme jádro

-- 
Internet Protokol verze 6

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (6)

-- 
Free software, Open Source, FSF, OSI, RMS, ESR, GPL, LGPL ... Zmatek?

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (7)

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (5)

-- 
Jak to chodí v jádře aneb napište si vlastní ovladač (1)






 Anketa




Jaký je váš oblíbený správce oken (window manager)?

twm (3%)

fvwm (a jeho klony) (6%)

mwm (0%)

Afterstep (1%)

Window Maker (22%)

Enlightement (7%)

IceWM (4%)

Sawfish / GNOME (19%)

KWin / KDE (21%)

jiný (14%)

X Window System nevedu (3%)







Linuxzone.cz - server o Linuxu pro programátory, administrátory a fanoušky.
Provozuje společnost Impossible.
ISSN: 1213-8738





Analyzujeme logy II - webalizer

V minulej časti sme sa začali venovať širšej problematike analýzy logových súborov, kde sme začali hovoriť o analýze logov web serverov prostredníctvom nástroja awstats. Dnes budeme v tejto téme pokračovať a predstavíme si druhý najpopulárnejší nástroj pre túto činnosť a to webalizer.

Webalizer rovnako ako awstats je nástroj pre vyhodnotenie jednotlivých požiadaviek na webserver v časovom rade z pohľadu vecného, objemového a časového. Pre vizualizáciu sa na rozdiel od awstats používa grafická knižnica GD, nakoľko výsledné grafy sú generované natívne a nie formou vkladanej predpripravenej grafiky. Domovská stránka tohto projektu vo veľmi pokročilom a prepracovanom štádiu je k dispozícii na http://www.mrunix.net/webalizer ktorý patrí skutočne k jedným z najrýchlejších.

1. Predpríprava a inštalácia

Pre úspešnú kompiláciu je potrebné mať v systéme k dispozícii grafický engine GD a príslušné gdlib knižnice čo je na väčšine systémov bežnou záležitosťou, v prípade ich neexistencie je potreba previesť ich inštaláciu s podporou .png. Zdrojový kód webalizeru je k dispozícii na ftp://ftp.mrunix.net/pub/webalizer/webalizer-2.01-09.src.tgz v súčasnosti vo verzii 2.01 build 09, takže po stiahnutí sa môžeme pustiť k dekomprimácii.

tar xzvf webalizer-2.01-09.src.tgz
cd webalizer-2.01.-09

Pred kompiláciou samotnou je potreba rozhodnúť sa či použijeme niektorý z podporovaných jazykov použitím parametra --with-language, alebo či budeme podporovať resolvovanie IP adries z logov za pomoci parametra --enable-dns. Následne prevedieme kompiláciu a inštaláciu:

./configure --with-language=slovak --enable-dns
make
make install

Výsledkom inštalácie je binárka webalizer umiestnená typicky v adresári /usr/local/bin/ so symlinkom s názvom webasolver a predpripravená štruktúra konfiguračného súboru s názvom webalizer.conf.sample umiestnená v adresári /etc/.

2. Konfigurácia

Implicitné umiestnenie konfiguračných súborov sa predpokladá v adresári /etc. Už pri tvorbe názvov súborov treba myslieť na použitie webalizera s viacerými virtualhostami, takže názvy konfiguračných súborov budeme odvodzovať priamo od názvu hostu, napríklad webalizer.conf.www.mojweb.sk a rovnakým spôsobom budeme pristupovať pri tvorbe názvov dočasných archívov a podobne. Priblížme si teda základné voľby konfigurácie pre beh:

LogFile /home/httpd/www.mojweb.sk-80/logs/access_log
LogType clf

Prvým krokom je určenie umiestnenia logového súboru webservera a jeho typovú špecifikáciu, v našom a vo väčšine prípadov to bude log typu combined, čomu zodpovedá voľba clf

OutputDir /home/httpd/www.mojweb.sk-80/html/stat
HistoryName mojweb.hist
Incremental yes
IncrementalName webalizer.mojweb
HostName       mojweb.sk
HTMLExtension  htm

Nasleduje špecifikácia cieľového adresára, v ktorom bude generovaná celková štruktúra s príslušným indexom. HistoryName a IncrementalName slúži na špecifikáciu dátových súborov pre cachovanie dát z predchádzajúcich spracovaní pre možnosť práce v inkrementálnom móde, ktorý je vhodné na systémoch kde nerotujeme príslušné logy používať. Následne označíme príslušné HostName a implicitnú príponu pre html dokumenty.

PageType htm*
PageType cgi
PageType phtml
PageType php3
PageType php
PageType pl

DNSCache dns_cache.db
DNSChildren 0
UseHTTPS no

Nezabudneme vyšpecifikovať všetky prípony dokumentov a povoliť alebo zakázať používanie DNS resolvovania a zapnúť podporu pre vyhodnocovanie SSL prístupov.

HTMLPre <!DOCTYPE HTML PUBLIC "-//W3C//DTD \
  HTML 4.0 Transitional//EN">
HTMLHead <META http-equiv="Content-Type" content=\ 
  "text/html" charset=iso-8859-2>
HTMLPost <BR CLEAR="all">
HTMLTail <IMG SRC="msfree.png" ALT="100% Micro$oft\
   free!" >
HTMLEnd </BODY></HTML>

Následne je vhodné špecifikovať príslušné hlavičky z ktorých je vhodné nezabudnúť na nastavenie si príslušnej špecifikácie kódovej stránky pri použití podpory svojho jazyka pre správne zobrazovanie diakritiky.

GroupURL /cgi-bin/* CGI Scripts
GroupURL /icons/* Icons
GroupURL /images/* Images

Nasledujú definície jednotlivých skupín pre prehľadné členenie vo výsledku analýzy, kde si môžeme jednotlivé dokumenty rozdeliť v závislosti od názvu súborov do pracovných skupín. K dispozícii sú ešte ďalšie voľby, ktoré určujú ktoré časti analýzy sa majú vykonávať a ktoré nie s príslušným určením počtu zobrazovaných prvkov celkovej agregácie, pre ich jednoznačné pomenovania priamo definujúce ktorú časť výstupu ovplyvňujú ich nebudeme musieť rozoberať, každý intuitívne bude vedieť, k čomu príslušné voľby patia.

3. Vykonanie analýzy

Základná myšlienka spočíva v implementácii spracovania do cronu vo forme cyklickej úlohy, či už v hodinovom alebo dennom intervale, čo závisí na celkovej vyťažení výpočtového výkonu servera samotného a požiadavkách užívateľa na aktuálnosť výsledku analýzy. V každom prípade pri použití inkrementálneho spôsobu generovania pri vypnutom resolvovaní je možné vykonávať spracovanie aj v hodinových intervaloch.

Spracovanie dávky sa zadáva s príslušnou špecifikáciu konfigurácie pri zákaze výpisu diagnostických informácií vyplývajúcich zo spracovania, ktorú sme si v predchádzajúcom kroku pripravili príkazom:

webalizer -q -c /etc/ webalizer.conf.www.mojweb.sk

V prípade resolvovania je navyše potrebné špecifikovať názov DNS cache súboru s maximálnym počtom jednotlivých DNS procesov nasledovne:

webalizer -q -c /etc/ webalizer.conf.www.mojweb.sk \
     -D /var/cache/dnscache -N 10

Ostatné parametre, ktorých nie je málo sa venujú nastaveniu jednotlivých parametrov v prípade nepoužívania konfiguračného súboru, čo však nie je z pohľadu ich celkového počtu efektívne, preto je vhodnejšie zostať pri používaní konfigurácií.

4. Výstup

Teraz si zhruba priblížime výstup analýzy samotnej. Titulná strana pozostáva z dvoch častí. Prvou je grafický sumár prístupov za posledných 12 mesiacov s agregátnymi mesačnými hodnotami ako napríklad:

Nasleduje vyhodnotenie údajov z tohto časového obdobia priemermi a agregáciou s príslušnými linkami na jednotlivé mesačné analýzy s celkovým sumárom.

Mesačné štatistiky zvoleného mesiaca na úvod prinášajú informáciu sumárne za mesiac, jednotlivé priemery a maximálne hodnoty za kratšie časové úseky s finálnym vyhodnotením jednotlivých návratových kódov.

Nasleduje grafické stvárnenie mesačného priebehu z pohľadu jednotlivých súborov a ich hitov, prehľad jednotlivých samostatných návštev a objem prenesených dát.

Súčasťou je samozrejme aj graf rozloženia v časovom prehľade v rozsahu jednotlivých hodín dňa, ktorý nám prináša základnú informáciu o globále skupiny návštevníkov.

Z ďalších popri tabuľkovom stvárnení už graficky znázornených údajov je k dispozícii tabuľka najnavštevovanejších URL z hľadiska počtu zo stránky štandardne vo vyhotovení prvých 30, čo je však možné príslušným parametrom jednoducho zmeniť:

Rovnaké vyhodnotenie je k dispozícii aj z hľadiska vytvoreného trafficu s vyhodnotením celkovej agregátnej hodnoty vo zvolenom časovom období.

A nakoniec vyhodnotenie návštevnosti podľa jednotlivých štátov v závislosti na resolvovaní IP adries. V prípade, že chceme mať túto štatistiku k dispozícii je potrebné buď vykonávať resolvovanie webalizerom samotným, alebo pri tvorbe logov web serverom čisto pre informatívny charakter vykonávať ich resolvovanie priamo pri ich tvorbe pokiaľ to objem celkového trafficu povoľuje.

5. Záver

Týmto sme si priblížili druhý najpoužívanejší balík na komplexnú analýzu logových súborov webserverov, v ďalšej časti sa budeme venovať analýze logových súborov proxyserverov.

Další části seriálu:

Autor: Milan Gigel, 19. 04. 2002, 12:00
Sekce Administrace, Komentářů: 0
Průměrné hodnocení: 2,94

o Poslat e-mailem
o Tisk článku
o Uložit do profilu


 Přispějte nám




Líbil se Vám tento článek? Můžete ho ocenit zavoláním na tel. číslo 906 460 134.
Cena hovoru za 1 minutu je 46 Kč.





 Hodnocení článku




Článek hodnotím jako:  [1] výborný   [2] dobrý   [3] průměr   [4] špatný   [5] hrůza  





 Komentáře







PŘIDAT KOMENTÁŘ ZOBRAZ VŠE >>










2002 © Impossible, s.r.o.   >> Kontaktujte redakci >> Právní upozornění >> Reklama