El. obchod/podnikání - prostředky (tj. kategorie prostředků a příklady produktů a jejich využívání u konkrétních Web-sitů) serveru pro sběr a analýzu dat o aktivitách zákazníka na serveru a pro personalizaci na serveru (personalizace prezentace, produktů, služeb). Důvody využívání těchto prostředků. Otázky soukromí. Co se dozví server z prohlížeče a odjinud.
Nedělám si žádné ambice na její přesnost a úplnost, za reakce (xhlaj10@vse.cz)
předem děkuji.
Můžete si ji také stáhnout zazipovanou
(asi 210KB) ve Wordu.
Zde je HTML verze (generováno z MS Wordu):
Vypracoval: Jindřich Hlaváč
Rodné číslo:
E-mail: xhlaj10@vse.cz
Hlavní specializace: Informační technologie
Datum: 12. dubna 2000
2.1.2
Provoz internetových obchodů
2.2
Podporovaný sběr dat zákazníkem
2.3
Sběr dat nepodporovaný zákazníkem
2.4
Logovací soubor webserverů
3.1
Metody měření návštěvnosti webserverů
3.3
Externí statistické servery
Příklady
statistických serverů v ČR:
1)
Příklad ze serveru typu Apache:
2)
Příklad ze serveru MS Internet Information Server 4.0:
·při získávání informací,
·při publikování informací.
Je efektivní, protože je ve všech těchto bodech rychlý a levný. Nastala ale doba, abychom přidali, že jde také o
·prodejní a marketingový kanál.
Moderním technologiím spjatým s internetem se otevřel svět a vznikl dokonce nový termín – New Economy, který má vyjádřit, že internet načal celou novou oblast pro podnikání.
Internetové obchody byly u nás v provozu již v roce 1998 (Zoner InShop). Proč tedy nastává takový boom okolo internetu právě nyní? Jak souvisí tento fakt s rozvojem sítí, mobilních technologií, ale i přístupem lidí k internetu a jeho marketingovým využitím? Jak je možné, že se vyplatí internetová reklama? Jak její zadavatel pozná, že nevyhodí peníze do vzduchu? Existuje nějaká objektivní možnost posuzovat návštěvnost webových serverů?
To vše spolu souvisí a já se pokusím zodpovědět zejména na otázku poslední.
Zadruhé – klesající nároky na připojení. Přestože jsou vzhledem k zahraničí stále vysoké, stav se lepší. Počítač vlastní téměř každá firma a pro domácnosti se stává spotřebičem jako třeba televize. Modem bývá často v ceně sestavy a ani koupě nového není závratnou investicí. Za největší úspěch ale považuji zlevnění telekomunikačních poplatků (tarify Internet 99 a 2000) a vstup na trh podnikatelských subjektů, které nabízejí připojení zdarma (v současnosti Czech On Line (Volný), World Online (World Business Starter) a Contactel (Internet RazDva).
Zatřetí – uvědomění si internetu jako podstatného obchodního a marketingového kanálu (viz dále).
Internetové obchody tedy vydělávají. Zajímavé je, co Češi kupují. Nejvíce domácí spotřebiče (24,4% obratu), knihy (21,9%), hudbu (14,3%), elektroniku (12,8%), video (9,3%) a SW & HW. Překvapující je podíl „bílé techniky“, která se v amerických obchodech zdaleka tak neprodává. Kdo si chce nákup přes internet vyzkoušet, může navštívit některý z uvedených na serveru Set (www.set.cz).
Zřízení takového obchodu není již doménou jen velkých firem, ale může to udělat každý a zdarma. A to ve dvou největších obchodech – Zoner InShop (http://www.inshop.cz/) nebo Vltava 2000 (www.vltava2000.cz).
E-business je jakoby o krůček dále. Jde o elektronické (internetové) podnikání. V tomto smyslu lze rozlišit dvě podskupiny. B2C (business to customer), tedy obchod s koncovými zákazníky a B2B (business to business), tedy obchod mezi firmami. Kromě virtuálních obchodů se již zde nabízí zákazníkům elektronické bankovnictví, pojišťovnictví atd. Stále významnější je právě B2B, přičemž už dnes na světě převyšuje tato oblast desetinásobně oblast obchodování s koncovými zákazníky a v příštích 5 letech se očekává meziroční nárůst 41%(dle Yankee Group)! Do této oblasti se zahrnuje agregace kupní síly firem, aukce, poskytovatelé řešení a zejména elektronické trhy (electronic marketplaces). Jde o webové portály, které k sobě přivádí kupce a prodejce v určitém průmyslovém odvětví (tzv. vertikální specializace) nebo v určité geografické lokalitě (tzv. horizontální specializace). Tyto elektronické trhy se napojují na informační systémy zainteresovaných společností, proto je to atraktivní oblast pro výrobce ERP softwaru a EDI řešení.
M-business je elektronický obchod realizovaný pomocí mobilního telefonu. Mobilní telefony jsou stále „chytřejší“ a dostupnější. Kromě nové technologie WAP, která přinesla na displeje telefonů (stručné) webové stránky, lze např. ovládat své bankovní konto (Peagas). Někteří vizionáři tvrdí, že celý e-business přesune v budoucnosti své těžiště právě na mobilní telefony.
Trendy ohledně e-businessu: postupné rozšiřování různých obchodních aktivit na internet, přičemž má budoucnost zejména vícekanálový prodej a marketing (neuvažuje se tedy o totálním konci „kamenných obchodů“), stále větší význam obchodu mezi firmami, tj. odběrateli a dodavateli, nabízení celých řešení přes a pomocí internetu a výrazný růst významu mobilních technologií.
Použité
zdroje k této kapitole : Computer 11/99, 22/99 a 6/2000, Chip 4/2000, PC
World 2/2000, PC Magazine 2/1999, HN 7.4.2000
Přímý a agresivní kanál, který může hraničit se spammingem (zasílání nevyžádaných e-mailů). Lze ale dobře zacílit skupinu potenciálních zákazníků, např. adresy z různých konferencí. Reklamní e-maily musí často překousnout i ti, kteří využívají některé ze služeb internetu, které jsou zadarmo (e-mail, webhosting…).
Kdo tyto reklamní e-maily dobrovolně přijímá, může na tom něco vydělat. Např. v ČR nyní existuje služba CashMail (www.cashmail.cz), která vám dá určitý malý peníz za každý přijatý, přečtený a „odkliknutý“ e-mail.
b)reklamní bannery
Reklamní bannery jsou často hlavním zdrojem příjmů provozovatelů webových serverů. Tyto reklamní plochy se prodávají a za kolik, to závisí na jejich umístění. Zadavatele reklamy zase zajímá, kolik lidí banner uvidí (a případně na něj klikne). Proto se monitoruje návštěvnost webových serverů. A právě o tom, jak se tento monitoring provádí, je tato práce.
c)začínají se objevovat tzv. rich media banners,
tedy reklamní proužky obsahující formuláře, programy v Javě či Shockwave. Ty umožňují například vyplnit rovnou v banneru objednávku.
d)Samotné webové prezentace jsou velkou reklamní plochou příslušných firem.
Použité
zdroje k této kapitole : PC World 2/2000, PC Magazine 10/98, Computer 6/2000,
MF DNES 28.1.2000
K měření těchto veličin existují tři metody:
a)speciální statistický software přímo na WWW serveru,
b)zpětná analýza log souboru,
c)měření pomocí externích statistických serverů.
Zde je přehledný obrázek rozdělení těchto metod. V následující části práce bude tento nákres (slovně) upřesněn a vysvětlen.
Zdroj:
Chip 10/99 (str. 126)
Speciální statistický software přímo na WWW serveru vychází z log souboru. Je výhodný pro provozovatele WWW serveru, protože může průběžně sledovat návštěvnost serveru a vyhodnocovat počet zhlédnutých stránek. Nevýhodou jsou počáteční náklady spojené s nákupem SW a také to, že naměřené hodnoty nelze zcela srovnávat s ostatními WWW servery a to především díky nejednotné metodice – všichni provozovatelé zřejmě nepoužívají stejný SW.
Ad b)
Zpětnou analýza log souboru na rozdíl od případu a), kde si analýzu dělá každý sám, provádí v tomto případě externí auditor. Probíhá to asi tak, že jednou za měsíc se log soubor stáhne ze serveru a dopraví externí firmě (ať už po internetu nebo vypálený na CD-ROM). Ta provádí analýzu log souboru pro více firem, ale vždy podle stejné metodiky, takže výsledky jsou vzájemně porovnatelné, což je velice důležité pro zadavatele reklamy, kteří obvykle požadují audit provedený nezávislou třetí stranou. Jednotná metodika zaručuje poměrně přesné údaje, které mohou, ale nemusí být veřejně přístupné. Nevýhodou je poměrná nákladnost této služby (cca 5000 Kč za měsíc) a pouze zpětné vyhodnocování návštěvnosti.
A proč vždy říkám „poměrně přesné“ výsledky? Jde o to, jak je log soubor tvořen. Přístupy na stránky můžou vést přes různé brány, firewally a proxy servery. Všechny tyto objekty (zejména tzv. transparentní proxy-servery) zkreslují výsledky už při samotném zápisu do log souboru.
V České republice tyto analýzy provádí firma DCCI Audit (www.dcci.cz) pro více než 90 serverů českého internetu.
Ze zahraničních jmenujme aspoň: BPA International (www.bpai.com/interactive/index.html), Media Metrix (http://www.mediametrix.com/), Nielsen/NetRatings(http://www.nielsen-netratings.com/), PCData (http://www.pcdataonline.com/).
Jaké programy pro analýzu log souboru můžeme použít, rozhodneme-li se udělat si ji sami?
Enterprise Edition – analýza návštěvnosti webserveru, od jednoho po multiserverové clustery.
Personal Edition – základní analýza provozu pro malé webservery, zdarma výměnou za reklamu na WebTrends na stránkách.
Zde je tabulka z doplňkovými informacemi. Nevyplněná pole jsou údaje, které se nepodařilo zjistit. Rychlost analýzy logu záleží velmi na okolnostech, viz popisy jednotlivých produktů.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Webalizer
|
|
HTML
|
2,67MB/s
|
CLOG
|
ANO
|
C
|
zdarma
|
censored
|
|
|
|
|
|
|
Combined
Logfile
|
|
|
|
|
|
|
|
|
|
wu-ftpd
xferlog
|
|
|
|
|
AccessWatch
|
|
|
0,33MB/s
|
|
|
perl
|
shareware
|
censored
|
|
|
|
|
|
|
|
|
|
provider
$400
|
|
|
|
|
|
|
|
|
|
sigle
$40
|
|
|
|
|
|
|
|
|
|
academic
$30
|
|
NetTracker
|
|
http://www.sane.com/products/NetTracker |
|
|
|
|
profi
$495
|
pollution.org
|
|
|
|
|
|
|
|
|
|
|
|
WebTrends
Pro Suite
|
|
HTML
|
|
Apache
|
|
|
20
650 Kč
|
|
|
|
|
|
Excel
|
|
MS
IIS
|
|
|
|
|
|
|
|
Word
|
|
Netscape
|
|
|
|
|
|
|
|
text
|
|
Lotus
Domino
|
|
|
|
|
|
|
|
|
|
CLOG
|
|
|
|
|
Funnel
Web Proffesional
|
|
HTML
|
0,04MB/s
|
|
|
|
standard
$249
|
|
|
|
|
|
RTF
|
|
|
|
|
$499
|
|
|
|
|
text
|
|
|
|
|
|
|
Zobrazení dalších informací záleží na tom, zda to zadavatel dovolil. Pak je možno zobrazit graf návštěvnosti podle hodin za den, graf návštěvnosti za posledních 100 dní, použité prohlížeče, operační systémy atd.
TopList (www.toplist.cz)
je službou mladší. Je také zdarma a má podobné portfolio služeb, ale jeho statistiky jsou poněkud nepřehledné.
Counter (www.counter.cz)
je nejmladší z předchozích. Je také zdarma, nabídku služeb má stejnou, grafické provedení strohé, ale přehledné.
Monitor (www.monitor.cz)
je službou placenou. Graficky jsou stránky pěkné, ale poněkud zastaralé, např. ceník je z října roku 1998. Není tedy poznat, zda server ještě funguje a jaké jiné služby vlastně nabízí. Nebo funguje tak dobře, že není cokoliv třeba měnit. Ani ceny.
Ze zahraničních jmenujme aspoň: Media Metrix (http://www.mediametrix.com/), PCData (http://www.pcdataonline.com/) a HitBox (http://www.hitbox.com/).
Použité
zdroje k této kapitole : Chip 4/99, 5/99 a 10/99.
Připravuje se zákon nový o ochraně osobních údajů. Ten by měl uzákonit tyto zásady:
·shromažďovat osobní údaje lze jen se souhlasem těch, koho se týkají
·zpracovávané údaje by měly být pravdivé, přesné a úplné
·povinnost informovat občana, že o něm správce sítí shromažďuje a zpracovává údaje
·shromažďovat lze jen takové údaje, které jsou nezbytné k naplnění předem stanoveného účelu
·neuchovávat osobní údaje déle, než je nezbytně nutné pro stanovený účel
·chránit osobní údaje před neoprávněným přístupem, poškozením, zneužitím apod.
·výjimky z těchto zásad stanoví jen zákon
Pokud občan zjistí, že ten, kdo osobní údaje zpracovává, porušil povinnosti stanovené zákonem, bude mít právo požadovat, aby nepravosti odstranil. Smí také požadovat opravu osobních údajů, pokud zjistí, že nejsou správné nebo aktuální. Může se také domáhat zaplacení peněžité náhrady, pokud neoprávněným zpracováním jeho osobních dat bylo porušeno jeho právo na lidskou důstojnost, osobní čest či dobrou pověst.
Otázkou je, zda budou tato práva skutečně prosazována. Shromažďování osobních údajů za účelem jejich obchodního využití zřejmě jen tak nezmizí. Ani nemusí, pokud jejich shromažďováním neutrpí práva někoho jiného. Nesmí se ale stávat, že budou k dispozici takové údaje jako jsou čísla kreditních karet, výpisy z bankovních kont či zdravotní údaje.
Vrátím-li se ke sběru dat o uživateli webovými servery, jenutno zopakovat, že v současné době není technicky možné (u komutovaného připojení) zjistit konkrétního uživatele. Pokud tedy on sám nechce. Například kombinace registrace u obchodního domu a uložení cookie u zákazníka na harddisku člověka přesně identifikuje, i když se do systému nepřihlásí pomocí hesla. Pokud ale zmíněný dům údaje neposkytne dále, zákazník přesně ví, komu své údaje dal a co od toho může čekat. V tomto smyslu bude hrát velkou úlohu elektronický podpis, certifikační autority a jistě se potom významně rozšíří systémy zabezpečené komunikace po internetu.
Použité
zdroje k této kapitole : HN 17.3.2000.
3)Denní tisk, přednášky IT_563 a konzultace.
4)Klander Lars: Hacker Proof, Unis Brno, 1998.
"http://www.volny.cz/zemanj2/mujweb/logo.htm"
"Mozilla/4.0 (compatible;
MSIE
5.0; Windows 98; DigExt)" mail.nemtru.cz - - [06/Apr/2000:06:48:41
+0200]
"GET /img/ikonka.gif HTTP/1.1" 304 -
"http://www.tady.cz/doginzert/"
"Mozilla/4.0 (compatible; MSIE 5.0;
Windows
98; DigExt)" ppp28.na.worldonline.cz - - [06/Apr/2000:06:49:33
+0200]
"GET /img/ikonka.gif HTTP/1.0" 304 -
"http://www.pingpong.cz/tribune/tribune.htm"
"Mozilla/2.0 (compatible;
MSIE
3.01; Windows 95)" ostravaa-143.vol.cz - - [06/Apr/2000:06:50:03
+0200]
"GET /img/ikonka.gif HTTP/1.1" 200 3136
"http://privat.none.cz/katka/katka.htm"
"Mozilla/4.0 (compatible; MSIE
5.0;
Windows 95; DigExt; Seznam)" as1-51.uhrad.iol.cz - -
[06/Apr/2000:06:50:47
+0200] "GET /img/ikonka.gif HTTP/1.1" 304 –
http://www.vltava.cz/knihy/default.asp
09:36:01 127.0.0.1 GET
/knihy/kniha/detail.asp
200
Mozilla/4.0+(compatible;+MSIE+5.01;+Windows+98)
http://www.vltava.cz/knihy/kategorie/vypis.asp?id=82
09:36:01 127.0.0.1
GET
/citibank/Default.asp 200 Mozilla/4.7+[en]+(WinNT;+I) - 09:36:03
127.0.0.1
GET /images/jcb.gif 200
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+NT;+DigExt)
http://www.vltava.cz/objednat/default.asp
09:36:03 127.0.0.1 GET
/knihy/kategorie/left.gif
404
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+NT;+DigExt)
http://www.vltava.cz/knihy/kategorie/vypis.asp?ID=61&odd=135
09:36:03
127.0.0.1
GET /knihy/kategorie/right.gif 404
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+NT;+DigExt)
http://www.vltava.cz/knihy/kategorie/vypis.asp?ID=61&odd=135
09:36:04
127.0.0.1
GET /images/ccs.gif 200
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+NT;+DigExt)
http://www.vltava.cz/objednat/default.asp
09:36:04 127.0.0.1 GET
/images/set.gif
200 Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+NT;+DigExt)
http://www.vltava.cz/objednat/default.asp
09:36:05 127.0.0.1 GET
/Objednavky/detail.asp
200 Mozilla/4.05+[en]+(Win95;+I+;Nav)
http://www.vltava.cz/Objednavky/default.asp
09:36:05 127.0.0.1 GET
/knihy/images/registrace.gif
200
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+98;+DigExt)
http://www.vltava.cz/knihy/default.asp
09:36:05 127.0.0.1 GET /Default.asp
302
Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+95) - 09:36:05 127.0.0.1
GET
/knihy/default.asp 200 Mozilla/4.0+(compatible;+MSIE+5.0;+Windows+95)
-
09:36:07 127.0.0.1 GET /system/testzivosti.asp 200
Servers+Alive+build+475
-
This
dialog box allows you to specify how log files will be created and saved.
New
Log Time Period
Choose
the criterion that the software uses when starting a new file.
Note
For
the Daily, Weekly, or Monthly criteria for new log files, "midnight" is
defined in the time zone used by the chosen log format. This means that
for NCSA Common Log File Format (or for IIS only, ODBC Logging), "midnight"
is on local time; for Microsoft IIS Log Format and W3C Extended Log File
Format, "midnight" is on Greenwich Mean Time.
DailyLog
files created daily, starting with the first entry that occurs after midnight.
WeeklyLog
files created weekly, starting with the first entry that occurs as Sunday
begins (after midnight).
MonthlyLog
files created monthly, starting with the first entry that occurs as the
month begins (after midnight).
Unlimited
file sizeData is always appended
to the same log file. You can only access this log file after stopping
the server (that is, selecting the server and clicking the Stop button).
When
file size reaches A new log
file is created when the current log file reaches a given size; specify
the size you want.
Log
file directory
Type
the directory in which log files should be saved, or click Browse and locate
the directory.
A
filename is displayed beneath the Log file directory box; this name is
determined by the log file format and the criterion used for starting new
log files.
Extended
Logging Properties - Extended Properties Property Sheet
This
dialog box allows you to customize W3C Extended logging, by choosing the
fields (items) to be recorded in the log. You can gather detail using fields
important to you, while limiting log size by omitting unneeded fields.
The fields are as follows:
DateThe
date on which the activity occurred.
TimeThe
time the activity occurred.
Client
IP AddressThe IP address of the
client that accessed your server.
User
NameThe name of the user who accessed
your server.
Service
NameThe Internet service that was
running on the client computer.
Server
NameThe name of the server on which
the log entry was generated.
Server
IPThe IP address of the server on
which the log entry was generated.
Server
PortThe port number the client is
connected to.
MethodThe
action the client was trying to perform (for example, a GET command).
URI
StemThe resource accessed: for example,
an HTML page, a CGI program, or a script.
URI
QueryThe query, if any, the client
was trying to perform; that is, one or more search strings for which the
client was seeking a match.
Http
StatusThe status of the action,
in HTTP terms.
Win32
StatusThe status of the action,
in terms used by Windows NT.
Bytes
SentThe number of bytes sent by
the server.
Bytes
ReceivedThe number of bytes received
by the server.
Time
TakenThe length of time the action
took.
Protocol
VersionThe protocol (HTTP, FTP)
version used by the client. For HTTP this will be either HTTP 1.0 or HTTP
1.1.
User
AgentThe browser used on the client.
CookieThe
content of the cookie sent or received, if any.
ReferrerThe
site on which the user clicked on a link that brought the user to this
site.
Web
Site Properties - Web Site Property Sheet
On
this property sheet, you set the identification parameters for your Web
site. For a site IP address to be available on this tab, the TCP/IP setting
for the site must first be configured by using the Protocols property sheet
in the Windows NT Control Panel Network application. The host header name,
and the IP address are optional.
Web
Site Identification
Description
You
can type any name you want for the server name. This name appears in the
tree view of Internet Service Manager. Click the Advanced button to configure
host header names.
IP
Address
For
an address to appear in this box, it must have already been defined for
use on this computer in Control Panel. See your Windows NT documentation
for more information. If you do not assign a specific IP address, this
site responds to all IP addresses assigned to this computer and not assigned
to other sites, which makes this the default Web site.
TCP
Port
Determines
the port on which the service is running. The default is port 80. You can
change the port to any unique TCP port number; however, clients must know
in advance to request that port number, or their requests fail to connect
to your server. A port number is required and cannot be left blank.
Connections
Unlimited
Select
this option to allow an unlimited number of connections to occur simultaneously.
Limited
to
Select
this option to limit the maximum number of simultaneous connections to
the site. In the dialog box, type the maximum number of connections permitted.
Connection
Timeout
Sets
the length of time in seconds before the server disconnects an inactive
user. This ensures that all connections are closed if the HTTP protocol
fails to close a connection.
Enable
Logging
Select
this option to enable your Web site’s logging features, which can record
details about user activity and create logs in your choice of format. The
logs can tell you which users accessed your Web sites and what information
they accessed. After enabling logging, select a format in the Active log
format list. The formats are as follows:
Microsoft
IIS Log Format
A
fixed ASCII format.
NCSA
Common Log File Format
The
National Center for Supercomputing Applications (NCSA) common format; a
fixed ASCII format.
W3C
Extended Log File Format
A
customizable ASCII format, selected by default.
ODBC
Logging (Only Available with IIS)
A
fixed format logged to a database.
The
default format is W3C Extended Log File Format, with Time, Client IP Address,
Method, URI Stem, and HTTP Status selected. For more information about
W3C Extended Log File Format, in the property sheet, click Properties and
then click Help.
To
configure the criterion by which log files are created (for example, weekly,
or by file size), or to configure properties for W3C Extended logging or
ODBC logging, click Properties.