Reklama na Internetu
Zjišťování návštěvnosti stránek
Transparentní cache
Referát z ledna roku 2000.

Obsah:

Reklama

Reklama na Internetu, stejně jako v jiných médiích, je blok informace, o níž je její zadavatel přesvědčen, že je potřebná a užitečná. Konzument reklamy má obvykle názor opačný. Reklama jej obtěžuje a sám o sobě ji většinou nevyhledává. Proto musí zadavatelé vymyslet pro každé médium způsob, jak konzumentovi reklamu vnutit, jak na ni upoutat jeho pozornost a jak zanést její obsah do jeho podvědomí. Nejinak je tomu i na Internetu. Existují zde v zásadě dva způsoby reklamy. Zároveň existují tři pohledy na věc - pohled zadavatele, pohled zprostředkovatele a pohled konzumenta, a proto si budu všímat u obou způsobů všech tří pohledů.

Aktivní šíření

Je prakticky ekvivalentní s šířením reklamy e-mailem a nazývá se spamming. Je to obdoba tzv. direct marketingu. Praktikuje se tak, že na porůznu sesbírané e-mailové adresy jsou posílány nevyžádané zprávy. Obvykle obsahují i nějaké URL nebo přílohu, kde je příslušná báječná nabídka rozvedena do podrobností.

Pohled zadavatele:

Pohled zprostředkovatele - šiřitele:

Pohled konzumenta:

Vůči spammingu panuje mezi uživateli Internetu od počátku značná nevole, a proto jsou vyvíjeny iniciativy na jeho potlačení. Není sice možné jej prostě zakázat, ale na jeho šiřitele je obecně pohlíženo jako na porušovatele slušného chování na Internetu (tzv. netiquette) a je na ně vyvíjen nejrůznější nátlak až po hrozbu fyzického odpojení nebo odfiltrování. Též na straně klientů existují různě propracované filtry, které třídí poštu podle odesílatele, výskytu klíčových slov v obsahu zprávy a možná i dalších způsobů. Myslím si, že bylo dosaženo stavu, že spamming není považován za "košer" a není proto využíván tolik, jak by odpovídalo jeho potenciálu z pohledu zadavatelů.

V posledním období se na Internetu objevilo několik služeb, zatím pouze zahraničních, které nabízejí placení zaregistrovaným členům za možnost zasílat jim reklamu e-mailem. Jde pochopitelně pouze o několik centů za "zkonzumovaný" kus. Informoval o tom např. Ondřej Bojar na serveru Lupa v článku s příhodným názvem "Nechte si platit za spam". Jak ovšem uvádí, nedošel mu ani jeden, ačkoliv se zaregistroval u všech tří služeb. Zde jsou odkazy:

  • SendMoreInfo
  • Totale -Mail
  • AllCommunity
  • Pasivní šíření

    Jedná se o vkládání reklamy do newsových skupin nebo webových stránek - tak zvaná proužková reklama. První varianta je v objemu provozu na Internetu zanedbatelná a proto se budu věnovat rovnou druhé. Po jistém boomu tohoto způsobu šíření reklamy a nadšení z něj se zdá, že možnosti jeho rozvoje jsou vyčerpány. Podle některých předpovědí (www.emarketer.com) sice dál poroste objem prostředků věnovaných na reklamu tímto způsobem, ale bude klesat jejich podíl z celkového množství. Z dnešních 52% prý na 26% v roce 2001 - v celosvětovém měřítku. Ještě rychleji než objem vkládaných prostředků poroste počet míst nabízejících prostor pro reklamu, což bude stlačovat ceny dolů. Vedoucí místo proužkové reklamy zaujme údajně strategické partnerství.

    Reklama na Internetu je pramenem života pro služby, bez nichž bychom Internet asi nechtěli mít. Jen namátkou několik služby závislých na reklamě: freemailové servery, servery poskytující prostor pro webové stránky, různé tematické servery a elektronické časopisy, noviny ap. Zprvu zavedený způsob placení za přístup na některé stránky pomocí kreditních karet se příliš neosvědčil ani v USA, tím méně u nás.

    Pohled zadavatele:

    Pohled zprostředkovatele - poskytovatele prostoru pro reklamu:

    Pohled konzumenta:

    Varianty provedení

    Reklamní obrázky - bannery - všeobecně rozšířená a akceptovaná varianta. Po jisté době nejednotnosti se ustálily dvě de-facto standardní velikosti: velký obrázek, s rozměry 468x60 (výrazem reklamní pruh - banner - je obvykle myšlen tento), a malý, s rozměry 88x31 obrazových bodů - pixelů. Existují samozřejmě i jiné velikosti, ale nejčastěji se lze setkat se dvěma výše uvedenými.

    Reklamní rámy - stránka je složena z několika rámů a některé z nich jsou využity pro reklamu. Tento způsob používají obzvláště někteří poskytovatelé volného prostoru na webu.

    Reklamní okna - uživateli nejméně oblíbená varianta. Spolu s žádanou stránkou v aktivním okně prohlížeče se otevře další okno (nebo i několik) s reklamou. To vede obvykle k uživatelovu frenetickému zavírání oněch narodivších se oken a to i v případě, že nejde o stránky s obsahem pro dospělé. Tento způsob používají kromě pornoserverů též někteří poskytovatelé volného místa. Nevýhodou tohoto způsobu pro zadavatele je ten, že stránky s úpornými a dotírajícími stále se otevírajícími okny jsou uživateli krajně neoblíbeny (svého času např. www.tripod.com). Zobrazení stránky s chybou ve skriptu (zacyklení) mohou položit i slabší operační systém (zvláště ten nejrozšířenější), na němž běží prohlížeč.

    Způsob zprostředkování reklamy

    Jako zadavatel reklamy na Internetu kupujete počet zobrazení. Ceny se uvádějí obvykle za tisíc zobrazení vašeho banneru - tzv. CPT (cost per thousand?). Dnes už nemusíte obcházet jednotlivé vlastníky stránek, stačí kontaktovat nějakou zprostředkovatelskou službu. Tou je buď nějaká internetová reklamní agentura, u nás např. MIA-IMS, nebo některá ze služeb výměny reklamy.

    Agentura MIA-IMS

    Jediná větší agentura na zprostředkování reklamy na českém Internetu. Z ceníku za prosinec 1999 vyplývá, že cena za CPT se na serverech, s nimiž spolupracuje, pohybuje mezi 190Kč a 600Kč. Cena se odvíjí od zaměření serveru - čím obecnější zaměření a různorodější publikum, tím nižší cena, a naopak. Nejvyšší cenu má prostor na serveru On-line trh objednávek. O něco levnější jsou Idnes (530Kč), Lupa (500Kč) a Lékárna (530Kč). Všem ostatním se vymyká server Business Week On-line s cenou $60. Nejnižší cena za CPT je na serverech Billboard (190Kč) a Post (200Kč), X-Chat (200Kč) a Seznamka (210Kč) a Seznam (220Kč).

    Služby výměny reklamy

    Jde o služby u nichž za sprostředkovanou reklamu můžete platit, jak název napovídá, nejen penězi, ale i pronájmem prostoru na svých stránkách pro reklamu dalších členů služby. Jako člen této služby získáte za jistý počet zobrazení cizí reklamy na svých stránkách jiný počet zobrazení vlastní reklamy na stránkách ostatních členů. Správce služby garantuje členům služby jistý minimální poměr, obvykle 2:1. Poměr skutečný záleží na tom, kolik zobrazení reklamy správce služby použije pro vlastní potřebu, tj. pro propagaci své služby, jiných aktivit a kolik prodá dalším komerčním klientům - zadavatelům reklamy.

    U nás existují nyní dvě takové služby. Třetí zde uvedená, jež fungovala na nekomerčním základě, ukončila na podzim 1999 svoji činnost.

    Zjišťování návštěvnosti stránek

    Jedním z neuralgickým bodů celého systému reklamy na webu je, v předchozí kapitole zmíněný, problém určení ceny za reklamní prostor - problém kde se protínají zájmy zadavatelů a zprostředkovatelů. Klíčem ke stanovení ceny je počet zobrazení reklamního objektu v prohlížečích klientů - konzumentů reklamy - a to samozřejmě v prohlížečích různých konzumentů. Ovšem systém současného Internetu je již natolik složitý, že zjistit tyto hodnoty se snadněji řekne než udělá. Metodám jejich zjišťování a vlivům některých systémových faktorů na ně se budu věnovat v této kapitole.

    V této oblasti nejsou dosud zcela ustálené pojmy, a proto pro většinu pojmů používám více variant tak, jak jsem je nalezl na různých stránkách zabývajích se zjišťováním návštěvnosti. Samotnému zjišťování návštěvnosti (sledování) se jinak říká auditing nebo monitoring. Sledování se provádí vždy na nějaké soustavě stránek, jež logicky patří k sobě - jejich sledování se provádí nezávisle na ostatních stránkách. Takové soustavě se říká systém stránek.

    Základní sledované hodnoty

    Metody sledování

    Interní

    Jsou to metody off-line, provádí se analýzou log souborů WWW serveru pořízených během hodnoceneného období pro sledovaný systém stránek.

    Klasické zjišťování počtu dotazů na stránky

    Výsledky získané touto metodou mohly být brány za přesné snad pouze v počátcích Internetu. Nyní její výsledky znehodnocují mj. stránky složené z rámů, existence skriptů na serveru, existence proxy a cachování stránek.

      hits hosts users sessions
    stránky složené z rámů ++      
    skripty na straně serveru +/-      
    existence cache -- - - -
    existence proxy / dyn. přidělování IP   -- - -
    tabulka č.1 - vliv různých faktorů na hodnoty návštěvnosti stránek
    zjištěné klasickou metodou

    V tabulce č.1 vidíme přehled vlivů jednotlivých faktorů na sledované hodnoty: znaménko plus znamená, že faktor zjištěnou hodnotu zvyšuje oproti skutečné hodnotě, mínus znamená opak. Fakt, že se stránka skládá z rámů, vede obvykle k nárůstu zaznamenaného počtu shlédnutých stránek, protože každý rám se zaznamená jako zvláštní dotaz. Skripty na straně serveru zase neumožní rozlišit, zda je jejich výsledkem obrázek nebo stránka a vliv tohoto faktoru lze odvodit jedině ze struktury stránek. Nicméně vliv tohoto faktoru nebývá oproti zbývajícím výrazný.

    Největší vliv na zjištěné hodnoty má jednoznačně existence cache a proxy a to kdekoliv mezi klientem a serverem se sledovaným systémem stránek. V době, kdy je mnoho sítí uvnitř organizací skryto před okolním světem pomocí proxy (na firewallu) se za jednu IP adresu zaznamenanou v logu "schová" několik skutečných IP adres, které se nikdy v žádném logu neobjeví. Vliv proxy na hodnotu hosts je tedy zřejmý. U často navštěvovaných systémů, jako je např. Seznam, může být dosti výrazný. Stejný vliv jako proxy má i dynamické přidělování IP adres, např. u poskytovatele vytáčeného spojení. Problém s hodnotou hits je o to složitější, že v hlavičce stránek je možné povolit nebo zakázat jejich cachování. Povoluje-li tedy jeden systém cachování a druhý ne, jsou zjištěné hodnoty hits mezi nimi neporovnatelné.

    Tuto metodu používá pravděpodobně DCCi s.r.o.(www.dcci.cz).

    Zajímavá čísla ("TOP-20 IP adres, za kterými se 'schovává' nejvíce uživatelů") o vlivu proxy na zjištěný počet unikátních IP převzatá z Monitoru. Ten je uvádí pravděpodobně jako agrument pro externí zjišťování návštěvnosti, na jehož provádění je zaměřen:

      IP Počet uživatelů
    1 c-engine4.ten34.ces.net 35972
    2 c-engine2.ten34.ces.net 19490
    3 c-engine1.ten34.ces.net 16479
    4 sysel.osanet.cz 6669
    5 c-engine5.ten34.ces.net 6038
    6 ns.felk.cvut.cz 5151
    7 cache.fee.vutbr.cz 4270
    8 195.119.190.2 2991
    9 cache34.zcu.cz 2131
    10 lyrix.vslib.cz 2036
    11 cache.sh.cvut.cz 1846
    12 proxy.inext.cz 1825
    13 ns1.poda.cz 1803
    14 proxy.vol.cz 1318
    15 proxy.czcom.cz 1284
    16 proxy.mfcr.cz 1259
    17 fw.mepnet.cz 1222
    18 firewall.czech-tv.cz 1113
    19 194.228.46.194 1076
    20 fw2.cdrail.cz 1056

    Aktualizováno: 7.4.1999, Autor: Jiří Holubec, Elektronická adresa: holubec@monitor.cz

    Metoda počítání mikroobrázků generovaných skriptem

    Vylepšením této metody je počítat nikoliv dotazy na samotné stránky (html soubory) ale dotazy na necachovatelné "mikroobrázky" generované skriptem, zpravidla o rozměrech 1x1 bod a velikosti několi bajtů. Cachování těchto obrázků lze zabránit pomocí proměnného parametru v dotazu (viz kód č.1).

    <SCRIPT LANGUAGE="JavaScript">
    <!--
    document.write("<IMG SRC=\"http://www.monitor.cz:8080/cgi-bin/stat?id=XXX&ref=" +
    top.document.referrer+'&'+Math.round(Math.random()*10000)+ "\" WIDTH=1 HEIGHT=1>");
    // -->
    </SCRIPT>
    <NOSCRIPT>
    <IMG SRC="http://www.monitor.cz:8080/cgi-bin/stat?id=XXX" WIDTH=1 HEIGHT=1>
    </NOSCRIPT>

    kód č.1 - necachovatelný obrázek

    Zde uvedený kód používá služba Monitor (www.monitor.cz) pro externí zjišťování návštěvnosti. Nic nám však nebrání použít jej i pro metodu interní. Odkaz bude směřovat na sledovaný server, kde bude umístěn skript generující pro jakoukoliv hodnotu náhodného parametru - jež slouží pouze pro obelstění cache - stejný obrázek. V logu budeme poté sledovat počet žádostí o něj. Další přidané parametry, ty ne náhodné, nám umožní sledovat návštěvnost různých sekcí nebo různých stránek v systému.

      hits hosts users sessions
    prohlížeč bez JavaScriptu -- - - -
    vypnuté načítání obrázků -- -- -- --
    umístění kódu ve stránce dole - - - -
    tabulka č.2 - vlivy různých faktorů na hodnoty návštěvnosti stránek
    zjištěné metodou necachovatelných mikroobrázků

    Prohlížeče bez podpory JavaScriptu a možnost vypnout zobrazování obrázků na straně klienta samozřejmě sníží zjištěné hodnoty, ale pravděpodobně pro všechny (konkurenční) systémy stránek stejně. Porovnatelnost hodnot mezi různými systémy zůstane tedy zachována. Další mírnou vadou této metody je závislost zjištěných hodnot na umístění kódu na stránce. Jeho umístění dole snižuje u dlouhých stránek hodnoty až o desítky procent. Je ale otázkou, nakolik lze přerušené načítání stránky považovat za plnohodnotné načtení. Pro zachování porovnatelnosti lze přijmout konvenci, že kód bude umístěn vždy nahoře. To ostatně svým klientům doporučuje i služba Monitor.

    Externí

    Tento způsob je založen, pokud je mi známo, pouze na metodě počítání generovaných obrázků. Do sledovaných stránek se umístí odkaz na obrázek vytvářený (spíše pouze umístěný) na specializovaném serveru, který sledování návštěvnosti nabízí obvykle jako službu mnoha systémům sledovaných stránek. Odkaz je buď prostý HTML kód nebo sofistikovanější JavaSript, který umožňuje serveru předat a sledovat více parametrů, jako jsou např. IP adresy, ze kterých byla stránka navštívena, použité prohlížeče, operační systémy klientů ap.

    Zcela jistě jsou však na uvedené hodnoty působí dva faktory: oproti skutečnosti zjištěné hodnoty snižuje možná nedostupnost služby - ať už pro poruchu systému (což nebylo ještě nedávno u prvních dvou služeb nic neobvyklého) nebo ztrátu spojení způsobenou poruchou na síti (což je obvyklé i dnes), což však nesnižuje všem sledovaným systémům stejně: systémy připojené do Internetu stejným providerem jako sledovací služba budou mít při stavu českého Internetu jistě větší hodnoty než systémy připojené providerem bez peeringu (nechvalně známý příklad je IOL vs. Cesnet a spojení přes New York). Nejasný vliv na výsledné hodnoty má však hlavně rozdílný počet vložení generovaných obrázků do stránek v konkurenčních sledovaných systémech.

    Tento způsob sledování nabízejí u nás jako bezplatnou službu servery Navrcholu (www.navrcholu.cz) a Toplist (www.toplist.cz) a jako placenou server Monitor (www.monitor.cz). Žádná z firem nedokumentuje veřejně přesný způsob svého výpočtu návštěvnosti a není tedy zcela jednoduché vysvětlit rozdíly v jimi prezentovaných hodnotách. Toplist ani Navrcholu narozdíl od Monitoru nepoužívají proměnný parametr pro eliminaci cache, ačkoliv Navrcholu variantně používá pro vložení mikroobrázku do sledované stránky JavaScript. Druhou variantou, v případě Toplist jedinou, je klasický statický <IMG SRC> .

    Transparentní cache

    V kapitole o reklamě na internetu se nám několikrát vyskytly termíny proxy a cache. Co je to? A jaký je rozdíl mezi běžnou a transparentní cache?

    Web cache

    Web cache je obecně zařízení, které se snaží zmenšit objem dat přenášených službou WWW po Internetu. Používá k tomu technologii velkokapacitních vyrovnávacích pamětí: poprvé položený dotaz zprostředkuje a odpověď si uloží. Pokud se v dohledné době stejný dotaz zopakuje, poskytne rovnou uloženou odpověď. Dochází tak k významné úspoře objemu přenášených informací.

    Klasická proxy

    Proxy (zprostředkující server, prostředník) vznikla jako nedílná součást firewallů (hradební počítač), které oddělují "špinavý a nebezpečný" Internet od vnitřních intranetů organizací. Prohlížeč spuštěný na poičítači v intranetu nemůže díky firewallu navázat přímé spojení s žádaným serverem umístěným na Internetu. Proto se na firewallu, který má jako jediný přístup jak do lokální sítě, tak do Internetu, instaluje proxy. Proxy přebere dotaz od klienta z intranetu a svým jménem (pod svoji IP adresou) se dotáže žádaného serveru na Internetu. Prohlížeč musí být nastaven, aby s ní spolupracoval.

    Proxy cache

    Proxy cache (vyrovnávací server) je spojení obou předchozích, jedná se o proxy vybavenou cache. Existují i proxy cache veřejné, svého času provozoval jednu Cesnet - pamatuji si, že nám na MFF bylo doporučeno ji využívat. V případě proxy cache je stále třeba spolupráce prohlížečů, tj. je nutné je správně nastavit.

    Transparentní cache

    Transparentní cache odstraňuje největší problém ze strany klinetů - jejich nespolupráci. Odstraňuje nutnost nastavování prohlížečů. Celé zprostředkování je pro uživatele neviditelné a není prakticky způsob, jak zjistit, zda byl jeho dotaz zodpovězen cílovým serverem nebo někde mezi umístěnou transparentní cache.

    U nás je největším (a pravděpodobně jediným velkým) projektem tohoto druhu je bezesporu projekt transparentních cache na TEN155CZ.

    Možné problémy všech typů cache

    Zaslání neaktuálních dokumentů
    Dokument byl od doby svého uložení do cache změněn a ta poskytne klientovi verzi, která již není platná. Jistou ochranou proti tomu je určení doby platnosti dokumentu v hlavičce. Jeden z možných algoritmů je popsán zde.

    Zaslání neplatných dokumentů
    Server může pod stejným dotazem odesílat různé verze dokumentů, obvykle jazykové mutace nebo způsoby kódování. Pracuje-li cache s protokolem HTTP 1.0, nerozliší tyto varianty a může klientům zaslat nesprávnou variantu. Při použití protokolu HTTP 1.1 již toto nebezpečí nehrozí, neboť cache je povinna si uchovávat i hlavičky dotazů a podle nich může případné varianty rozpoznat.

    Zaslání neúplných dokumentů
    Někdy si cache uloží nekompletní dokument (pokud odesílající server neoznámí délku dat, těžko se dá určit, zda dorazila kompletní data) a při pozdějších přístupech k němu dostávají uživatelé tuto zkrácenou verzi. Řešení: Pavel Satrapa uvádí na své stránce řešení Hynka Meda: klient připojí k URL žádané stránky příponu ?něco. Ta zajistí, že cílová adresa bude odlišná od předchozí a navíc se adresy obsahující otazník typicky neukládají. Klient má tedy skoro jistotu, že dokument bude nově získán z mateřského WWW serveru.

    Neplatná autorizace klienta
    Některé servery identifikují klienta podle jeho IP. To je nyní (v případě transparentní cache bez jeho vědomí) změněno, server to může vyhodnotit jako porušení bezpečnosti a odmítnout přístup. Problém je i se změnou IP adresy klineta (z pohledu serveru) během komunikace: navázání spojení proběhne typicky na portu 80 a je zprostředkováno cache, další komunikace pak probíhá na jiném portu, jde proto mimo cache a má tedy i jinou IP "odesílatele".

    Jak ovlivnit cachování vlastních stránek?
    Tagy META se vždy vkládají do hlavičky dokumentu mezi <HEAD> a </HEAD>.

    Ve web cache

    Tag <META HTTP-EQUIV="XXX" CONTENT="YYY"> obecně slouží k vyplnění pole XXX HTTP hlavičky hodnotou YYY odesílajícím WWW serverem.

    V prohlížeči
    <META HTTP-EQUIV="PRAGMA" CONTENT="NO-CACHE">. MSIE však přesto takovou stránku uloží, musíte tento příkaz zopakovat včetně tagů <HEAD> a </HEAD> i za tagem </BODY> na konci dokumentu. (Zdroj: Svět Namodro)

    Závěr

    Jak jsem uvedl v kapitole zjišťování návštěvnosti stránek, cache významně ovlivňuje klasickou metodu interního zjišťování návštěvnosti, tj. analýzu log souboru WWW serveru. Všechny hodnoty získané touto metodou jsou nižší, než je skutečnost. To vede zprostředkovaně i k podcenění počtu zobrazení reklamy, což je hlavní parametr při stanovování její ceny.

    Nejlepší ochranou správných výsledků je pravděpodobně spojit metodu počítání mikroobrázků a zobrazení reklamního objektu. Reklama je typicky obrázek a tedy by neměl být problém stanovit za počítaný obrázek právě reklamu. Tato metoda (proměnný náhodný parametr) eliminuje ve velké míře vliv cache a získaná čísla věrně odrazí i vynechání zobrazení reklamy v prohlížečích klientů, mají-li instalovánu filtraci reklamy nebo nastavené vypnuté načítání obrázků.


    Zdroje informací:

    Obecné:
    * www.lupa.cz
    * svet.namodro.cz

    Transparení cache:
    * www-cache.ten.cz
    * www.foundrynet.com
    * www.ten34.ces.net
    * www.ten34.ces.net/doc/zprava1998/kap06.html - cache na TEN34CZ
    * www.ten34.ces.net/doc/sbornik/19990407/ref4.html - cache na TEN155CZ

    Sledování návštěvnosti:
    * www.monitor.cz
    * www.dcci.cz
    * www.toplist.cz
    * www.navrcholu.cz

    Reklama na Internetu:
    * www.mia.cz
    * www.mia.cz/ims
    * www.ara.cz
    * ecommerce.vanderbilt.edu/novak/web.standards/webstand.html - New Metrics for New Media: Toward the Development of Web Measurement Standards
    * www.clickz.com/index.shtml Warning: include(): Unable to access ./pagebottom.html in /DISK2/WWW/stransky.cz/marek/cacvisads.php on line 828 Warning: include(./pagebottom.html): failed to open stream: No such file or directory in /DISK2/WWW/stransky.cz/marek/cacvisads.php on line 828 Warning: include(): Unable to access ./pagebottom.html in /DISK2/WWW/stransky.cz/marek/cacvisads.php on line 828 Warning: include(./pagebottom.html): failed to open stream: No such file or directory in /DISK2/WWW/stransky.cz/marek/cacvisads.php on line 828 Warning: include(): Failed opening './pagebottom.html' for inclusion (include_path='.:/usr/local/lib/php') in /DISK2/WWW/stransky.cz/marek/cacvisads.php on line 828