Funda.nl: Meer dan 1.000.000 unieke pagina’s per dag, wat moet je ermee? |
|
Een klein stukje geschiedenis Wat moet je met meer dan 1.000.000 unieke pagina’s per dag?In het verleden werd de web analytics (WA) tool zodanig ingericht dat deze alles, maar dan ook alles, meette. Iedere klik en pagina op site werd gelogd in HBX. Het idee was om eerst alles te meten en daarna maar eens te gaan kijken wat we met de data zouden gaan doen. De vragen zouden vanzelf wel onstaan was het idee. Helaas bleek zo’n overload aan data voor niemand werkbaar. De gebruikersvragen bleken namelijk vrij globaal te zijn. Bijvoorbeeld: Hoeveel zoekopdrachten worden er gedaan per site onderdeel en hoeveel huizen worden er bekeken per onderdeel van de site. Veel diepgaander vragen dan dit kwamen niet aan de orde. Verder liet de gebruikers interface van HBX ook behoorlijk te wensen over. Dit was mede de reden dat WA weinig leefde onder de mensen. Makelaars hebben een eigen statistieken omgeving los van WA tools. Hiermee kunnen zij zien hoe vaak een huis onder andere gevonden en bekeken wordt. Deze informatie wordt door hen gebruikt om onder andere aan klanten door te geven. Wij slaan dus weldegelijk specifieke data op, maar hebben deze niet nodig voor dagelijkse analyse vraagstukken. Tag je pagina’sToen wij geconcludeerd hadden dat wij geen behoefte hadden zoveel data was gelijk één van de grootste drempels om met GA in zee te gaan overwonnen. GA kent namelijk een limiet van 50.000 unieke pagina’s per dag. Boven de 50.000 worden de pagina’s opgeslagen onder de content sectie “Other”. In ons geval, tijdens een test, liep dit getal al snel op tot ruim boven de 200.000.000 pagina’s. In eerste instantie waren wij in de veronderstelling dat er nog data in een queue stond en later wel ingelopen zou worden.
We besloten om alle soorten pagina’s te gaan benoemen in een tagging document. Dit resulteerde in een lijst van ~300 verschillende pagina namen. Denk hierbij aan bijvoorbeeld de resultaatlijst, object overzicht pagina, object foto pagina, kaart, homepage, etc.. Deze pagina namen werden voor alle onderdelen van de site (koop, huur, nieuwbouw, recreatie, etc.) zoveel mogelijk gelijk gehouden. Dit om de leesbaarheid te bevorderen. Ook hebben we ons best gedaan om de naamgeving zo duidelijk mogelijk te maken en in lijn te laten met woorden/termen die wij binnen funda gebruiken. Enkele voorbeeldenObject detail pagina van een huis in de Eerste Helmersstraat 79 in Amsterdam:
Resultaatlijst van een zoekopdracht in Amsterdam tussen 450.000 en 550.000:
Pagina vergeten te taggen?Het kan natuurlijk altijd voorkomen dat een pagina geen tag heeft. Dit kan bijvoorbeeld gebeuren doordat:
In deze gevallen zorgen wij er voor dat deze pagina niet wegvallen in GA, maar een default tagname krijgen. Deze default tagname begint altijd met “niet_gecategoriseerd_” gevolgd door het URL. Bijvoorbeeld: “/niet_gecategoriseerd_http://www.funda.nl/fout/ObjectNotFound.aspx?zoekurl=~/koop/” Op deze manier verlies je pagina’s niet uit oog. Zo nu en dan gaan we lijst met “niet_gecategoriseerd_” pagina’s door en geven deze dan de juiste tagname.
Nadelen?Tja, niet echt. Er zijn een paar functies die niet meer werken zoals de site overlay en de links in GA naar de desbetreffende pagina op funda. Dit omdat het virtuele pagina’s zijn geworden. Tagging documentMocht je geinteresseerd zijn in deze methode, dan heb ik een voorbeeld van het tagging document online gezet. Dit document kun je gebruiken om tagnames samen te stellen. Geef een site onderdeel en een naam van de pagina op en in de laatste kolom verschijnt dan de javascript GA tag. Sla op bij favorieten of deel dit artikel:
Blog: feedproxy.google.com |












