Gratis advies

Funda.nl: Meer dan 1.000.000 unieke pagina’s per dag, wat moet je ermee?

Een klein stukje geschiedenis
Een krap jaar geleden liep het contract met Omniture HBX af en besloten wij over te stappen op Google Analytics (GA). Het overstappen van een grote “industry standard” tool als HBX naar het gratis GA was voor een high traffic site als funda best spannend. We hebben hier dan ook veel geleerd. Dit is ook de reden dat ik mijn ervaringen over de migratie en enkele “best practices” met jullie wil delen. Ik heb het idee dat er best veel “grote” site’s zijn die best wel willen overstappen, maar het nog niet durven.

Wat moet je met meer dan 1.000.000 unieke pagina’s per dag?

In het verleden werd de web analytics (WA) tool zodanig ingericht dat deze alles, maar dan ook alles, meette. Iedere klik en pagina op site werd gelogd in HBX. Het idee was om eerst alles te meten en daarna maar eens te gaan kijken wat we met de data zouden gaan doen. De vragen zouden vanzelf wel onstaan was het idee. Helaas bleek zo’n overload aan data voor niemand werkbaar. De gebruikersvragen bleken namelijk vrij globaal te zijn. Bijvoorbeeld: Hoeveel zoekopdrachten worden er gedaan per site onderdeel en hoeveel huizen worden er bekeken per onderdeel van de site. Veel diepgaander vragen dan dit kwamen niet aan de orde. Verder liet de gebruikers interface van HBX ook behoorlijk te wensen over. Dit was mede de reden dat WA weinig leefde onder de mensen.

Makelaars hebben een eigen statistieken omgeving los van WA tools. Hiermee kunnen zij zien hoe vaak een huis onder andere gevonden en bekeken wordt. Deze informatie wordt door hen gebruikt om onder andere aan klanten door te geven. Wij slaan dus weldegelijk specifieke data op, maar hebben deze niet nodig voor dagelijkse analyse vraagstukken.

Tag je pagina’s

Toen wij geconcludeerd hadden dat wij geen behoefte hadden zoveel data was gelijk één van de grootste drempels om met GA in zee te gaan overwonnen. GA kent namelijk een limiet van 50.000 unieke pagina’s per dag. Boven de 50.000 worden de pagina’s opgeslagen onder de content sectie “Other”. In ons geval, tijdens een test, liep dit getal al snel op tot ruim boven de 200.000.000 pagina’s. In eerste instantie waren wij in de veronderstelling dat er nog data in een queue stond en later wel ingelopen zou worden.

Google Analytics: other

We besloten om alle soorten pagina’s te gaan benoemen in een tagging document. Dit resulteerde in een lijst van ~300 verschillende pagina namen. Denk hierbij aan bijvoorbeeld de resultaatlijst, object overzicht pagina, object foto pagina, kaart, homepage, etc.. Deze pagina namen werden voor alle onderdelen van de site (koop, huur, nieuwbouw, recreatie, etc.) zoveel mogelijk gelijk gehouden. Dit om de leesbaarheid te bevorderen. Ook hebben we ons best gedaan om de naamgeving zo duidelijk mogelijk te maken en in lijn te laten met woorden/termen die wij binnen funda gebruiken.

Enkele voorbeelden

Object detail pagina van een huis in de Eerste Helmersstraat 79 in Amsterdam:
GA tag: “pageTracker._trackPageview(”koop/nvm/object-overzicht”);”
GA tag in detail

  • koop: “koop” onderdeel van de site
  • nvm: makelaarsvereniging, we hebben er meedere
  • object-overzicht: Objecte overzicht pagina

Resultaatlijst van een zoekopdracht in Amsterdam tussen 450.000 en 550.000:
GA tag: “pageTracker._trackPageview(”koop/resultaatlijst”)”
GA tag in detail:

  • koop: “koop” onderdeel van de site
  • resultaatlijst: zoekresultaten pagina

Top content report

Pagina vergeten te taggen?

Het kan natuurlijk altijd voorkomen dat een pagina geen tag heeft. Dit kan bijvoorbeeld gebeuren doordat:

  • het betreft een nieuwe pagina;
  • je bent hem domweg vergeten;
  • url van de pagina is anders (geworden);
  • case sensitivity van het url.

In deze gevallen zorgen wij er voor dat deze pagina niet wegvallen in GA, maar een default tagname krijgen. Deze default tagname begint altijd met “niet_gecategoriseerd_” gevolgd door het URL.

Bijvoorbeeld: “/niet_gecategoriseerd_http://www.funda.nl/fout/ObjectNotFound.aspx?zoekurl=~/koop/”

Op deze manier verlies je pagina’s niet uit oog. Zo nu en dan gaan we lijst met “niet_gecategoriseerd_” pagina’s door en geven deze dan de juiste tagname.

Niet gecategoriseerd

Nadelen?

Tja, niet echt. Er zijn een paar functies die niet meer werken zoals de site overlay en de links in GA naar de desbetreffende pagina op funda. Dit omdat het virtuele pagina’s zijn geworden.

Tagging document

Mocht je geinteresseerd zijn in deze methode, dan heb ik een voorbeeld van het tagging document online gezet. Dit document kun je gebruiken om tagnames samen te stellen. Geef een site onderdeel en een naam van de pagina op en in de laatste kolom verschijnt dan de javascript GA tag.

Tijdens de implementatie hebben wij veel lol gehad van het tooltje genaamd WASP. Deze plugin nestelt zich in Firefox en laat je razendsnel zien in de sidebar welke informatie meegegeven wordt aan GA. Voordeel is dat je niet constant “view source” hoeft te doen. Voor de geavanceerde gebruikers. Je kunt zelfs een script maken van pagina’s die WASP moet aflopen. De resultaten worden dan netjes in een logfile weggeschreven.

Sla op bij favorieten of deel dit artikel: del.icio.us Facebook Google NuJIJ StumbleUpon E-mail this story to a friend! LinkedIn


Blog: feedproxy.google.com