Hoe werkt mijn zoekopdracht?
Woorden, of combinaties van woorden die u
bij een zoekopdracht intypt worden vergeleken met de
informatie in de database van de zoekmachine. De zoekfunctie
probeert die documenten te vinden waarin uw zoek woorden
voorkomen. De documenten die worden gevonden worden
volgens een bepaald algoritme in volgorde van relevantie
(of belangrijkheid) gepresenteerd. Het meest relevante
document staat bovenaan de lijst, gevolgd door de minder
relevante documenten. Met document wordt in deze context
overigens een web-pagina bedoeld, want u kunt immers
op het document van uw keuze klikken om naar de desbetreffende
website te gaan.

Hoe wordt de relevatie
van een document bepaald?
Wanneer een zoekmachine een lijst van documenten
heeft gevonden die voldoen aan uw zoekwoorden, dan worden
die in uw browser gepresenteerd op volgorde van relevantie.
"Hoe bepaalt een zoekmachine deze volgorde?"
is de vraag die vaak wordt gesteld. Het algortime, een
set van procedures en beinvloedende factors dat deze
verdeling maakt verschilt van bedrijf tot bedrijf. In
sommige gevallen vertellen de zoekmachines op hun site
hoe dat gebeurt, maar meestal is dit een goedbewaard
geheim.
Het ligt voor de hand dat factoren als gedegen
inhoud, meta
tags en het aantal malen dat uw zoekwoord in het
document voorkomt een rol spelen. Maar ook externe factoren
spelen steeds vaker een belangrijke rol. We noemen site
populariteit binnen de zoekmachine (het aantal doorklikken),
de hits van een bepaalde site en tegenwoordig ook de
pay-by-click en pay-for-location betalingen die bedrijven
doen.

Hoe werkt een zoekmachine?
De term "zoekmachine" wordt vaak
in het algemeen gebruikt om zowel echte (true)
zoekmachines, directories en hybride zoekmachines aan
duiden.
Echte zoekmachines
Echte zoekmachines zoals HotBot, bouwen
hun listing van websites automatisch en zelfstandig.
Ze speuren (crawlen) het web af naar geschikte sites
en paginas. Bezoekers kunnen via de zoekmachine zien
wat de crawlers hebben gevonden. Indien webpaginas veranderen,
dan zullen deze crawlers de veranderingen vinden en
opnemen in hun database. Zo blijft de site informatie
in de zoekmachine up to date. Een consequentie is echter
dat bij veranderingen de manier waarop de site was opgenomen
kan veranderen. Pagina titels, inhoud van het "Body"
deel, "Keywords" en andere elementen spelen
hierbij een rol.
Directories:
Een directory als Yahoo is qua inhoud afhankelijk
van handmatige acties. Het sturen van korte beschrijving
van uw site naar de directory zorgt ervoor dat medewerkers
van het portal uw site bekijken en eventueel (!) indelen
in een bepaalde categorie. Het kan dus goed zijn dat
uw site niet wordt toegelaten. Bij het zoeken wordt
door de zoekmachine alleen gekeken naar deze korte beschrijving,
ongeacht de inhoud van de site. Veranderingen van webpaginas
hebben derhalve geen invloed op de listing binnen de
directorie. Acties om een listing binnen een echte
zoekmachine te verbeteren hebben dus geen effect bij
een directory. De enige uitzondering is dat een goede
site, met goede inhoud en informatie meer kans maakt
om een goede positie binnen de directorie te krijgen
dan een matige of zelfs slecht geschreven site. De laatste
worden waarschijnlijk sowieso geweigerd.
Hybride zoekmachines:
Sommige echte zoekmachines beschikken
ook over een directory. Te worden opgenomen in de directory
van een hybride zoekmachine is vaak een kwestie van
geluk en natuurlijk de kwaliteit van uw website. Het
is mogelijk dat deze zoekmachines een mogelijkheid bieden
tot het aanmelden van uw website, maar ook hier bestaat
geen garantie voor opname.

Hoe worden paginas
ingedeeld?
Zoek naar iets willekeurigs op uw favoriete
zoekmachine. Bijna gelijktijdig en hoogstens tien seconden
later krijgt u een lijst van paginas gepresenteerd
die gerelateerd zijn aan zoek term. Hiervoor moet de
machine soms miljoenen paginas doorlopen. Bovenaan
de lijst die u wordt gepresenteerd staan de meest relevante
paginas, en naarmate u de lijst afdaalt wordt de relevantie
minder. Het is derhalve belangrijk om als aanbieder
van een website bij de eerste 20 listings te eindigen.
Zoals de uitvinder van de WebCrawler Brian
Pinkerton ooit zei, "Stel je voor dat je naar een bibliotheekt
gaat en tegen een medewerker zegt Reizen. De
medewerker zal u met een wit weggetrokken gezicht aanstaren,
en u waarschijnlijk met Que? antwoorden".
Zoekmachines kunnen die wedervraag niet stellen
om wat meer duidelijkheid te krijgen over wat u nu werkelijk
zoekt. Ze kunnen ook niet vertrouwen op ervaringen in
het verleden, om zodoende de oplossingen naar waarschijnlijkheid
voor te schotelen aan de vrager. Er zijn wel ontwikkelingen
op dit gebied, waarbij populaire keuzes langzaamaan
meer prioriteit krijgen en derhalve bovenaan de listing
verschijnen indien de volgende bezoeker het woord "reizen"
voor de zoveelste maal intikt, maar er is nog steeds
een lange weg te gaan.
Hoe gaan zoekmachines hier dan mee om? Hoe
bepalen ze de relavantie van een onderwerp? Hiervoor
volgen zoekmachines een aantal regels. Een van de hoofdregels
heeft betrekking op de keywords die in de zogenaamde
"meta-tags" van de desbetreffende pagina worden
gespecificeerd. Het gaat daarbij om de lokatie van deze
keywords en de frequentie waarin deze op die pagina
voorkomen. Deze methode van bepalen van relevantie wordt
de "location/frequency method" genoemd.
Indien u de vraag opnieuw stelt aan de bibliothecaris
dan zal deze in eerste instantie zoeken naar de boeken
waar "Reizen" in de titel van het boek voorkomt.
Zoekmachines doen dat dus ook.
Paginas die de keywords in hun titel hebben
zijn blijkbaar meer relevant dan de andere paginas.
Zoekmachines kijken ook of de keywords zijn opgenomen
in de top van de pagina, zoals in de koppen boven de
eerste paar alinea's tekst. Zoekmachines vermoeden dat
een keyword relevant is wanneer het in de openingsteksten
van webpaginas wordt genoemd.
Frequentie is een andere hoofdfactor bij
het bepalen van de relevantie van een keyword. Een zoekmachines
bepaalt hoe vaak de genoemde keywords in relatie tot
andere woorden in de tekst voorkomen. De woorden met
een hoge frequentie zijn blijkbaar meer relevant dan
deze die minder vaak worden gebruikt.
Indien u dus een website over "degelijke
auto's uit Zweden" wilt aanbieden aan een echte
zoekmachine, zorg er dan voor 1) dat de titel van uw
pagina "Degelijke Auto's uit Zweden" is, 2)
dat uw keywords deze woorden ook vermelden en 3) dat
uw begin tekst op uw openingspagina deze slagzin nog
een aantal malen herhaalt.

Zoeken naar specifieke
woorden
De meeste mensen zoeken bijvoorbeeld met
het woord "bloemen" naar sites die een bloemen
bezorgservice bieden. Het resultaat is een ongelimiteerde
lijst van sites over bloemen, bloemen boeken, bloemen
veilingen, bloemen kwekerijen en ook bloemen bezorgservices.
Ben daarom specifieker bij het zoeken.
Indien u een bloemen bezorgservice in Parijs
zoekt, type dan "bloemen bezorgservice Parijs"
in op uw zoekmachine. U zult verbaasd staan over het
resultaat. Waarschijnlijk vindt u de site van uw keuze
bij de eerste tien uit de lijst!

Gebruik van Booleans;
AND, OR en NOT
Indien u wilt zoeken naar twee of meer woorden
die ieder in een document moeten voorkomen, gebruik
dan de AND Boolean (of het "+" teken). Elk
woord moet dan worden voorafgegaan door het "+"
teken zoals in; "+bloemen +bezorgservice +Parijs".
Indien u wilt dat het ene woord of het andere
woord of beide woorden in een document voorkomen, gebruik
dan de OR Boolean tussen de woorden in zoals in; "Versailles
OR Parijs".
Indien u een woord wilt uitsluiten van een
zoekopdracht (het woord mag niet in het document voorkomen)
gebruik dan de NOT boolean, of het "-" teken,
zoals in "-Versailles +Parijs", hetgeen documenten
oplevert waarin Parijs staat genoemd maar geen Versailles.

Kleine letters
/ Grote letters
Type uw zoekwoorden altijd in kleine letters, behalve
wanneer u zoekt naar plaatsnamen, landen en personen.
Voorbeelden van zulke zoek acties zijn "+filosofie
+Nietzsche" of "+bioscoop +Amsterdam".

Gebruik van
aanhalingstekens en de asterix
Indien u aan het zoeken bent naar een EXACTE
term, dus een combinatie van woorden die bij elkaar
hoort, zet dan aanhalingstekens om de term heen zoals
in ""the phantom menace"" of ""Victoria
falls"".
Sommige zoekmachines staan het toe om naar
varianten van een woord te zoeken, waarbij u alleen
het begin van een woord opgeeft gevolgd door een asterix
"*" teken. Typt u bijvoorbeeld "opt*"
in dan zal de zoekmachine zoeken naar woorden die met
opt beginnen zoals optimist, optimaal, optisch etc..

|