Alles over zoekmachines in 2021: welke search engines zijn er?
Introductie
Er zijn veel zoekmachines waarmee je websites kan vinden op het internet. Iedereen kent Google, maar welke andere zoekmachine's zijn er, wanneer zijn ze ontstaan en waarom zou je een andere zoekmachine dan Google gebruiken? Op deze pagina vind je alles over zoekmachines en meer informatie over de nieuwe zoekmachine Yessle.
Hoe vind je een website?
Het internet bestaat uit miljarden pagina's met veel informatie (tekst, foto's, video's, geluidsbestanden, codes, etc.). Er zijn meerdere manieren om een website te bereiken. Allereerst kan je als je het internetadres al kent, dat intikken in de adresbalk, op die manier kom je direct op je al bekende website. Om een voorbeeld te noemen, stel dat je de website van de VPRO zoekt, dan tik je gewoon vpro.nl in, en ga je direct naar die website. Dit werkt voor veel instanties en bedrijven en ook namen, bijvoorbeeld (www.leonardodicaprio.com) voor Leonardo DiCaprio. Maar stel dat je een website zoekt over een bepaald onderwerp, en je kent het adres niet, wat doe je dan? Voordat er zoekmachines waren, ging je naar een website waarop lijsten met websites stonden. Lijsten geordend op onderwerp. Zocht je een website van een bepaalde acteur, dan surfde je eerst naar een reeds bekende startpagina en klikte op categorie "films", vervolgens "acteurs" en daar stond dan als je geluk had de website van je gezochte acteur in een lijstje. Dat was voor 1995.
Met het ontstaan van zoekmachines, werd het veel makkelijker om websites te vinden. Je tikt hetgene waar je naar zoekt in in de zoekbalk en de zoekmachine presenteert een lijst met websites over dat onderwerp, geordend op relevantie.
Welke zoekmachines zijn er? Een lijst van zoekmachines
Er zijn meerder zoekmachines. Google is er een van en is de grootste. Het heeft eigenlijk een monopolie op zoeken op internet. Microsoft heeft zoekmachine Bing, wat qua kwaliteit niet veel onderdoet voor Google. Yahoo bestaat ook al lang en wordt nog steeds gebruikt. Dan zijn er zoekmachines die resultaten van andere zoekmachines gebruiken en meer geven om je privacy, zoals StartPage (geen cookies!) en Duckduckgo (maar twee cookies, veel minder dan de 28 cookies van Google, de 15 cookies van Bing en de 22 cookies van Yahoo). Rusland heeft zijn eigen grote zoekmachine (Yandex) evenals China (Baidu). Een onafhankelijke zoekmachine, geheel onafhankelijk van de groten, is Gigablast, maar de kwaliteit is minder. De Nederlandse zoekmachine Ilse was redelijk bekend, maar wordt nu (in 2021) veel minder gebruikt. Dan zijn er in Nederland nog vinden.nl en zoeken.nl, maar deze hebben geen eigen database en maken gebruik van andere zoekmachines (niet geheel onafhankelijk dus). In Duitsland was een zoekmachineproject gaande, Cliqs, maar ze zijn er vorig jaar (2020) mee gestopt.
Waarom een nieuwe zoekmachine, we hebben toch Google al?
Laten we voorop stellen dat Google een hele goede zoekmachine is, er staat ontzettend veel in en meestal vind je wat je zocht. Er zijn echter meerdere redenen waarom je een andere zoekmachine dan Google zou moeten gebruiken.
Ten eerste heeft Google een monopolie. Dat betekent direct dat Google een te grote machtspositie heeft. De resultaten die zij tonen, en de keuzes die ze daarbij maken, hebben een grote invloed op de maatschappij en de kennis van mensen. Google's algoritme zet bijna altijd Wikipedia bovenaan, een goede keuze, maar andere encyclopediën zijn misschien wel beter, met meer zorg gemaakt en gecontroleerd door echte experts. Verder is de resultatenlijst meestal redelijk uniform, omdat Google een keuze maakt voor het type zoekresultaten dat wordt getoond. Bijvoorbeeld: toptien- of tophonderd-lijstjes, omdat mensen daar veel op klikken. Dus, omdat mensen graag op dit soort resultaten klikken, verschijnen deze bovenaan. Misschien zijn er veel interessantere soorten websites, maar die doen het toch minder goed in Google, omdat er niet op geklikt wordt.
Ten tweede: Google bouwt een heel profiel van jou als gebruiker op. Alles wat je ooit hebt gezocht wordt opgeslagen en als je iets zoekt, wordt daar rekening mee gehouden. Daardoor kom je in een soort eigen bubbel terecht. Ben je een republikein, dan krijg je op een gegeven moment geen sites van democraten meer te zien, omdat Google weet dat je daar toch niet op klikt.
Ten derde: Google schaadt je privacy en verdient daar aan. Als je iets zoekt in Google, wordt dat opgeslagen en gebruikt om gerichte advertenties te tonen. Niet alleen op het moment dat je zoekt, maar ook later. Dan krijg je drie dagen later ineens een reclame over dat onderwerp te zien in Youtube (wat ook van Google is). Probeer het maar eens: Google "Barcelona vakantie", dan krijg je in de dagen daarna waarschijnlijk allemaal reclames te zien over goedkope vluchten naar Barcelona, niet alleen in Google, maar ook op andere websites die reclames vertonen via Google Adsense. Soms is dat wel handig, maar niet als je per ongeluk iets gezocht hebt, waar je later niks meer over wil zien. Verder krijg je ook het gevoel dat Google teveel over je weet.
Hoe werkt een zoekmachine?
Zoekmachines zoals Google bouwen eerst een database op van webpagina's. Het proces van het vinden van websites en pagina's daarop, wordt crawlen genoemd. Een crawler begint op een pagina die reeds bekend is, dan volgt hij alle linkjes die erop staan en vindt dus nog meer pagina's. Als er goede informatie op een pagina staat, wordt deze geindexeerd, wat betekent dat de pagina vertoond kan worden in de resultatenlijsten. De geindexeerde pagina komt ook in een database terecht. Welke pagina's precies vertoond worden voor een zoekopdracht en in welke volgorde wordt bepaald door een ranking-systeem. Hoog in de lijst komen pagina's waarop het zoekwoord (keyword) gevonden is. Hoe hoog hangt af van de plek waar het zoekwoord staat (in de titel of alleen helemaal onderaan de pagina), de sterkte van het domein waarop het staat (wikipedia heeft bijvoorbeeld een goede reputatie bij Google), de sterkte van de individuele pagina (wordt de pagina vaak en langdurig bekeken), hoe lang de pagina al bestaat en of deze up-to-date is. Verder wordt gekeken hoeveel andere websites linkjes hebben geplaatst naar een pagina (page strength) en naar het domein waar de pagina op staat (domain strength). Methodes om hoger in Google te komen worden SEO genoemd, waarover hier onder meer verteld wordt.
Een zoekmachine bestaat uit:
-de zoekbalkpagina: een pagina met daarop een zoekbalk waarin de gebruiker intikt/inspreekt of aanklikt wat hij zoekt;
-het rankingsysteem: het rankingsysteem bepaalt de volgorde van de getoonde resultaten;
-het indexeringsysteem: het bepaalt welke pagina's worden opgenomen in de database en op welke manier deze in de serps (search engine result page) verschijnen;
-de crawlers: deze robots zoeken nieuwe pagina's of kijken of oude pagina's veranderd zijn en nog bestaan;
-de autosuggest: het systeem dat suggesties geeft aan de gebruiker als deze begint met tikken;
-de autocorrector: het systeem dat fouten ondekt in de zoekterm (bijvoorbeeld spelfouten) of aangeeft dat je misschien iets anders zocht
Hoe werkt zoekmachine Yessle?
Yessle heeft bij het maken van de zoekmachine eerst webpagina's gezocht op internet, dus al voordat je iets intikt. Door linkjes te volgen op webpagina's is deze database van internetadressen snel uitgebreid tot meer dan honderduizenden pagina's. Vervolgens is van elke pagina een samenvatting gemaakt en een bijbehorende foto uitgezocht. Als je iets zoekt in Yessle kijkt hij eerst of het zoekwoord in een pagina voorkomt. Dan komt deze in aanmerking om vertoond te worden in de zoekresultaten. Als het in de titel van de pagina staat komt het resultaat hoger. Als het 'los' staat komt de pagina ook hoger. Stel dat je "koe" zoekt, dan vertoont Yessle een pagina die "wat is een koe?" heet hoger dan "wat is een koelkast?", want koe komt wel voor in koelkast, maar is toch echt iets anders. Als er echt geen een pagina is waarin koe los staat dan laat Yessle toch de pagina met koelkast zien en lager in de lijst zelfs bijvoorbeeld diepvrieskoelkast. Als het woord in het adres voorkomt (los), dan laat Yessle dat meteen zien. Bijvoorbeeld, voor "nos" geeft Yessle meteen "nos.nl" als eerste hit, tenminste als deze pagina in de database staat.
De suggesties die getoond worden als je begint met tikken komen uit de titels van de pagina's die er in staan. Eerst alleen de eerste woorden van de paginatitels, vervolgens na een spatie ook de tweede woorden, etc. Er staan dus meer woorden in de database dan in de suggesties.
De samenvatting van de pagina wordt als volgt gemaakt:
-De titel wordt opgeslagen (in de html-code tussen <title> en </title>);
-De meta-description wordt opgeslagen en als deze mist, de eerste paragraaf (<p>...</p>)
-De foto is de og:image of als deze mist, de eerste foto na <img
Hoe rank je in Yessle?
Yessle vertoont je pagina als deze gevonden is bij het crawlen of als je het zelf handmatig hebt toegevoegd door het internetadres in de zoekbalk in te tikken. De volgorde van de resultaten wordt als volgt bepaald:
- bestaat "zoekwoord.nl" of "zoekwoord.com"?;
- Staat het zoekwoord in het begin van de titel en los in de beschrijving?
- Staat het zoekwoord ergens in de titel en los in de beschrijving?
- Staat het zoekwoord ergens los in de samenvatting (niet in de titel)?
- Staat het zoekwoord ergens met links ervan een spatie? Bijvoorbeeld: zoekwoordpuzzel
- Staat het zoekwoord ergens met rechts ervan een spatie? Bijvoorbeeld :puzzelzoekwoord
- Staat het zoekwoord ergens op de pagina?
Geschiedenis van zoekmachines
Archie 1990
De eerste zoekmachine, Archie, stamt uit 1990. Alan Emtage, een student van de McGill universiteit in Montreal schreef een computerprogramma waarmee websites gezocht konden worden. Als software- en computerbeheerder moest Emtage handmatig op zoek naar sites om software te vinden voor de studenten en om dat proces te versnellen schreef hij een programma dat automatisch naar computerbestanden zocht op alle op het internet aangesloten systemen. Met hulp van Peter Deutsch en Bill Heelan, ook van de McGill, genereerde Archie het meeste internetverkeer van Montreal. Emtage wilde Archie eigenlijk "Archives" noemen, maar deze naam was te lang voor het computersysteem van die tijd.
Aliweb 1993
In 1993 kwam er concurrentie van Aliweb, een zoekmachine geschreven door de Nederlander Martijn Koster tijdens zijn werkzaamheden bij Nexor. Gebruikers konden hun website zelf aanmelden bij het systeeem, maar omdat er niet veel gebruik van gemaakt werd, is Aliweb niet heel populair geworden.
Yahoo! 1994
De eerste grote en zeer populaire zoekmachine die nog steeds gebruikt wordt is Yahoo!. In 1994 lanceerden Jerry Yang and David Filo, twee studenten van de Stanford Universiteit, een website met de naam "Jerry and David's guide to the World Wide Web", wat in hetzelfde jaar al tot "Yahoo!" werd hernoemd. Eerst was het alleen een website met folder-structuur en later was deze doorzoekbaar en werd erg populair.
Lycos 1994
Lycos is een van de oudste zoekmachines. Het startte als een onderzoeksproject van de Carnegie Mellon University (CMU) in Pittsburgh in de VS. Michael Loren "Fuzzy" Mauldin schreef 3 pagina's codes en verkocht zijn zoekmachine al gauw aan CMGI voor 2 miljoen dollar, een bedrag dat hij moest delen met de universiteit.
Altavista 1995
Altavista was een zoekmachine. Het was een van de meestgebruikte zoekmachines in het begin, maar verloor de strijd om bezoekers van Google. Het werd opgekocht door Yahoo! in 2003. Tot 8 juli 2013 kon je er mee zoeken, maar is toen afgesloten door Yahoo!. Nu verwijst altavista.com direct naar Yahoo!.
Dogpile 1996
Dogpile is een metazoekmachine, ontwikkeld door Aaron Flin, die gebruikt maakt van resultaten van andere zoekmachines.
Ask 1996
Zoals de naam al zegt, kan je bij ask.com een vraag stellen. Aangezien dit tegenwoordig in Google ook kan, is het eigenlijk gewoon een zoekmachine. Ask is opgericht door Garret Gruener en David Warthen.
Yandex 1997
Yandex is de grootste Russische zoekmachine. In dit filmpje wordt uitgelegd waarom Google het moeilijk heeft in Rusland.
Google 1998
In de wetenschap is het aantal citaties van een artikel een belangrijke graadmeter van de kwaliteit van een artikel. Dit idee pasten Larry Page en Sergey Brin, studenten van de universiteit van Stanford, toe op internetpagina's met linkjes (backlinks) als het equivalent van citaties. Hun zoekmachine, die eerst nog Backrub heette, bleek erg succesvol en kreeg al snel investeringen van investeerders in Silicon Valley.
-Fouten in zoekmachines
-Fouten in Yessle
-Doel van zoekmachine Yessle
-Search Engine Optimization (SEO) - Zoekmachineoptimalisatie
-Hoog komen in Google
-Hoog komen in Yessle
-Pagina's op laten nemen in zoekmachine Google
-Pagina toevoegen in Yessle