Delfts Schaakforum (http://www.delftseschaaksite.nl/wbb/index.php)
- Overig (http://www.delftseschaaksite.nl/wbb/board.php?boardid=15)
-- Over de Delftse SchaakSite (http://www.delftseschaaksite.nl/wbb/board.php?boardid=17)
--- PageRank Disabled (http://www.delftseschaaksite.nl/wbb/threadid.php?threadid=44)


Posted by Corniel on 25-03-2002 at 14:08:

PageRank Disabled

Weet iemand, misschien waarom het forum op de GoogleToolBar een disabled PageRank heeft?

__________________
stukken in het gras

ik zag stukken in het gras - en paarden grazen
en een zwarte dame
ik hoopte - dat jij het was


Posted by Sander on 25-03-2002 at 18:26:

Ik heb die google toolbar 1 keer geinstalleerd - een jaar geleden ofzo - en heb hem zo snel mogelijk verwijderd. Ik vond het niks.

Maar die page ranking klinkt als de ranking die gebruikt wordt in zogenaamde 'content advisors'. Systemen die je vertellen wat het sex- en geweldgehalte van verschillende sites is. Als dat zo is, dan verbaasd het mij niet dat het DSC Forum geen rank heeft. Het grootste deel van het internet heeft geen rank. Lach

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now


Posted by Remkius on 25-03-2002 at 19:40:

Zover ik weet is het een ranking die gebruikt wordt door de search-engine. Hoe hoger de waarder des te eerder wordt hij gemeld bij een zoekopdracht.

Maar waarom hij bij het forum disabled is weet ik niet. Er zijn namelijk ook sites met een PageRank waarde 0.


Posted by Sander on 26-03-2002 at 17:28:

Quote

by Google
Your URL (http://svg.xs4all.nl/dsc/) has been successfully added to our list of URLs to crawl. Please note that we do not add all submitted URLs to our index, and we cannot make any predictions or guarantees about when or if they will appear.
Misschien dat dat helpt. Tevreden

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now


Posted by Corniel on 26-03-2002 at 20:27:

Quote

by Google
Your URL (http://svg.xs4all.nl/dsc/) has been successfully added to our list of URLs to crawl. Please note that we do not add all submitted URLs to our index, and we cannot make any predictions or guarantees about when or if they will appear.


Quote

Originally posted by Sander
Misschien dat dat helpt. Tevreden


Ik betwijfel of dit helpt. Ten eerste heb ik deze handeling al eens uitgevoerd. En ten tweede - niet onbelangrijk en al eerder gemeld - er zijn ook pagina's op internet te vinden met een PageRank met waarde null en dat is toch iets anders dan een disabled PageRank.

Het probleem is hierdoor ook, dat het formum niet te vinden is met Google.

__________________
stukken in het gras

ik zag stukken in het gras - en paarden grazen
en een zwarte dame
ik hoopte - dat jij het was


Posted by Sander on 26-03-2002 at 20:37:

Volgens Google is het ranking systeem gebaseerd op het aantal links naar de gegeven site in de Google database. Een ranking 0 komt dus overeen met (zo goed als) geen links, maar de betreffende site zit dan wel in de database.

Mijn ervaring is dat het wel een paar weken kan duren voordat de Google crawlbot de opgegeven site bekijkt. Kwestie van geduld.

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now


Posted by Sander on 31-03-2002 at 14:45:

Oeps, ik zie net dat ik een niet al te vriendelijke robots.txt in mn www root directory had.

Idee

Is gecorrigeerd.

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now


Posted by Sander on 03-04-2002 at 23:44:

Met het gevolg dat de een of andere bot nu bezig is het hele forum te lezen. Grijns

Toch maar even geblokkeerd en de robots.txt weer iets strenger gemaakt. Hopen dat ie goed is zo.

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now


Posted by winfvdm on 12-04-2002 at 09:11:

aanmelden

Het is bekend dat men een pagina kan aanmelden? We hebben wel eens pagina's aangemeld bij search engines, dat werkte dan ook.
Bij Google zal dat ook wel kunnen, lijkt me.
winfvdm

__________________
Als je de Dame bent in het schaakspel, sla dan maar flink om je heen
(Zie ook Rekenvout 125)


Posted by Sander on 12-04-2002 at 09:31:

Zoals eerder vermeld hebben we (Corniel en ik) dat allebei al geprobeerd, maar met een robots.txt die toegang weigert schiet dat niet op:

Agent: *
DisAllow: /

Ik moet er wel iets inzetten, want anders gaan web crawlers zonder pardon alles scannen (inclusief honderden keren 'access denied'). Lach Nu staat er (zo uit mn hoofd):

Agent: *
DisAllow: /cgi-bin/dir.cgi
DisAllow: /bb

Ik hoop dat ie daarmee wel de index in /dsc scant, maar ik heb nog niet zoveel ervaring met robots.txt. Is er misschien een DSCer die er meer van weet?

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now


Posted by Corniel on 12-04-2002 at 12:33:

Quote

Originally posted by Sander
Agent: *
DisAllow: /cgi-bin/dir.cgi
DisAllow: /bb

Ik hoop dat ie daarmee wel de index in /dsc scant, maar ik heb nog niet zoveel ervaring met robots.txt. Is er misschien een DSCer die er meer van weet?


Ik guess. DSC heeft vanaf heden een pageRank 1 (of 10). Corniel wordt nog niet gescanned. (Tenminste daar ga ik vanuit omdat die nogsteeds disabled is).

Het lijkt mij wenselijk dat ie die ook appart kan herkennen.

__________________
stukken in het gras

ik zag stukken in het gras - en paarden grazen
en een zwarte dame
ik hoopte - dat jij het was


Posted by Corniel on 12-04-2002 at 12:38:

Trouwens, dat zie ik nu pas, je hebt ook niet echt wenselijke code om de site later terug te vinden. Geen <meta> tags zeg maar.

Daar moet ook iets anders aan verandert worden lijkt me. Die zet je gewoon in de header generende php-code (ja ik snap dat je dat zelf ook begrijpt) en dan moet het allemaal werken. Want als ik nu DSC en forum injens op Google, gaat ie ons niet - in iedergeval niet bij een van de eerste - vinden.

__________________
stukken in het gras

ik zag stukken in het gras - en paarden grazen
en een zwarte dame
ik hoopte - dat jij het was


Posted by Sander on 12-04-2002 at 13:29:

Quote

Originally posted by Corniel
Het lijkt mij wenselijk dat ie die ook apart kan herkennen.
Helaas ondersteunt robots.txt alleen 'Disallow' en niet 'Allow'.

Quote

Die zet je gewoon in de header generende php-code (ja ik snap dat je dat zelf ook begrijpt) en dan moet het allemaal werken.
In dat geval zal ik toch een manier moeten bedenken om te voorkomen dat zo'n bot overal alle knopjes en links gaat proberen. Dat is zeker niet de bedoeling: het kost uren (ja uren), en levert per post 8 keer access denied op. (= ruim 2000 access denied pagina's)

Ik zal aan /index.html /dsc/index.html en /corniel/index.html wat meta's toevoegen (ergens dit weekend), maar voor zover ik weet zijn die bots niet (100%) afhankelijk van meta's en scannen ze ook de content en titel van pagina's. In elk geval doet google dat. Probleem met /corniel zou wel kunnen zijn dat die niet is gelinkt vanaf /index.html cq niet apart is aangemeld bij google.

__________________
Start the clock and keep it running
It's the one to beat
I'm not in danger
I'm the danger now

Powered by: Burning Board Lite 1.0.1 © 2001-2004 WoltLab GmbH
English translation by Satelk