Site icon Noir Solutions

Utilizzo noindex , nofollow con il tag name robots

Vediamo adesso come bloccare l’accesso dello spider crawler al vostro sito pagina o cartella tramite noindex inserito nel meta robots.
Ovviamente si tratta di un metodo molto analogo a quello già visto nel robots.txt.

Per la precisione è praticamente identico. Con la differenza che qui invece di metterlo in un file separato lo mettiamo in un meta tag del file html della pagina.
Vediamo subito la dicitura e poi vi spieghiamo il funzionamento.

Impedire accesso indicizzazione allo spider con robots noindex.

contente,
Si tratta quindi di andare ad inserire nell’header prima del tag body il seguente codice

<meta name ="robots> content ="noindex, follow">

Cominciamo dalla prima parte dove abbiamo scritto

meta name ="robot"

Questa scritta ha carattere generale. Ossia consiglia a tutti i motori di ricerca di eseguire l’azione seguente presente nel content.
Ma volendo possiamo anche circoscrivere tale azione a determinati robot per esempio se avessimo voluto solamente dare un’indicazione a google avremmo scritto.

<meta name="googlebot" content="noarchive">

E cosi’ via. Se volete vi lascio tutta la lista dei vari Robots direttamente dal sito ufficiale robottxt.org se avete qualche esigenza particolare.
Andando avanti vedete che ho scritto

content ="noindex, follow">

senza perderci in parole, vediamo una lista di possibili combinazioni e valori che possiamo attribuire al content.

Oltre questi ci sarebbero altri tag , ma che non sono presi nemmeno lontanamente in considerazione dai motori di ricerca e quindi vi evito. Oltretutto sono anche di scarsissimo utilizzo da parte dei webmaster.

Come si inserisce il tag robot nel codice html

Come vi dicevo il suo inserimento è estremamente semplice e ve lo mostro subito con un semplice esempio

<html>
<head>
<title>Pagina esempio</title>
<meta name="robots" content="index,follow">
</head>
<body>

Contenuto Informativo della vostra pagina Web.
</body>
</html>
Exit mobile version