Meta Tag Robot Satelit Network

Meta Tag Robot, Tutorial Robot.txt, Spider Robot, Index Robot, Robot Khusus

Dokumen ini bagaimana Seowaps menangani halaman-tingkat pengaturan pengindeksan memungkinkan Anda untuk mengontrol bagaimana Google membuat konten yang tersedia melalui hasil pencarian. Anda dapat menentukan ini dengan memasukkan meta tag pada (X) halaman HTML atau dalam header HTTP.

Catatan: Perlu diketahui bahwa pengaturan ini dapat dibaca dan diikuti hanya jika crawler yang diizinkan untuk mengakses halaman yang mencakup pengaturan ini.

Menggunakan tag meta robot - Membuat Meta tag robot - Robot Txt

Meta tag robot memungkinkan Anda memanfaatkan, granular khusus halaman pendekatan untuk mengendalikan bagaimana setiap halaman harus diindeks dan disajikan kepada pengguna dalam hasil pencarian. Tempatkan tag meta robot di bagian <head> halaman yang diberikan, seperti ini:

Artikel berkaitan dengan Meta Tag :

<DOCTYPE html!>
<html> <head>
<meta name="robots" content="noindex" /> 
(...)
</ Head>
<body> (...) </ body>
</ Html>

Meta tag robot dalam contoh di atas menginstruksikan semua mesin pencari tidak menampilkan halaman dalam hasil pencarian. Nilai dari nama atribut ( robot ) menyatakan bahwa direktif berlaku untuk semua crawler. Untuk mengatasi crawler tertentu, menggantikan robot nilai nama atribut dengan nama crawler yang Anda menangani. Crawler tertentu juga dikenal sebagai pengguna-agen (crawler menggunakan yang user-agent untuk meminta halaman.) Standar Google web crawler memiliki user-agent nama Googlebot. Untuk mencegah Googlebot hanya dari merangkak halaman Anda, memperbarui tag sebagai berikut:

<meta name="googlebot" content="noindex" />

Tag ini sekarang menginstruksikan Google (tapi tidak ada mesin pencari lainnya) tidak menunjukkan halaman ini dalam hasil pencarian web. Baik nama dan isi atribut non-kasus sensitif.

Search engine mungkin memiliki crawler berbeda untuk sifat yang berbeda atau tujuan. Misalnya, untuk menampilkan halaman dalam hasil pencarian Google web, tetapi tidak dalam Berita Google, gunakan meta tag berikut:

<meta name="googlebot-news" content="noindex" />

Jika Anda perlu menentukan crawler beberapa individual, tidak apa-apa untuk menggunakan beberapa tag meta robot:

<meta name="googlebot" content="noindex">
<meta name="googlebot-news" CONTENT="NOSNIPPET">

Jika arahan bersaing ditemui oleh crawler kami akan menggunakan direktif yang paling ketat kita temukan.

Menggunakan `X-Robots-Tag` HTTP header

The X-Robots-Tag dapat digunakan sebagai elemen dari respon HTTP header untuk URL yang diberikan. Setiap direktif yang dapat digunakan dalam meta tag robot juga dapat ditetapkan sebagai Tag X-Robots- . Berikut ini adalah contoh dari respon HTTP dengan X-Robots-Tag menginstruksikan crawler tidak ke halaman indeks:

HTTP/1.1 200 OK
Tanggal: Tue, 25 May 2010 21:42:43 GMT
(...) 
X-Robots-Tag: noindex 
(...)

Beberapa X-Robots-Tag header dapat dikombinasikan dalam respon HTTP, atau Anda dapat menentukan daftar comma-separated arahan. Berikut ini adalah contoh dari respon HTTP header yang memiliki noarchive X-Robots-Tag dikombinasikan dengan unavailable_after X-Tag Robot- .

HTTP/1.1 200 OK
Tanggal: Tue, 25 May 2010 21:42:43 GMT
(...) 
X-Robots-Tag: noarchive
X-Robots-Tag: unavailable_after: 25 Jun 2010 15:00:00 PST 
(...)

The X-Robots-Tag opsional dapat menentukan user-agent sebelum arahan. Misalnya, set berikut X-Robots-Tag header HTTP dapat digunakan untuk kondisional memungkinkan menampilkan suatu halaman dalam hasil pencarian untuk mesin pencari yang berbeda:

HTTP/1.1 200 OK
Tanggal: Tue, 25 May 2010 21:42:43 GMT
(...) 
X-Robots-Tag: Googlebot: nofollow
X-Robots-Tag: otherbot: noindex, nofollow 
(...)

Arahan ditentukan tanpa user agent-berlaku untuk semua crawler. Bagian bawah menunjukkan bagaimana menangani arahan gabungan. Kedua nama dan nilai-nilai tertentu yang tidak sensitif huruf.

Struktur Meta Tag Robot :

All : Tidak ada batasan untuk mengindeks atau melayani. Catatan: direktif ini adalah nilai default dan tidak berpengaruh jika eksplisit tercantum
Noindex : Jangan menampilkan halaman ini dalam hasil pencarian dan tidak menunjukkan "Cached" link dalam hasil pencarian
nofollow : Jangan mengikuti link di halaman ini
none : Setara dengan noindex, nofollow
nosnippet : Jangan menunjukkan potongan dalam hasil pencarian untuk halaman ini
noodp : Jangan gunakan metadata dari proyek Open Directory untuk judul atau potongan ditampilkan untuk halaman ini.
notranslate : Jangan melakukan terjemahan dari halaman ini dalam hasil pencarian
noimageindex : Jangan Indeks gambar halaman ini.
unavailable_after: [RFC-850 date/time] : Jangan menampilkan halaman ini dalam hasil pencarian setelah tanggal yang ditentukan / waktu. Tanggal / waktu harus ditetapkan dalam format RFC 850.

Setelah file robots.txt (atau tidak adanya satu) telah memberikan izin untuk menjelajah halaman, dengan halaman default diperlakukan sebagai crawlable, indexable, archivable, dan isinya telah disetujui untuk digunakan dalam potongan yang muncul dalam hasil pencarian, kecuali izin khusus ditolak dalam meta tag robot atau X-Robots-Tag .

Penanganan pengindeksan gabungan dan melayani arahan

Anda dapat membuat instruksi multi-direktif dengan menggabungkan robot arahan meta tag dengan koma. Berikut adalah contoh dari meta tag robot yang menginstruksikan web crawler untuk tidak halaman indeks dan tidak merangkak salah satu link pada halaman:

<meta name="robots" CONTENT="NOINDEX, NOFOLLOW">

Untuk situasi di mana beberapa crawler ditentukan bersama dengan arahan yang berbeda, mesin pencari akan menggunakan jumlah arahan negatif. Sebagai contoh:

<meta name="robots" content="nofollow">
<meta name="googlebot" content="noindex">

Halaman yang berisi tag meta akan ditafsirkan sebagai memiliki noindex, nofollow direktif saat dirayapi oleh Googlebot.

Praktis pelaksanaan X-Robots-Tag dengan Apache

Anda dapat menambahkan X-Robots-Tag untuk respon HTTP sebuah situs menggunakan htaccess dan. file httpd.conf yang tersedia secara default pada server web Apache berbasis. Keuntungan menggunakan X-Robots-Tag dengan respon HTTP adalah bahwa Anda dapat menentukan merangkak arahan yang diterapkan secara global di seluruh situs. Dukungan dari ekspresi reguler memungkinkan tingkat fleksibilitas yang tinggi.

Misalnya, untuk menambahkan noindex, nofollow X-Robots-Tag . untuk respon HTTP untuk semua file PDF di seluruh situs, tambahkan potongan berikut ke akar situs htaccess file atau file httpd.conf.:

<Files ~ "\.pdf$">
  Header set X-Robots-Tag "noindex, nofollow"
</ Files>

Anda dapat menggunakan X-Robots-Tag untuk non-HTML file seperti file gambar mana penggunaan meta tag robot tidak mungkin. Berikut ini adalah contoh menambahkannoindex X-Robots-Tag direktif untuk file gambar (png, jpeg, jpg, gif....) di seluruh situs:

<Files ~ "\.(png|jpe?g|gif)$">
  Header set X-Robots-Tag "noindex"
</ Files>

Menggabungkan merangkak dengan pengindeksan / melayani arahan

Meta tag robot dan X-Robots-Tag HTTP header ditemukan ketika URL dijelajahi. Jika halaman yang dilarang dari merangkak melalui file robots.txt, maka setiap informasi tentang mengindeks atau melayani arahan tidak akan ditemukan dan karena itu akan diabaikan. Jika mengindeks atau melayani arahan harus diikuti, URL yang mengandung arahan tersebut tidak dapat menjadi batasan dari merangkak.

Meta Tag Robot

Meta Tag Robot

Menggunakan tag meta robot - Membuat Meta tag robot - Robot Txt

Menggunakan X-Robots-Tag HTTP header

Penanganan pengindeksan gabungan dan melayani arahan

Menggabungkan merangkak dengan pengindeksan / melayani arahan

Ditulis Oleh : Admin

Menggunakan `X-Robots-Tag` HTTP header