Pembaharuan Yang Google Luncurkan Pada Bulan November

Pembaharuan Yang Google Luncurkan Pada Bulan November

Gary Illyes memberikan informasi yang cukup komprehensif tentang cara Google mendeteksi halaman duplikat dan memilih halaman kanonis agar memenuhi syarat untuk hasil penelusuran. Dia juga menyarankan bahwa ada dua puluh sinyal berbeda yang diberi bobot untuk mengidentifikasi halaman kanonis dan bagaimana machine learning digunakan untuk menyesuaikan bobot.

Pada bulan ini, Google memberitahu tentang bagaimana cara mereka mengidentifikasi halaman kanonis dan duplikatnya, serta tentang tingkat crawling untuk situs besar dan kecil.

4 November: Cara Google memilih halaman kanonis

4 November - Cara Google memilih halaman kanonis

Jadi, bagaimana Google menangani kanonikalisasi? Kami mengumpulkan sinyal dan sekarang berakhir dengan langkah berikutnya, yang sebenarnya adalah kanonikalisasi dan deteksi konten duplikat.

Pertama, Anda harus mendeteksi konten duplikat, pada dasarnya mengelompokkan mereka bersama, mengatakan bahwa semua halaman ini saling menipu. Dan kemudian pada dasarnya Anda harus menemukan halaman pemimpin untuk semuanya.

Dan cara kami melakukannya mungkin adalah cara kebanyakan orang, mesin telusur lain melakukannya, yang pada dasarnya mereduksi konten menjadi hash atau checksum dan kemudian membandingkan checksum.

Jadi kami mengurangi konten menjadi checksum dan kami melakukannya karena kami tidak ingin memindai seluruh teks karena tidak masuk akal. Pada dasarnya dibutuhkan lebih banyak sumber daya dan hasilnya akan kurang lebih sama. Jadi kami menghitung beberapa jenis checksum tentang konten tekstual halaman dan kemudian kami membandingkannya dengan checksum.

Apakah Proses Ini Menemukan Duplikat yang Hampir Duplikat atau Duplikat Persis?

Apakah Proses Ini Menemukan Duplikat yang Hampir Duplikat atau Duplikat Persis

Itu bisa merangkap keduanya. Kami memiliki beberapa algoritma yang, misalnya, mencoba mendeteksi dan kemudian menghapus boilerplate dari halaman. Jadi, misalnya, kami mengecualikan navigasi dari perhitungan checksum. Kami juga menghapus footer.

Dan kemudian Anda akan mendapatkan apa yang kami sebut bagian tengah, yang merupakan konten pusat halaman, seperti inti dari halaman. Ini tentunya merupakan cara terbaik untuk bisa mendapatkan sebuah peringkat pada mesin pencarian.

Apa Itu Checksum?

Apa Itu Checksum

Checksum pada dasarnya adalah sekumpulan konten. Pada dasarnya adalah sidik jari dari sesuatu. Dan kemudian, setelah kami menghitung checksum ini, kami memiliki kelompok konten duplikat. Kemudian kita harus memilih satu dokumen, yang ingin kita tampilkan di hasil pencarian.

10 November: Google Tentang Tingkat Crawling untuk Situs Besar dan Kecil

10 November - Google Tentang Tingkat Crawling untuk Situs Besar dan Kecil

John Mueller dari Google menjawab tweet tentang apakah situs besar memiliki keunggulan tingkat pecrawlingan dibandingkan situs kecil dalam hal alat pengiriman URL. Ketika John bertanya – tanya kenapa orang – orang kehilangan alat pengiriman URL, seorang pengguna Twitter mengklaim bahwa karena situs yang lebih besar lebih sering di crawl, situs kecil dirugikan.

Pernyataan ini memicu diskusi yang mengekstrak beberapa wawasan menarik. Crawling tidak tergantung pada ukuran situs web. Beberapa situs memiliki triliun URL (tidak berguna) dan untungnya kami tidak banyak crawling situs tersebut. Jika Anda memiliki contoh dari situs Anda yang mengalami masalah, jangan ragu untuk menambahkannya ke formulir.

John Muller Tentang Sitemap

John Muller Tentang Sitemap

John Mueller mengatakan bahwa beberapa platform penerbitan bahwa situs penerbitan tertentu tidak memperbaharui sitemap mereka secara otomatis. John Mueller menyarankan bahwa pendekatan yang lebih sederhana adalah dengan meningkatkan platform sehingga secara otomatis memperbarui sitemap.

Masih ada situs yang tidak menggunakan sitemap? Sepertinya perbaikan yang jauh lebih sederhana daripada mengirimkan secara manual setiap URL baru atau yang diperbarui. Pengiriman manual tidak pernah dapat diskalakan, pastikan itu bekerja secara otomatis. Membuat file sitemap secara otomatis tampak seperti dasar minimal untuk situs web yang serius.

Blog Lainnya

I am text block. Click edit button to change this text. Lorem ipsum dolor sit amet, consectetur adipiscing elit. Ut elit tellus, luctus nec ullamcorper matti pibus leo.

Hubungi Kami

Tentang kami

Open chat