1 Agustus 2011

Indentifikasi Duplikat Konten Google Masih Lemah

Indentifikasi Duplikat Konten Google Masih Lemah. Sudah dua minggu tidak menulis blog. Gara-gara crawler Google tidak adil memperlakukan pada blog sumberjambe. Beberapa artikel blog ini telah dicuri, sehingga beberapa query yang saya masukkan tidak menghasilkan apa-apa. Ternyata beberapa artikel telah di copy paste. Artikel palsu menempatkan peringkat jauh lebih baik dari artikel asli tulisan saya. Sedangkan artikel saya harus tersingkir dari indeks google.

Bagaimana mungkin teknologi google tidak bisa membedakan mana artikel yang asli dan palsu alias copy paste melalui daftar indeks artikel blog yang meliputi jam dan tanggal pertama kali blog diterbitkan ukuran file, gambar, atau beberapa algoritma tidak dapat mendeteksi setiap huruf mempunyai nilai dengan tingkat kesamaan tinggi. Dan saya percaya mungkin artikel blog anda sudah copy paste oleh blog-blog yang baru.

Benar prediksi teman-teman di forum linkreferral yang saya ikuti. Jumlah website sudah menjadi ratusan milyar. Bagaimana mungkin Google dapat mendeteksi duplikat konten meskipun melibatkan manusia untuk menilai suatu kualitas konten blog. Sedangkan mereka pun tak tahu apakah konten yang dibaca adalah duplikat dari blog yang lain. Ratusan milyar website telah terdaftar di Google, bagaimana google membandingkan duplikat konten antara blog yang satu dengan yang lain. Tentu dengan variasi cross check lebih banyak untuk menentukan apakah artikel suatu blog merupakan duplikat konten dan ini memerlukan waktu yang lama. Ini merupakan pekerjaan berat bagi google, kecuali sang webmaster langsung lapor atas ketidakadilan ini.

Akhir-akhir ini saya juga mempersiapkan lahirnya situs resmi pemerintah kecamatan sumberjambe. Diperkirakan akan launching pada awal tahun 2012 tentu dengan domain sumberjambekec.go.id. Saat ini saya masih merencanakan anggaran untuk membiayai situs resmi pemerintah kecamatan sumberjambe melalui Kebijakan Umum Anggaran Pagu Plafon Anggaran Sementara (KUA PPAS) Tahun 2012. Sehingga banyak menyita waktu saya untuk merancang sebuah situs resmi pemerintah yang ideal sesuai dengan tuntutan dan kebutuhan masyarakat. Dimana saat ini jaringan koneksi internet di kecamatan sumberjambe sudah tersedia dengan beberapa operator dengan harga murah. Pertumbuhan pengguna internet dan situs blog di kecamatan sumberjambe sangat pesat diperkirakan kurang lebih 50 penguna internet per desa atau sekitar 450 pengguna internet. Saat ini juga diperkirakan sekitar lebih dari 20 situs blog yang dikelola oleh masyarakat sumberjambe. Seperti yang anda ketahui, bahwa kecamatan Sumberjambe adalah kecamatan miskin dan terbelakang berada di ketinggian 500 mdpl terletak di lereng barat Gunung Raung Jawa Timur.

Pesatnya perkembangan blog-blog baru sudah tentu akan membebani Google dalam menentukan peringkat terbaik dari suatu situs di SERP's (Search Engine Result Page's). Sudah barang tentu Google akan menambah kekuatan mesin pencari agar semua situs terindeks dengan sempurna dengan peringkat yang adil dan sesuai. Crawler Google mungkin bekerja sesuai data-data pada situs kemudian mengirimkan data-data tersebut ke repository untuk diolah sesuai algoritma google panda. Ketidaksempurna indentifikasi Duplikat konten saat repository mengolah data dari crawler, ini adalah suatu metode dasar mesin pencari google yang diungkapkan oleh Larry Page dan Brian Sergery di University Stanford saat pertama kali membuat Google. Metode kerja dasar google masih berjalan hanya saat ini Google memasukkan beberapa unsur-unsur untuk peringkat situs.

Duplikat konten Google saat ini, dapat saya perkirakan masih belum efektif berlaku untuk IP address Indonesia. Hal ini dikarenakan perubahan algoritma tidak berubah secara total tetapi masih bertahap dalam melakukan perubahan algoritma khususnya untuk indentifikasi duplikat konten. Perubahan secara mendadak dan menyeluruh akan menimbulkan crash program antara algoritma lama yang masih digunakan dengan penambahan algoritma terbaru. Sehingga perlu diberlakukan secara bertahap agar tidak menimbulkan masalah. Saya percaya algoritma google panda di Indonesia masih dalam tahap peralihan sehingga tidak mampu membedakan konten asli dan palsu. Indentifikasi Duplikat Konten Google Masih Lemah

0 komentar:

Posting Komentar