Apa definisi anti repetisi?
Kita semua tahu bahwa di era internet seperti sekarang banyak artikel, gambar atau video yang sama dipublikasikan oleh beberapa media sekaligus, dan ini merupakan hal yang umum terjadi. Sebuah artikel dengan konten orisinil seringkali dijiplak atau langsung dibagikan ulang oleh website atau media platform lainnya.
Ketika mencari konten dari sebuah artikel melalui Google, biasanya kita akan mendapatkan beberapa URL. Jika menghadapi situasi seperti ini, sebelumnya kita cukup menyaring dan menilai sendiri sumber mana yang lebih berotoritas, baru kemudian memutuskan untuk mengunjungi websitenya. ?
Manfaat mekanisme anti repetisi
Anda mungkin mulai berpikir bahwa mekanisme anti repetisi hanya menguntungkan pihak penerbit asli, sedangkan bagi media yang pandai menemukan dan mengolah ulang konten berkualitas menjadi kurang menguntungkan. Tetapi secara keseluruhan, mekanisme anti repetisi memiliki banyak manfaat, terutama bagi pengguna:
Mengoptimalkan kepuasan pengguna. Pengguna tidak memerlukan beberapa artikel dengan topik yang sama, cukup 1 saja.
Mendorong penulisan artikel orisinil. Di antara banyak artikel dengan konten yang mirip, artikel yang menyatakan tulisannya “orisinil” akan berkesempatan lebih besar untuk direkomendasikan oleh sistem komputer.
Memberikan kesempatan lebih besar bagi konten-konten lainnya untuk dilihat pembaca. Setiap pengguna memiliki minat masing-masing, tetapi jika setiap kali mereka selalu direkomendasikan artikel dengan konten yang sama, maka artikel lain yang dipublikasikan akan kehilangan kesempatannya untuk dilihat pembaca bukan?
Bagaimana cara sistem komputer menilai 2 artikel dengan konten yang sama?
Jika pekerjaan dilakukan secara manual, maka editor perlu membaca keseluruhan artikel sampai habis baru bisa mengambil keputusan. Sistem komputer tentunya juga bisa mengerjakan hal yang sama, tetapi jika setiap harinya harus membaca puluhan ribu artikel tentunya juga akan cukup merepotkan bagi komputer.
Adakah cara berhitung yang lebih sederhana?
Ada, komputer dapat mengubah tulisan, judul, dan gambar menjadi sederetan kode angka, seperti nomor KTP kita. Jika nomor KTP 2 orang sama persis, maka bisa dipastikan kedua orang ini sama, tanpa perlu melihat wajah atau penampilannya. “KTP” masing-masing artikel juga dapat memberikan manfaat yang hampir sama.
Bacaan lanjutan:
Perhatian: informasi berikut merupakan prinsip kerja komputer, belum tentu sama dengan proses perhitungan sebenarnya.
Kode pengenal setiap artikel lebih dikenal dengan sebutan sidik jari informasi, dan sidik jari ini paling sering digunakan untuk melakukan anti repetisi. Ada beberapa cara untuk menghitung sidik jari informasi, tetapi semuanya memiliki prinsip kerja yang hampir sama.
Mungkin Anda sudah mengetahui bahwa bahasa atau angka apapun akan tersimpan dalam sistem komputer dalam bentuk kode yang terdiri dari angka 1 dan 0 yang disebut dengan kode ASCII. Misalnya kode ASCII untuk huruf capital “A” adalah 01000001, sedangkan huruf kecil “z” berupa 01111010 (sebenarnya masih ada banyak standar pengkodean lainnya, tetapi ASCII adalah standar kode yang sering digunakan dalam bahasa inggris yang menggunakan 8 digit kode biner). Artinya, setiap karakter huruf atau tanda baca memiliki sidik jari masing-masing.
Singkatnya, komputer akan melakukan perhitungan algoritma berulang kali terhadap setiap sidik jari informasi yang terdapat dalam sebuah artikel dan frekuensi kemunculannya dalam konten artikel, sampai akhirnya menghasilkan sidik jari artikel secara keseluruhan. Secara teori, jika perhitungan ini dilakukan berkali-kali, maka akan menghasilkan kode angka yang unik dari setiap artikel.
Seberapa rendah probabilitas pengulangan sebuah sidik jari informasi? Misalnya kita mendapatkan 128 digit kode biner berdasarkan cara perhitungan di atas, jumlah ini hanya membutuhkan ruang penyimpanan kecil dalam komputer. Sedangkan berdasarkan “prinsip laci”, kode seperti ini hanya bisa diulang sekali setiap 180 miliar kali. Jumlah ini sudah lebih dari cukup untuk anti repetisi pada umumnya.
Intinya, hampir tidak mungkin 2 artikel yang sama bisa memiliki sidik jari yang berbeda, atau 2 artikel yang berbeda bisa memiliki sidik jari yang sama, untuk itu tidak perlu takut mekanisme anti repetisi akan salah menilai.
Secara teori, kode pengenal artikel yang berbeda pasti tidak akan sama, begitu pula sebaliknya. Sedangkan artikel dengan konten yang mirip akan memiliki kode pengenal yang mirip juga. Ini adalah prinsip dasar yang digunakan sistem komputer dalam melakukan anti repetisi terhadap berita di halaman utama.
Setiap artikel memiliki kode pengenal masing-masing yang dapat digunakan untuk dibandingkan dengan artikel lain dalam platform yang sama. Umumnya ada beberapa macam mekanisme anti repetisi:
Anti repetisi konten dan [item esensial]
Setelah berhasil mendapatkan kode pengenal sebuah artikel, selanjutnya ada 2 kemungkinan.
Pertama, kode pengenal ini hanya satu-satunya di dalam sistem, yang artinya hanya ada 1 artikel ini yang memiliki konten seperti itu. Ini merupakan kondisi paling ideal bagi pihak publikasi, karena sistem komputer tidak memiliki pilihan lain ketika ingin merekomendasikan konten yang sama kepada pembaca.
Kemungkinan kedua jauh lebih kompleks dan juga paling sering terjadi. Di dalam sistem komputer terdapat artikel dengan konten berbeda tetapi memiliki kode pengenal yang sama. Jika terjadi hal seperti ini, maka komputer harus memilih 1 artikel dengan “item esensial” untuk direkomendasikan kepada pengguna. Tujuan dari pemilihan ini adalah agar pembaca mendapatkan rekomendasi artikel dari sumber yang lebih berotoritas, atau artikel orisinil dari akun UC NEWS.
Bagaimana cara kerja sistem komputer dalam menentukan akun UC NEWS mana yang lebih berotoritas dan lebih mungkin menghasilkan artikel orisinil? 2 buah artikel dengan konten yang sama mungkin memiliki perbedaan kecil lainnya yang dapat digunakan sebagai kunci penilaian. Kritieria penilaian secara spesifik terdiri dsari berbagai macam, yang terpenting di antaranya adalah:
Bersumber dari akun UC NEWS yang telah mengaktifkan lambang “orisinil”
Waktu publikasi
Otoritas sumber informasi dan jumlah referensi di internet
Sebagai contoh, misalkan akun BBC merilis sebuah artikel pagi ini melalu platform UC NEWS, kemudian keesokan harinya sebuah akun koran lokal merilis artikel dengan konten yang sama, keduanya sama-sama tidak memberikan lambang orisinil, maka:
Pertama-tama, berdasarkan analisis teks yang dilakukan oleh sistem komputer, konten kedua artikel ini akan menghasilkan sidik jari informasi yang sama.
Selanjutnya, BBC adalah media berita yang lebih berotoritas dan juga lebih awal merilis artikel tersebut, oleh sebab itu kemungkinan mereka menjadi sumber yang orisinil dan berotoritas jauh lebih besar dibanding akun koran lokal.
Akhirnya, sistem komputer akan mengenali artikel yang dirilis akun BBC sebagai item esensial dari konten kedua artikel yang sama, kemudian direkomendasikan kepada para pengguna.
Tetapi jika ternyata akun koran lokal pagi ini merilis artikel, kemudian keesokannya akun BBC merilis artikel dengan konten yang sama, bagaimana sistem komputer akan memutuskan? Situasi seperti ini menjadi jauh lebih kompleks, tetapi sistem komputer akan menilai secara komprehensif dan kemungkinan besar akan memilih sumber berita yang terbaik.
Tetapi ada sebuah pengecualian, jika sebuah akun UC NEWS memberi lambang “orisinil” pada sebuah konten artikel, maka kemungkinan besar sistem komputer akan memilih artikel tersebut sebagai “item esensial” tanpa mempertimbangkan unsur-unsur penilaian lainnya. (Walaupun demikian, pengelola akun UC NEWS harus berhati-hati dalam menggunakan fitur “orisinil”, jika dilaporkan dan terbukti menyalahgunakan fitur tersebut, maka akun bersangkutan akan mendapatkan sanksi dan terancam kehilangan kualifikasi untuk menggunakan fitur tersebut lagi.)
Ketika menemukan bahwa pembaca berpotensi sedang memperbaharui halaman tampilan UC NEWS, sistem komputer otomatis akan memilih 1 artikel terbaik dari antara banyak sidik jari konten yang sama, dan merekomendasikannya kepada pembaca. Artikel lainnya dengan sidik jari konten yang sama kemungkinan besar tidak akan mendapatkan kesempatan untuk direkomendasikan.
Berdasarkan mekanisme anti repetisi terhadap konten artikel, kita bisa memahami mengapa banyak artikel dengan konten yang tidak orisinil di UC NEWS tidak bisa mendapatkan volume rekomendasi.
Aturan anti repetisi lainnya
Selain terhadap konten artikel, masih ada aturan anti repetisi lainnya yang ditujukan kepada unsur lain dalam sebuah artikel.
Anti repetisi terhadap judul dan gambar preview
Prinsip kerjanya hampir mirip dengan anti repetisi konten, bedanya kali ini membandingkan sidik jari informasi judul dan gambar preview.
Seandainya 2 buah artikel dengan konten berbeda memiliki judul atau gambar preview yang sama, ketika pengguna belum mengklik masuk untuk membaca lebih lanjut, maka akan terlihat seolah sistem komputer merekomendasikan 2 artikel dengan konten yang sama. Bisa kita bayangkan bahwa pengalaman seperti ini kurang menyenangkan, lagipula jarang ada orang yang mau membuka beberapa artikel yang kelihatannya memiliki konten sama persis, akibatnya rekomendasi seperti ini hasilnya akan kurang maksimal. Itulah sebabnya perlu dilakukan anti repetisi judul dan gambar preview, meskipun kontennya berbeda.
Anti repetisi terhadap topik yang mirip
Anda mungkin tidak asing dengan kejadian seperti ini: setiap kali ada topik atau kejadian yang sedang ramai dibicarakan, berbagai media dan KOL (key opinion leader) bersaing untuk membuat laporan dan menyampaikan opininya, sampai-sampai akun Facebook Anda dipenuhi dengan berbagai artikel mengenai topik tersebut.
Mengejar berita terkini adalah perilaku naluriah bagi para pelaku media, tetapi sebenarnya pembaca tidak perlu membaca berita yang sama berulang kali, cukup membaca beberapa artikel berita atau opini yang berkualitas.
Agar pembaca tidak menlihat terlalu banyak artikel dengan topik pembahasan yang sama secara bersamaan, sistem komputer akan melakukan anti repetisi terhadap topik penulisan yang mirip.
Anti repetisi topik memiliki mekanisme yang sama dengan anti repetisi konten, jika sistem dapat menghitung sidik jari informasi pada seluruh kata kunci dalam konten artikel, tentunya juga dapat melakukan hal yang sama pada sebagian kata kunci yanga berkaitan dengan topik artikel.
Dari semua aturan anti repetisi, aturan yang diterapkan pada aanti repetisi konten merupakan yang paling ketat. Aturan anti repetisi jenis lainnya cenderung lebih fleksibel, karena melihat konten yang sama berulang kali merupakan pengalaman terburuk bagi pembaca.
Bagaimana cara menghindari eliminasi dalam tahap anti repetisi?
Baik artikel asli ataupun hasil menyusun ulang konten berkualitas dari internet, setiap orang pasti akan menyesalkan jika artikelnya dieleminasi dalam tahapan anti repetisi dan tidak direkomendasikan kepada pembaca. Bagaimana cara menghindari situasi seperti ini?
Selalu berusaha menghasilakan konten yang orisinil
Jika konten artikel sepenuhnya merupakan karya orisinil Anda, maka pada dasarnya konten tersebut hanya satu-satunya, sehingga Anda tidak perlu mengkhawatirkan masalah anti repetisi.
Ini merupakan situasi yang paling ideal, tetapi perlu diingat bahwa penilaian terhadap “orisinalitas” yang dilakukan sistem komputer dan manusia tidak sepenuhnya sama. Karena komputer hanya bisa mengamati hal yang terjadi di internet, dan samasekali tidak mengetahui hallain yang terjadi di luar internet.
Ketika penulis merilis artikel yang sama lewat akun pribadinya di UC NEWS, artikel mereka mungkin tidak berhasil menjadi “item esensial” karena merilisnya lebih lambat atau karena akunnya tidak sepopuler akun media lainnya. Untuk itu, disarankan kepada penulis orisinil untuk membuat perjanjian yang jelas sebelum memberikan hak rilis artikelnya kepada media lain. Dan jika memungkinkan, sebaiknya artikel orisinil tersebut dirilis pertama kali di akun UC NEWS pribadi.
Perlu mengejar topik terkini, tetapi harus berhati-hati terhadap sistem anti repetisi
Jangan lupa dengan aturan “anti repetisi topik”, meskipun prosesnya tidak seketat “anti repetisi konten”, tetapi ketertarikan pembaca terhadap topik sehangat apapun juga tetap terbatas. Oleh sebab itu, jika tidak yakin memiliki sudut pandan yang cukup unik atau konten yang cukup berkualitas, lebih baik jangan sembarangan membahas topik terkini atau usaha Anda akan sia-sia.