Kamis, 24 Juni 2021

Web Archiving

 

Kesimpulan 

Web pengarsipan (Archiving) adalah proses pengumpulan bagian dari World Wide Web untuk memastikan informasi tersebut diawetkan dalam arsip bagi para peneliti di masa depan, serta berusaha untuk memelihara arsip dari seluruh Web. Salah satu cara Kerja web ini ialah Remote Harvesting, melakukan proses pengumpulan halaman web. Setelah disimpan dalam format standar, konten yang diarsipkan dapat tersedia untuk diakses menggunakan single access system. Transactional archiving, mengumpulkan transaksi yang berlangsung antar web server dan web browser. Sistem yang digunakan beroperasi dengan memeriksa setiap permintaan HTTP dan respon dari web server, menyaring setiap aktifitas untuk menghilangkan konten yang duplikat, secara permanen disimpan sebagai bitstreams.

Beberapa Metode Pengumpulan sebagai berikut : 
  • Panen Jarak Jauh untuk mengotomatisasi proses pengumpulan halaman web. Contoh web crawler yang digunakan untuk web pengarsipan meliputi : Heritrix, HTTrack, Wget, On-demand.
  • Arsip dapat digunakan sebagai bukti hukum (Smarsh Web Pengarsipan) dirancang untuk menangkap, memelihara dan menciptakan kembali pengalaman web seperti ada setiap saat dalam waktu untuk kewajiban kepatuhan e-discovery dan peraturan.
  • Database pengarsipan mengacu pada metode untuk pengarsipan konten mendasari database-driven website. 
Web arsip, mengandalkan web sebagai sarana utama mereka mengumpulkan, dipengaruhi oleh kesulitan merangkak web. Protokol pengecualian robot meminta crawler tidak dapat mengakses bagian dari sebuah situs web. Sebagian dari sebuah situs mungkin tersembunyi di dalam Web. Namun, penting untuk dicatat bahwa web arsip format asli yaitu, web dibrowser penuh, dengan link bekerja, media, hanya mungkin menggunakan teknologi crawler.

Sebuah alat untuk Kurasi Web oleh Konsorsium Pelestarian Internet International :
  • Situs resmi
  • Mengumpulkan aset Web NutchWAX
  • Pencarian Web arsip koleksi Wayback (Sumber Wayback Machine Terbuka)
  • Pencarian dan navigasi koleksi arsip Web menggunakan NutchWax Web Kurator Alat
  • Seleksi dan Pengelolaan Koleksi Web

Peralatan terbuka untuk memanipulasi Web Arsip :
  • WARC Tools untuk membuat, membaca, memanipulasi, web arsip pemrograman pencarian, mengindeks dan mencari teks lengkap dan metadata dalam web arsip.

    Tidak ada komentar:

    Posting Komentar

    Quantum Computing

    Sebutkan dan jelaskan Konsep Quantum Computation! Quantum Computation adalah paradigma komputasi yang menggunakan prinsip-prinsip fisika ku...