Sumber: blog pembelajaran mesin
Artikel ini adalah tentang 2215 kata , Dianjurkan untuk membaca 6 menit
Artikel ini memperkenalkan model pengambilan sampel negatif baru, Jaringan Kebijakan Grafik Pengetahuan (KGPolicy), untuk mengeksplorasi sampel negatif berkualitas tinggi dalam bentuk agen pembelajaran penguatan.
Pengambilan Sampel Negatif yang Diperkuat pada Grafik Pengetahuan untuk Rekomendasi
Xiang Wang, Yaokun Xu, Xiangnan He, Yixin Cao, Meng Wang, Tat-Seng Chua
Universitas Nasional Singapura, Universitas Tenggara, Universitas Sains dan Teknologi Cina, Universitas Teknologi HeFei
Dalam sistem rekomendasi, sulit untuk menangani data yang hilang dengan benar.
Saat ini, sebagian besar pekerjaan akan melakukan pengambilan sampel negatif dari data yang tidak teramati, sehingga dapat melatih model rekomendasi dengan sinyal negatif. Namun, strategi pengambilan sampel negatif saat ini, baik itu pengambilan sampel negatif statis atau pengambilan sampel negatif adaptif, tidak dapat memperoleh sampel negatif berkualitas tinggi. Sampel negatif ini tidak memiliki kemampuan untuk membantu pelatihan model dan mencerminkan kebutuhan nyata pengguna.
Dalam artikel ini, dibuat asumsi bahwa grafik pengetahuan komoditas dapat memberikan informasi yang lebih kaya antara komoditas dan entitas grafik pengetahuan, yang membantu mendapatkan sampel negatif dengan informasi yang kaya dan lebih realisme.
Untuk tujuan ini, penulis mengusulkan model pengambilan sampel negatif baru, Jaringan Kebijakan Grafik Pengetahuan (KGPolicy), untuk mengeksplorasi sampel negatif berkualitas tinggi dalam bentuk agen pembelajaran penguatan. Secara khusus, dengan merancang operasi eksplorasi yang sesuai, model secara adaptif menerima informasi sampel negatif dengan pengetahuan dari interaksi sampel positif target, dan akhirnya menghasilkan produk sampel negatif potensial untuk melatih model rekomendasi.
Setelah menggabungkan faktorisasi matriks dengan Kebijakan KGP, metode pengambilan sampel STOA (seperti DNS dan IRGAN) dan model rekomendasi yang menggunakan peningkatan grafik pengetahuan (seperti KGAT) mencapai peningkatan yang signifikan.
Sampling negatif dapat dibagi menjadi tiga kategori utama
Perbedaan dalam ketiga jenis fokus ini terutama tercermin dalam aspek berikut
Sampel negatif berkualitas tinggi memiliki dua karakteristik berikut
Diagram distilasi sampel negatif adalah sebagai berikut
Model yang diusulkan dalam artikel ini adalah
Kontribusi utama artikel ini adalah sebagai berikut
Berikut beberapa ketentuan notasi
Di bawah ini adalah deskripsi masalahnya
Di bawah ini adalah contoh jalur multi-hop dan sampel negatif
Kerangka model dan diagram sampling negatif berdasarkan grafik pengetahuan adalah sebagai berikut
Fungsi tujuan didefinisikan sebagai berikut
Sampel negatif dengan lebih banyak informasi memiliki karakteristik sebagai berikut
Proses rinci pengambilan sampel negatif sebagai pembelajaran penguatan adalah sebagai berikut
Di bawah ini adalah definisi status
Perilaku tersebut didefinisikan sebagai berikut
Dinamika transisi keadaan didefinisikan sebagai berikut
Fungsi penghargaan ditentukan berdasarkan dua faktor berikut
Di bawah ini adalah definisi dari fungsi tujuan
Berikut ini adalah bentuk modul pembelajaran graph
Operasi eksplorasi dapat dibagi menjadi dua langkah
Berikut ini adalah cara mendapatkan titik dekat dari grafik pengetahuan dengan perhatian
Berikut ini adalah cara untuk mendapatkan poin tetangga dari produk tersebut
Mengenai pelatihan model dan pengoptimalan, penulis mengadopsi strategi berikut
Statistik informasi kumpulan data adalah sebagai berikut
Beberapa metode pengambilan sampel yang terlibat dalam perbandingan adalah sebagai berikut
Beberapa model rekomendasi berdasarkan grafik pengetahuan yang berpartisipasi dalam perbandingan adalah sebagai berikut
Indeks evaluasi adalah
Parameternya diatur sebagai berikut
Perbandingan efek model rekomendasi yang berbeda adalah sebagai berikut
Efek dari metode pengambilan sampel yang berbeda adalah sebagai berikut
Perbandingan jumlah operasi eksplorasi adalah sebagai berikut
Dampak dari fungsi penghargaan dibandingkan sebagai berikut
Tren gradien rata-rata dengan jumlah iterasi pelatihan adalah sebagai berikut
Alamat kode
https://github.com/xiangwang1223/kgpolicy
-Selesai-
Ikuti platform publik WeChat resmi dari Institut Ilmu Data Tsinghua-Qingdao " Pai Data AI "Dan nomor saudara perempuan" Data Pie THU "Dapatkan lebih banyak manfaat kuliah dan konten berkualitas.
- Google Terjemahan dihancurkan! Mesin terjemahan pertama di dunia, DeepL, telah kembali, dan "detail gila" telah selesai
- University of Science and Technology of China × MSRA | Catatan Kuliah Dr. Zhou Ming: Pemrosesan Bahasa Alami Membuat Hidup Lebih Baik
- Tonggak sejarah yang "menyeramkan": AI ilmuwan China menerjemahkan gelombang otak dengan akurasi 97%
- Di mana menemukan data penelitian mahkota baru? Tempat yang harus dilihat untuk pekerja penelitian ilmiah (dengan tautan)
- Menggunakan gerbang logika protein untuk mengubah sel menjadi komputer, cendekiawan muda Tiongkok belajar tentang Sains
- Mesin terjemahan pertama di dunia telah kembali dari evolusi, dan "detail gila" menangani dialek China klasik