Abstrak
Karena berbagai modul yang digunakan untuk membangun jaringan neural konvolusional (CNN) memiliki struktur geometris yang relatif tetap, hal ini pada dasarnya membatasi pemodelan transformasi geometrik dengan algoritme CNN. Lei Feng.com mengetahui bahwa dalam makalah "Jaringan Konvolusional yang Dapat Diubah", para peneliti dari Microsoft Research Asia mengusulkan dua modul baru, Konvolusi yang dapat diubah dan penyatuan RoI yang Dapat Diubah, untuk meningkatkan kemampuan algoritma CNNs untuk memodelkan transformasi geometris.
Gambar di atas menunjukkan struktur konvolusi Deformable ukuran 3 x 3
Konsep konvolusi Deformable dan penyatuan RoI Deformable adalah:
-
Dalam hal memberikan offset tambahan, tingkatkan posisi pengambilan sampel spasial dalam modul (lihat Gambar 2);
-
Pelajari offset dari tugas target tanpa pengawasan tambahan (lihat Gambar 3).
Gambar di atas menunjukkan struktur penyatuan RoI Deformable ukuran 3 x 3
Perlu disebutkan bahwa kedua modul ini dapat dengan mudah menggantikan modul yang sesuai dalam jaringan saraf konvolusional (CNN) yang ada, dan juga dapat menjadi ujung ke ujung (End-to-End) melalui algoritme propagasi mundur standar. ) Pelatihan untuk menghasilkan jaringan konvolusional yang dapat diubah bentuk.
-
Gambar di atas (a) menunjukkan bidang reseptif tetap dua lapis dalam operasi konvolusi tradisional, dan (b) menunjukkan bidang reseptif adaptif dua lapis dalam operasi konvolusi yang dapat dideformasi. Kedua gambar (a) dan (b) mengikuti struktur yang sama. Dari atas ke bawah, yaitu: 1. Gambar paling atas menunjukkan dua unit aktivasi, terletak pada objek dengan bentuk dan ukuran yang berbeda, dan masukannya berasal dari Untuk filter ukuran 3x3; 2. Gambar tengah menunjukkan posisi sampling dari dua filter ukuran 3x3 pada peta fitur sebelumnya, dan masih ada dua unit aktif yang disorot; 3. , Gambar di bawah menunjukkan posisi pengambilan sampel dari filter ukuran 3x3 dua tingkat pada peta fitur sebelumnya. Dua set posisi pengambilan sampel disorot, yang sesuai dengan sorotan di lapisan gambar sebelumnya. satuan.
Menurut Leifeng.com, para peneliti di Microsoft Research Asia telah memverifikasi keefektifan metode baru untuk dua tugas penglihatan kompleks yaitu deteksi objek dan segmentasi semantik melalui sejumlah besar eksperimen, dan kode eksperimental terkait juga akan diterbitkan.
melalui Jaringan Konvolusional Cacat, disusun oleh Lei Feng.com
- Ibu negara di Asia Tenggara, biaya hidup 2,2 juta yuan per bulan, kemiskinan membatasi imajinasi saya ...
- Penjualan telah mencetak rekor baru. Apakah "Empat Modernisasi Baru" SAIC merupakan jawaban untuk promosinya ke merek-merek top dunia?
- Mengapa pekerjaannya selalu tidak lengkap? 3 teknik manajemen waktu untuk veteran di tempat kerja, memungkinkan Anda bekerja secara efisien dan pulang kerja lebih awal
- Teknisi perangkat keras Google mengungkap rahasianya, mengapa TPU 30 kali lebih cepat dari CPU dan GPU?