Leifeng.com Tinjauan Teknologi AI Catatan: Artikel ini secara eksklusif dikontribusikan oleh Shangtang Technology, dan Tinjauan Teknologi AI berwenang untuk mencetak ulang.
Konferensi visi komputer terbaik dunia IEEE CVPR 2018 (Visi Komputer dan Pengakuan Pola, Konferensi Internasional IEEE tentang Visi Komputer dan Pengenalan Pola) akan diadakan di Salt Lake City, AS pada bulan Juni. Sebanyak 979 makalah dari seluruh dunia diterima untuk konferensi ini. CVPR adalah konferensi penelitian tingkat tertinggi di bidang visi komputer, dan makalah yang diterima mewakili tingkat teknologi terbaru dan tertinggi serta tren perkembangan masa depan di bidang visi komputer pada tahun 2018.
Menurut situs resmi CVPR, lebih dari 3.300 makalah telah dikirim ke konferensi tahun ini, dan 979 makalah diterima, meningkat 25% dibandingkan tahun lalu (783 makalah diterima pada tahun 2016). Hasil penelitian ilmiah terbaru diakui mencakup berbagai karya mutakhir di bidang computer vision. CVPR 2018 mencakup 21 tutorial, 48 lokakarya, dan lebih dari 115 perusahaan dari seluruh dunia akan mengikuti pameran industri CVPR tahun ini.
Sebanyak 44 makalah dari Shangtang Technology, The Chinese University of Hong Kong-Shangtang Technology Joint Laboratory dan SenseTime Joint Laboratory lainnya diterima oleh konferensi CVPR ini, termasuk 3 makalah presentasi lisan (tingkat penerimaan hanya 62/3300 = 1,88% ), terdapat 13 makalah dalam highlight report, dan jumlah makalah yang diterima meningkat signifikan dibandingkan dengan 23 makalah di CVPR 2017, dan hasilnya luar biasa. Hasil penelitian ilmiah terkemuka di dunia menunjukkan kumpulan bakat yang kuat, landasan penelitian ilmiah, dan kemampuan inovasi SenseTime di bidang visi yang cerdas.
Makalah penerimaan CVPR 2018 SenseTime mencapai terobosan di bidang-bidang berikut: pelatihan terdistribusi skala besar, pemahaman manusia dan pengenalan kembali pejalan kaki, pemahaman dan analisis adegan mengemudi otonom, algoritme visual yang mendasari, pemahaman komprehensif tentang penglihatan dan bahasa alami, deteksi objek, pengenalan dan Pelacakan, model generatif yang mendalam, pemahaman video dan perilaku, dll. Algoritme visi komputer baru ini tidak hanya memiliki banyak skenario aplikasi, sehingga algoritme visi yang lebih cerdas dapat digunakan dalam kehidupan sehari-hari, tetapi juga memberikan pengalaman dan arahan yang berharga untuk penelitian selanjutnya.
Pelatihan terdistribusi skala besar
Makalah perwakilan: Pembelajaran penguatan lisan-Deep desain struktur jaringan otomatisMakalah ini didedikasikan untuk memecahkan masalah desain otomatis struktur jaringan saraf dalam Berbeda dari desain struktur manual umum, makalah ini mengusulkan algoritma yang efisien untuk secara otomatis merancang struktur jaringan yang optimal melalui pembelajaran penguatan. Desain struktur jaringan saraf tradisional biasanya membutuhkan banyak pengetahuan ahli, biaya trial and error, dan bahkan beberapa inspirasi.Hanya beberapa struktur jaringan penting yang dirancang setiap tahun. Oleh karena itu, desain struktur jaringan secara manual adalah tugas yang sangat sulit. . Algoritme pencarian otomatis baru-baru ini untuk struktur jaringan biasanya membutuhkan sumber daya komputasi yang besar (ratusan GPU, hampir sebulan pelatihan), dan model yang dihasilkan tidak terlalu portabel, sehingga sulit untuk mencapai kepraktisan yang sebenarnya.
Makalah ini mengusulkan algoritma desain otomatis untuk struktur jaringan berdasarkan pembelajaran penguatan Melalui ide desain "blok jaringan", ruang pencarian sangat berkurang, dan jaringan yang dirancang memiliki transferabilitas yang sangat kuat. Pada saat yang sama, artikel ini menggunakan "penghentian prematur" dan arsitektur terdistribusi untuk mempercepat seluruh proses pembelajaran struktur jaringan, yang seratus kali lebih cepat daripada algoritme sebelumnya (32 GPU, pelatihan 3 hari). Permukaan percobaan menunjukkan bahwa struktur jaringan yang dihasilkan pada kumpulan data CIFAR mencapai dan melebihi keakuratan struktur jaringan yang dirancang oleh manusia, dan strukturnya dapat ditransfer ke data ImageNet skala besar untuk mencapai kinerja yang baik.
Pemahaman tubuh manusia dan identifikasi ulang pejalan kaki
Makalah perwakilan: Identifikasi ulang Lisan-Pejalan Kaki berdasarkan batasan konsistensi kelompokIdentifikasi ulang pejalan kaki adalah salah satu komponen penting dalam generasi baru sistem keamanan cerdas. Mengingat gambar pejalan kaki, pengenalan ulang pejalan kaki membutuhkan kamera yang berbeda untuk mencocokkan dan mengenali pejalan kaki yang sama secara akurat berdasarkan tampilan visualnya. Algoritme pembelajaran dalam yang ada biasanya menggunakan fungsi kehilangan kendala yang terlalu lokal untuk pembelajaran fitur pejalan kaki, sehingga tidak dapat mempelajari kesamaan visual antara gambar pejalan kaki secara akurat. Dalam makalah ini, kondisi kendala konsistensi kelompok baru diusulkan untuk masalah ini, dan kondisi kendala dimodelkan dengan lapangan acak bersyarat kontinu. Bidang acak bersyarat berkelanjutan ditambahkan ke jaringan neural dalam untuk mewujudkan pelatihan ujung ke ujung model dalam. Hasil eksperimen menunjukkan bahwa kondisi konsistensi ini dapat meningkatkan kekokohan dan diskriminatif fitur visual akhir secara signifikan dalam pelatihan dan pengujian, serta mencapai pengenalan ulang pejalan kaki dengan presisi tinggi.
Pemahaman skenario mengemudi otonom
Makalah perwakilan: Segmentasi Semantik Video Spotlight dengan Latensi Sangat RendahMakalah ini berfokus pada masalah segmentasi semantik real-time video untuk skenario autonomous driving Meskipun segmentasi semantik gambar telah membuat kemajuan besar dalam beberapa tahun terakhir, masih terdapat tantangan untuk segmentasi semantik berorientasi video. Kesulitan utamanya adalah: 1) Video memerlukan lebih banyak kalkulasi; 2) Banyak aplikasi real-time seperti mengemudi otonom perlu mencapai latensi rendah.
Artikel ini didedikasikan untuk menyelesaikan dua masalah ini sambil memastikan keakuratan segmentasi sebanyak mungkin. Pada masalah segmentasi video, perubahan tag semantik antar frame yang berdekatan relatif kecil, sehingga tidak perlu menggunakan jaringan lengkap untuk mengekstrak tag semantik untuk setiap frame. Berdasarkan pemahaman tersebut, makalah ini mengusulkan kerangka segmentasi semantik seperti yang ditunjukkan pada gambar, yang membagi seluruh jaringan menjadi bagian tingkat tinggi dan tingkat rendah.Bagian tingkat rendah mengkonsumsi lebih sedikit perhitungan, kerangka makalah ini hanya menjalankan jaringan lengkap dalam bingkai kunci. Fitur tingkat tinggi diekstraksi untuk segmentasi semantik, sedangkan di bingkai lain, fitur disebarkan dari bingkai kunci sebelumnya untuk segmentasi semantik. Kerangka kerja terkait terdiri dari dua komponen: 1) modul penjadwalan bingkai kunci, dan 2) modul propagasi lintas bingkai fitur, yang melakukan penghitungan yang sesuai berdasarkan fitur tingkat rendah, sehingga penghitungan jaringan yang relatif lengkap jauh lebih kecil. Pada saat yang sama, untuk mengurangi penundaan, ketika bingkai saat ini terdeteksi sebagai bingkai kunci, strategi penjadwalan penundaan rendah digunakan. Metode yang diusulkan dalam makalah ini memverifikasi keefektifan metode kami pada kedua kumpulan data, mencapai latensi rendah dan menjaga akurasi segmentasi yang akurat.
Pencocokan stereo lampu sorot berdasarkan tampilan tunggalMetode estimasi kedalaman monokuler untuk skenario autonomous driving biasanya menggunakan data gambar dari suatu perspektif sebagai input untuk memprediksi secara langsung nilai kedalaman yang sesuai dengan setiap piksel pada gambar tersebut.Hal ini mengakibatkan metode yang ada biasanya membutuhkan data dalam jumlah besar yang dianotasi dengan informasi kedalaman. . Studi terbaru telah mengusulkan perbaikan yang memperkenalkan kendala geometris dalam proses pelatihan, tetapi masih terdapat kekurangan kendala geometris eksplisit dalam proses pengujian. Makalah ini mengusulkan untuk menguraikan estimasi kedalaman monokuler menjadi dua sub-proses, yaitu proses sintesis tampilan dan proses pencocokan binokular.Setelah dekomposisi ini, model yang diusulkan tidak hanya dapat secara eksplisit memperkenalkan kendala geometris pada tahap pengujian, tetapi juga sangat mengurangi Ketergantungan pada data dengan anotasi mendalam. Eksperimen telah membuktikan bahwa metode yang diusulkan dalam makalah ini dapat melampaui semua metode sebelumnya pada dataset KITTI hanya dengan menggunakan sejumlah kecil data kedalaman, dan untuk pertama kalinya hanya mengandalkan data gambar monokuler untuk melampaui algoritma pencocokan binokuler Block Matching, yang selanjutnya mempromosikan kedalaman monokuler. Perkirakan pendaratan teknologi.
Algoritme visual tingkat rendah
Makalah perwakilan: Spotlight-Restorasi gambar universal berdasarkan pembelajaran penguatan mendalamMakalah ini mengusulkan metode pemulihan citra pembelajaran mendalam yang baru. Sebagian besar algoritma restorasi yang ada hanya berorientasi untuk menyelesaikan jenis masalah restorasi citra tertentu, sehingga kurang universalitas untuk berbagai jenis citra yang terdegradasi. Menanggapi masalah ini, algoritma RL-Restore yang diusulkan dalam artikel ini pertama-tama melatih serangkaian jaringan saraf kecil untuk berbagai gambar yang terdegradasi; pada saat yang sama, ia merancang fungsi penghargaan untuk mengevaluasi kualitas pemulihan gambar, dan menggunakan algoritme pembelajaran yang ditingkatkan untuk mempelajari cara merasionalisasi jaringan saraf kecil ini. kombinasi. Untuk citra terdegradasi yang berbeda, kombinasi komponen algoritme restorasi berbeda diperoleh untuk mencapai restorasi efektif citra terdegradasi kompleks.
Makalah representatif tentang pemahaman komprehensif tentang penglihatan dan bahasa alami: Pembuatan pertanyaan penglihatan ganda dengan sorotan untuk menjawab pertanyaan visualBertujuan pada masalah data pelatihan yang terlalu sedikit dalam Menjawab VisualQuestion Terbuka, artikel ini mengusulkan "jaringan penjawab pertanyaan yang dapat dibalik". Model tersebut dapat mengatur ulang modul yang berbeda untuk memungkinkan sekelompok model menyelesaikan dua tugas timbal balik secara bersamaan yaitu "menjawab pertanyaan" dan "menghasilkan pertanyaan". Model ini memanfaatkan sepenuhnya dualitas pertanyaan dan jawaban visual serta pembuatan pertanyaan visual untuk meningkatkan efisiensi penggunaan model data pelatihan terbatas. Metode ini menggunakan dua tugas untuk melatih model yang sama pada waktu yang sama, sehingga jaringan dapat memiliki pemahaman yang lebih dalam tentang hubungan antara pertanyaan dan gambar, sehingga mencapai akurasi dan efek yang lebih baik pada dua tugas pembuatan pertanyaan dan jawaban pertanyaan.
Pengenalan wajah dan analisis wajah
Makalah representatif: Disosiasi Poster-Wajah menampilkan pembelajaran ruang angkasa di luar pengenalan wajahMakalah ini secara bersamaan memecahkan tiga masalah pengenalan wajah, klasifikasi atribut dan pembuatan wajah sewenang-wenang. Sebagian besar pekerjaan pembelajaran fitur wajah biasanya memungkinkan jaringan untuk mempelajari fitur dengan identitas yang kuat atau diskriminasi atribut, yang dapat diterapkan pada tugas-tugas seperti pengenalan wajah dan klasifikasi atribut; atau mempelajari fitur dengan informasi global untuk aplikasi Aplikasi seperti pembuatan dan pengeditan wajah. Mengapa kita tidak dapat mempelajari ruang fitur lengkap dan membuat informasi semantik sangat berbeda, dan kemudian menyadari bahwa satu fitur dapat menyelesaikan semua tugas? Makalah ini mengusulkan kerangka kerja distilasi informasi dan jaringan pengusiran, hanya menggunakan ID identitas sebagai informasi pengawasan, dan mempelajari ruang fitur cembung padat dengan diskriminasi informasi yang kuat dan informasi global. Eksperimen pada dataset seperti LFW, LFWA dan CelebA menunjukkan bahwa proyeksi wajah di ruang fitur ini memiliki kemampuan pengenalan identitas dan atribut yang sangat tinggi, dan titik mana pun di ruang tersebut memiliki semantik identitas dan atribut yang kuat. , Dan dapat menghasilkan gambar wajah dengan semantik.
Poster - Lokasi titik-titik penting pada wajah berdasarkan persepsi tepiMakalah ini mengusulkan algoritma deteksi titik kunci wajah berdasarkan persepsi tepi, yang mengintegrasikan informasi struktural yang dijelaskan oleh garis tepi wajah ke dalam deteksi titik kunci, yang sangat meningkatkan algoritma secara ekstrem seperti wajah profil besar, ekspresi berlebihan, oklusi, dan blur. Akurasi deteksi dalam situasi tersebut. Artikel ini terutama memecahkan dua masalah utama: 1. Poin utama dari wajah tidak jelas di antara berbagai kumpulan data, dan definisinya tidak konsisten. Artikel ini menangkap informasi garis tepi yang lebih umum untuk wajah manusia dan menggunakannya sebagai media perantara dari wajah ke titik-titik utama, sehingga meskipun terdapat perbedaan dalam poin-poin utama, kumpulan data yang berbeda masih dapat saling membantu dalam pelatihan. 2. Akurasi deteksi poin-poin penting dalam situasi yang kompleks. Makalah ini pertama-tama memperoleh hasil deteksi garis tepi presisi tinggi melalui penyampaian pesan yang dikombinasikan dengan pembelajaran adversarial, dan kemudian mengintegrasikan informasi garis tepi ke dalam deteksi titik kunci pada beberapa tingkat semantik, yang sangat meningkatkan ketahanan algoritme dalam situasi yang kompleks.
Selain itu, artikel ini juga mengusulkan kumpulan data pendeteksian titik kunci wajah baru Wider Facial Landmarkin-the-wild (WFLW), yang berisi 10.000 data wajah dengan 98 poin dan 6 anotasi atribut, yang bertujuan untuk membantu sivitas akademika lebih efektif. Evaluasi kekuatan algoritme titik kunci dalam berbagai kondisi.
Deteksi, pengenalan dan pelacakan objek
Makalah perwakilan: Spotlight-Pelacakan visual berkinerja tinggi berdasarkan jaringan area kandidat kembarMakalah ini mengusulkan algoritma pelacakan target tunggal berkinerja tinggi berdasarkan kerangka pembelajaran mendalam end-to-end. Algoritme pelacakan target tunggal yang ada biasanya sulit untuk menyeimbangkan kinerja dan kecepatan, dan hanya dapat mendominasi dalam indeks tertentu. Makalah ini menggunakan jaringan Siam dan Region Proposal Network untuk membangun algoritma pelacakan target tunggal berkecepatan tinggi dan presisi tinggi. Kedua sub-jaringan ditingkatkan melalui operasi konvolusi dan disatukan dalam kerangka kerja jaringan saraf dalam ujung ke ujung. Selama proses pelatihan, algoritme dapat dilatih menggunakan kumpulan data dengan pelabelan padat (VID) dan pelabelan renggang (YoutubeBB). Dibandingkan dengan metode yang ada, kumpulan data berlabel jarang sangat meningkatkan sumber data pelatihan, sehingga jaringan neural dalam dapat lebih terlatih sepenuhnya; regresi koordinat di jaringan kandidat regional dapat membuat kerangka pelacakan lebih akurat dan menghemat banyak skala Waktu yang dihabiskan untuk ujian. Dalam hal percobaan, algoritma pelacakan yang diusulkan dalam makalah ini dapat mencapai level lanjutan saat ini pada kumpulan data VOT2015 dan VOT2016 dengan kecepatan 160 frame.
Metode pengenalan dan deteksi teks multi-sudut ujung-ke-ujung poster-FastMakalah ini menyajikan deteksi teks multi-sudut ujung ke ujung dan metode pengenalan untuk pertama kalinya. Deteksi dan pengenalan teks (Text Detection and Recognition / OCR) adalah masalah klasik di bidang computer vision, di masa lalu deteksi dan pengenalan teks diselesaikan sebagai dua masalah. Makalah ini mengusulkan metode end-to-end untuk deteksi dan pengenalan teks simultan, yang memverifikasi bahwa kedua tugas ini saling melengkapi, dan bersama-sama mengawasi pelatihan jaringan dapat membuat kedua tugas ini mencapai akurasi yang lebih baik. Karena dua tugas berbagi jaringan ekstraksi fitur, kecepatannya sekitar dua kali lipat dari deteksi dan pengenalan teks. Pada saat yang sama, artikel ini juga mengusulkan operasi RoIRotate, yang memperluas RoIAlign dan dapat diterapkan pada deteksi objek berputar. Artikel ini melampaui metode yang ada di beberapa kumpulan data.
Model generatif yang dalam
Makalah perwakilan: Transfer gaya titik nol poster-waktu nyata berdasarkan dekorasi fiturSaat ini, untuk aplikasi stilisasi gambar secara real-time, kebanyakan dari mereka perlu merancang model transfer gaya tertentu untuk peta gaya tertentu; jika transfer peta gaya apa pun perlu diterapkan, kompleksitas komputasi dan efek migrasi sebagian besar tidak dijamin. Makalah ini mengusulkan model transfer gaya gambar titik nol waktu nyata untuk mewujudkan transfer gaya multi-skala dan kualitas tinggi untuk gambar gaya arbitrer. Metode ini didasarkan pada struktur jaringan transfer fitur yang disebut dekorator gaya, yang dapat dengan mudah disematkan dalam jaringan rekonstruksi gambar untuk mencapai transfer fitur gaya multi-skala. Struktur jaringan memungkinkan gambar bergaya yang dihasilkan untuk sepenuhnya mengekspresikan pola tekstur tertentu dalam peta gaya sambil mempertahankan informasi semantik dalam gambar asli. Eksperimen menunjukkan bahwa jaringan memiliki kemampuan stilisasi tinggi untuk berbagai jenis peta gaya, dan dapat secara efektif diperluas ke aplikasi seperti transfer multi-gaya dan transfer gaya video.
lampiran:
Sebanyak 44 makalah dari laboratorium bersama SenseTime dan SenseTime diterima, sebagai berikut:
1.3D Estimasi Pose Manusia di Alam Liar dengan Adversarial Learning
Wei Yang, Wanli Ouyang, Xiaolong Wang, Xiaogang Wang
2. Jaringan Komposisi Sadar Perhatian untuk Identifikasi Ulang Orang
Jing Xu, Rui Zhao, Feng Zhu, Huaming Wang, Wanli Ouyang
3. Avatar-Net: Transfer Gaya Zero-shot Multi-skala dengan Dekorasi Fitur
Lu Sheng *, Jing Shao *, Ziyi Lin dan Xiaogang Wang (* kontribusi yang sama)
4. Melampaui Pengenalan Objek Holistik: Memperkaya Pemahaman Citra dengan Beberapa Negara Bagian
Cewu Lu, Hao Su, Yonglu Li, Yongyi Lu, Li Yi, Chi-Keung Tang, Leonidas J.Guibas
5. Jaringan Kolaboratif dan Adversarial untuk adaptasi domain yang tidak diawasi
Weichen Zhang, Wanli Ouyang, Dong Xu, Wen Li
6. Pengkodean Konteks untuk Segmentasi Semantik
Hang Zhang, Kristin Dana, Jianping Shi, Zhongyue Zhang, Xiaogang Wang, Ambrish Tyagi, Amit Agrawal
7. Deep Cocktail Networks: Adaptasi Domain Tanpa Supervisi Multi-sumber dengan Pergeseran Kategori
Ruijia Xu, Ziliang Chen, Wangmeng Zuo, Junjie Yan, Liang Lin
8. Pengacakan Acak Kelompok Dalam untuk Identifikasi Ulang Orang
Yantao Shen, Hongsheng Li, Tong Xiao, Shuai Yi, Dapeng Chen, Xiaogang Wang
9. Deblurring Adegan Dinamis Menggunakan Jaringan Neural Berulang Varian Spasial
Jiawei Zhang, Jinshan Pan, Jimmy Ren, Yibing Song, Linchao Bao, Rynson Lau, Ming-Hsuan Yang
10. Menghilangkan bias Latar Belakang untuk Identifikasi Ulang Orang Kuat
Maoqing Tian, Hongsheng Li, Shuai Yi, Xuesen Zhang, Jianping Shi, Junjie Yan, Xiaogang Wang
11. Pencocokan Produk-Produk Kronecker Ujung-ke-Ujung untuk Identifikasi Ulang Orang
Yantao Shen, Tong Xiao, Hongsheng Li, Shuai Yi, Xiaogang Wang
12. Pelacakan Korelasi Aliran Ujung-ke-ujung dengan Perhatian Spasial-temporal
Zheng Zhu, Wei Wu, Wei Zou, Junjie Yan
13. Menjelajahi Representasi Fitur Terurai Di Luar Identifikasi Wajah
Yu Liu *, Fangyin Wei *, Jing Shao *, LuSheng, Junjie Yan dan Xiaogang Wang (* kontribusi yang sama)
14. Pembelajaran Penguatan Peningkatan Lingkungan untuk Pipa Multi-tahap yang Tidak Terdiferensiasi
Shuqin Xie, Zitian Chen, Chao Xu, Cewu Lu
15. FOTS: Spotting Teks Berorientasi Cepat dengan Jaringan Terpadu
Xuebo Liu, Ding Liang, Shi Yan, Dagui Chen, Yu Qiao, Junjie Yan
16. GeoNet: Pembelajaran Tanpa Pengawasan tentang Kedalaman Padat, Bidang Gerakan, dan Pose Kamera
Zhichao Yin, Jianping Shi
17. Pembelajaran Kesamaan yang Konsisten Kelompok melalui CRF yang Dalam untuk Identifikasi Ulang Orang
Dapeng Chen, Dan Xu, Hongsheng Li, Nicu Sebe, Xiaogang Wang
18. Pelacakan Visual Kinerja Tinggi dengan Jaringan Proposal Wilayah Siam
Bo Li, Wei Wu, Zheng Zhu, Junjie Yan
19. ID-GAN: Mempelajari GAN Simetri Tiga Pemain untuk Sintesis Wajah yang Menjaga Identitas
Yujun Shen, Ping Luo, Junjie Yan, Xiaogang Wang, Xiaoou Tang
20. Mempelajari Rantai Alat untuk Pemulihan Gambar
Ke Yu, Chao Dong, Liang Lin, Chen Ganti Loy
21. Mempelajari Jaringan Neural Konvolusional Ganda untuk Penglihatan Tingkat Rendah
Jinshan Pan, Sifei Liu, Deqing Sun, Jiawei Zhang, Yang Liu, Jimmy Ren, Zechao Li, Jinhui Tang, Huchuan Lu, Yu-Wing Tai, Ming-Hsuan Yang
22. Pembelajaran Detektor Objek yang Dioptimalkan Secara Global melalui Gradien Kebijakan
Yongming Rao, Dahua Lin, Jiwen Lu
23. LiteFlowNet: Jaringan Neural Konvolusional Ringan untuk Estimasi Aliran Optik
Tak Wai Hui, Xiaoou Tang, Chen Ganti Loy
24. Segmentasi Semantik Video Latensi Rendah
Yule Li, Jianping Shi, Dahua Lin
25. Perhatikan Batas: Algoritma Penyelarasan Wajah Sadar-Batas
Wayne Wu, Chen Qian, Shuo Yang, Wang Quan
26. Mesin Pose LSTM
Yue Luo, Jimmy Ren, Zhouxia Wang, Wenxiu Sun, Jinshan Pan, Jianbo Liu, Jiahao Pang, Liang Lin
27. Model Perhatian Kontrasif yang Dipandu Topeng untuk Identifikasi Ulang Orang
Lagu Chunfeng, Yan Huang, Wanli Ouyang, Liang Wang
28. Fitur Terpandu Aliran Optik: Representasi Gerakan Cepat dan Kuat untuk Pengenalan Tindakan Video
Shuyang Sun, Zhanghui Kuang, Lu Sheng, Wanli Ouyang, Wei Zhang
29. Mengoptimalkan Deteksi Objek Video melalui Kisi Skala-Waktu
Kai Chen, Jiaqi Wang, Shuo Yang, Xingcheng Zhang, Yuanjun Xiong, Chen Change Loy, Dahua Lin
30. PAD-Net: Multi-Tasks Guided Prediciton-and-Distillation Network untuk Estimasi Kedalaman dan Parsing Pemandangan Simultan
Dan Xu, Wanli Ouyang, Xiaogang Wang, Nicu Sebe
31. Jaringan Agregasi Jalur untuk Segmentasi Instance
Shu Liu, Lu Qi, Haifang Qin, Jianping Shi, Jiaya Jia
32. Pose-Strong Face Recognition melalui Deep Residual Equivariant Mapping
Kaidi Cao, Yu Rong, Cheng Li, Xiaoou Tang, Chen Ganti Loy
33. Generasi Arsitektur Neural Network Block -wise Praktis
Zhao Zhong, Junjie Yan, Wei Wu, Jing Shao, Cheng-lin Liu
34. Kenali Tindakan dengan Menguraikan Komponen Dinamika
Yue Zhao, Yuanjun Xiong, Dahua Lin
35. Memulihkan Tekstur Realistis dalam Resolusi Super Gambar dengan Modulasi Fitur Spasial
Xintao Wang, Ke Yu, Chao Dong, Chen Ganti Loy
36. Pencocokan Stereo Tampilan Tunggal
Yue Luo, Jimmy Ren, Mude Lin, Jiahao Pang, Wenxiu Sun, Hongsheng Li, Liang Lin
37. Halusinasi Temporal untuk Pengakuan Tindakan dengan Beberapa Gambar Diam
Lei Zhou, Yali Wang, Yu Qiao
38. Menuju Kerja Sama Manusia-Mesin: Evolusi Pembelajaran Aktif dengan Proses yang Diawasi Sendiri untuk Deteksi Objek
Keze Wang, Xiaopeng Yan, Lei Zhang, Liang Lin
39. Identifikasi Pemersatu dan Pembelajaran Konteks untuk Pengenalan Orang
Qingqiu Huang, Yu Xiong, Dahua Lin
40. Pembelajaran Fitur Tanpa Pengawasan melalui Diskriminasi Tingkat Instans Non-Parametrik
Zhirong Wu, Yuanjun Xiong, Stella Yu, Dahua Lin
41. Identifikasi Ulang Orang Video dengan Agregasi Kesamaan Cuplikan Kompetitif dan Penyematan Cuplikan Co-attentive
Dapeng Chen, Hongsheng Li, Tong Xiao, Shuai Yi, Xiaogang Wang
42. Pembuatan Pertanyaan Visual sebagai Tugas Ganda Menjawab Pertanyaan Visual
Yikang Li, Nan Duan, Bolei Zhou, Xiao Chu, Wanli Ouyang, Xiaogang Wang
43. Penguraian Bagian Tubuh Manusia yang Diawasi dengan Lemah melalui Transfer Pengetahuan yang Dipandu Pose
Hao-Shu Fang, Guansong Lu, Xiaolin Fang, Jianwen Xie, Yu-Wing Tai, Cewu Lu
44. Zoom dan Pelajari: Generalisasi Deep Stereo Matching ke Domain Novel
Jiahao Pang, Wenxiu Sun, Chengxi Yang, Jimmy Ren, Ruichao Xiao, Jin Zeng, Liang Lin
- "Golden Brothers" meledak, dan lima bersaudara termasuk Ekin Cheng dan Chen Xiaochun menyanyikan persahabatan mereka dengan debut yang kuat
- Malam Tahun Baru dari Timur, Barat, Selatan dan Utara | Hari kelima di bulan lunar pertama, Kota Kuno Laitan mengalami Tahun Baru yang kuat
- Wilayah Tencent Financial berkembang lagi! Aplikasi sederhana untuk pendaftaran beberapa merek dagang "Tengfu Financial"
- Saya mendengar bahwa Anda dapat menyesuaikan item Fashion secara pribadi dengan memainkan WeChat sekarang? !
- "Tahun Baru Imlek adalah cita rasa kampung halamanku" Ciqikou's Weird Shumiao menggunakan kartun untuk menggambar Tahun Baru Chongqing dan kerinduan