Yiqi Juechen, 44 makalah SenseTime telah dipilih untuk CVPR 2018

Leifeng.com Tinjauan Teknologi AI Catatan: Artikel ini secara eksklusif dikontribusikan oleh Shangtang Technology, dan Tinjauan Teknologi AI berwenang untuk mencetak ulang.

Konferensi visi komputer terbaik dunia IEEE CVPR 2018 (Visi Komputer dan Pengakuan Pola, Konferensi Internasional IEEE tentang Visi Komputer dan Pengenalan Pola) akan diadakan di Salt Lake City, AS pada bulan Juni. Sebanyak 979 makalah dari seluruh dunia diterima untuk konferensi ini. CVPR adalah konferensi penelitian tingkat tertinggi di bidang visi komputer, dan makalah yang diterima mewakili tingkat teknologi terbaru dan tertinggi serta tren perkembangan masa depan di bidang visi komputer pada tahun 2018.

Menurut situs resmi CVPR, lebih dari 3.300 makalah telah dikirim ke konferensi tahun ini, dan 979 makalah diterima, meningkat 25% dibandingkan tahun lalu (783 makalah diterima pada tahun 2016). Hasil penelitian ilmiah terbaru diakui mencakup berbagai karya mutakhir di bidang computer vision. CVPR 2018 mencakup 21 tutorial, 48 lokakarya, dan lebih dari 115 perusahaan dari seluruh dunia akan mengikuti pameran industri CVPR tahun ini.

Sebanyak 44 makalah dari Shangtang Technology, The Chinese University of Hong Kong-Shangtang Technology Joint Laboratory dan SenseTime Joint Laboratory lainnya diterima oleh konferensi CVPR ini, termasuk 3 makalah presentasi lisan (tingkat penerimaan hanya 62/3300 = 1,88% ), terdapat 13 makalah dalam highlight report, dan jumlah makalah yang diterima meningkat signifikan dibandingkan dengan 23 makalah di CVPR 2017, dan hasilnya luar biasa. Hasil penelitian ilmiah terkemuka di dunia menunjukkan kumpulan bakat yang kuat, landasan penelitian ilmiah, dan kemampuan inovasi SenseTime di bidang visi yang cerdas.

Makalah penerimaan CVPR 2018 SenseTime mencapai terobosan di bidang-bidang berikut: pelatihan terdistribusi skala besar, pemahaman manusia dan pengenalan kembali pejalan kaki, pemahaman dan analisis adegan mengemudi otonom, algoritme visual yang mendasari, pemahaman komprehensif tentang penglihatan dan bahasa alami, deteksi objek, pengenalan dan Pelacakan, model generatif yang mendalam, pemahaman video dan perilaku, dll. Algoritme visi komputer baru ini tidak hanya memiliki banyak skenario aplikasi, sehingga algoritme visi yang lebih cerdas dapat digunakan dalam kehidupan sehari-hari, tetapi juga memberikan pengalaman dan arahan yang berharga untuk penelitian selanjutnya.

Pelatihan terdistribusi skala besar

Makalah perwakilan: Pembelajaran penguatan lisan-Deep desain struktur jaringan otomatis

Makalah ini didedikasikan untuk memecahkan masalah desain otomatis struktur jaringan saraf dalam Berbeda dari desain struktur manual umum, makalah ini mengusulkan algoritma yang efisien untuk secara otomatis merancang struktur jaringan yang optimal melalui pembelajaran penguatan. Desain struktur jaringan saraf tradisional biasanya membutuhkan banyak pengetahuan ahli, biaya trial and error, dan bahkan beberapa inspirasi.Hanya beberapa struktur jaringan penting yang dirancang setiap tahun. Oleh karena itu, desain struktur jaringan secara manual adalah tugas yang sangat sulit. . Algoritme pencarian otomatis baru-baru ini untuk struktur jaringan biasanya membutuhkan sumber daya komputasi yang besar (ratusan GPU, hampir sebulan pelatihan), dan model yang dihasilkan tidak terlalu portabel, sehingga sulit untuk mencapai kepraktisan yang sebenarnya.

Makalah ini mengusulkan algoritma desain otomatis untuk struktur jaringan berdasarkan pembelajaran penguatan Melalui ide desain "blok jaringan", ruang pencarian sangat berkurang, dan jaringan yang dirancang memiliki transferabilitas yang sangat kuat. Pada saat yang sama, artikel ini menggunakan "penghentian prematur" dan arsitektur terdistribusi untuk mempercepat seluruh proses pembelajaran struktur jaringan, yang seratus kali lebih cepat daripada algoritme sebelumnya (32 GPU, pelatihan 3 hari). Permukaan percobaan menunjukkan bahwa struktur jaringan yang dihasilkan pada kumpulan data CIFAR mencapai dan melebihi keakuratan struktur jaringan yang dirancang oleh manusia, dan strukturnya dapat ditransfer ke data ImageNet skala besar untuk mencapai kinerja yang baik.

Pemahaman tubuh manusia dan identifikasi ulang pejalan kaki

Makalah perwakilan: Identifikasi ulang Lisan-Pejalan Kaki berdasarkan batasan konsistensi kelompok

Identifikasi ulang pejalan kaki adalah salah satu komponen penting dalam generasi baru sistem keamanan cerdas. Mengingat gambar pejalan kaki, pengenalan ulang pejalan kaki membutuhkan kamera yang berbeda untuk mencocokkan dan mengenali pejalan kaki yang sama secara akurat berdasarkan tampilan visualnya. Algoritme pembelajaran dalam yang ada biasanya menggunakan fungsi kehilangan kendala yang terlalu lokal untuk pembelajaran fitur pejalan kaki, sehingga tidak dapat mempelajari kesamaan visual antara gambar pejalan kaki secara akurat. Dalam makalah ini, kondisi kendala konsistensi kelompok baru diusulkan untuk masalah ini, dan kondisi kendala dimodelkan dengan lapangan acak bersyarat kontinu. Bidang acak bersyarat berkelanjutan ditambahkan ke jaringan neural dalam untuk mewujudkan pelatihan ujung ke ujung model dalam. Hasil eksperimen menunjukkan bahwa kondisi konsistensi ini dapat meningkatkan kekokohan dan diskriminatif fitur visual akhir secara signifikan dalam pelatihan dan pengujian, serta mencapai pengenalan ulang pejalan kaki dengan presisi tinggi.

Pemahaman skenario mengemudi otonom

Makalah perwakilan: Segmentasi Semantik Video Spotlight dengan Latensi Sangat Rendah

Makalah ini berfokus pada masalah segmentasi semantik real-time video untuk skenario autonomous driving Meskipun segmentasi semantik gambar telah membuat kemajuan besar dalam beberapa tahun terakhir, masih terdapat tantangan untuk segmentasi semantik berorientasi video. Kesulitan utamanya adalah: 1) Video memerlukan lebih banyak kalkulasi; 2) Banyak aplikasi real-time seperti mengemudi otonom perlu mencapai latensi rendah.

Artikel ini didedikasikan untuk menyelesaikan dua masalah ini sambil memastikan keakuratan segmentasi sebanyak mungkin. Pada masalah segmentasi video, perubahan tag semantik antar frame yang berdekatan relatif kecil, sehingga tidak perlu menggunakan jaringan lengkap untuk mengekstrak tag semantik untuk setiap frame. Berdasarkan pemahaman tersebut, makalah ini mengusulkan kerangka segmentasi semantik seperti yang ditunjukkan pada gambar, yang membagi seluruh jaringan menjadi bagian tingkat tinggi dan tingkat rendah.Bagian tingkat rendah mengkonsumsi lebih sedikit perhitungan, kerangka makalah ini hanya menjalankan jaringan lengkap dalam bingkai kunci. Fitur tingkat tinggi diekstraksi untuk segmentasi semantik, sedangkan di bingkai lain, fitur disebarkan dari bingkai kunci sebelumnya untuk segmentasi semantik. Kerangka kerja terkait terdiri dari dua komponen: 1) modul penjadwalan bingkai kunci, dan 2) modul propagasi lintas bingkai fitur, yang melakukan penghitungan yang sesuai berdasarkan fitur tingkat rendah, sehingga penghitungan jaringan yang relatif lengkap jauh lebih kecil. Pada saat yang sama, untuk mengurangi penundaan, ketika bingkai saat ini terdeteksi sebagai bingkai kunci, strategi penjadwalan penundaan rendah digunakan. Metode yang diusulkan dalam makalah ini memverifikasi keefektifan metode kami pada kedua kumpulan data, mencapai latensi rendah dan menjaga akurasi segmentasi yang akurat.

Pencocokan stereo lampu sorot berdasarkan tampilan tunggal

Metode estimasi kedalaman monokuler untuk skenario autonomous driving biasanya menggunakan data gambar dari suatu perspektif sebagai input untuk memprediksi secara langsung nilai kedalaman yang sesuai dengan setiap piksel pada gambar tersebut.Hal ini mengakibatkan metode yang ada biasanya membutuhkan data dalam jumlah besar yang dianotasi dengan informasi kedalaman. . Studi terbaru telah mengusulkan perbaikan yang memperkenalkan kendala geometris dalam proses pelatihan, tetapi masih terdapat kekurangan kendala geometris eksplisit dalam proses pengujian. Makalah ini mengusulkan untuk menguraikan estimasi kedalaman monokuler menjadi dua sub-proses, yaitu proses sintesis tampilan dan proses pencocokan binokular.Setelah dekomposisi ini, model yang diusulkan tidak hanya dapat secara eksplisit memperkenalkan kendala geometris pada tahap pengujian, tetapi juga sangat mengurangi Ketergantungan pada data dengan anotasi mendalam. Eksperimen telah membuktikan bahwa metode yang diusulkan dalam makalah ini dapat melampaui semua metode sebelumnya pada dataset KITTI hanya dengan menggunakan sejumlah kecil data kedalaman, dan untuk pertama kalinya hanya mengandalkan data gambar monokuler untuk melampaui algoritma pencocokan binokuler Block Matching, yang selanjutnya mempromosikan kedalaman monokuler. Perkirakan pendaratan teknologi.

Algoritme visual tingkat rendah

Makalah perwakilan: Spotlight-Restorasi gambar universal berdasarkan pembelajaran penguatan mendalam

Makalah ini mengusulkan metode pemulihan citra pembelajaran mendalam yang baru. Sebagian besar algoritma restorasi yang ada hanya berorientasi untuk menyelesaikan jenis masalah restorasi citra tertentu, sehingga kurang universalitas untuk berbagai jenis citra yang terdegradasi. Menanggapi masalah ini, algoritma RL-Restore yang diusulkan dalam artikel ini pertama-tama melatih serangkaian jaringan saraf kecil untuk berbagai gambar yang terdegradasi; pada saat yang sama, ia merancang fungsi penghargaan untuk mengevaluasi kualitas pemulihan gambar, dan menggunakan algoritme pembelajaran yang ditingkatkan untuk mempelajari cara merasionalisasi jaringan saraf kecil ini. kombinasi. Untuk citra terdegradasi yang berbeda, kombinasi komponen algoritme restorasi berbeda diperoleh untuk mencapai restorasi efektif citra terdegradasi kompleks.

Makalah representatif tentang pemahaman komprehensif tentang penglihatan dan bahasa alami: Pembuatan pertanyaan penglihatan ganda dengan sorotan untuk menjawab pertanyaan visual

Bertujuan pada masalah data pelatihan yang terlalu sedikit dalam Menjawab VisualQuestion Terbuka, artikel ini mengusulkan "jaringan penjawab pertanyaan yang dapat dibalik". Model tersebut dapat mengatur ulang modul yang berbeda untuk memungkinkan sekelompok model menyelesaikan dua tugas timbal balik secara bersamaan yaitu "menjawab pertanyaan" dan "menghasilkan pertanyaan". Model ini memanfaatkan sepenuhnya dualitas pertanyaan dan jawaban visual serta pembuatan pertanyaan visual untuk meningkatkan efisiensi penggunaan model data pelatihan terbatas. Metode ini menggunakan dua tugas untuk melatih model yang sama pada waktu yang sama, sehingga jaringan dapat memiliki pemahaman yang lebih dalam tentang hubungan antara pertanyaan dan gambar, sehingga mencapai akurasi dan efek yang lebih baik pada dua tugas pembuatan pertanyaan dan jawaban pertanyaan.

Pengenalan wajah dan analisis wajah

Makalah representatif: Disosiasi Poster-Wajah menampilkan pembelajaran ruang angkasa di luar pengenalan wajah

Makalah ini secara bersamaan memecahkan tiga masalah pengenalan wajah, klasifikasi atribut dan pembuatan wajah sewenang-wenang. Sebagian besar pekerjaan pembelajaran fitur wajah biasanya memungkinkan jaringan untuk mempelajari fitur dengan identitas yang kuat atau diskriminasi atribut, yang dapat diterapkan pada tugas-tugas seperti pengenalan wajah dan klasifikasi atribut; atau mempelajari fitur dengan informasi global untuk aplikasi Aplikasi seperti pembuatan dan pengeditan wajah. Mengapa kita tidak dapat mempelajari ruang fitur lengkap dan membuat informasi semantik sangat berbeda, dan kemudian menyadari bahwa satu fitur dapat menyelesaikan semua tugas? Makalah ini mengusulkan kerangka kerja distilasi informasi dan jaringan pengusiran, hanya menggunakan ID identitas sebagai informasi pengawasan, dan mempelajari ruang fitur cembung padat dengan diskriminasi informasi yang kuat dan informasi global. Eksperimen pada dataset seperti LFW, LFWA dan CelebA menunjukkan bahwa proyeksi wajah di ruang fitur ini memiliki kemampuan pengenalan identitas dan atribut yang sangat tinggi, dan titik mana pun di ruang tersebut memiliki semantik identitas dan atribut yang kuat. , Dan dapat menghasilkan gambar wajah dengan semantik.

Poster - Lokasi titik-titik penting pada wajah berdasarkan persepsi tepi

Makalah ini mengusulkan algoritma deteksi titik kunci wajah berdasarkan persepsi tepi, yang mengintegrasikan informasi struktural yang dijelaskan oleh garis tepi wajah ke dalam deteksi titik kunci, yang sangat meningkatkan algoritma secara ekstrem seperti wajah profil besar, ekspresi berlebihan, oklusi, dan blur. Akurasi deteksi dalam situasi tersebut. Artikel ini terutama memecahkan dua masalah utama: 1. Poin utama dari wajah tidak jelas di antara berbagai kumpulan data, dan definisinya tidak konsisten. Artikel ini menangkap informasi garis tepi yang lebih umum untuk wajah manusia dan menggunakannya sebagai media perantara dari wajah ke titik-titik utama, sehingga meskipun terdapat perbedaan dalam poin-poin utama, kumpulan data yang berbeda masih dapat saling membantu dalam pelatihan. 2. Akurasi deteksi poin-poin penting dalam situasi yang kompleks. Makalah ini pertama-tama memperoleh hasil deteksi garis tepi presisi tinggi melalui penyampaian pesan yang dikombinasikan dengan pembelajaran adversarial, dan kemudian mengintegrasikan informasi garis tepi ke dalam deteksi titik kunci pada beberapa tingkat semantik, yang sangat meningkatkan ketahanan algoritme dalam situasi yang kompleks.

Selain itu, artikel ini juga mengusulkan kumpulan data pendeteksian titik kunci wajah baru Wider Facial Landmarkin-the-wild (WFLW), yang berisi 10.000 data wajah dengan 98 poin dan 6 anotasi atribut, yang bertujuan untuk membantu sivitas akademika lebih efektif. Evaluasi kekuatan algoritme titik kunci dalam berbagai kondisi.

Deteksi, pengenalan dan pelacakan objek

Makalah perwakilan: Spotlight-Pelacakan visual berkinerja tinggi berdasarkan jaringan area kandidat kembar

Makalah ini mengusulkan algoritma pelacakan target tunggal berkinerja tinggi berdasarkan kerangka pembelajaran mendalam end-to-end. Algoritme pelacakan target tunggal yang ada biasanya sulit untuk menyeimbangkan kinerja dan kecepatan, dan hanya dapat mendominasi dalam indeks tertentu. Makalah ini menggunakan jaringan Siam dan Region Proposal Network untuk membangun algoritma pelacakan target tunggal berkecepatan tinggi dan presisi tinggi. Kedua sub-jaringan ditingkatkan melalui operasi konvolusi dan disatukan dalam kerangka kerja jaringan saraf dalam ujung ke ujung. Selama proses pelatihan, algoritme dapat dilatih menggunakan kumpulan data dengan pelabelan padat (VID) dan pelabelan renggang (YoutubeBB). Dibandingkan dengan metode yang ada, kumpulan data berlabel jarang sangat meningkatkan sumber data pelatihan, sehingga jaringan neural dalam dapat lebih terlatih sepenuhnya; regresi koordinat di jaringan kandidat regional dapat membuat kerangka pelacakan lebih akurat dan menghemat banyak skala Waktu yang dihabiskan untuk ujian. Dalam hal percobaan, algoritma pelacakan yang diusulkan dalam makalah ini dapat mencapai level lanjutan saat ini pada kumpulan data VOT2015 dan VOT2016 dengan kecepatan 160 frame.

Metode pengenalan dan deteksi teks multi-sudut ujung-ke-ujung poster-Fast

Makalah ini menyajikan deteksi teks multi-sudut ujung ke ujung dan metode pengenalan untuk pertama kalinya. Deteksi dan pengenalan teks (Text Detection and Recognition / OCR) adalah masalah klasik di bidang computer vision, di masa lalu deteksi dan pengenalan teks diselesaikan sebagai dua masalah. Makalah ini mengusulkan metode end-to-end untuk deteksi dan pengenalan teks simultan, yang memverifikasi bahwa kedua tugas ini saling melengkapi, dan bersama-sama mengawasi pelatihan jaringan dapat membuat kedua tugas ini mencapai akurasi yang lebih baik. Karena dua tugas berbagi jaringan ekstraksi fitur, kecepatannya sekitar dua kali lipat dari deteksi dan pengenalan teks. Pada saat yang sama, artikel ini juga mengusulkan operasi RoIRotate, yang memperluas RoIAlign dan dapat diterapkan pada deteksi objek berputar. Artikel ini melampaui metode yang ada di beberapa kumpulan data.

Model generatif yang dalam

Makalah perwakilan: Transfer gaya titik nol poster-waktu nyata berdasarkan dekorasi fitur

Saat ini, untuk aplikasi stilisasi gambar secara real-time, kebanyakan dari mereka perlu merancang model transfer gaya tertentu untuk peta gaya tertentu; jika transfer peta gaya apa pun perlu diterapkan, kompleksitas komputasi dan efek migrasi sebagian besar tidak dijamin. Makalah ini mengusulkan model transfer gaya gambar titik nol waktu nyata untuk mewujudkan transfer gaya multi-skala dan kualitas tinggi untuk gambar gaya arbitrer. Metode ini didasarkan pada struktur jaringan transfer fitur yang disebut dekorator gaya, yang dapat dengan mudah disematkan dalam jaringan rekonstruksi gambar untuk mencapai transfer fitur gaya multi-skala. Struktur jaringan memungkinkan gambar bergaya yang dihasilkan untuk sepenuhnya mengekspresikan pola tekstur tertentu dalam peta gaya sambil mempertahankan informasi semantik dalam gambar asli. Eksperimen menunjukkan bahwa jaringan memiliki kemampuan stilisasi tinggi untuk berbagai jenis peta gaya, dan dapat secara efektif diperluas ke aplikasi seperti transfer multi-gaya dan transfer gaya video.

lampiran:

Sebanyak 44 makalah dari laboratorium bersama SenseTime dan SenseTime diterima, sebagai berikut:

1.3D Estimasi Pose Manusia di Alam Liar dengan Adversarial Learning

Wei Yang, Wanli Ouyang, Xiaolong Wang, Xiaogang Wang

2. Jaringan Komposisi Sadar Perhatian untuk Identifikasi Ulang Orang

Jing Xu, Rui Zhao, Feng Zhu, Huaming Wang, Wanli Ouyang

3. Avatar-Net: Transfer Gaya Zero-shot Multi-skala dengan Dekorasi Fitur

Lu Sheng *, Jing Shao *, Ziyi Lin dan Xiaogang Wang (* kontribusi yang sama)

4. Melampaui Pengenalan Objek Holistik: Memperkaya Pemahaman Citra dengan Beberapa Negara Bagian

Cewu Lu, Hao Su, Yonglu Li, Yongyi Lu, Li Yi, Chi-Keung Tang, Leonidas J.Guibas

5. Jaringan Kolaboratif dan Adversarial untuk adaptasi domain yang tidak diawasi

Weichen Zhang, Wanli Ouyang, Dong Xu, Wen Li

6. Pengkodean Konteks untuk Segmentasi Semantik

Hang Zhang, Kristin Dana, Jianping Shi, Zhongyue Zhang, Xiaogang Wang, Ambrish Tyagi, Amit Agrawal

7. Deep Cocktail Networks: Adaptasi Domain Tanpa Supervisi Multi-sumber dengan Pergeseran Kategori

Ruijia Xu, Ziliang Chen, Wangmeng Zuo, Junjie Yan, Liang Lin

8. Pengacakan Acak Kelompok Dalam untuk Identifikasi Ulang Orang

Yantao Shen, Hongsheng Li, Tong Xiao, Shuai Yi, Dapeng Chen, Xiaogang Wang

9. Deblurring Adegan Dinamis Menggunakan Jaringan Neural Berulang Varian Spasial

Jiawei Zhang, Jinshan Pan, Jimmy Ren, Yibing Song, Linchao Bao, Rynson Lau, Ming-Hsuan Yang

10. Menghilangkan bias Latar Belakang untuk Identifikasi Ulang Orang Kuat

Maoqing Tian, Hongsheng Li, Shuai Yi, Xuesen Zhang, Jianping Shi, Junjie Yan, Xiaogang Wang

11. Pencocokan Produk-Produk Kronecker Ujung-ke-Ujung untuk Identifikasi Ulang Orang

Yantao Shen, Tong Xiao, Hongsheng Li, Shuai Yi, Xiaogang Wang

12. Pelacakan Korelasi Aliran Ujung-ke-ujung dengan Perhatian Spasial-temporal

Zheng Zhu, Wei Wu, Wei Zou, Junjie Yan

13. Menjelajahi Representasi Fitur Terurai Di Luar Identifikasi Wajah

Yu Liu *, Fangyin Wei *, Jing Shao *, LuSheng, Junjie Yan dan Xiaogang Wang (* kontribusi yang sama)

14. Pembelajaran Penguatan Peningkatan Lingkungan untuk Pipa Multi-tahap yang Tidak Terdiferensiasi

Shuqin Xie, Zitian Chen, Chao Xu, Cewu Lu

15. FOTS: Spotting Teks Berorientasi Cepat dengan Jaringan Terpadu

Xuebo Liu, Ding Liang, Shi Yan, Dagui Chen, Yu Qiao, Junjie Yan

16. GeoNet: Pembelajaran Tanpa Pengawasan tentang Kedalaman Padat, Bidang Gerakan, dan Pose Kamera

Zhichao Yin, Jianping Shi

17. Pembelajaran Kesamaan yang Konsisten Kelompok melalui CRF yang Dalam untuk Identifikasi Ulang Orang

Dapeng Chen, Dan Xu, Hongsheng Li, Nicu Sebe, Xiaogang Wang

18. Pelacakan Visual Kinerja Tinggi dengan Jaringan Proposal Wilayah Siam

Bo Li, Wei Wu, Zheng Zhu, Junjie Yan

19. ID-GAN: Mempelajari GAN Simetri Tiga Pemain untuk Sintesis Wajah yang Menjaga Identitas

Yujun Shen, Ping Luo, Junjie Yan, Xiaogang Wang, Xiaoou Tang

20. Mempelajari Rantai Alat untuk Pemulihan Gambar

Ke Yu, Chao Dong, Liang Lin, Chen Ganti Loy

21. Mempelajari Jaringan Neural Konvolusional Ganda untuk Penglihatan Tingkat Rendah

Jinshan Pan, Sifei Liu, Deqing Sun, Jiawei Zhang, Yang Liu, Jimmy Ren, Zechao Li, Jinhui Tang, Huchuan Lu, Yu-Wing Tai, Ming-Hsuan Yang

22. Pembelajaran Detektor Objek yang Dioptimalkan Secara Global melalui Gradien Kebijakan

Yongming Rao, Dahua Lin, Jiwen Lu

23. LiteFlowNet: Jaringan Neural Konvolusional Ringan untuk Estimasi Aliran Optik

Tak Wai Hui, Xiaoou Tang, Chen Ganti Loy

24. Segmentasi Semantik Video Latensi Rendah

Yule Li, Jianping Shi, Dahua Lin

25. Perhatikan Batas: Algoritma Penyelarasan Wajah Sadar-Batas

Wayne Wu, Chen Qian, Shuo Yang, Wang Quan

26. Mesin Pose LSTM

Yue Luo, Jimmy Ren, Zhouxia Wang, Wenxiu Sun, Jinshan Pan, Jianbo Liu, Jiahao Pang, Liang Lin

27. Model Perhatian Kontrasif yang Dipandu Topeng untuk Identifikasi Ulang Orang

Lagu Chunfeng, Yan Huang, Wanli Ouyang, Liang Wang

28. Fitur Terpandu Aliran Optik: Representasi Gerakan Cepat dan Kuat untuk Pengenalan Tindakan Video

Shuyang Sun, Zhanghui Kuang, Lu Sheng, Wanli Ouyang, Wei Zhang

29. Mengoptimalkan Deteksi Objek Video melalui Kisi Skala-Waktu

Kai Chen, Jiaqi Wang, Shuo Yang, Xingcheng Zhang, Yuanjun Xiong, Chen Change Loy, Dahua Lin

30. PAD-Net: Multi-Tasks Guided Prediciton-and-Distillation Network untuk Estimasi Kedalaman dan Parsing Pemandangan Simultan

Dan Xu, Wanli Ouyang, Xiaogang Wang, Nicu Sebe

31. Jaringan Agregasi Jalur untuk Segmentasi Instance

Shu Liu, Lu Qi, Haifang Qin, Jianping Shi, Jiaya Jia

32. Pose-Strong Face Recognition melalui Deep Residual Equivariant Mapping

Kaidi Cao, Yu Rong, Cheng Li, Xiaoou Tang, Chen Ganti Loy

33. Generasi Arsitektur Neural Network Block -wise Praktis

Zhao Zhong, Junjie Yan, Wei Wu, Jing Shao, Cheng-lin Liu

34. Kenali Tindakan dengan Menguraikan Komponen Dinamika

Yue Zhao, Yuanjun Xiong, Dahua Lin

35. Memulihkan Tekstur Realistis dalam Resolusi Super Gambar dengan Modulasi Fitur Spasial

Xintao Wang, Ke Yu, Chao Dong, Chen Ganti Loy

36. Pencocokan Stereo Tampilan Tunggal

Yue Luo, Jimmy Ren, Mude Lin, Jiahao Pang, Wenxiu Sun, Hongsheng Li, Liang Lin

37. Halusinasi Temporal untuk Pengakuan Tindakan dengan Beberapa Gambar Diam

Lei Zhou, Yali Wang, Yu Qiao

38. Menuju Kerja Sama Manusia-Mesin: Evolusi Pembelajaran Aktif dengan Proses yang Diawasi Sendiri untuk Deteksi Objek

Keze Wang, Xiaopeng Yan, Lei Zhang, Liang Lin

39. Identifikasi Pemersatu dan Pembelajaran Konteks untuk Pengenalan Orang

Qingqiu Huang, Yu Xiong, Dahua Lin

40. Pembelajaran Fitur Tanpa Pengawasan melalui Diskriminasi Tingkat Instans Non-Parametrik

Zhirong Wu, Yuanjun Xiong, Stella Yu, Dahua Lin

41. Identifikasi Ulang Orang Video dengan Agregasi Kesamaan Cuplikan Kompetitif dan Penyematan Cuplikan Co-attentive

Dapeng Chen, Hongsheng Li, Tong Xiao, Shuai Yi, Xiaogang Wang

42. Pembuatan Pertanyaan Visual sebagai Tugas Ganda Menjawab Pertanyaan Visual

Yikang Li, Nan Duan, Bolei Zhou, Xiao Chu, Wanli Ouyang, Xiaogang Wang

43. Penguraian Bagian Tubuh Manusia yang Diawasi dengan Lemah melalui Transfer Pengetahuan yang Dipandu Pose

Hao-Shu Fang, Guansong Lu, Xiaolin Fang, Jianwen Xie, Yu-Wing Tai, Cewu Lu

44. Zoom dan Pelajari: Generalisasi Deep Stereo Matching ke Domain Novel

Jiahao Pang, Wenxiu Sun, Chengxi Yang, Jimmy Ren, Ruichao Xiao, Jin Zeng, Liang Lin

Pengalaman seperti apa mengemudi di lingkungan minus 30 ?

Sebelumnya

Jika Anda makan ayam dengan dewi, persediaan apa yang akan Anda pilih untuk diberikan padanya? Pilihlah untuk menjadi master cinta

Lanjut

: Andrew bangga! CPU terkuat Qualcomm akhirnya menjungkirbalikkan Apple

: "Golden Brothers" meledak, dan lima bersaudara termasuk Ekin Cheng dan Chen Xiaochun menyanyikan persahabatan mereka dengan debut yang kuat

: Malam Tahun Baru dari Timur, Barat, Selatan dan Utara | Hari kelima di bulan lunar pertama, Kota Kuno Laitan mengalami Tahun Baru yang kuat

: Wilayah Tencent Financial berkembang lagi! Aplikasi sederhana untuk pendaftaran beberapa merek dagang "Tengfu Financial"

: Saya mendengar bahwa Anda dapat menyesuaikan item Fashion secara pribadi dengan memainkan WeChat sekarang? !

: Kualitas hidup dimulai dari pengalaman produk rumah pintar!

: Jika saya ingin membeli Lexus, itu adalah GS450h

: Menjalankan game komputer di ponsel bukanlah mimpi! CPU baru Qualcomm dapat menjalankan exe

: "Tahun Baru Imlek adalah cita rasa kampung halamanku" Ciqikou's Weird Shumiao menggunakan kartun untuk menggambar Tahun Baru Chongqing dan kerinduan

: Namanya dipelajari, karena "pengaruh buruk", ciri khas Anda akan dingin setiap saat!

: AMG akan terus meluncurkan supercar listrik murni di masa depan untuk menggandeng New North Electric King

: League of Legends: Jika Anda memberi Anda 300 juta dan memilih seorang pahlawan untuk menjadi istri Anda, bagaimana Anda akan memilih

Yiqi Juechen, 44 makalah SenseTime telah dipilih untuk CVPR 2018

Pelatihan terdistribusi skala besar

Pemahaman tubuh manusia dan identifikasi ulang pejalan kaki

Pemahaman skenario mengemudi otonom

Algoritme visual tingkat rendah

Pengenalan wajah dan analisis wajah

Deteksi, pengenalan dan pelacakan objek

Model generatif yang dalam

lampiran:

Informasi Terkait

Teknologi Borderless Black: Nubia Z11 Edisi Platinum Harga Peluncuran Pertama 3199 Yuan

Konferensi Strategi Merek Le Orange "Smart Orange Life" Diadakan di Beijing

Pekerja sanitasi Huanglongxi membuang sampah ke sungai? Penanggung jawab lokasi kejadian menanggapi: bergegas ke hilir untuk menyelamatkan secara terpadu. Wisatawan: Cara penanganan ini tidak tepat

Jika Anda seorang presiden bank, mobil apa yang akan Anda beli sebagai mobil?

Bahkan jika Anda tahu 10 kata sandi lemah teratas, kotak surat Anda akan tetap tiba-tiba | Deep Report

Menilai jangkar terpopuler Douyu, Dumei 7 poin, Saobai 8 poin, skor penuhnya tidak cukup

Animasi domestik hati nurani lainnya ada di sini! Grafis 3D yang luar biasa dari "Bad Westward Journey" menerima pujian yang luar biasa

Google akhirnya menyangkal "kembali ke China"

Malam Tahun Baru dari Timur, Barat, Selatan, dan Utara | Berjalan kaki dari "orang mengikuti kerumunan" Desa Sekolah Xiamen Jimei

Terminal lingkaran koin meledak lagi dengan transaksi "luar biasa", dengan lebih dari 5 juta untuk menyelesaikan peningkatan merek!