Peninjauan Teknologi AI: Beli lebih banyak GPU, hemat lebih banyak uang! (Semakin banyak GPU yang Anda beli, semakin banyak uang yang Anda hemat!) Kalimat ini, CEO Nvidia Huang Renxun mengulang 9 kali di seluruh GTC (mungkin ada beberapa kelalaian).
Sebagai konferensi terpenting Nvidia setiap tahun, GTC tahunan yang diadakan di San Francisco, AS selalu menjadi tampilan paling terkonsentrasi dari kekuatan teknis Nvidia. Selain itu, produk baru Nvidia juga sangat memengaruhi hati para peneliti di bidang pembelajaran mendalam. GPU yang lebih cepat, memori grafis yang lebih besar, API komputasi dalam yang baru, kluster komputasi yang lebih kuat, dll., Semuanya membuat skala yang lebih besar dan kinerja yang lebih tinggi. Model menjadi lebih mudah didekati.
Sepertinya slot, tapi sebenarnya titik terang:
"GPU terbesar di dunia", "memori video terbesar di dunia"
Kali ini, GTC tidak merilis arsitektur GPU baru seperti yang diharapkan semua orang, dan definisi tradisional "bom nuklir" (GPU tunggal atau produk paket kartu grafis tunggal).
Tapi Nvidia sebenarnya datang dengan produk baru-DGX-2, yang oleh Huang Renxun sendiri disebut sebagai "GPU terbesar di dunia".
DGX-2 dengan komponen yang kuat
Saat arsitektur Volta dirilis tahun lalu, Nvidia sebenarnya telah menggantikan arsitektur lama dan proses lama GPU P100 di DGX-1 dengan GPU V100. GPU V100 asli sudah sangat bertenaga, jadi jika Anda ingin lebih bertenaga, hanya ada satu metode "sederhana dan kasar": tambahkan beberapa GPU V100 lagi. Dengan cara ini, kita akan melihat hingga 16 V100 GPU di akselerator server DGX-2.
Dua dari 16 GPU mana pun dapat bertukar data dengan bandwidth 300GB / dtk
Setelah menggandakan jumlah GPU, agar dapat memainkan kekuatan mereka yang sebenarnya, NVIDIA juga menawarkan versi upgrade dari teknologi NVLink Switch (singkatnya NV Switch). Hanya ada satu tujuan dari teknologi ini: untuk mengaktifkan 16 GPU V100 di DGX-2 menjadi "GPU yang sangat besar" untuk beroperasi.
Menurut Jim McHugh, Vice President of Nvidia and Product Manager of DGX Systems, dengan teknologi NVswitch, semua 16 GPU di DGX-2 dapat langsung dihubungkan dengan transmisi satu-ke-satu. Setiap GPU memiliki bandwidth hingga 50Gb / s dan mendukung hingga 18 GPU terhubung satu sama lain, memungkinkan kinerja throughput seluruh sistem mencapai 900 Gb / s yang menakjubkan.
Huang Renxun, yang memegang akselerator Quadro GV100 dengan memori video dua kali lipat
Perlu disebutkan bahwa meskipun GPU V100 masih digunakan di DGX-2, ia telah mengalami sedikit perubahan - memori video 4 GB HBM2 asli telah ditingkatkan menjadi memori video 4 GB HBM2, yang juga memungkinkan keseluruhan memori video dari GPU V100 Ukurannya ditingkatkan menjadi 32GB. (Parameter GPU lainnya, termasuk lebar bit dan bandwidth memori video, tidak berubah.) Dan di DGX-2, memori video 32 GB di masing-masing dari 16 GPU V100 akan dihubungkan bersama, Anda bahkan dapat menganggapnya sebagai memori video 512 GB secara keseluruhan. ruang.
Jadi, seberapa besar dampaknya pada pengguna? Kata asli resmi NVIDIA adalah: "Peningkatan kapasitas memori memungkinkan untuk menjalankan model deep learning yang lebih dalam dan lebih besar, dan ini juga akan meningkatkan kinerja deep learning. Untuk aplikasi yang peka terhadap memori, ini dapat meningkatkan kinerja sebenarnya hingga 50%. . "
Penurunan harga di tempat "Promosi"
Huang Renxun mengatakan di tempat bahwa produk eksperimental yang digunakan untuk demonstrasi sebenarnya bernilai 2,5 juta dolar AS, dan kemudian dirilis pertama dengan harga 1,5 juta dolar AS, dan kemudian "dipotong menjadi" 399,99 juta dolar AS, berharap untuk mengesankan dengan harga yang "tulus" Calon pengguna dari semua pihak.
Kecepatan tinggi dan efisiensi tinggi
Biarkan tes jalan mengemudi otonom bergerak menuju era VR
Komposisi sistem sebenarnya dari Drive Constellation (di bawah)
Di antara banyak aplikasi kecerdasan buatan, mengemudi otonom jelas merupakan salah satu arahan NVIDIA yang paling ditentukan. Dalam pidatonya di konferensi GTC tahun ini, Huang Renxun juga membawa solusi baru untuk industri penggerak otonom-Drive Constellation.
Drive Constellation adalah simulator mengemudi otonom yang menggunakan teknologi virtual reality (VR). Simulator ini memungkinkan developer mengemudi otonom untuk membuat dunia virtual di pusat data dan menguji algoritme kendaraan otonom sejauh miliaran mil. Nvidia berharap melalui rendering gambar yang kuat dan teknologi realitas virtual, pengujian algoritme di lingkungan virtual akan sangat dekat dengan pemandangan sebenarnya.
Simulasikan mengemudi otonom di malam hari di Drive Constellation
Strukturnya juga sangat sederhana, dan terlihat seperti dua server DGX-1. Namun, konten dari kedua server tersebut tidak sama: satu dilengkapi dengan beberapa kartu grafis profesional NVIDIA, dan yang lainnya dilengkapi dengan platform NVIDIA DRIVE PX yang sama dengan kendaraan otonom.
Modus kerja seluruh sistem juga sangat sederhana, server yang dilengkapi dengan kartu grafis profesional menggabungkan peta definisi tinggi, algoritma simulasi mengemudi kendaraan, dan serangkaian kondisi seperti cuaca dan cahaya untuk membentuk lingkungan berkendara virtual melalui rendering profesional. Kemudian data ini dikirim langsung ke server yang dimuat dengan platform Drive PX dalam format yang mirip dengan sensor sebenarnya, dan platform Drive PX menjalankan algoritme autopilot yang sesuai berdasarkan data tersebut, dan terakhir mengembalikan keluaran manipulasi kendaraan ke server virtual Masuk, membentuk siklus.
Menurut instruksi resmi Nvidia, dua server dapat melakukan 30 siklus seperti itu dalam 1 detik. Nvidia juga mengatakan bahwa sistem ini dapat mensimulasikan cuaca yang berbeda, seperti badai dan cuaca bersalju, silau yang menyilaukan pada waktu yang berbeda dalam sehari, penglihatan yang terbatas pada malam hari, serta berbagai jenis kondisi jalan dan medan. Pada saat yang sama, itu juga dapat mensimulasikan kondisi jalan yang berbahaya untuk menguji kemampuan reaksi kendaraan otonom. Kemudian pengembang dapat meningkatkan dan menyempurnakan algoritme mengemudi otonom.
Danny Shapiro, direktur senior divisi otomotif Nvidia, mengatakan: Ini adalah alat yang sangat berharga bagi industri, yang dapat mempercepat pengembangan mengemudi otonom. Huang Renxun juga menyampaikan sejumlah dalam pidatonya: 10.000 Sistem Konstelasi Drive , Itu bisa mengemudi 3 miliar mil setahun.
Menurut AI Technology Review, Drive Constellation akan diperkenalkan ke pasar pada kuartal ketiga tahun ini dan akan memberikan layanan kepada pelanggan awal NVIDIA.
Dalam ekosistem Nvidia, lebih dari 370 perusahaan berbeda kini telah digabungkan. Setiap orang akan bekerja sama untuk mengembangkan teknologi mengemudi otonom. Meski angka ini mencerminkan ukuran kamp Nvidia, tidak semua 370 mitra dalam ekosistem ini adalah pembuat mobil. Secara khusus, mitra ini mencakup mobil penumpang, truk, kendaraan logistik, dan taksi tanpa pengemudi, pemasok tingkat pertama, perusahaan rintisan tanpa pengemudi, perusahaan lidar, perusahaan peta, dan sebagainya.
Melalui rangkaian simulator penggerak realitas virtual ini, NVIDIA dapat menempatkan sejumlah besar mitra dalam satu platform untuk mempercepat pengembangan dan penerapan teknologi mengemudi otonom, dan pada gilirannya mengkonsolidasikan perangkat keras NVIDIA sendiri yang tak tergantikan di bidang mengemudi otonom.
memegang Penetrasi TensorRT yang berkelanjutan
Lansekap AI yang terus berakselerasi
TensorRT juga merupakan teknologi baru yang dirilis oleh Nvidia tahun lalu. Tujuannya adalah menyesuaikan berbagai algoritme arsitektur kecerdasan buatan ke berbagai arsitektur GPU Nvidia, dan meningkatkan efisiensi keseluruhan algoritme yang berjalan pada GPU Nvidia melalui algoritme pengoptimalan sekunder. .
Selain GTC ini, Nvidia hadir dengan versi terbaru TensorRT 4. Fitur terpentingnya adalah efisiensi yang lebih tinggi. Menurut pengujian resmi Nvidia, saat beberapa algoritme kecerdasan buatan berjalan di server yang sama, TensorRT 4 Ini dapat mengurangi persyaratan perangkat keras hingga 70%, sekaligus meningkatkan latensi hingga 190 kali.
Berkat peningkatan bersama perangkat lunak dan perangkat keras, Huang Renxun mengatakan bahwa kecepatan pelatihan AlexNet pada GPU miliknya telah meningkat 500 kali lipat dalam 5 tahun.
Dibandingkan dengan peningkatan performa, perkembangan baru TensorRT dalam dukungan industri sebenarnya lebih layak untuk diperhatikan. Karena tahun lalu TensorRT sampai batas tertentu adalah arsitektur kecerdasan buatan NVIDIA, dan itu adalah arsitektur pamungkas yang melampaui hampir semua arsitektur kecerdasan buatan. Ini bukan hal yang baik bagi perusahaan yang sebelumnya berharap bisa membangun ekosistem kecerdasan buatan yang gratis dengan mengolah arsitektur buatan.
Anehnya, NVIDIA secara resmi menyatakan telah menjalin kerja sama dengan Google dan akan langsung menyematkan TensorRT dalam versi TensorFlow 1.7 terbaru, yang selanjutnya akan meningkatkan performa model saat dijalankan pada GPU NVIDIA. Rajat Monga, direktur teknik di Goolge, juga secara khusus menyatakan bahwa tim TensorFlow Google selalu menjaga hubungan kerja sama yang erat dengan NVIDIA.
Konten lainnya
Penelusuran sinar, platform medis, teknologi cloud GPU sendiri, peta jalan mengemudi otonom, mengemudi VR jarak jauh
Teknologi NVIDIA RTXTeknologi RTX saat ini merupakan teknologi penelusuran sinar paling kuat di pasaran, yang dapat membuat berbagai materi secara real-time paling mendekati kenyataan. Demonstrasi langsung juga mencakup pemandangan dinamis yang lebih kompleks.
Platform medis Clara
Platform medis Clara yang digerakkan oleh kecerdasan buatan adalah upaya baru oleh NVIDIA. Dalam tampilan di tempat, NVIDIA secara langsung dan akurat memulihkan aktivitas organ dalam pasien dengan memproses hasil waktu nyata dari deteksi ultrasonik dua dimensi, dan bahkan dapat langsung menghitung jantung Volume, dan perbedaan volume antara setiap pemukulan.
Peta jalan platform mengemudi otonom masa depan
Huang Renxun membagikan peta jalan untuk pengembangan produk seri DRIVE NVIDIA di masa mendatang. Pertama, platform chip tunggal berukuran kecil dirilis, lalu jumlah chip dan jumlah GPU ditingkatkan untuk mendapatkan performa yang lebih kuat, lalu performa yang lebih kuat dikompresi lagi menjadi ukuran kecil menggunakan teknologi Platform chip tunggal, dan sebagainya.
Terungkap di tempat kejadian bahwa platform chip tunggal generasi berikutnya diberi nama kode Orin.
Sistem penggerak virtual jarak jauh berdasarkan Holodeck
Startup yang berencana menggunakan VR untuk mengemudi jarak jauh dapat runtuh.
Ringkasan tinjauan teknologi AI:
Tenaga GPU masih kuat
Nvidia bukan hanya "perusahaan yang digerakkan oleh kinerja"
Dalam beberapa tahun terakhir, Nvidia hampir terus menerus memproduksi chip GPU yang lebih baru dan lebih bertenaga. Namun, sebagai produk semikonduktor, keterbatasan fisik dari proses pembuatan hanya dapat didekati secara bertahap dan tidak dapat dilampaui secara langsung.Kesulitan dalam mengupgrade sebuah chip akan terus meningkat. Namun, karena komputasi paralel, GPU sebenarnya sangat mudah untuk diperluas secara horizontal Akselerator DGX-2 dengan 16 GPU V100 terintegrasi baru yang dirilis pada GTC adalah bukti terbaik. Di bawah premis penggunaan teknologi transmisi data yang tepat, pertumbuhan kekuatan GPU di masa depan akan tetap "sangat kuat".
Selain perangkat keras, NVIDIA juga telah melakukan banyak pekerjaan untuk seluruh ekosistem. Dari pengoptimalan berkelanjutan dari dukungan komputasi paralel masif yang diwakili oleh pembelajaran yang mendalam hingga uji jalan autopilot berbasis VR, NVIDIA sebenarnya terus berkontribusi pada seluruh ekosistem. Pemberdayaan, singkirkan beberapa hambatan utama. Kemampuan semacam ini, dalam bidang seperti kecerdasan buatan dan mengemudi otonom, tidak tertandingi.
Tidak diragukan lagi bahwa dalam beberapa hari mendatang di tahun 2018, sang leader dan Nvidia-nya akan memberi kami lebih banyak kejutan.
Ngomong-ngomong, kami sedang merekrut orang, mari cari tahu?
Pertarungan kelompok waktu terbatas --- Kelas Praktik Pengantar untuk Insinyur NLP
Tiga modul, lima aplikasi, cakupan penuh poin pengetahuan, dosen doktoral luar negeri, pengalaman yang kaya dalam berbagi proyek;
Teori + praktik, membawa Anda untuk mempraktikkan aplikasi industri yang khas; komunitas Tanya Jawab profesional, jadikan mitra yang berpikiran sama.
Klik Baca aslinya Atau pindai kode untuk segera bergabung dengan grup ~
( 0 ) Selamat datang untuk berbagi, sampai jumpa besok!
- Urutan film dan analisis lokasi teater dengan satu klik, Yueke Software ingin membantu bioskop memasuki era operasi data
- Snapdragon 8150 akan segera dirilis, CPU mengadopsi desain delapan inti 1 + 3 + 4, kinerja GPU melebihi A12
- Film dan Televisi Xitian berlari ke Dewan Ketiga Baru, Wu Xiubo memegang 2% saham, dan ingin menjadi model CAA luar negeri di masa depan