Menurut Leifeng.com, pada 23 Oktober, NVIDIA mengadakan pertemuan komunikasi di Beijing. Zhao Liwei, direktur arsitektur solusi di kawasan Asia-Pasifik, menjelaskan platform percepatan data GPU open source RAPIDS secara detail.
Platform ini dirilis pada konferensi GTC Eropa pada 10 Oktober 2018. Ini adalah platform yang dipercepat GPU untuk ilmu data dan pembelajaran mesin. Platform ini menyediakan data scientist dengan alat pipeline standar. Kecepatan pemrosesan datanya 50 kali lebih cepat daripada yang hanya menggunakan CPU. .
Setelah pertemuan komunikasi, Leifeng.com melakukan pertukaran lebih lanjut dengan NVIDIA China Senior Solution Architect He Ping, dan Direktur Solusi Senior NVIDIA Asia Pasifik Zhao Liwei dan eksekutif lainnya di platform RAPIDS dan ilmu data dan pembelajaran mesin yang dipercepat GPU.
Menurut perkiraan analis, pasar server untuk ilmu data dan pembelajaran mesin bernilai sekitar US $ 20 miliar per tahun. Bersama dengan analisis ilmiah dan pasar pembelajaran mendalam, nilai total pasar komputasi berkinerja tinggi adalah sekitar US $ 36 miliar, dan pasar terus berkembang pesat. Perkembangan, hampir setiap perusahaan menggunakan data-driven untuk meningkatkan daya saing intinya.
"Analisis data dan pembelajaran mesin adalah segmen pasar terbesar di pasar komputasi berkinerja tinggi, tetapi mereka belum mencapai akselerasi," kata pendiri dan CEO NVIDIA Huang Renxun saat merilis RAPIDS. "Industri terbesar di dunia semuanya didasarkan pada server yang sangat besar. Tujuan menjalankan algoritme pembelajaran mesin adalah untuk memahami pola kompleks di pasar dan lingkungan, serta membuat prediksi dengan cepat dan akurat yang secara langsung akan memengaruhi fondasinya. "
Proses analisis big data umumnya dibagi menjadi tiga langkah: persiapan data, penggabungan data, dan pengurangan dimensi data. Banyak fitur data perlu dipahami oleh para ahli di industri atau bidang profesional dan diekstraksi terlebih dahulu. Oleh karena itu, diperlukan proses pelatihan dalam Machine Learning yang merupakan proses loop kontinu. Dalam proses optimasi berkelanjutan dan penyesuaian parameter secara kontinu, akurasi proses pelatihan ditingkatkan, dan hasil prediksi yang diperoleh lebih akurat.
Untuk mendukung proses analisis big data tersebut, diperlukan DASK, PYTHON, PANDAS, SKLEARN, NUMPY, Apache Arrow, dan komponen lainnya. RAPIDS dibangun di atas komponen seperti Apache Arrow, PANDAS, dan SKLEARN, dan mempercepat pemrosesan data melalui pemfilteran data CUDF, pembelajaran mesin CUML, dan visualisasi data CUGRAPH, membawa akselerasi GPU ke rantai alat sains data Python yang paling populer.
Ketiga perangkat perangkat lunak ini semuanya dikembangkan berdasarkan CUDA dan dapat dianggap sebagai bagian dari CUDA. Fungsi CUDF dan Pandas sangat mirip. Semua fungsi Panda dapat ditemukan di API terkait di CUDF; CUML sesuai dengan SKLEARN, dan algoritme seperti klasifikasi, pengelompokan, dan regresi dapat ditemukan di CUML. Meskipun CUGRAPH belum diluncurkan secara resmi, CUGRAPH diharapkan dapat diintegrasikan secara resmi ke dalam RAPIDS tahun depan.
Zhao Liwei mengungkapkan kepada Leifeng.com bahwa RAPIDS sangat mudah diintegrasikan dengan framework komputasi sebelumnya. Meskipun tidak dapat dikatakan sebagai transisi "tanpa kode", biayanya sangat kecil, dan efisiensi pemrosesan data dapat ditingkatkan lebih dari 50 kali lipat. Pada saat yang sama, untuk memperkenalkan lebih banyak pustaka dan fungsi pembelajaran mesin ke dalam RAPIDS, NVIDIA telah bekerja sama secara ekstensif dengan kontributor ekosistem sumber terbuka, termasuk Anaconda, BlazingDB, Databricks, dan pandas pustaka sains data Python yang berkembang pesat.
Selain itu, Huang Renxun menggunakan 16 kartu komputasi Tesla V100 saat menunjukkan RAPIDS di konferensi GTC Eropa. Setiap kartu dilengkapi dengan memori video 32 GB HBM2, dan bandwidth hingga 900 GB / dtk. Kedua kartu komputasi melewati 300 GB / dtk. Interkoneksi bus NV Switch memungkinkan seluruh server memiliki kemampuan komunikasi yang tidak diblokir, dengan total daya komputasi hingga 2PFLOP (titik mengambang presisi setengah), dan kapasitas pemrosesan data yang setara dengan 5 DGX-1.
Selain DGX-2 dan DGX-1, NVIDIA juga memiliki banyak produk perangkat keras yang disediakan oleh serangkaian mitra, seperti ODM, produsen OEM berdasarkan dua standar arsitektur HGX-1 dan HGX-2 menghasilkan berbagai jenis server, bahkan termasuk yang di atas. Generasi server GPU dengan arsitektur Pascal semuanya dapat mendukung operasi dan penggunaan RAPIDS.
Zhao Liwei berkata sambil tersenyum bahwa karena kecepatan pemrosesan data sebelumnya terlalu lambat, para ilmuwan data sering kali memiliki banyak waktu tunggu gratis untuk minum kopi dengan santai. Setelah penerapan platform RAPIDS, waktu tunggu menjadi lebih pendek, dan bagian yang membutuhkan partisipasi kreatif dari data scientist telah meningkat sesuai dengan itu.Pekerjaan data scientist mungkin bukan lagi pekerjaan yang indah.
Tentu saja, analisis data dan pembelajaran mesin terus menjadi panas, dan NVIDIA tidak sendirian di pasar ini. Minggu lalu, Xilinx baru saja meluncurkan Alveo U200 dan U250 untuk pusat data dan kartu akselerasi AI berdasarkan UltraScale + FPGA, mengklaim bahwa throughput inferensi waktu nyata 20 kali lebih tinggi daripada CPU kelas atas.
Wakil Presiden Pusat Data Xilinx Manish Muthal mengatakan bahwa peluncuran kartu akselerator Alveo semakin mendorong transformasi Xilinx menjadi perusahaan platform, memungkinkan ekosistem mitra aplikasi yang berkembang mempercepat inovasi pada tingkat yang lebih cepat dari sebelumnya, dan akan menjadi Ekosistem aplikasi bekerja sama untuk bersama-sama memperkenalkan kepada pelanggan berbagai solusi yang dapat diproduksi menggunakan Alveo.
Dibandingkan dengan platform RAPIDS yang diluncurkan oleh NVIDIA, keduanya mencakup rentang yang hampir sama melalui satu hard dan satu soft. Dalam hal ini, Zhao Liwei mengatakan kepada Leifeng.com bahwa analisis data dan pasar pembelajaran mesin belum membuktikan batasan spesifik dan skenario aplikasinya di lapangan. Sangat beragam, apakah itu didasarkan pada FPGA atau ASIC untuk percepatan heterogen dapat dilakukan, tergantung pada persyaratan berbeda yang dihasilkan untuk skenario yang berbeda.
- The King of Glory Raja penebangan, hampir seribu dolar per menit, pelajari bagaimana KCC Cao Cao tumbuh di alam liar
- Nenek S dijatuhi hukuman satu tahun penjara oleh pengadilan Hong Kong? Wang Xiaofei mengklarifikasi: berita itu tidak benar