Mengapa pembelajaran mendalam (DL) lebih baik daripada metode pembelajaran mesin (ML) lainnya?
Lei Feng.com: Belakangan ini, di banyak forum dan majalah developer asing, topik "keuntungan deep learning" memang memicu banyak diskusi. Dalam hal ini, Aureli Soria-Frisch, seorang ahli AI Spanyol yang terkenal dan kepala penelitian ilmu saraf Starlab, mengungkapkan pandangannya.
Inilah tiga alasannya: 1. Proses pelatihan DL mengintegrasikan ekstraksi fitur; 2. Pengumpulan kumpulan data besar; 3. Kemajuan teknis.
Aureli Soria-Frisch
Aureli Soria-Frisch: Saya ingin menunjukkan tiga alasan - di mata saya, tiga alasan tersebut membentuk landasan kinerja unggul deep learning. Saya bukan orang pertama yang membahas topik ini, dan saya jelas bukan yang terakhir, tetapi saya ingin memperluas topik ini - menambahkan alasan praktik pengembang. Oleh karena itu, jika Anda mencari dukungan teoritis, silakan mencarinya dalam karya akademis. itu disini, Saya akan membahas dari perspektif praktis mengapa pembelajaran mendalam telah menjadi teknologi yang berharga untuk menangani masalah klasifikasi dan aplikasi. Tentu saja, artikel ini tidak memasukkan semua masalah dan aplikasinya.
Saat ini, pembelajaran mendalam adalah teknologi mutakhir untuk pengenalan pola, seperti mesin vektor dukungan (SVM) sebelumnya dan algoritma hutan acak (Random Forests). Tetapi berdasarkan prinsip "tidak ada makan siang gratis", algoritma optimal yang dapat menangani semua masalah secara efisien tidak ada. Oleh karena itu, pembaca Leifeng.com harus mengingat bahwa yang dievaluasi artikel ini adalah pengaruh DL pada tugas klasifikasi. Evaluasi kinerja adalah dasar dari aplikasi pembelajaran mesin dan terkait langsung dengan keberhasilan pembelajaran dalam, lihat di bawah.
Satu, ekstraksi fitur terintegrasi
Alasan mengapa pembelajaran mendalam berhasil, Yang pertama adalah karena ini mengintegrasikan ekstraksi fitur selama pelatihan.
Belum lama ini, pengenalan pola masih difokuskan pada tahap klasifikasi, dan ekstraksi fitur dianggap sebagai masalah yang agak independen. Pemrosesannya sebagian didasarkan pada operasi manual dan pengetahuan ahli pengrajin AI. Oleh karena itu, dulu developer sering mengundang pakar di bidang terkait untuk bergabung dalam tim. Misalnya, jika Anda ingin mengklasifikasikan era EEG, Anda memerlukan ahli elektrofisiologi yang berpengalaman; pengenalan tulisan tangan membutuhkan ahli analisis tulisan tangan.
Keahlian para ahli ini digunakan untuk memilih fitur yang menarik bagi pengembang dalam masalah tertentu. Sebaliknya, metode pembelajaran mendalam tidak perlu membuat fitur terlebih dahulu: dalam pembelajaran mendalam, ekstraksi fitur dan klasifikasi dilatih pada waktu yang sama. Misalnya, dalam pengenalan gambar, filter gambar atau parameter asli dilatih di lapisan pertama jaringan klasifikasi. Ini adalah konsep yang telah disebutkan oleh komunitas antarmuka interaksi otak-komputer misalnya, melatih Common Spatial Filters (CSP) untuk mengekstrak fitur yang sesuai untuk setiap pengguna BCI.
Dua, kumpulan data besar
Lebih penting lagi, pembelajaran yang mendalam mampu mengatasi banyak masalah yang tidak dapat diselesaikan sebelumnya. Ini berhubungan dengan: 1. Pengumpulan kumpulan data besar didorong sepenuhnya; 2. Evaluasi kinerja terintegrasi secara sistematis dalam proses pengembangan.
Leifeng.com: Seperti koin yang sama, ini adalah pro dan kontra dari pertanyaan yang sama. Untuk kumpulan data yang besar, tidak mungkin lagi menggunakan proses manual untuk evaluasi kinerja. Anda perlu mengotomatiskan prosesnya sebanyak mungkin. Otomasi berarti menyiapkan fase validasi silang dan mengintegrasikannya ke dalam proses pengembangan.
Dalam beberapa tahun terakhir, popularitas berbagai platform DL dan tantangan analisis data telah memainkan peran yang sangat baik dalam mendukung kumpulan data yang besar dan evaluasi kinerja. Tantangan pertama diatur seputar visi komputer yang paling penting dan konferensi pengenalan pola. Inilah tantangan PASCAL dan ImageNet. Mereka memungkinkan kumpulan data gambar besar dibuat untuk pertama kalinya, dan yang terpenting, mereka adalah contoh kebenaran dasar yang dapat digunakan untuk evaluasi kinerja algoritme sistematis.
Lebih penting lagi, evaluasi kinerja adalah tes buta pada penanda sebenarnya dari set pelatihan. Tidak mungkin untuk mendorong kinerja tinggi melalui penyetelan parameter. Konsep tantangan ini kemudian digunakan dalam platform analisis data, yang paling terkenal adalah Kaggle, tetapi ini bukan satu-satunya, ada DrivenData, InnoCentive dan sebagainya. Platform persaingan data ini didasarkan pada konsep yang sama: mereka menyediakan kumpulan data untuk pelatihan, kumpulan data "buta" untuk pengujian, ditambah platform yang dapat membandingkan efek dari tim yang berbeda. Untuk ilmu data, terutama deep learning, ini jelas merupakan tempat yang bagus untuk belajar pengalaman.
3. Kemajuan teknologi
Alasan terakhir saya ingin berbagi dengan Anda sangat dekat dengan dua yang pertama: tanpa kemajuan teknologi, tidak ada inovasi di atas yang dapat terwujud.
Turunnya harga memori dan penyimpanan (catatan Lei Feng.com: Fokusnya di sini adalah pada tren jangka panjang. Kenaikan harga memori dan SSD pada 2016-2017 disebabkan oleh rebound harga yang disebabkan oleh berbagai alasan), yang memungkinkan kumpulan data disimpan dalam skala yang terus berkembang. Hukum Moore yang terkenal menjelaskan peningkatan kinerja komputasi yang menyertainya. Terakhir, ledakan teknologi Internet tidak diragukan lagi telah "mendemokratisasi" memori dan kinerja komputasi, dan lebih banyak orang akan menikmati kemudahan yang mereka bawa. Penyimpanan cloud dan komputasi kinerja tinggi (HPC) membuat kompleksitas arsitektur yang diimplementasikan (misalnya, bibliografi lapisan dan node terkait dalam jaringan) meningkat secara eksponensial. Setidaknya untuk saat ini, ini telah terbukti sebagai jalur aplikasi paling sukses untuk pembelajaran mendalam.
melalui kdnuggets
- Asisten Luo Jin menghancurkan telepon orang yang lewat, dan Tang Yan serta istrinya memperhatikan dengan acuh tak acuh
- Kepala Ilmuwan Google Vincent Vanhoucke: Robot dan pembelajaran mendalam sedang menjalani "perpaduan yang menarik" | AAAI 2017
- Sesuai dengan tujuan awal dari tugas awal, bagaimana lini produksi OPPO Find X menyusun kata "kualitas"?
- Angin kencang merobohkan pohon besar di Jalan Xinwen, menggantung kabel, dan menabrak bus! Untung...