Foto oleh Mike Petrucci di Majalah Unsplash
Pada artikel ini, kita akan melihat proyek pembelajaran mesin open source terpopuler di MyBridge pada tahun 2019.
Kloning suara waktu nyata (13.7K)
Proyek ini merupakan implementasi dari makalah SV2TTS, yaitu vocoder yang dapat bekerja secara real time. Menggunakan repo ini, pengguna dapat mengkloning suara dalam 5 detik dan menghasilkan percakapan sewenang-wenang secara real time.
Situs web: https://arxiv.org/abs/1806.04558
Kerangka pembelajaran mendalam tiga tahap SV2TTS memungkinkan pembuatan representasi digital ucapan dari beberapa detik audio.
Situs web: https://github.com/CorentinJ/Real-Time-Voice-Cloning
UGATIT: Jaringan Perhatian Generatif Tanpa Pengawasan dengan Normalisasi Lapisan Adaptif (4.4K)
Ini adalah implementasi TensorFlow dari U-GAT-IT. Makalah ini menyajikan metode implementasi konversi gambar-ke-gambar tanpa pengawasan, yang menambahkan modul perhatian baru dan fungsi normalisasi end-to-end baru yang dapat dipelajari.
Situs web: https://arxiv.org/abs/1907.10830
Modul perhatian memandu model untuk fokus pada area yang lebih penting, sehingga dapat membedakan domain sumber dari domain target berdasarkan peta perhatian yang diperoleh oleh pengklasifikasi tambahan. Fungsi AdaLIN (Adaptive Layer Instance Normalization) membantu model mengontrol jumlah perubahan bentuk dan tekstur pada gambar melalui parameter yang dipelajari.
Situs web: https://github.com/taki0112/UGATIT
RAdam: Varians kecepatan pemelajaran adaptif dan kelebihannya (1.9K)
Ini adalah implementasi dari makalah berikut:
Situs web: https://arxiv.org/abs/1908.03265
Penulis mengusulkan varian Adam Radam. Ini dicapai dengan mengoreksi varians dari proses pembelajaran adaptif. Penulis menggunakan klasifikasi gambar, pemodelan bahasa dan tugas penerjemahan mesin saraf untuk mendapatkan hasil eksperimen.
Situs web: https://github.com/LiyuanLucasLiu/RAdam
Penerapan Model Rekomendasi Deep Learning DLRM (1.7K)
Ini adalah model rekomendasi deep learning-DLRM paling canggih, yang dapat diterapkan di PyTorch dan Caffe2.
Situs web: https://arxiv.org/abs/1906.00091
Model memiliki skema paralelisasi khusus yang menggunakan paralelisme model yang tertanam dalam tabel untuk memigrasi batasan memori. Hal ini memungkinkan pengembangan paralelisme data untuk memperluas komputasi dari lapisan yang terhubung sepenuhnya.
Situs web: https://github.com/facebookresearch/dlrm
TecoGAN (1.3K)
Repo ini berisi kode untuk TEmporally COherent GAN.
Situs web: https://github.com/thunil/TecoGAN
URL Video: https://youtu.be/pZXFXtfd-Ak
Makalah ini mengusulkan skema resolusi-super untuk video pelatihan permusuhan, yang mencapai solusi koheren temporer tanpa mengorbankan detail spasial. Ini juga mengusulkan kerugian Ping-Pong yang dapat menghilangkan artefak waktu di jaringan rekursif tanpa mengurangi kualitas yang dirasakan.
Situs web: https://arxiv.org/abs/1811.09393
Megatron-LM (1.1K)
Megatron repo adalah proyek penelitian berkelanjutan yang bertujuan untuk melatih model bahasa transformator yang kuat dan berskala besar dalam skala besar. Saat ini mendukung pelatihan paralel dan multi-node model GPT2 dan BERT.
Situs web: https://github.com/NVIDIA/Megatron-LM
Saat ini ia dapat melatih model bahasa GPT2 dengan 72 lapisan dan 8,3 miliar parameter, dengan model 8 arah dan paralelisme data 64 arah, yang didistribusikan pada 512 GPU. Itu dapat melatih hingga 64 V100 gpu BERT dalam 3 hari. Kebingungan model bahasa Megatron adalah 3,15, dan skor F1 adalah 90,7.
TensorNetwork (1K)
TensorNetwork adalah pustaka sumber terbuka untuk mengimplementasikan algoritme jaringan tensor. Ini adalah pembungkus jaringan tensor untuk TensorFlow, JAX, PyTorch, dan NumPy.
URL: https://github.com/google/tensornetwork
Jaringan sensor adalah struktur data renggang yang saat ini digunakan dalam penelitian machine learning. Saat ini, pengembang tidak menganjurkan penggunaan alat ini dalam lingkungan produksi.
Situs web: https://arxiv.org/abs/1906.06329
Python_autocomplete (70865039;)
Ini adalah proyek berbasis TensorFlow yang tujuannya adalah menguji kemampuan LSTM untuk menyelesaikan kode Python secara otomatis.
Situs web: https://github.com/vpj/python_autocomplete
Kerbau (365 )
Buffalo adalah sistem rekomendasi open source yang cepat, dapat diskalakan, dan berorientasi pada produksi. Ini secara efektif menggunakan sumber daya sistem, sehingga mencapai kinerja tinggi pada mesin dengan spesifikasi rendah.
Situs web: https://github.com/kakao/buffalo
Model kepala berbicara saraf yang realistis (312)
Ini adalah realisasi dari artikel "Pembelajaran Adversarial Beberapa Model Kepala Neural Berbicara Realistis". Makalah ini mengusulkan model kepala bicara yang dipersonalisasi dan realistis, yang tujuannya adalah untuk mensintesis gambar wajah yang realistis dan dipersonalisasi dengan serangkaian tanda wajah.
Situs web: https://arxiv.org/abs/1905.08233
Metode ini cocok untuk telepresence, konferensi video, industri efek khusus, dan game multipemain. Sistem yang diusulkan dapat menginisialisasi parameter generator dan diskriminator dengan cara tertentu, yang memungkinkan gambar digunakan dengan cepat selama pelatihan.
Situs web: https://github.com/vincent-thevenin/Realistic-Neural-Talking-Head-Models
Melihat ke masa depan
Menantikan tahun 2020, karena alat pembelajaran mesin menjadi lebih canggih dan lebih mudah digunakan, kami pasti akan menemukan proyek open source yang lebih menarik, jadi pantau terus.
melalui: https://heartbeat.fritz.ai/2019s-top-open-source-machine-learning-projects-3cd082a02f78
Lei Feng Net Lei Feng Net Lei Feng Net
- "Ruang obrolan medis" hanya bisa dilakukan satu kasus sehari, mereka juga memperjuangkan kecantikan Anda
- Lagu Fana · Festival Qingming Harap ingat nama mereka, 5 pahlawan Shandong memadamkan api di Muli, Liangshan
- Bagaimana cara melakukan pendidikan tenaga kerja? Distrik Jinan Shizhong dan seminar Kelompok Pendidikan Weier datang untuk mendukung
- Suka! Sekolah Dasar No. 1 Dianliu di Kota Jinan melaksanakan kegiatan "Peringatan Online untuk Pahlawan"
- Laporan Mingguan Global Industri E-niaga Makanan Segar Prospektif No. 21: Jingdong mengontrak pantou Chaganhu dengan 1/3 keluaran dan penjualan diperkirakan melebihi 10 juta
- Laporan Mingguan Global Calon Industri Gen No. 51: Gen kebangkitan ingatan pertama ditemukan, dan gen ini benar-benar memiliki ingatan terbaik sebelum tidur
- Film "Tank News" "Pet Love": Hewan yang tidak dapat disempurnakan setelah pendirian Republik Rakyat Tiongkok ada di sini
- 36Kr Reading | Daftar Buku Investor Triwulan Pertama: Menghadapi Ketidakpastian, Mereka Mencari Ke Dalam