Memimpin: Artikel ini adalah Universitas Peking Wan Xiaojun Profesor di Byte Tech 2019 Machine Intelligence Frontier Forum Bagikan di. Byte Tech 2019 diselenggarakan bersama oleh China Artificial Intelligence Society, ByteDance, Universitas Tsinghua, dan diselenggarakan bersama oleh Institute of Data Science, Universitas Tsinghua.
Saya ingin berdiskusi dengan Anda sebelum pidato, Mengapa generasi bahasa alami (NLG), Sebelumnya kita lebih banyak dihadapkan pada natural language Understanding (NLU), yaitu pemahaman bahasa manusia, yang merupakan tujuan penting dari natural language processing. Sekarang kami mengharapkan peralatan menjadi cerdas untuk lebih mewujudkan komunikasi antara mesin dan manusia. Yang perlu kami lakukan adalah meningkatkan lebih lanjut teknologi NLG, yaitu, teknologi generasi bahasa alami, untuk benar-benar mewujudkan interaksi alami antara mesin dan manusia, dan untuk meningkatkan tingkat kecerdasan mesin.
Pertama-tama, Apa generasi bahasa alami NLG? NLG memiliki jangkauan yang luas, dengan subtugas yang berbeda berdasarkan jenis masukan yang berbeda. Masukan termasuk gambar, audio, tabel, teks, dll., Dan akhirnya teks harus dibuat. Pembuatan teks ke teks dapat mencakup beberapa jenis subtugas. Misalnya, mengeluarkan teks pendek berdasarkan teks panjang adalah ringkasan dokumen, sedangkan retelling teks adalah penulisan ulang teks. Panjang input dan output sama, dan teks yang dihasilkan memiliki semantik yang sama dengan teks input, tetapi ekspresi teksnya akan berbeda.
Selain itu, pembuatan dialog dan terjemahan mesin juga merupakan tugas pembuatan teks-ke-teks. Terjemahan mesin mengambil teks dalam satu bahasa sebagai teks masukan dan keluaran dalam bahasa lain. Pembuatan dialog didasarkan pada balasan yang dihasilkan di atas. Dua bidang pembuatan dialog dan terjemahan mesin sangat besar, dan umumnya diperlakukan secara terpisah dan tidak digabungkan ke dalam bidang pembuatan teks.
Selain text-to-text generation, ada juga data-to-text generation, seperti pembuatan teks deskripsi keuangan berdasarkan laporan keuangan yang memiliki kegunaan yang sangat penting dalam bidang bisnis.Saat ini banyak unit yang mempelajari teknologi ini.
Menghasilkan kalimat berdasarkan semantik dan sintaksis merupakan tugas NLG yang telah dipelajari di kalangan akademisi. Lebih rumit untuk diterapkan dalam aplikasi praktis karena melibatkan NLU dan NLG.
Terakhir, memasukkan gambar atau video untuk menghasilkan teks juga merupakan arah penelitian utama NLG, dan lebih banyak penelitian terkonsentrasi di bidang computer vision (CV). Kita dapat melihat bahwa seluruh cakupan NLG sangat besar, secara pribadi saya mulai melakukan penelitian peringkasan dokumen, kemudian saya secara bertahap mempelajari tugas-tugas NLG lainnya.
NLG memiliki berbagai aplikasi, Termasuk robot dialog Xiaoice yang sekarang sangat populer, pembuatan ringkasan, pembuatan berita, pembuatan puisi, dll.
Saat ini, Permintaan aplikasi NLG sangat besar, dan permintaan teknologi NLG di pasar juga sangat luas. Termasuk penulisan ulang artikel satu-ke-banyak, pembuatan skrip novel, dll. Tetapi saat ini, sangat sulit untuk menyelesaikan kebutuhan ini, sama sulitnya untuk membuat komputer mewujudkan penciptaan dalam arti yang sebenarnya. Yang harus kita lakukan adalah membiarkan komputer memainkan peran tambahan. Untuk penulisan ulang artikel one-to-many, seperti memproduksi soft article, cara menulis ulang artikel menjadi berbagai gaya dan menyebarkannya di Internet agar lebih banyak orang dapat melihatnya. Jika penulisan ulang tidak bagus, untuk dua artikel dengan konten yang sangat mirip, artikel yang ditulis ulang akan diblokir. Kita perlu banyak menulis ulang sambil mempertahankan semantik asli tidak berubah. Proses ini sangat sulit. Selain itu, AI sulit menjadi host dan melakukan debat, meskipun belum bisa dimanfaatkan untuk saat ini, namun dapat diteliti dan dieksplorasi terlebih dahulu.
Sebelum deep learning menjadi populer, NLG memiliki banyak metode, salah satunya adalah Rule based atau template filling. Tulis aturan secara manual terlebih dahulu, lalu isi data dan informasi, Anda juga dapat membuat teks. Faktanya, meskipun metode ini sederhana, ini sangat berguna dalam banyak aplikasi komersial. Anda juga dapat menggunakan metode pembelajaran mesin otomatis untuk meringkas dan mendapatkan template penulisan secara otomatis.
Dalam beberapa tahun terakhir, metode pembelajaran yang dalam telah banyak digunakan Model konversi urutan-ke-urutan berdasarkan kerangka encoder dan decoder adalah model generasi teks yang paling utama. Pembelajaran penguatan dan jaringan generasi konfrontasi juga terutama untuk meningkatkan model konversi urutan. Inti dari penelitian kami adalah arsitektur codec. Beberapa studi menyempurnakan encoder, dan beberapa studi menyempurnakan decoder untuk meningkatkan efeknya.
Berikut ini menjelaskan sumber daya dan model untuk tugas-tugas NLG umum. Data paralel dari tugas pembuatan teks yang berbeda akan berbeda, dan metode pembelajaran mendalam sangat bergantung pada data paralel tersebut. Kami melihat bahwa ada relatif banyak data paralel untuk tugas pembuatan abstrak, tetapi hanya ada ratusan ribu pasangan. Skala data ini relatif kecil dibandingkan dengan data pelatihan terjemahan mesin, sehingga efek yang dihasilkan saat ini tidak ideal. Banyak tugas pembuatan teks saat ini tidak memiliki korpus pelatihan berskala besar, dan korpus pelatihan ini sulit untuk dianotasi secara manual dalam waktu singkat. Kenyataannya, semua model pembuatan teks tidak sempurna, masalah besar terletak pada datanya, tetapi model itu sendiri perlu disesuaikan.
Saya ingin tegaskan bahwa NLG berbasis neural network model ini tidak berhasil.Meski kita sudah banyak melakukan penelitian akademis dan banyak menerbitkan makalah akademis, pada banyak tugas, selama kinerjanya ditingkatkan 1% -2%, makalah dapat diterbitkan, tetapi dari Dari sudut pandang praktis, teknologi ini sulit untuk mencapai tingkat kepuasan yang diinginkan, jadi kami perlu lebih meningkatkan data dan model.
Tim kami juga telah melakukan banyak penelitian tentang pembuatan teks.Target penelitian diposisikan sebagai generasi X-to-Text, di mana X mewakili berbagai masukan, seperti teks, data, gambar, kode, dan sebagainya. Jenis teks keluaran meliputi kalimat, ringkasan pendek, artikel, puisi, komentar, dll. Misalnya, menulis puisi kuno berdasarkan gambar. Pembentukan puisi pada umumnya didasarkan pada kata kunci yang dirangkum menjadi empat kata kunci yang terkait sesuai tema yang diberikan, menurut setiap kata kunci, baris puisi merupakan keluaran, dan keempat baris puisi tersebut disatukan untuk membentuk puisi yang utuh. Memperhatikan karakteristik puisi kuno, beberapa pengolahan perlu dilakukan, seperti rima dan rima yang relatif mudah untuk diselesaikan oleh komputer, dan dapat dicapai dengan sedikit kontrol saat mendekode teks. Yang harus kita lakukan bukanlah menghasilkan puisi dari satu gambar, tetapi menghasilkan puisi dari kumpulan gambar, seperti sekelompok foto yang diambil saat bepergian, cara menghasilkan puisi untuk menggambarkan pemandangan dan mewujudkan ekspresi dengan gambar dan kata-kata, ini juga Tugas konversi dari gambar ke teks. Berdasarkan kerangka encoder dan decoder, kami mengadopsi mekanisme seleksi dan mekanisme self-attention untuk menangani masalah noise dan gambar yang berlebihan dalam konsentrasi gambar, dan inkonsistensi beberapa kata dalam puisi kuno dengan konten gambar.
Gambar di bawah ini adalah hasil akhir, dan di atas adalah kumpulan gambar masukan, pantun dapat kita buat di pojok kiri bawah dan syair di pojok kanan bawah. Efek keseluruhan puisi yang dihasilkan lebih baik. Kami juga akan meluncurkan demo terkait.
Masih ada beberapa tantangan di bidang natural language generation.
pertama, Saat ini, indikator evaluasi kami seperti BLEU, ROUGE, dll. Tidak cukup akurat, tetapi evaluasi manual kurang stabil dan tidak nyaman untuk dioperasikan. Bagaimana menemukan indeks evaluasi otomatis yang akurat dan obyektif, kontribusi untuk bidang ini melebihi kontribusi model mana pun.
kedua, Cara membuat teks ketika korpus paralel sedikit, atau bahkan pembuatan teks tanpa pengawasan dapat dilakukan, tetapi tidak ada keraguan bahwa jika korpusnya mencukupi, efek pembuatan teks yang diawasi pasti akan lebih baik.
ketiga, Bagaimana memecahkan kode teks panjang, decoder saat ini dapat memecahkan kode teks dari lusinan kata, tetapi sangat menantang untuk langsung memecahkan kode urutan ratusan kata atau ribuan kata. Bagaimana mencapai ini juga merupakan pertanyaan yang patut dipertimbangkan.
Akhirnya, Bagaimana melakukan pembuatan teks lintas modal tingkat tinggi, yaitu, melihat gambar dan berbicara. Gambar di bawah ini adalah prangko dari tahun 2019. Apa yang Anda katakan atau tulis di artikel ketika melihat prangko ini?
Seribu pembaca memiliki seribu Hamlet, dan setiap orang berpikir dari sudut pandang yang berbeda. Hasil CaptionBot, alat penampil gambar dari Microsoft, adalah "Saya pikir ini adalah karakter kartun." Hasil ini tidak dapat dikatakan sepenuhnya salah, tetapi karena model dan data, pemahaman semantik mesin terhadap gambar masih sangat dangkal, dan tidak dapat menalar dan mendamaikan. Lenovo. Jika ditulis oleh penulis manusia, Anda bisa memikirkan banyak hal, seperti mendorong kelahiran tiga anak; tekanan belajar tinggi, dahi anak tumbuh keriput; ibu dibakar seharian mengerjakan PR, dan ayah masih gemuk Tunggu. Oleh karena itu, kita akan menemukan bahwa manusia memiliki imajinasi yang sangat kuat dan akan menggabungkan berbagai pengetahuan dan petunjuk untuk membuat artikel yang kaya dan menarik. Meskipun sekarang diketahui bahwa kecerdasan buatan sangat ampuh, nyatanya setidaknya untuk tugas menghasilkan teks masih terdapat gap yang besar dibandingkan dengan manusia.Saat ini, AI hanya dapat digunakan dalam bisnis untuk menyelesaikan kebutuhan penulisan yang berulang dan sederhana, dan tidak mungkin untuk membuat tulisan yang mendalam. artikel. Adanya gap tersebut merupakan peluang penelitian bagi civitas akademika, apalagi ada gap dan kekurangannya, dan perlu dilakukan penelitian.
Terima kasih semua.
Editor: Wen Jing - Selesai -Ikuti platform publik WeChat resmi dari Institut Ilmu Data Tsinghua-Qingdao " THU Data Pie "Dan nomor saudara perempuan" Data Pie THU "Dapatkan lebih banyak manfaat kuliah dan konten berkualitas.
- Zhang Bo, Dekan Institut Penelitian Kecerdasan Buatan Tsinghua: Hubungan saya dengan AI adalah "menikah dulu dan jatuh cinta"
- Merilis ponsel kamera empat kamera S10 pertama di dunia, Gionee meluncurkan pertempuran untuk memotret kaum muda
- Mandzukic menegaskan bahwa dia tidak akan dihukum! Ofisial memberikan 1 penjelasan, kemungkinan akan diskors selama 5 pertandingan di Liga Super
- Merkel melakukan pendaratan darurat di Bandara Cologne dan terpaksa melewatkan upacara pembukaan G20
- 16.625 makalah mengungkapkan hukum evolusi AI dalam 25 tahun! Era pembelajaran mendalam akan segera berakhir!