Sumber: Big Data Digest

Artikel ini adalah tentang 3200 kata , Dianjurkan untuk membaca 8 menit

Artikel ini memperkenalkan Anda pada DeepL, perangkat lunak terjemahan mesin online.

Tag: pencapaian mutakhir

Baru-baru ini, perangkat lunak terjemahan mesin online menjadi populer di Jepang.

Perangkat lunak terjemahan ini disebut DeepL , Penyebab kebakaran justru karena terlalu bertanggung jawab atas pekerjaannya, Terjemahan terlalu akurat , Takut diskusi panas di Jepang.

Dilihat dari evaluasi pribadi netizen Jepang, tidak hanya efek terjemahan dari dialek Jepang yang tidak masuk akal, tetapi juga teks-teks Tiongkok klasik. Anda tahu, ini adalah Bahkan Google Terjemahan tidak dapat melakukannya Benda.

Tapi seberapa tepat itu? Sebagai software teknologi yang ketat, tentunya tetap harus Anda gunakan Data berbicara untuk , Pejabat DeepL juga mengumumkannya Hasil tes buta terjemahan Jepang-Inggris dan terjemahan Mandarin-Inggris , Seperti yang ditunjukkan pada gambar di bawah ini, dapat dilihat bahwa DeepL hanyalah adanya tahapan bergulir:

Blind testing adalah untuk mengevaluasi teks yang diterjemahkan ketika pengulas penerjemah profesional tidak tahu versi terjemahan mana yang diterjemahkan oleh situs web mana. Ini selalu menjadi salah satu metode pengujian DeepL.

Karena akurasinya yang sangat baik, DeepL juga Juga meledakkan Reddit Beberapa netizen menilai DeepL tidak menerjemahkan dari kata-kata seperti Google Translate, terlihat dari pengaturan Textractor yang juga didukung DeepL. Terus gunakan terjemahan sebelumnya sebagai konteks untuk meningkatkan hasil terjemahan .

Netizen juga banyak Sebut "DeepL mengagumkan"!

Tiga tahun lalu, ketika DeepL pertama kali muncul di hadapan publik, itu sudah menarik banyak perhatian. CEO DeepL Gereon Frahling pernah berkata, Tujuan DeepL tidak terbatas pada tugas terjemahan. Jaringan saraf akan mulai dengan memahami teks dan membuka lebih banyak kemungkinan.

Adapun bagaimana lebih berkembang, kami melakukan evaluasi kecil, lalu kami berkumpul untuk melihat sejarah sejarah DeepL. Bangku kecil telah ditempatkan, dan Anda dipersilakan untuk duduk ~

Dialek, Cina klasik, makalah akademis, pertarungan peri mesin terjemahan!

Baik evaluasi pribadi dan hasil tes buta DeepL resmi menunjukkan bahwa DeepL mungkin merupakan terjemahan mesin paling akurat saat ini, dan Anda masih harus mencobanya sendiri sebelum Anda menyadarinya.

Karena pembaruan ini juga menyertakan bahasa Cina Sederhana, dengan sedikit kecurigaan dan sedikit rasa ingin tahu, kami juga tertarik dengan DeepL Melakukan evaluasi sederhana , Dan arus utama saat ini Google Translate, Microsoft Translator, Baidu Translator, Youdao Translator dibandingkan.

Skor untuk tes ini Tiga babak, babak pertama dialek, babak kedua bahasa Cina klasik, dan babak ketiga makalah akademis . Oke, sekarang kami mengundang lima pemain.

Di babak pertama, mari kita lihat dialek.

Semua orang tahu bahwa budaya dialek bahasa Tionghoa itu luas dan mendalam, jika dialek tersebut tidak dapat diterjemahkan dengan benar, maka tingkat keakuratannya masih akan menimbulkan tanda tanya.

Kami memilih Topik tingkat kesepuluh dialek timur laut: "Biarkan aku pergi, kamu terlalu keras kepala" . Pertanyaan ini punya Dua poin untuk mencetak gol, satu adalah "Biarkan aku pergi" dan yang lainnya adalah "Knock" . Mari kita lihat performa kelima pemain tersebut.

Untuk score pertama, Google menerjemahkannya menjadi "I'll go there". Microsoft dan Baidu mengira itu artinya "I'll go", sedangkan Youdao memberikan jawaban "I don't know". DeepL tampil sangat baik, diterjemahkan dengan benar ke dalam "oh my god" dengan nada terkejut.

Pada poin kedua, kelima pemain tersebut memberikan jawaban yang berbeda, Google "malu", Microsoft "sombong", Baidu "lusuh", Youdao "buruk", dan DeepL "jelek".

Dari sudut pandang poin penilaian, kinerja Baidu di pertanyaan kedua cukup adil, Anda memiliki cara ... hampir tidak bisa dilewati, Google dan Microsoft benar-benar musnah. Mari kita nikmati Makalah tes skor penuh DeepL :

Ini pertanyaan pertama, jangan khawatir, masih ada kesempatan untuk menyerah. Selanjutnya, mari kita lihat bahasa Mandarin klasik. Karena DeepL dapat menerjemahkan bahasa Jepang kuno, akan salah jika tidak dapat menerjemahkan bahasa China kuno.

Babak kedua, bahasa Cina klasik.

Di bagian Tiongkok klasik, kami menggunakan penyair Dinasti Tang yang terkenal, Zhang Jiuling Kalimat terkenal dalam "Menunggu Bulan dan Jauh" "Bulan cerah lahir di laut, "Untuk pertanyaan tes, arti dari puisi ini adalah bulan cerah terbit di lautan luas, mengingatkan orang-orang dari kerabat dan teman jauh di ujung dunia. Dia seharusnya melihat bulan terang yang sama saat ini.

Poin skor dari pertanyaan ini adalah untuk melihat apakah para pemain dapat menggunakannya Ekspresikan konsepsi artistik dari keseluruhan puisi dalam bahasa Inggris . Nah, jawaban standar versi China sudah diumumkan, lalu bagaimana performa kelima pemainnya?

Pertama-tama, dari perspektif makna kalimat, Google, Microsoft dan Baidu secara langsung meninggalkan terjemahan paruh kedua kalimat, dan Youdao menerjemahkan paruh kedua kalimat tersebut ke dalam "Tianya saat ini"; dalam terjemahan paruh pertama kalimat, baik Microsoft maupun Baidu menggunakan kata born Kata ini, tapi terjemahan Microsoft adalah "Laut lahir"? ? ? ?

Mari kita lihat DeepL. Paruh pertama kalimat persis sama dengan jawaban Google, tetapi kita tidak tahu apakah terjemahan dari paruh kedua kalimat telah mencapai tingkat kesetiaan, tetapi Rasanya sangat nyaman untuk dibaca, dan semua orang bisa mencicipinya :

Final ketiga dan terakhir, kita akan memeriksa terjemahan bahasa Mandarin-Inggris dari makalah akademis oleh para kontestan.

Kunci makalah akademis Selain kalimat yang lancar, Anda juga harus akurat dalam kosakata profesional. Ini juga yang menjadi fokus investigasi ini.

Untuk terjemahan bahasa Mandarin-Inggris, kami memilih artikel yang diterbitkan tahun lalu di Jurnalisme Internasional. Para peneliti menyelidiki dampak kepercayaan media sosial pada persepsi risiko privasi dan pengungkapan diri.

Asli: Hasil empiris menunjukkan bahwa: 1. Tidak ada korelasi yang signifikan antara persepsi risiko privasi dan pengungkapan diri; 2. Kepercayaan media sosial berpengaruh negatif terhadap persepsi pengguna tentang risiko privasi, dan kepercayaan antarpribadi online memainkan peran perantara; 3. Kepercayaan media sosial positif Mempengaruhi pengungkapan diri pengguna, kepercayaan antarpribadi online memainkan peran perantara.

Dilihat dari hasil terjemahannya, jawaban yang diberikan kelima kontestan cukup memuaskan. Tidak ada masalah dengan pola kalimat dan tata bahasa ,hanya Masing-masing memiliki keunggulannya sendiri dalam beberapa istilah tertentu . Misalnya, "pengungkapan diri", DeepL dan Microsoft menggunakan "ekspresi diri", dan tiga kontestan lainnya menggunakan "pengungkapan diri"; sedangkan "kepercayaan antarpribadi di Internet", Youdao, Baidu, dan Microsoft menerjemahkan sebagai "jaringan interpersonal" trust ", Google memberikan jawaban untuk" online interpersonal trust ", dan DeepL menerjemahkannya sebagai" cyber-interpersonal trust ".

Seperti biasa, mari kita lihat jawaban DeepL.

Untuk bagian terjemahan bahasa Inggris, kami memilih bagian pendahuluan dari disertasi Imperial College. Dalam hal pengalaman pengguna, kami perlu menghentikan siaran. Saat beralih dari bahasa Mandarin ke Inggris ke Inggris ke Mandarin, Hanya Baidu, Youdao dan DeepL yang mendapatkan pengakuan otomatis , Google dan Microsoft masih perlu memilih bahasa secara manual.

Asli: Dampak global COVID-19 sangat besar, dan ancaman kesehatan masyarakat yang diwakilinya adalah yang paling serius terlihat pada virus pernapasan sejak pandemi influenza H1N11918. Berikut kami sajikan hasil pemodelan epidemiologi yang telah menginformasikan pembuatan kebijakan di Inggris dan negara lain dalam beberapa minggu terakhir. Dengan tidak adanya vaksin COVID-19, kami menilai peran potensial dari sejumlah tindakan kesehatan masyarakat - yang disebut intervensi non-farmasi (NPI) - yang bertujuan untuk mengurangi tingkat kontak dalam populasi. dan dengan demikian mengurangi penularan virus. Dalam hasil yang disajikan di sini, kami menerapkan model mikrosimulasi yang diterbitkan sebelumnya ke dua negara: Inggris (khususnya Inggris Raya) dan AS. Kami menyimpulkan bahwa efektivitas satu intervensi dalam isolasi cenderung dibatasi, membutuhkan banyak intervensi untuk digabungkan untuk memiliki dampak substansial pada penularan.

Dari hasil tersebut, lima pemain Pencapaian akademik relatif tinggi, dan standar penggunaan bahasa akademik tidak jauh berbeda . tapi, Lihat detailnya , Hanya Youdao yang mempertahankan penggunaan tanda hubung ganda, tetapi ini sebenarnya tidak umum dalam bahasa China, kecuali Youdao, tiga kontestan lainnya tidak mencapai kesempurnaan dalam ekspresi "NPI".

Tetap saja yang terakhir tertawa adalah DeepL. Meski masih ada berbagai masalah kecil dan tidak bisa mendapat nilai penuh, itu juga gambaran. Makalah nilai tinggi :

Di atas adalah semua pertanyaan tes untuk penilaian ini, Anda bisa lihat DeepL pantas menjadi pemain unggulan nomor satu Entah itu dialek, Mandarin klasik atau wacana akademis, semuanya punya performa bagus, nampaknya DeepL masih sangat jujur.

Transformasi dari Linguee, pembelajaran mesin memberdayakan DeepL

Melihat performa "single show" DeepL, selanjutnya kita akan fokus pada unggulan teratas DeepL dengan performa terbaik dalam evaluasi ini.

Tidak tahu DeepL? bahwa Linguee Seharusnya saya pernah mendengarnya, itu adalah kamus bahasa asing online yang telah beroperasi lebih dari sepuluh tahun. Pendahulu DeepL adalah Linguee . Linguee adalah alat terjemahan yang telah ada selama bertahun-tahun. Meskipun digunakan secara luas dan memiliki sekelompok pengguna setia, kualitas terjemahannya tidak dapat dibandingkan dengan Google Terjemahan, terutama mengingat keunggulan besar dari merek dan status yang terakhir.

tapi Yang paling penting adalah akumulasi teknis Linguee , Salah satu pendiri Linguee, Gereon Frahling, pernah bekerja di Google Research. Pada 2007, dia memilih untuk memulai perjalanan baru. Tim Telah mengerjakan terjemahan mesin selama beberapa tahun Baru pada tahun 2016 mereka mulai mengembangkan sistem baru dan membangun perusahaan baru yaitu DeepL.

Keunggulan kompetitif inti Linguee adalah perayap dan sistem pembelajaran mesin , Yang pertama dapat mengambil database besar hasil terjemahan dan kueri lebih dari 1 miliar kalimat di Internet, dan yang terakhir mencari dan mengevaluasi metode terjemahan sebenarnya dari segmen serupa di web. Kombinasi keduanya menjadikan Linguee "mesin pencari terjemahan pertama di dunia" pada saat itu .

Setelah sepuluh tahun akumulasi, Linguee Tidak masalah dalam data dan penelitian tentang algoritme, tidak boleh dianggap remeh , Dan ini secara langsung menjadi keunggulan absolut DeepL, meletakkan dasar yang kokoh bagi tim untuk melatih model baru.

Arsitektur saraf transformatif DeepL berjalan pada superkomputer di Islandia dengan kemampuan 5,1 petaFLOPS (5100 triliun operasi per detik), yang dapat menerjemahkan 1 juta kata dalam waktu kurang dari satu detik. "Islandia kaya akan energi terbarukan, jadi kami dapat melatih jaringan saraf kami di sini dengan biaya yang sangat rendah. Kami akan terus fokus pada perangkat keras berkinerja tinggi," kata Jaroslaw Kutylowski, CTO DeepL.

"Arsitektur jaringan saraf kami telah mencapai banyak peningkatan yang signifikan," kata Gereon Frahling. "Dengan mengatur neuron dan koneksinya dengan cara yang berbeda, Jaringan kami memetakan bahasa alami lebih komprehensif daripada jaringan saraf lain saat ini. "

Kemajuan penelitian yang dipublikasikan oleh universitas, lembaga penelitian, dan pesaing Linguee menunjukkan bahwa jaringan neural konvolusional adalah jalur yang tepat untuk terjemahan mesin, bukan jaringan saraf berulang yang digunakan oleh DeepL. Namun sekarang bukan waktunya untuk mengeksplorasi perbedaan keduanya. Untuk kata terkait Selama Anda dapat mengontrol kelemahannya, efek jaringan neural konvolusional akan lebih baik.

Misalnya, CNN memproses satu kata dalam satu waktu, dan ini menjadi masalah ketika kata penutup menentukan pembentukan kata pertama. Carilah seluruh kalimat untuk kata pertama dari kalimat tersebut. Jika kata pertama yang diperoleh jaringan salah, itu terlalu boros. Anda harus menggunakan pengetahuan ini untuk memulai lagi. Oleh karena itu, DeepL dan institusi lain di bidang pembelajaran mesin beralih ke kata berikutnya atau Saat menggunakan frase, gunakan mekanisme perhatian yang dapat memantau potensi masalah untuk menyelesaikannya.

DeepL adalah Versi terbaru menambahkan dukungan untuk Jepang dan Cina (Sederhana), termasuk Kanji Jepang, Hiragana dan Katakana, dan ribuan karakter Cina . Saat ini, jumlah bahasa yang didukung oleh DeepL telah meningkat menjadi 11 jenis , Meskipun dukungan bahasa tidak seluas layanan terjemahan lainnya, seperti Google Translate dan Bing Microsoft Translator keduanya mendukung lebih dari seratus bahasa yang berbeda, tetapi Akurasi terjemahan Ini juga merupakan poin kunci yang tidak bisa diabaikan.

Editor Techcrunch Frederic, yang menguasai banyak bahasa, pernah berkomentar tentang DeepL: "Gaya Google Terjemahan sangat mudah, tetapi melewatkan beberapa detail dan idiom (atau menerjemahkan idiom ini dengan tidak benar). DeepL sering kali dapat memberikan efek terjemahan yang lebih alami, seperti terjemahan manusia yang terlatih dengan baik. "

Sudah banyak bicara, kalimatnya tetap sama. Anda hanya bisa mengetahui apakah benar atau salah setelah mencobanya sendiri. Jika tertarik, Anda bisa mencobanya sendiri. Jika menemukan hasil terjemahan yang menarik, jangan lupa beri tahu kami ~

Terakhir, tautan situs web resmi ditawarkan dengan kedua tangan:

https://www.deepl.com/translator

Editor: Yu Tengkai

Proofreading: Lin Yilin

-Selesai-

Ikuti platform publik WeChat resmi dari Institut Ilmu Data Tsinghua-Qingdao " Pai Data AI "Dan nomor saudara perempuan" Data Pie THU "Dapatkan lebih banyak manfaat kuliah dan konten berkualitas.

Ajari Anda untuk menggunakan jaringan saraf untuk menyelesaikan persamaan matematika tingkat lanjut!

Sebelumnya

Mengirimi Anda 16 tip praktis untuk menggambar matplotlib (kode terlampir)

Lanjut

: University of Science and Technology of China × MSRA | Catatan Kuliah Dr. Zhou Ming: Pemrosesan Bahasa Alami Membuat Hidup Lebih Baik

: Tonggak sejarah yang "menyeramkan": AI ilmuwan China menerjemahkan gelombang otak dengan akurasi 97%

: Di mana menemukan data penelitian mahkota baru? Tempat yang harus dilihat untuk pekerja penelitian ilmiah (dengan tautan)

: Teknologi hitam di balik "Hey Siri" terungkap!

: Pembelajaran mesin grafis: prinsip algoritme yang dapat dipahami semua orang

: Menggunakan gerbang logika protein untuk mengubah sel menjadi komputer, cendekiawan muda Tiongkok belajar tentang Sains

: Mesin terjemahan pertama di dunia telah kembali dari evolusi, dan "detail gila" menangani dialek China klasik

: Sebarkan "informasi" bukan "virus"! Programmer menerjemahkan "cuci tangan" ke lebih dari 500 bahasa

: Tim AI Tsinghua meluncurkan platform keamanan AI untuk menipu algoritme bagian atas dan kemudian memperbaiki kerentanan dengan kuat

: Batasan keputusan berbagai model pembelajaran mesin (dengan kode)

: Robot kecil membantu mengambil! Taman Sains dan Teknologi Zhongguancun Dongsheng, "senjata pencegahan" ini membantu melanjutkan pekerjaan dan produksi

: Pipa pemanas tidak panas, pipa air bocor ... "tim parkour" komunitas memperbaiki lebih dari 1.000 kali dalam 60 hari

Google Terjemahan dihancurkan! Mesin terjemahan pertama di dunia, DeepL, telah kembali, dan "detail gila" telah selesai

Dialek, Cina klasik, makalah akademis, pertarungan peri mesin terjemahan!

Transformasi dari Linguee, pembelajaran mesin memberdayakan DeepL

Informasi Terkait

Kota Yangjiang: Kota Shuangjie, Sub-distrik Chengnan, Sub-distrik Ganglie, "Tiga Implementasi" Sub-distrik Chengxi secara ketat mengamati pencegahan epidemi dan keselamatan kebakaran

"Tiga Kuat dan Tiga Berat" di Distrik Jiangcheng, Kota Yangjiang Menenun Jaring Pengaman "Pertahanan Ganda" selama Periode Qingming

Polisi Yangjiang: Tangani polisi dengan cepat dan tangani insiden yang membahayakan keselamatan publik dengan cepat

Upacara pembukaan Olimpiade Tokyo mendorong setiap delegasi untuk mengirimkan dua orang pembawa bendera

Apakah Anda akan menghemat energi musim semi ini untuk "makan daging babi"? Kementerian Pertanian dan Pedesaan menanggapi

Menganalisis data 1.085 pasien dengan pneumonia koroner baru di seluruh dunia, kami sampai pada kesimpulan ini!

10 harus tahu trik PyCharm

Model matematika dan prediksi infeksi virus Covid-19 Italia (kode terlampir)

Gunakan MediaPipe dan TensorFlow.js untuk melacak wajah dan tangan di browser

Penerapan model negatif sampling berdasarkan grafik pengetahuan dalam sistem rekomendasi (open source)