Landasan era kecerdasan kognitif e-niaga: Peta kognitif e-niaga Alibaba terungkap

Saat ini, Tim Peta Kognitif dari Divisi Rekomendasi Pencarian telah secara komprehensif merangkum eksplorasi saat ini dalam membangun peta kognitif e-commerce, terutama memperkenalkan definisi peta kognitif, ide konstruksi keseluruhan, beberapa masalah algoritmik spesifik dalam proses konstruksi, dan akhirnya Cari aplikasi yang direkomendasikan.

Latar Belakang

Meskipun algoritma pencarian dan rekomendasi e-commerce telah membuat kemajuan besar dalam beberapa tahun terakhir, algoritma ini masih memiliki banyak masalah, seperti rekomendasi berulang yang sering dikritik dalam rekomendasi dan kurangnya hal baru. Intinya, ini karena algoritme yang ada sebagian besar mengikuti gagasan "komoditas-ke-komoditas" dan tidak secara langsung didorong oleh kebutuhan pengguna, dan bahkan tidak ada definisi yang jelas tentang kebutuhan pengguna. Di sisi lain, memahami dan memuaskan kebutuhan pengguna adalah tujuan akhir dari algoritme ini, dan ada penghalang alami di antara keduanya.

Untuk memecahkan penghalang ini dan memungkinkan algoritma pencarian dan rekomendasi untuk lebih memahami kebutuhan pengguna, kami mengusulkan untuk membangun ConceptNet E-niaga berskala besar yang secara eksplisit mengekspresikan kebutuhan pengguna sebagai node dalam grafik (disebut Konsep E-niaga), dan mengaitkan poin permintaan ini dengan produk dan kategori di bidang e-niaga, dan pengetahuan domain umum di luar e-niaga, untuk menyediakan landasan data terpadu untuk kognisi produk, kognisi pengguna, dan kognisi pengetahuan , Dan memberikan ide pengoptimalan baru dan lebih banyak kemungkinan untuk algoritme rekomendasi penelusuran hilir.

Apa itu konsep e-commerce?

Seperti yang telah disebutkan sebelumnya, kami menyebut kebutuhan pengguna sebagai "konsep e-commerce": sebuah konsep dengan kebutuhan komoditas, yang umumnya diwakili oleh frase yang sesuai dengan akal sehat, memiliki semantik lengkap, dan urutan kata yang lancar. Misalnya: "Pakaian", "Pencegahan Kehilangan Anak-Anak", "Pokok Barbekyu", "Menjaga Kehangatan Bayi", "Gaun Bohemian", "Perayaan Tahun Baru China", dll. Konsep ini harus memenuhi prinsip dasar berikut:

Seperti yang ditunjukkan di atas, frasa di sebelah kanan melanggar prinsip dasar konsep e-commerce, sehingga akan tersaring dalam proses penambangan yang sebenarnya. Selanjutnya, kami membagi konsep tersebut menjadi tiga kategori:

Skenario belanja: Mewakili kebutuhan pengguna dari kategori non-spesifik, dengan gambaran yang kuat tentang suasana, seperti "pencegahan kehilangan anak-anak", "hadiah Tahun Baru China", dll.
Kategori ekstensif: Menunjukkan kategori kebutuhan pengguna dengan kategori tertentu, yang dapat berupa kategori murni tanpa modifikasi, seperti "pakaian", "buah", dll., Atau kategori dengan batasan atribut, seperti "Versi Korea "Gaun", "Raket bulutangkis anak-anak", dll.
Konsep umum: Konsep umum yang dapat dikaitkan dengan pengetahuan domain terbuka di luar e-commerce, seperti "pelindung matahari", "barbekyu", "lansia", dll.

Dari manakah konsep E-commerce berasal?

Setelah mengklarifikasi definisi dan prinsip dasar, kita perlu menggali banyak konsep untuk memenuhi berbagai kebutuhan pengguna. Saat ini, kami percaya bahwa istilah pencarian (kueri) dan judul produk (judul) yang dimasukkan oleh pengguna saat mencari di Taobao atau Tmall adalah sumber terbesar yang dapat digunakan dalam penambangan konsep. Dan pekerjaan kami terutama untuk menggali frase konsep yang memenuhi prinsip-prinsip kami di atas dari kueri dan judul yang berisik. Langkah ini disebut "Penambangan Konsep".

Penambangan Konsep terutama dibagi menjadi dua langkah, satu adalah Pembuatan Kandidat, dan yang lainnya adalah Klasifikasi Konsep. Proses keseluruhannya adalah sebagai berikut:

Diantaranya, generasi kandidat dibagi menjadi dua bagian, satu adalah informasi frase yang tersegmentasi dari kalimat sesuai dengan granularitas kata menggunakan AutoPhrase, dan yang lainnya adalah informasi template setelah penambangan urutan yang sering oleh Sequential Pattern Extractor, dikombinasikan dengan 2 -gram model bahasa statistik, dapatkan calon konsep. Setelah mendapatkan kandidat, kami akan menggunakan model diskriminan untuk mengintegrasikan embedding model bahasa, informasi urutan konsep, serta fitur-fitur seperti awalan aturan dan sufiks, dan statistik pv untuk menentukan apakah konsep tersebut memenuhi persyaratan.

Pembuatan Kandidat

Pertama-tama kita mengekstrak pola dari konsep positif dan negatif yang ada melalui ekstraktor pola dan menghitung bobotnya. Kemudian, melalui pola-pola ini, dikombinasikan dengan model bahasa statistik di tiga jendela, kita melakukan pemangkasan kandidat. Kandidat yang dihasilkan akhir pada dasarnya sejalan Urutan kata memenuhi akal sehat dasar.

Klasifikasi Konsep

Di satu sisi, kami menggabungkan beberapa aturan sederhana untuk ekstraksi fitur. Di sisi lain, kami menggunakan fitur urutan yang ada untuk melatih model WideDeep untuk menilai rasionalitas konsep. Dalam hal pemrosesan data awal, karena sebagian besar konsep kami adalah teks pendek, dan sebagian besar urutan istilah dalam kueri dan judul tidak sesuai dengan urutan kata normal, kami juga menggunakan informasi parsing teks panjang untuk ekstraksi dan pemotongan kandidat, pelatihan ELMo digunakan sebagai model bahasa dasar, dan urutan kata disesuaikan dalam panjang gram yang sama untuk mendapatkan informasi urutan terbaik dan kemudian ke model diskriminan.

Ontologi

Setelah mengklarifikasi definisi konsep e-commerce dan menggali banyak konsep, kita akan bingung, karena sebuah kata (frase), konsep tidak memiliki kategori (domain), tidak ada deskripsi (deskripsi), dan tidak ada atribut kecuali nama. (Atribut), bagaimana Anda menyebutnya "Tupu"? Bagaimana jumlah informasi yang begitu kecil dapat berperan dalam aplikasi hilir? Konsep ingin menjadi node dalam grafik, apa sebenarnya grafik kita?

Untuk lebih memahami konsep e-commerce, menyelaraskan dengan grafik pengetahuan eksternal, dan memperkenalkan pengetahuan yang lebih umum, kami telah mendefinisikan satu set ontologi grafik kognitif e-commerce untuk menggambarkan atribut entitas, konsep dan lainnya. Hubungan antara. Entitas mewakili contoh spesifik dari keberadaan dunia objektif, misalnya, contoh spesifik penyanyi Andy Lau. Konsep mewakili konsep yang luas dalam dunia objektif, misalnya, bintang hiburan adalah konsep umum. Sistem klasifikasi dan definisi hubungan atribut (Schema), termasuk definisi entitas dan konsep, dan atribut khusus dan nilai atribut entitas dan konsep. Misalnya, dalam sistem klasifikasi, penyanyi Andy Lau termasuk dalam karakter karakter hiburan penyanyi, dan atribut meliputi tanggal lahir, karya, dll.

Di sini, kami mengacu pada struktur mendeskripsikan hal-hal objektif di Schema.org dan cnSchema.org, dan menetapkan sistem klasifikasi ontologi yang mendasari grafik pengetahuan e-niaga dengan Thing sebagai simpul akar. Dalam sub-kategori benda, ada 9 kategori utama: "tindakan", "karya kreatif", "aktivitas", "tidak berwujud", "kategori", "entitas medis", "institusi", "orang", dan "lokasi". kelas. Setiap subclass memiliki subclassnya sendiri, dan setiap subclass akan mewarisi semua atribut dan hubungan kelas induk. Struktur spesifiknya ditunjukkan pada gambar di bawah ini:

Sistem klasifikasi ontologi, dimana isi dalam tanda kurung adalah nama Cina dan singkatan bahasa Inggris sesuai kategorinya

Di sini, simpul putih tengah adalah kelas benda, yang merupakan simpul akar dari semua kelas. 9 node yang mengelilingi kelas thing adalah subtipe langsung dari kelas thing. Setiap kategori memiliki simpulnya sendiri. Pada gambar ini, mengambil kategori intangible sebagai contoh, kategori audiens adalah node anak dari kategori intangible, dan audiens: kategori hewan, audiens: kategori bagian tubuh, audiens: kategori kerumunan, dan audiens: kategori tumbuhan adalah node anak dari kategori audiens. Saat memperoleh pengetahuan melalui data terstruktur, semi terstruktur, dan tidak terstruktur, data dimasukkan sesuai dengan sistem klasifikasi ini.

Seperti disebutkan di atas, tujuan akhir dari peta kognitif e-commerce adalah untuk menggambarkan kebutuhan pengguna.Oleh karena itu, dalam ontologi kami mendefinisikan sejumlah kelas khusus e-commerce untuk memodelkan dunia tujuan dalam lingkungan e-commerce:

Merek (merek) Kategori: Kategori adalah tingkat terakhir dari klasifikasi komoditas yang terlibat dalam keputusan pembelian pelanggan. Kategori ini dapat dikaitkan dengan merek, dan pemilihan pembelian yang sesuai dapat diselesaikan dalam kategori ini. Contoh dalam kategori adalah apa yang kami fokuskan selama proses konstruksi ontologi.
Audiens (audiens): Audiens adalah kelompok belanja atau populasi yang secara langsung berhubungan dengan produk, yang merupakan kategori yang sangat penting dalam kancah e-commerce. Kategori audiens mencakup empat subkategori: audiens: hewan, audiens: bagian tubuh, audiens: kerumunan, audiens: tumbuhan.
Style (gaya): Untuk suatu produk, harus ada gaya yang unik untuk menarik pembeli, dan kategori gaya yang paling utama mendeskripsikannya. Kategori gaya meliputi enam subkategori: gaya sastra, gaya musik dan tari, gaya penciuman, gaya sentuhan, gaya rasa, dan gaya visual.
Fungsi: Penjelasan spesifik tentang fungsi produk, yang dapat menemukan lokasi produk secara akurat dan secara langsung menghubungkan produk dan permintaan. Kategori fungsi mencakup empat sub kategori: fungsi kecantikan, fungsi pakaian, fungsi kesehatan, dan fungsi rumah.
Bahan: Bahan yang disebut hanyalah seperti apa tekstur objek itu. Deskripsi produk melalui materi dapat membuat produk lebih spesifik.

Atribut adalah atribut yang melekat pada kata-kata, seperti "alias", "deskripsi", dll .; hubungan adalah hubungan objektif antara kata-kata ontologi, seperti "tempat lahir" dari sebuah instance dalam kelas Person akan ditautkan ke instance lain dari kelas Place. Dalam sistem klasifikasi ontologi, setiap kategori memiliki atribut dan hubungan uniknya sendiri, dan subkategori akan mewarisi semua atribut dan hubungan dari kategori induk. Di sini, kami mengambil benda dan kategori sebagai contoh untuk memperkenalkan atribut dan hubungan, seperti yang ditunjukkan pada gambar berikut:

Hubungan antara benda dan kategori

Kategori hal: Dalam kategori ini, kami mendefinisikan empat atribut dan hubungan: "alias", "deskripsi", "gambar", dan "nama". "Alias" sebenarnya adalah sinonim dari kosakata saat ini, yang merupakan atribut; "Deskripsi" adalah deskripsi karakteristik benda saat ini; "Gambar" dapat dihubungkan ke "objek gambar" lain, yang sebenarnya berada di antara dua hal Hubungan; "nama" adalah nama standar dari hal saat ini.
Kategori: Kategori adalah subkategori langsung dari benda, dan akan langsung mewarisi semua atribut dan hubungan benda. Pada saat yang sama, kategori berisi atribut uniknya sendiri "tipe kategori".

Semua kelas dan subclass di bawah sistem klasifikasi ontologi memiliki atribut dan hubungan unik mereka sendiri. Saat memodelkan setiap kategori dalam ontologi, kami mendefinisikan 140+ atribut dan hubungan.

Saat membangun kosakata ontologi, kami sepenuhnya memobilisasi sumber daya terstruktur berkualitas tinggi dari BU utama dalam grup. Sumber termasuk Taoxi, Youku, Feizhu, Shenma, dll., Untuk melakukan pengetahuan tentang data terstruktur dan semi-terstruktur dari berbagai sumber. Atur dan gabungkan. Secara khusus, jika data terstruktur multi-sumber dianggap sebagai sistem pengetahuan dari berbagai sumber, akuisisi dan fusi termasuk ontologi dan pencocokan contoh (Ontologi / Pencocokan Enity) dan fusi pengetahuan (Fusion Pengetahuan).

Kami mengadopsi metode pencocokan berbasis fitur teks untuk menggabungkan data dari berbagai sumber dalam kelompok. Tugas fusi pengetahuan yang kami definisikan adalah: dalam kategori yang sama, kata-kata dengan arti yang sama perlu digabung menjadi satu id, di mana kata-kata yang paling umum digunakan sebagai kunci utama, dan sinonim lainnya digunakan sebagai alias. Misalnya, "orang tua" dan "orang tua" adalah sinonim. Dengan id yang sama, konten atribut "nama" adalah "orang tua", dan konten "alias" adalah "orang tua". Atas dasar pencocokan, melalui deteksi konflik, Penemuan Kebenaran dan teknologi lainnya menggabungkan dan membubarkan pengetahuan secara konsisten. Untuk konflik, metode penanganan termasuk mengabaikan, menghindari dan menyelesaikan.

Metode resolusi umum meliputi: Metode pemungutan suara, berbasis kualitas, dan berbasis hubungan. Kami menggunakan metode berbasis Kualitas untuk menyelesaikan atribut bernilai tunggal. Akhirnya, melalui pemilahan dan penggabungan data terstruktur, jutaan entitas dan data Konsep diperoleh.

Teks alami ada dalam bentuk yang tidak terstruktur, mengandung sejumlah besar hubungan semantik yang kaya, yang menggambarkan entitas, konsep, dan hubungannya di dunia objektif. Oleh karena itu, pemahaman teks juga menjadi sumber informasi penting tentang entitas dan konsep. Entitas dan konsep adalah elemen kunci dari grafik, dan pengenalannya dalam teks telah menjadi teknologi penting untuk akuisisi pengetahuan. Di antara mereka, pengenalan entitas (NER) membagi dan mengkategorikan entitas yang disebutkan dalam teks, dan dapat menambang kategori entitas tertentu dari kalimat besar. Kami menggunakan model pelabelan urutan berdasarkan Pengawasan Jauh Label jenis pelabelan meliputi peristiwa, fungsi, objek, waktu, ruang, kategori, gaya dan kategori lain yang disebutkan di atas.

Sejauh ini, kami telah membangun sistem ontologi yang dirancang untuk e-niaga, dan memperluas sejumlah besar entitas, konsep, atribut, dan hubungan, yang juga dapat dianggap sebagai grafik pengetahuan e-niaga biasa.

Dari grafik pengetahuan hingga grafik kognitif

Struktur ontologi peta kognitif (Ontologi) yang diperkenalkan di atas mencakup taksonomi yang relatif lengkap dan skema yang sesuai, dan mengintegrasikan sejumlah besar entitas eksternal, e-commerce, konsep, dan hubungan atribut. Ini adalah peta pengetahuan e-commerce yang relatif dasar Tujuannya adalah untuk menyusun konsep e-commerce berskala besar yang telah kami gali, dan menghubungkan konsep-konsep ini ke grafik untuk menjadi node, sehingga "grafik pengetahuan" benar-benar bergerak ke arah "grafik kognitif". Langkah ini disebut Pemberian Tag Konsep.

Idealnya, kami berharap setelah konsep tersegmentasi, setiap unit kata dapat dihubungkan dengan kosakata kosakata ontologi, sehingga mendapatkan sistem pengetahuan yang sesuai, tetapi karena ontologi mungkin tidak mencakup semua kosakata konsep, hanya sebagian dari konsep yang dapat Tertaut, hubungan atribut tidak lengkap. Kedua, masalah polisemi dalam ontologi, dan kosakata yang sama memiliki jenis yang berbeda, sehingga diperlukan disambiguasi pengertian kata. Konsep biasanya berupa teks pendek dengan konteks yang sangat terbatas. Model pelabelan sekuens konvensional tidak dapat mencapai kinerja yang memadai, dan sistem klasifikasi ontologi saat ini adalah struktur pohon, di mana ada kosakata yang didistribusikan dalam kategori besar yang sama tetapi dalam subkategori yang berbeda. Misalnya, jenis kata "Denmark" adalah "ruang negara" dan "ruang distrik administratif", yang juga menyulitkan disambiguasi arti kata.

Tujuan kami adalah untuk secara akurat menghubungkan konsep ke kosakata kosakata ontologi. Inputnya adalah daftar konsep dan pustaka ontologi, dan outputnya adalah kosakata dan jenis yang sesuai:

Mengingat kesulitan di atas, diagram alir keseluruhan dari algoritme adalah sebagai berikut:

Di bawah ini kami secara khusus akan menjelaskan modul pada gambar:

1) Pencocokan maju maksimum berbasis kamus dan pencocokan awalan : Diberikan sebuah konsep, pertama-tama algoritme menggunakan perincian terkecil untuk menyegmentasikan kata, membagi konsep menjadi kata-kata, dan kemudian menggunakan algoritme pencocokan maju maksimum untuk mencocokkan beberapa kata yang berurutan dari konsep setelah segmentasi kata dengan kamus pustaka ontologi dari kiri ke kanan, jika cocok Di atas mengembalikan kosakata dan tipe ontologi (ID).

Dalam proses ini, ada kata-kata yang cocok di berbagai posisi dalam sistem klasifikasi ontologi, yaitu masalah kata-kata polisem. Di sini, kami mengembalikan semua kandidat yang mungkin untuk pemrosesan disambiguasi selanjutnya. Perlu disebutkan bahwa saat kami menggunakan kosakata, kami tidak menggunakan semua kosakata. Daftar merek dan daftar IP (selebriti, karya, film TV, dll.) Sangat besar dan ada banyak ambiguitas.

Misalnya, kata frekuensi tinggi yang biasa kita gunakan juga merupakan kata IP, tetapi dalam banyak kasus kata itu tidak berarti IP. Oleh karena itu, kami menghapus bagian data ini dalam proses pencocokan maju maksimum, tetapi menambahkan modul pencocokan awalan untuk mencocokkan prefiks tak teridentifikasi dengan tabel nama di tabel merek dan IP, yang selanjutnya dapat meningkatkan cakupan.

2) Disambiguasi pengertian kata : Berbeda dengan metode disambiguasi konvensional, konsepnya biasanya terdiri dari teks pendek, dan informasi yang dapat diberikan oleh konteks sangat terbatas. Oleh karena itu, kami memilih model pelabelan urutan untuk mempelajari kombinasi jenis kosakata, seperti: "objek" + "gaya" + "kategori" dan seterusnya. Mengingat perbedaan jenis kosakata di industri yang berbeda, misalnya kata "splicing", pada bidang "clothing" maka jenis "splicing" pada "spliced knitted dress" adalah "style", sedangkan pada bidang "furniture lamps" Di dalam, jenis "pipa air sambung" adalah "fungsi", sehingga kami menggunakan mekanisme perhatian untuk mempelajari informasi terkait di lapangan. Model urutan anotasi ditunjukkan pada gambar di bawah ini:

Setelah mendapatkan keluaran model dari sequence labeling, maka hasil akhir penandaan adalah keluaran sesuai dengan calon sense dari kata tersebut. Nanti, kita akan mencoba menggunakan anotasi urutan sebagai fitur, dan kemudian menggabungkan fitur konsep lainnya, dan menggunakan model klasifikasi untuk menentukan peringkat skor kandidat.

3) Pemberian tag halus : Dalam pembahasan masalah yang ada, kami menyebutkan bahwa ada kasus di mana kosakata termasuk dalam kategori besar yang sama tetapi subkategori berbeda. Biasanya hanya ada selusin kategori label untuk model pelabelan urutan, dan sistem klasifikasi database ontologi kami saat ini berisi lusinan atau bahkan ratusan jenis.Model pelabelan urutan tradisional tidak dapat menyelesaikan masalah ini. Oleh karena itu, kita membutuhkan model anotasi urutan yang lebih halus untuk lebih memperjelas.

4) Sejajarkan penarikan teks panjang : Setelah pencocokan kosakata dan disambiguasi arti kata, karena pustaka ontologi yang ada tidak mencakup semua kosakata dalam konsep, kita perlu menandai istilah yang tidak teridentifikasi dan mengidentifikasi jenis yang sesuai untuk mengembalikan pustaka ontologi. Salah satu cara yang memungkinkan adalah dengan menggunakan sejumlah besar kalimat teks panjang di bidang e-niaga untuk menyelaraskan konsep dengan teks panjang dari jarak jauh untuk pelabelan urutan, dengan demikian mengingat istilah yang tidak teridentifikasi.

Tepi di Grafik Kognitif

Hubungan grafik pengetahuan adalah kunci bagi mesin untuk memahami pengetahuan. Jenis hubungan ditentukan oleh jenis node head dan tail, dan node tersebut dapat berupa kosakata, konsep, dan entitas apa pun. Saat ini, kami telah mendefinisikan 19 jenis relasi dan menggunakan tripel untuk merepresentasikan relasi antara semua node. Hubungan ini termasuk "is_related_to (related)", "isA (is a kind of)", "has_instance (has an instance)", "is_part_of (is a part)" dan seterusnya. Berikut dua jenis hubungan yang paling berguna untuk skenario e-niaga:

konsep-isA-konsep

Contoh: Gaun Bohemian adalah Gaun.

Persyaratan e-niaga sebagian besar merupakan persyaratan kategori, yang sangat penting untuk ekspresi semantik persyaratan kategori. Hubungan isA mengubah konsep kita dari struktur datar menjadi struktur grafik, yang sangat penting bagi mesin untuk memahami semantik. Secara umum, konstruksi hubungan isA melibatkan dua langkah:

Ekstrak relasi isA dari korpus teks skala besar, yang utamanya menyertakan pencocokan template (berbasis pola) dan prediksi relasi isA berdasarkan representasi vektor (distribusi)

Buat struktur hierarki dalam himpunan relasi isA yang diekstrak pada langkah pertama, seperti de-duplikasi, disambiguasi, dan de-ringing, dan tambahkan relasi isA yang lebih detail.

Dalam skenario khusus konstruksi peta kognitif e-commerce, kesulitan utama konstruksi hubungan isA adalah:

E-commerce adalah bidang vertikal, terutama di Taobao, platform yang "hanya Anda yang tidak dapat memikirkannya, tidak ada Taobao yang tidak dapat membelinya". Ada banyak kategori yang terlibat, dan banyak istilah kategori yang relatif tidak populer tetapi sangat penting.

Korpus teks yang terkait dengan e-niaga langka, dan kemunculan kata-kata kategori dalam korpus sangat jarang, yang membawa kesulitan besar untuk ekstraksi. Menanggapi kesulitan ini, kami mulai merancang satu set algoritma manual + pengoptimalan berulang terus menerus dari proses pembelajaran aktif, berharap dapat memberikan dukungan yang dapat diandalkan untuk pemahaman konsep dan aplikasi penalaran selanjutnya.

konsep-is_related_to-item

Dalam lingkungan e-commerce saat ini, membangun hubungan is_related_to antara konsep dan produk juga akan menghadapi banyak tantangan: konsep terlalu pendek, judul produk bertumpuk, kata-kata yang tidak relevan, atribut produk salah, grafik dan teks produk tidak cocok, dll., Yang akan menyebabkan kesalahan pencocokan atau Bawalah ambiguitas.

Menanggapi masalah di atas, keseluruhan proses solusi yang kami adopsi adalah sebagai berikut: pertama menggunakan pencocokan teks / i2i / model semantik untuk mencocokkan konsep dan item secara semantik (judul, deskripsi), dan kemudian mengkalibrasi sesuai dengan konsep untuk skor kategori, dan kemudian melalui disambiguasi Nantinya, produk akan digabungkan berdasarkan hubungan antar konsep. Gambar berikut adalah diagram skema dari model pencocokan semantik dalam:

Lengkapi gambaran besar

Berbicara tentang ini, gambaran besar dari peta kognitif e-commerce juga siap untuk diungkapkan:

Seperti yang ditunjukkan pada gambar di atas, peta kognitif lengkap berisi bagian-bagian berikut:

Konsep: Node semantik terpenting yang mengekspresikan kebutuhan pengguna.
Ontologi: Sistem klasifikasi dan skema grafik pengetahuan yang dirancang untuk e-commerce. Grafik kognitif terakhir dibentuk melalui koneksi dengan konsep, yang dapat mengintegrasikan data grafik pengetahuan eksternal dan memperkenalkan akal sehat yang sulit untuk ditambang secara langsung dalam e-commerce.
Relasi: Kami telah mendefinisikan lebih dari selusin jenis relasi untuk mendeskripsikan semantik antara node yang berbeda, yang merupakan kunci pemahaman mesin tentang semantik.
Item: Buat konsep, kosakata, dan relasi skala besar berdasarkan grafik, sehingga Anda dapat memahami produk dengan lebih akurat.
Pengguna: Buat konsep berskala besar, kosakata, dan atribut item berdasarkan grafik, yang dapat lebih akurat memahami dan menjelaskan kebutuhan pengguna.

aplikasi

Penerapan eksplisit

Grafik Kognitif E-niaga telah diterapkan pada banyak produk seperti rekomendasi penelusuran Taobao. Format produk utama adalah kartu bertema dengan konsep sebagai pembawa. Misalnya, di beranda, tebak Anda menyukai "Ensiklopedia Belanja" di air terjun:

Adegan yang direkomendasikan di halaman detail bayi:

Aplikasi implisit

Data hubungan titik dan tepi dengan konsep sebagai inti yang disediakan oleh peta kognitif e-niaga menambahkan perincian informasi baru dan struktur informasi ke algoritme pencarian dan rekomendasi, yang akan membawa imajinasi yang lebih besar dan dapat memenuhi keragaman dengan lebih baik. Kebutuhan pengguna.

Pada saat yang sama, banyak topik baru yang didasarkan pada aplikasi peta kognitif sedang dalam proses, seperti:

Rekomendasi yang bisa dijelaskan
Penyematan Grafik Pengetahuan
Rekomendasi alasan

Ringkasan dan pandangan

Pembangunan peta kognitif membutuhkan banyak sumber daya, mencakup berbagai bidang, dan rumit dalam konten. Hal ini tidak dapat dilakukan tanpa bantuan algoritme, teknik, operasi, dan sumber daya crowdsourcing / outsourcing dalam jumlah besar. Artikel ini hanya merangkum secara singkat konstruksi peta kognitif dari perspektif seorang insinyur algoritma, dan banyak modul masih dieksplorasi dan dioptimalkan.

Kami percaya bahwa grafik kognitif e-niaga yang bertujuan untuk mengenali kebutuhan pengguna dengan lebih baik akan membantu saran penelusuran untuk beralih dari pendekatan berbasis perilaku ke era kecerdasan kognitif berdasarkan integrasi perilaku dan semantik. Ini akan menjadi ekosistem platform yang stabil dan berkembang. Dasar penting untuk kemajuan.

tentang kami

Tim Peta Kognitif dari Divisi Rekomendasi Pencarian Alibaba Group bertujuan untuk membangun peta pengetahuan e-commerce Tiongkok terbesar di dunia, mendukung bisnis rekomendasi dan pencarian dari seluruh Alibaba Group termasuk Taobao, Tmall Youku dan bahkan e-commerce luar negeri, melayani ratusan juta dolar setiap hari pengguna. Grafik "kognitif" e-commerce, dimulai dari kebutuhan pengguna dalam skenario e-commerce, tidak terbatas pada grafik komoditas tradisional, tetapi jaringan semantik berskala besar yang menghubungkan barang, pengguna, kebutuhan belanja, dan berbagai pengetahuan domain terbuka dan akal sehat .

Penulis: Ali awan komunitas Yunqi

Lihatlah bagaimana Reba memperlakukan asisten, lalu lihat bagaimana bayi memperlakukan asisten. Inilah celahnya!

Sebelumnya

Wawancara | Empat Belas Tahun Pencarian Anak

Lanjut

: Gambarkan mekanisme perhatian dalam terjemahan mesin saraf

: Saat menggoreng daging, sangat mudah untuk menempel di wajan dan mudah untuk menggoreng. Jangan khawatir, mempelajari trik ini tidak masalah!

: Anjing yang penasaran itu lari ke tempat pembuangan sampah dan melihat apa yang ada di mulutnya.

: Apa itu grafik pengetahuan

: Libra R-CNN: Detektor target yang sepenuhnya seimbang

: Sistem yang disarankan mengingat empat model model FM serba guna

: Melihat potensi risiko emiten emiten dari laporan tahunan 2018

: Sebagian besar suku bunga pasar uang naik, suku bunga obligasi masih menghadapi tekanan penyesuaian dalam jangka pendek dan menengah

: Laporan Analisis Kuisioner Investasi Investor Perorangan Dana Tahunan 2017 (10): Masalah Pensiun

: Bagaimana menjelaskan model Markov yang tersembunyi dengan contoh-contoh yang sederhana dan mudah dimengerti?

: Penerapan Pohon Keputusan dalam Model Multi-faktor

: Pelajar China bunuh diri di American Airlines School Classmate: Guru menghukum dan menyalahgunakan hukuman fisik seperti mereka di penjara

Landasan era kecerdasan kognitif e-niaga: Peta kognitif e-niaga Alibaba terungkap

Informasi Terkait

Apa yang harus saya lakukan untuk meningkatkan lalu lintas sistem?

Angin kencang sepuluh tingkat dengan guntur dan kilat yang kuat! Kota Chongyang, Wujiang Secara Aktif Melakukan Penyelamatan dan Bantuan Bencana

Bisakah sub-database dan sub-tabel berkembang tanpa batas?

Mesin tidak belajar: Praktik pengoptimalan arsitektur sistem IM konkurensi tinggi

Didirikan selama satu setengah tahun, kehilangan 2,2 miliar yuan. Platform siaran langsung Douyu bersama

Tembakan geng dalam drama film dan televisi, drama internet yang muncul dalam drama klasik, Zhang Yishan "sembuh sendiri"

Praktik teknologi arsitektur ketersediaan tinggi Internet

Juara dunia tinju kelas berat sempat kesal dan tersingkir, Zhang Junlong punya kekuatan memimpin kebangkitan kuat tinju Tiongkok

"Shen Cong" dimana kamu? Anak laki-laki itu diculik di Guangzhou pada usia satu tahun, dan ayahnya berhenti dari pekerjaannya dan menjual rumahnya untuk mencari seorang putra selama 14 tahun.

Juara dunia tinju kelas berat sempat kesal dan tersingkir, Zhang Junlong punya kekuatan memimpin kebangkitan kuat tinju Tiongkok