Zhu Mingfeng, Zheng Sheng, Zeng Xiangyun, Xu Gaogui
(School of Science, China Three Gorges University, Yichang, Hubei 443002)
Informasi rekaman tulisan tangan dari gambar bintik matahari yang digambar dengan tangan sangat berharga untuk mempelajari aktivitas bintik matahari jangka panjang, dan ekstraksi latar belakang adalah proses utama dalam digitalisasi informasi bintik matahari yang digambar dengan tangan menggunakan komputer. Artikel ini mengusulkan mesin vektor dukungan (Support Vector Machine, SVM) berbasis metode ekstraksi informasi gambar sunspot yang digambar tangan, melalui pembelajaran dan pelatihan yang ditargetkan dari setiap vektor fitur sampel piksel, sehingga dapat mencapai pemisahan piksel latar belakang dan piksel latar depan Eksperimen telah membuktikan bahwa metode ini memiliki ketahanan yang baik Analisis komparatif antara metode ini dan metode tradisional K-means fuzzy division dan fuzzy C-means (FCM) clustering membuktikan bahwa metode ini memiliki nilai aplikasi yang lebih tinggi.
Peta bintik matahari yang digambar tangan; ekstraksi latar belakang; mendukung mesin vektor; pembelajaran yang diawasi; pengelompokan K-means
Kode identifikasi dokumen TP319: ADII: 10.19358 / j.issn.16747720.2016.23.015
Zhu Mingfeng, Zheng Sheng, Zeng Xiangyun, dkk.Metode ekstraksi latar belakang citra bintik matahari yang digambar tangan berdasarkan SVM J. Mikrokomputer dan Aplikasi, 2016,35 (23): 52-55,58.
0 Kata Pengantar
Dengan pesatnya perkembangan ilmu pengetahuan dan teknologi, hanya dalam beberapa dekade saja, teknologi pengolahan citra digital telah berkembang pesat dan berangsur matang. Teknologi ini telah banyak digunakan di banyak bidang seperti aplikasi kecerdasan buatan, pemrosesan citra penginderaan jauh, eksplorasi ruang angkasa, deteksi industri, dan biomedis, dan memberikan arah dan titik terobosan baru untuk pengembangan disiplin ilmu di bidang ini [1]. Dalam proses mempelajari aktivitas matahari, pengamatan aktivitas bintik matahari adalah yang paling jelas dan mudah. Di masa lalu, ketika komputer masih terbelakang, ukuran, bentuk, dan lokasi bintik matahari yang diamati oleh para astronom terutama dilacak secara manual dengan metode proyeksi [2]. Dalam beberapa tahun terakhir, secara bertahap digantikan oleh pengamatan fotosfer dan fotografi. Metode tradisional. Nilai luas bintik matahari harian merepresentasikan luas bintik matahari yang muncul di seluruh permukaan matahari setiap hari (satuannya adalah sepersejuta dari total luas matahari), dalam arti tertentu merupakan representasi digital dari fluks magnet harian dari aktivitas medan magnet matahari. Ekspresi langsung daya bintik matahari yang dihasilkan oleh generator surya [3]. Mendigitalkan pekerjaan peta bintik matahari yang dilukis dengan tangan dapat melindungi data berharga ini agar tidak hilang sejauh mungkin, dan dapat dengan mudah dan cepat mengintegrasikan semua informasi bintik matahari yang diamati, sehingga informasi data pengamatan dari berbagai observatorium dapat diintegrasikan dan diatur secara efektif. Hal ini dapat memberikan permintaan data yang mudah digunakan dan menggunakan layanan untuk peneliti aktivitas bintik matahari. Pentingnya inovasi ini untuk penelitian astronomi terbukti dengan sendirinya [4-5].
Spanyol dan Belgia memulai pemrosesan digital gambar bintik matahari yang dilukis dengan tangan lebih awal di dunia, dan alat digital untuk gambar bintik matahari yang dilukis dengan tangan seperti DigiSun dan HSUNSPOTS dikembangkan oleh mereka [6]. China mulai mengamati aktivitas bintik matahari pada akhir tahun 1930-an dan mencatat hasil observasi tersebut di atas kertas.Sejauh ini, Observatorium Astronomi Nasional Yunnan telah memperoleh lebih dari 20.000 gambar bintik matahari yang digambar dengan tangan seperti yang ditunjukkan pada Gambar 1. Digitalisasi informasi peta bintik matahari yang digambar tangan adalah untuk mengekstrak dan menyimpan informasi rekaman tulisan tangan pada citra di database. Bagian penting dari pekerjaan ini adalah ekstraksi dan pemisahan latar belakang citra.
Kunci dari digitalisasi informasi citra terletak pada algoritma pemrosesan citra digital [7-10], termasuk pengelompokan spasial citra RGB, segmentasi citra, dll. Segmentasi latar belakang yang efektif adalah sulitnya mendigitalkan informasi pada citra bintik matahari yang dilukis dengan tangan.
SVM adalah salah satu metode pembelajaran mesin klasik dan memiliki keuntungan yang jelas dalam pemrosesan regresi dan klasifikasi pola [11]. Bertujuan untuk pekerjaan pemisahan latar belakang dalam digitalisasi informasi citra sunspot yang digambar tangan, makalah ini mengusulkan metode ekstraksi latar belakang berbasis mesin vektor pendukung.Komponen warna R, G, dan B pada citra dilatih dan dipelajari dengan menggunakan algoritma pemrosesan citra LIBSVM untuk mendapatkan hasil yang optimal. Model klasifikasi, diverifikasi oleh eksperimen, metode ini tidak hanya efektif, tetapi juga kuat, dan secara otomatis menyesuaikan dengan efek blur yang disebabkan oleh usia dan perubahan kertas.
1 landasan teori
Metode pembelajaran mesin Support Vector Machine (SVM) didasarkan pada prinsip dasar teori statistik VC dan minimalisasi risiko konstruksi. Metode ini dapat didasarkan pada informasi sampel tertentu, sehingga model menemukan keseimbangan terbaik antara kelayakan dan kemampuan klasifikasi polanya, yang merupakan keberhasilan implementasi SLT [12], yang juga dikenal sebagai mesin regresi. Misalkan sampel pelatihan adalah (xi, yi), (i = 1, ..., n), di mana n adalah ukuran sampel. Memasukkan sampel dengan fungsi linier adalah metode analisis regresi SVM yang paling mudah. Untuk cara memecahkan masalah klasifikasi linier yang tidak dapat dipisahkan, metode yang paling efektif adalah dengan membuat model linier dalam ruang fitur sampel berdimensi tinggi. Kuncinya adalah memetakan titik sampel ke transformasi non-linier ruang berdimensi tinggi. Mesin regresi SVM dapat diekspresikan sebagai berikut:
Dalam rumus (1), 2 adalah faktor terkait kompleksitas model; C > 0 mewakili penekanan sampel di luar rentang kesalahan, yaitu koefisien penalti; mewakili fungsi kerugian non-sensitif, jumlah vektor dukungan dalam model akan dipengaruhi oleh nilainya; i, * i mewakili sampel dan tidak sensitif Jarak relatif dari area tersebut yaitu variabel slack.
Untuk rumus (1), metode untuk mendapatkan solusi terbaik dari masalah asli biasanya dengan menyelesaikan solusi terbaik dari masalah ganda model di atas:
Diantaranya, K (xi + xj) adalah fungsi kernel, yang memenuhi kondisi Mercer dan K (xi + xj) = (xi) (xj). Radial Basis Function (RBF) adalah fungsi kernel universal:
Dimana = 1 / 2, > 0 adalah koefisien lebar fungsi kernel. Tingkat hukuman C, tingkat ketidaksensitifan , pemilihan kernel konvolusi dan parameter pemrosesannya memiliki pengaruh yang lebih besar pada akurasi klasifikasi SVM [13].
K-means merupakan algoritma clustering partisi data tanpa pengawasan, tanpa mengetahui terlebih dahulu kategori sampelnya, maka secara otomatis akan mengklasifikasikan sampel sesuai dengan jarak atau kemiripan antar sampel, merupakan clustering berdasarkan partisi. Metode [14].
Dalam algoritma K-means klasik, jumlah minimum kesalahan kuadrat antara setiap sampel dan titik tengah dari setiap area sampel digunakan sebagai kriteria untuk menetapkan hubungan pemetaan. Dengan asumsi bahwa kumpulan sampel yang akan diklasifikasikan adalah D = {xj} nj = 1, xjRd, tujuan dari algoritma pembagian K-means adalah untuk membagi kumpulan data sampel menjadi k (k < n) Kelas: S = {S1, S2, ... Sk}, sehingga himpunan bagian sampel k yang dibagi memenuhi jumlah minimum kuadrat kesalahan dalam kelas tersebut.
FCM menggunakan matriks keanggotaan untuk menentukan sejauh mana setiap sampel termasuk dalam klasifikasi tertentu [15]. Dengan asumsi bahwa jumlah sampel adalah kelompok fuzzy yang terdiri dari n vektor xi (i = 1,2, ..., n), maka pusat regional c dibagi menjadi c untuk meminimalkan nilai fungsi indeks ketidaksamaan.
2 Pengumpulan sampel data dan konstruksi vektor fitur
2.1 Pengumpulan sampel data
Pengamatan awal bintik matahari dicatat di kertas khusus. Kertas gambar khusus dicetak, dengan bentuk tetap dan informasi teks di atasnya, seperti yang ditunjukkan pada Gambar 2. Untuk melakukan operasi segmentasi gambar berikutnya dengan lebih baik, pertama-tama perlu mengekstrak bagian gambar yang dicetak, yang merupakan bagian yang ditunjukkan pada Gambar 2.
Binarize gambar pada Gambar 2 untuk mendapatkan informasi kategori dari setiap sampel piksel. Pada citra sunspot yang dilukis dengan tangan, untuk setiap piksel adalah sampel tertentu, dan nilai R, G, dan B-nya adalah nilai karakteristiknya. Kemudian, untuk setiap sampel piksel, vektor karakteristiknya adalah X = RGB ].
2.2 Konstruksi vektor fitur
Pada ekstraksi background citra sunspot yang digambar tangan, setiap piksel merupakan sampel yang akan diklasifikasikan.Oleh karena itu, vektor fitur dari sampel yang dibangun adalah:
Diantaranya, n adalah jumlah piksel pada gambar. Dengan asumsi bayangan tersebut adalah matriks M × N × 3, maka n = M × N. Dalam proses pelatihan model SVM, diperlukan vektor supervisi dari sampel input. Oleh karena itu, pembentukan vektor supervisi adalah:
Diantaranya, ketika Xi adalah piksel latar depan, yi = + 1; ketika Xi adalah piksel latar belakang, yi = -1.
SVM dapat menggunakan sejumlah kecil sampel untuk mengklasifikasikan sejumlah besar objek fisik [16-17]. Oleh karena itu, makalah ini secara acak memilih 20.000 titik dalam piksel gambar asli untuk pelatihan, dan kemudian menggunakan model yang diperoleh untuk mengekstrak latar depan dan latar belakang gambar.
2.3 Mekanisme pemecahan masalah SVM
SVM pandai memecahkan masalah klasifikasi biner, dan masalah ini termasuk dalam masalah klasifikasi biner. Misalkan himpunan N sampel yang akan diklasifikasikan adalah: xi, yiNi, dan yi = + 1, -1. Di sini, contoh fitur vektor Xi dapat dianggap sebagai xi, dan Yi adalah yi. Dimana xi adalah vektor berdimensi n, dimana n = 3, dan yi adalah informasi kategori klasifikasi dimana vektor tersebut berada.
SVM menggunakan hyperplane untuk mengklasifikasikan sampel:
Diantaranya, w adalah vektor masukan, x adalah vektor bobot adaptif, dan b adalah offset. Dalam proses solusi, maksimalkan batas 2 / w2 untuk mendapatkan parameter antarmuka yang optimal w dan b, dan tetapkan kondisi kendala sebagai berikut:
Perkenalkan koefisien Lagrangian untuk mendapatkan solusi efektif untuk masalah ganda:
Untuk memenuhi persyaratan:
i0, mi = 1iyi = 0
Petakan poin data formulir produk dalam ke ruang hasil kali dalam Hilbert:
Diantaranya, K (·) adalah fungsi kernel.
Dengan demikian rumus (9) dapat diubah menjadi:
Pengklasifikasi SVM dapat diperoleh sebagai:
diantara mereka,
Apakah ekspresi keputusan pada permukaan klasifikasi SVM.
3 Hasil percobaan dan analisis ekstraksi background gambar bintik matahari yang dilukis dengan tangan
3.1 Ekstraksi latar belakang SVM
Sampel yang dibuat dilatih untuk mendapatkan model klasifikasi SVM, kemudian gambar aslinya diklasifikasikan.
Gambar 3 merupakan tampilan sebagian dari hasil ekstraksi background, Gambar 3 (a) merupakan sebagian citra pada citra asli, Gambar 3 (b) merupakan citra background hasil ekstraksi, dan Gambar 3 (c) merupakan tampilan background hitam putih hasil ekstraksi.
3.2 Analisis perbandingan partisi SVM dan partisi fuzzy cluster
Makalah ini menggunakan Observatorium Yunnan dari Akademi Ilmu Pengetahuan China dari tahun 1982 hingga 1992, serta dari tahun 1995, 1997, dan 2000. Sebanyak 14 gambar bintik matahari yang dilukis dengan tangan dipilih secara acak pada setiap bulan Januari untuk percobaan. Gambar tersebut masing-masing dianalisis dengan K-means, FCM, dan SVM. Latar belakang yang dicetak diekstraksi, dan beberapa hasil ditunjukkan pada Gambar 4.
Pada Gambar 4, a0, a1, a2, a3, dan a4 merupakan bagian dari citra asli citra sunspot yang digambar tangan pada tanggal 19 Januari 1989, sebagian citra pada posisi yang sama pada citra informasi latar yang diekstrak secara manual, dan pengelompokan K-means untuk mengekstrak informasi latar belakang. Bagian posisi yang sama dari gambar pada gambar, bagian posisi yang sama dari gambar latar yang diekstraksi dengan SVM, dan gambar bagian posisi yang sama dari gambar latar belakang yang diekstraksi FCM; b0, b1, b2, b3, b4, c0, c1, c2, c3, dan c4 masing-masing adalah tahun 1991 Tampilan sebagian gambar setelah pemrosesan berbeda pada tanggal 9 Januari 1995 dan 11 Januari 1995.
Statistik kecepatan pemrosesan dan PSNR pemrosesan dari beberapa metode pemrosesan dilakukan, dan hasilnya ditunjukkan pada Tabel 1. Rumus penghitungan PSNR adalah:
Diantaranya, d merepresentasikan kedalaman bit dari piksel citra. Pada citra 8-bit, d = 8. MSE adalah mean square error antara citra asli dan citra yang diproses. Rumus penghitungannya adalah sebagai berikut:
Diantaranya, m, n adalah dimensi ukuran citra, I (i, j) adalah nilai piksel pada citra asli, dan P (i, j) adalah nilai piksel pada citra yang diproses. Oleh karena itu, semakin besar nilai PSNR, semakin kecil distorsi citra setelah diproses.
Dapat dilihat dari Tabel 1 bahwa rata-rata PSNR informasi latar belakang yang diperoleh dari ekstraksi SVM dari latar belakang tercetak dan pemrosesan manual telah mencapai 56,33, yang memiliki nilai praktis tinggi, dan kecepatan pemrosesan juga dalam kisaran yang dapat diterima.
4. Kesimpulan
Metode pengelompokan tradisional seperti K-means dan FCM memiliki nilai yang baik dalam pemisahan latar depan dan latar belakang, tetapi ketidakstabilan pusat kluster dan kompleksitas algoritme pengelompokan membatasi cakupan dan skenario aplikasi mereka. Sebagai jaringan klasifikasi yang diawasi, mesin vektor pendukung dapat memperoleh ekspresi pengetahuan klasifikasi dari serangkaian masalah klasifikasi terkait setelah pembelajaran satu kali, dan modelnya mudah dipromosikan dan digunakan.Ini memiliki efek yang baik dalam pemisahan latar belakang gambar bintik matahari yang digambar tangan dan dapat diterapkan Ini digunakan dalam pra-pemrosesan segmentasi gambar bintik matahari yang digambar dengan tangan untuk mengekstrak dan mengenali informasi tulisan tangan dengan lebih baik pada gambar, yang sangat penting untuk ekstraksi dan digitalisasi informasi gambar bintik matahari yang digambar tangan. Selain itu, pada gambar di bawah latar belakang natural, juga memiliki kemampuan adaptasi yang lebih baik terhadap segmentasi target monokrom.
referensi
1 Liu Zhonghe, Wang Ruixue, Wang Fengde, dll. Status Saat Ini dan Prospek Pemrosesan Gambar Digital J. Computer Times, 2005 (9): 6-8.
2 Liu Xuefu. Pengamatan Bintik Matahari J. Astronom, 1999 (6): 24-26.
[3] Wu Lide. Visi Komputer M. Shanghai: Fudan University Press, 1993.
4 Li Kejun, Su Tongwei, Liang Hongfei. Periodisitas minggu bintik matahari yang diamati oleh bintik matahari modern J. Buletin Sains Cina, 2004, 49 (24): 2511-2516.
5 Zheng Sheng, Zeng Xiangyun, Lin Ganghua, dkk. Sunspot menggambar metode pengenalan karakter tulisan tangan berdasarkan deep learning J. New Astronomy, 2016, (45): 54-59.
6 Zhu Daoyuan, Zheng Sheng, Zeng Xiangyun, dkk.Penelitian tentang metode segmentasi karakter tulisan tangan dari gambar bintik matahari yang dilukis dengan tangan J. Microcomputer and Application, 2015, 34 (20): 33-35.
[7] Zhou Deshui, Ge Hongwei. Segmentasi citra koneksi fuzzy cepat berdasarkan algoritma rakus J. Aplikasi dan Perangkat Lunak Komputer, 2015, 32 (8): 201-203.
8 Tai Yingying, Wu Yanhai, Zhang Li. Metode segmentasi gambar berdasarkan pengelompokan pergeseran rata-rata cepat dan penandaan batas air J. Aplikasi dan Perangkat Lunak Komputer, 2015, 32 (8): 184-186.
9 Li Yuansong. Segmentasi citra MR otak berdasarkan model campuran Gaussian dan SSC J. Aplikasi dan Perangkat Lunak Komputer, 2015, 32 (7): 70-73.
10 Deng Juan Segmentasi citra tekstur yang tidak dipantau berdasarkan set elemen tekstur yang diwakili oleh vektor abu-abu J. Aplikasi Komputer, 2005, 25 (1): 117-118.
[11] Zhong Tanwang, Lin Zhaoyu Penerapan algoritma regresi LIBSVM dalam peramalan lalu lintas J. Telecommunications Engineering Technology and Standardization, 2014 (9): 80-83.
12 Li Dongping Penelitian tentang SVM classifier berdasarkan chaotic particle swarm optimization J. Computer Simulation, 2010, 27 (4): 185-187.
13 Yuan Xun, Wu Xiuqing, Hong Richang, dll. Klasifikasi video berdasarkan pembelajaran aktif pengklasifikasi SVM J. Jurnal Universitas Sains dan Teknologi Cina, 2009, 39 (5): 473-478.
[14] Gao Liping, Zhou Xueyan, Zhan Yubin Pengelompokan diskriminan K-means non-linear dalam mode J of. Jurnal Aplikasi Komputer, 2011, 31 (12): 3247-3251.
[15] Xu Shaoping, Liu Xiaoping, Li Chunquan, dkk. Segmentasi citra FCM yang cepat meningkatkan algoritme berdasarkan analisis fitur regional J. Pengenalan Pola dan Kecerdasan Buatan, 2012, 25 (6): 987-995.
[16] Sun Shaoyi, Huang Zhibo. Algoritme multi-klasifikasi SVM J. Komputer mikro dan Aplikasi, 2016, 35 (8): 12-14, 17.
[17] Gao Qing, Yan Deqin, Chu Yonghe, dkk. Pengenalan wajah berdasarkan pengelompokan fuzzy LLE dan SVM J. Komputer Mikro dan Aplikasi, 2016, 34 (6): 56-58.
- National Health Insight: 53% orang telah menggunakan layanan medis online, dan kerontokan rambut wanita lebih merepotkan daripada pria
- OPPO R17 Pro menciptakan bidikan malam yang sangat jernih dengan teknologi hitam yang dijual pada 11 November
- Festival Film Utara Penghapusan Ranjau · Film Baru Kami mencapai skor keseluruhan tertinggi yang pernah ada