Sumber: Zhiyang Creative Talk
Artikel ini adalah tentang 4500 kata , Dianjurkan untuk membaca 9 menit
Artikel ini telah mengumpulkan beberapa tipe data, sumber data, database dan platform untuk Anda, termasuk "Sumber Data Coronavirus Baru dan Proyek Penelitian Global".
Label: Pengumpulan Data
Saat ini, virus mahkota baru telah menyebar secara global. Meskipun epidemi di Cina telah dikendalikan secara efektif, negara-negara seperti Italia, Korea Selatan, Iran, Jepang, dan Amerika Serikat secara bertahap "jatuh". Jumlah kasus pneumonia koroner baru yang dikonfirmasi di seluruh dunia telah melebihi satu juta. Dalam menghadapi epidemi yang mengancam, para peneliti ingin menggunakan keahlian penelitian mereka untuk membantu memahami virus dan masalah sosial yang terkait dengannya. Jadi di mana kita akan menemukan data?
Artikel ini merangkum dan memilah beberapa "Sumber Data Virus Corona Baru dan Proyek Penelitian Global" yang bekerja sama dengan Pusat Data Geografis Universitas Harvard, Institut Penelitian Data China, Pusat Komputasi Geografis Sosial Universitas Wuhan, dan Metode Penelitian dan Laboratorium Ilmu Data. Jenis data, sumber data, database dan platform sebagai referensi.
Data dasar
terutama mencakup Data peta (tingkat provinsi, kota dan kabupaten), data sensus (penduduk dan sensus ekonomi), statistik provinsi, kota dan kabupaten dan data lainnya. Data peta tidak statis, peta nasional atau provinsi dapat berubah sangat sedikit, tetapi peta spasial di tingkat kota atau kabupaten / kabupaten sangat berbeda dan akan berubah seiring waktu. Sehingga pemilihan peta dasar sangat penting untuk penelitian.
Referensi sumber data
Biro Statistik Nasional: Tautan ke situs web statistik berbagai provinsi, kota, dan wilayah untuk memberikan laporan statistik yang lebih resmi.
Data nasional: Biro Statistik Nasional telah membuat situs web untuk mempublikasikan situasi ekonomi makro di berbagai bidang di negara kita, yang sangat berwibawa.
China Data Online:
https://www.china-data-online.com/
Data virus
Terutama termasuk epidemi virus korona baru Data besar waktu nyata, database terkait, platform .
Data besar epidemi secara real-time
Laporan Big Data Waktu Nyata tentang Epidemi Baidu
https://voice.baidu.com/act/newpneumonia/newpneumonia
Netease epidemi pneumonia siaran dinamis waktu nyata
https://wp.m.163.com/163/page/news/virus_report/index.html?_nw_=1_anw_=1
Pelacakan waktu nyata dari epidemi Tencent
https://news.qq.com/zt2020/page/feiyan.htm?from=timelineisappinstalled=0#/global
Pelacakan dinamis waktu nyata dari epidemi Sina
https://news.sina.cn/zt_d/yiqing0121?cre=tianyimod=wnewsloc=3r=-1rfunc=97tj=cxvertical_wap_wnewstr=73vt=4pos=3
Kumpulan Data Penelitian Coronavirus COVID-19 Baru Global
Kumpulan data penelitian terbuka COVID-19 berisi lebih dari 29.000 artikel akademis terkait tentang virus corona (keluarga) dari seluruh dunia, yang terutama akan digunakan untuk penelitian di bidang kedokteran dan bidang terkait NLP (pemrosesan bahasa alami) untuk menangani epidemi pneumonia mahkota baru. Dalam kumpulan data ini, ada lebih dari 13.000 artikel yang dapat dibaca mesin. Peneliti dapat menggunakan pembelajaran mesin untuk mempercepat penambangan teks dan interpretasi, sehingga dapat menemukan cara untuk melawan virus corona baru dengan lebih efisien.
https://pages.semanticscholar.org/coronavirus-research
Topik baru virus corona dan layanan pengetahuan serta platform pertukaran penelitian ilmiah
Ini dikelola oleh Chinese Academy of Sciences dan memberikan informasi dokumenter termasuk pelacakan epidemi, perkembangan terbaru, kemajuan penelitian, dan topik lapangan. Bagian "Kemajuan Penelitian" menunjukkan aktivitas dan kemajuan penelitian yang dilakukan oleh peneliti dalam suatu garis waktu. Konten terus diperbarui, dan teks lengkap dapat diunduh setelah pendaftaran.
Basis Data Informasi Novel Coronavirus 2019
Dikelola oleh National Bioinformatics Center (CNCB) / Beijing Institute of Genomics (BIG), Chinese Academy of Sciences (BIG) / National Genome Science Data Center (NGDC) / Life and Health Big Data Center (BIGD), termasuk dinamika pelepasan urutan genom virus dan data mutasi genom virus Analisis, pencarian literatur, dll.
https://bigd.big.ac.cn/ncov#contact
Sistem Layanan Sumber Daya Sains dan Teknologi Nasional Coronavirus Baru
Ini dikelola oleh Pusat Data Sains Mikrobiologi Nasional / Sistem Layanan Sumber Daya Sains dan Teknologi Nasional Coronavirus Baru, dan berisi informasi strain virus, foto mikroskop elektron virus, primer pendeteksi asam nukleat dan urutan probe, informasi genom virus, pengetahuan ilmiah, dll.
Pemantauan dinamis penelitian COVID-19
Itu dikelola oleh Pusat Dokumentasi dan Informasi Wuhan dari Akademi Ilmu Pengetahuan China dan Pusat Dokumentasi dan Informasi dari Akademi Ilmu Pengetahuan China. Situs web ini mengumpulkan perkembangan penelitian ilmiah penting dari "2019-nCoV" di dalam dan luar negeri, mengekstrak kemajuan penelitian ilmiah penting, dan mengirimkan kemajuan penelitian ilmiah yang relevan dua kali sehari. Konten yang diekstrak membentuk buletin harian, dan konten yang relevan minggu ini dilacak ke sumber virus, perkiraan epidemi, Klasifikasi deteksi virus dan diagnosis penyakit, penelitian dan pengembangan obat, penelitian mekanisme, kebijakan dan peraturan membentuk kompilasi klasifikasi dinamis penelitian ilmiah mingguan.
Infeksi virus corona baru, pencegahan epidemi, platform berbagi informasi paten
Dikelola oleh Pusat Informasi Paten China / Kolaborasi Pemeriksaan Paten Kantor Kekayaan Intelektual Nasional Beijing, data mencakup pengobatan obat pneumonia koroner baru, obat pencegahan, pengujian virus, peralatan medis, produk pelindung, desinfeksi lingkungan, pengolahan limbah, pengolahan air limbah, kecerdasan buatan Dan aplikasi data besar dan bidang lainnya.
Kolom Novel Coronavirus Pneumonia
Dikelola oleh Pusat Pengendalian dan Pencegahan Penyakit Tiongkok. Ini terdiri dari kolom seperti situasi epidemi, rencana teknis, laporan literatur, dan informasi WHO, yang dapat mengikuti perubahan epidemi domestik dan langkah-langkah terbaru dari Organisasi Kesehatan Dunia.
Platform Pertukaran Akademik untuk Hasil Riset Ilmiah Novel Coronavirus Pneumonia
Ini didirikan bersama oleh Kementerian Sains dan Teknologi, Komisi Kesehatan Nasional, Asosiasi Cina untuk Sains dan Teknologi, dan Asosiasi Medis Cina. Memperbarui dan meringkas konten akademis dan sumber daya akademis publik yang relevan secara terus-menerus yang diterbitkan oleh seri jurnal Asosiasi Medis China dan jurnal biomedis dan kesehatan domestik lainnya, dan mempromosikan hasil penelitian ilmiah yang sangat baik terkait pneumonia koroner baru di luar negeri.
Kolom informasi literatur darurat pneumonia baru
Didirikan oleh Perpustakaan Sains dan Teknologi Nasional (NSTL). Basis data tematik berisi lebih dari 3,5 juta dokumen ilmiah dan teknologi terkait penelitian virus corona dalam bahasa asing, dan jenis dokumennya mencakup artikel jurnal luar negeri, buku ilmiah, laporan ilmiah dan teknologi, paten, standar, dll. Portal informasi tematik tepat waktu menindaklanjuti dan melaporkan pedoman pencegahan dan pengendalian yang diterbitkan oleh Organisasi Kesehatan Dunia (WHO), Komisi Kesehatan Nasional China, Pusat Pengendalian dan Pencegahan Penyakit China, dan Pusat Pengendalian dan Pencegahan Penyakit AS. Hasil penelitian terbaru lebih dari 30 jurnal otoritatif seperti New England Journal of Medicine. Konten tersebut tidak hanya mencakup infeksi virus korona baru Wuhan, tetapi juga dokumen terkait seperti SARS dan MERS. Ini tidak hanya mencakup penelitian dasar seperti biologi patogen dan epidemiologi, tetapi juga mencakup konten penting dari diagnosis dan pengobatan klinis, perawatan obat, inspeksi dan pengujian, dan penelitian vaksin.
https://www.nstl.gov.cn/service/coronaviridae/index.html
Pusat Informasi Novel Coronavirus
Springer Nature, salah satu organisasi penerbitan akademis terbesar di dunia, mengumpulkan makalah terbaru yang paling relevan dengan penelitian virus corona dari jurnalnya, dan merangkumnya di laman web khusus bersama dengan artikel dan buku ulasan yang relevan. Semua konten di dalamnya Tersedia secara gratis.
https://www.elsevier.com/connect/coronavirus-information-center
Data migrasi populasi
Dalam proses penelitian tentang virus corona baru, sulit bagi kita untuk membicarakan virus tanpa adanya data migrasi penduduk. Data migrasi penduduk yang disebutkan di sini sebagian besar mencakup dua sumber, yaitu data migrasi penduduk harian yang disediakan oleh Baidu Migrations, yang dapat diperoleh melalui teknologi crawler. Dua gambar berikut adalah peta populasi terapung Wuhan pada 23 Januari 2020. Di sebelah kiri adalah aliran dari kota lain ke Wuhan, dan di sebelah kanan adalah aliran dari Wuhan ke kota lain.
Sumber data: Baidu Migration
https://qianxi.baidu.com
Akan tetapi, data migrasi Baidu hanya memberitahu kita arah arus penduduk, tetapi tidak mengungkapkan besarnya masing-masing arah arus. Hal ini mengharuskan kita untuk menentukan besarnya arus dalam hubungannya dengan sumber data lain, yaitu data populasi terapung yang dikeluarkan oleh Biro Statistik Nasional.
Ini lebih mendekati definisi akademis dari populasi terapung, dan data pergerakan populasi Baidu lebih seperti catatan perubahan aliran pergerakan populasi. Gambar berikut menunjukkan data populasi terapung yang disediakan oleh data populasi terapung yang dirilis oleh Biro Statistik Nasional:
Sumber data: China Data Online
https://china-data-online.com
Data fasilitas kesehatan
Data fasilitas kesehatan terutama mencakup data POI (Titik Informasi) dari Peta Gaode dan data sensus ekonomi yang disediakan oleh Biro Statistik Nasional.
Ambil data rumah sakit di Wuhan sebagai contoh.Dengan meng-crawl peta AutoNavi (seperti merangkak lintang dan bujur), kita dapat mengintegrasikan data rumah sakit di Wuhan ke dalam Excel, lalu menggabungkan informasi di tabel Excel ini dengan data dasar sebelumnya untuk mendapatkan Data peta yang lebih berharga.
Sumber data:
https://lbs.amap.com
Proses perayap data rumah sakit meliputi: Mendapatkan antarmuka HTTP dari data AutoNavi POI, menentukan jenis POI dan cakupan divisi administrasi lokasi > Parsing data format JSON dan simpan labelnya sebagai data POI di pois. Parameter tersebut meliputi nama rumah sakit, jenis POI, alamat semantik, koordinat dalam sistem koordinat WGS84, dan unit divisi administrasi > Menetapkan hubungan pemetaan antara standar klasifikasi lembaga kesehatan nasional dan standar klasifikasi POI Peta Gaode > Cocokkan jenis rumah sakit dan simpan dalam format file Excel berdasarkan divisi administrasi provinsi > Cocokkan dan gabungkan sesuai dengan peta pembagian administrasi provinsi, kota, kabupaten dan kabupaten.
Data rumah sakit juga dimasukkan dalam sensus ekonomi. Data Peta AutoNavi tidak dapat memberi tahu kami waktu ketika rumah sakit didirikan, struktur kepemilikan rumah sakit (swasta vs umum), dan jumlah rumah sakit di wilayah tertentu pada tahun yang berbeda, tetapi data sensus ekonomi dapat menutupi data yang hilang ini (seperti yang ditunjukkan di bawah):
Sumber data:
https://china-data-online.com
Data rumah sakit dalam sensus ekonomi dapat dicocokkan dengan data peta AutoNavi, dan juga dapat digabungkan dengan data dasar untuk menghasilkan data peta spasial yang relevan dengan penelitian kami.
Sumber data:
https://lbs.amap.com
Selain data rumah sakit, peralatan medis dan manufaktur juga sangat penting untuk pencegahan dan pengendalian epidemi. Informasi ini juga dapat diperoleh dari sensus ekonomi.
Sumber data:
https://china-data-online.com
Selain itu, kami memiliki beberapa data terkait kesehatan lainnya yang dapat digunakan. Misalnya, statistik kesehatan tahunan pada gambar di bawah ini (data China tersedia online). Statistik tahunan merinci jumlah rumah sakit, jumlah pasien rawat jalan, jumlah tempat tidur, jumlah staf medis dan statistik kesehatan lainnya di kabupaten nasional, provinsi dan kota, yang dapat melengkapi informasi yang hilang dari peta Gaode.
Sumber data:
Contoh lain adalah China Geo-Explorer, data kesehatan yang disediakan oleh Sistem Informasi Spasial China. Platform situs web ini mengintegrasikan data statistik, data sensus, dan data GIS untuk menghasilkan bagan, peta, dan laporan yang diperlukan untuk berbagai penelitian.
Sumber data:
Data media sosial
Bagian ini terutama mencerminkan opini publik sosial, terutama termasuk media sosial seperti Weibo dan Twitter. Karena media sosial ini adalah sumber informasi utama, mereka memiliki efek langsung pada hotspot penelitian seperti prediksi epidemi dan orientasi opini publik.
Institut Penelitian Data China:
Harvard Dataverse:
Indeks Baidu: Sebuah platform berbagi data di bawah data perilaku pengguna Baidu / Baidu, mendukung grafik permintaan permintaan
Indeks Mikro: Alat analisis data di bawah Sina Weibo / mencerminkan opini publik Weibo atau tren pengembangan akun
https://data.weibo.com/
Indeks Sogou: Sebuah platform berbagi data di bawah Sogou / berdasarkan perilaku pengguna Sogou, dan juga mendukung popularitas pencarian WeChat
Segmen industri dan data lainnya
Ini terutama mencakup berbagai sub-industri dan jenis sumber data lainnya, termasuk Internet, e-commerce, hiburan, mobil, real estat, terminal seluler, industri investasi, dll. Dampak epidemi pada berbagai industri sangat luas, dan luasnya dampak serta tren masa depan layak untuk dipelajari lebih lanjut.
Industri internet
Tencent Big Data: Anak perusahaan Tencent / menerbitkan laporan penelitian yang berkaitan erat dengan Tencent, dan seringkali ada beberapa topik menarik
https://bigdata.qq.com//reports?page=1
IResearch: di bawah iResearch / support melihat laporan data yang lebih baru, terutama meneliti bidang ekonomi baru seperti media online, e-commerce, dan game online.
IiMedia: iiMedia tidak ada hubungannya dengan iResearch, laporan penelitian yang dirilis oleh iiMedia sebagian besar mengarah ke Internet seluler
Analysys Think Tank: Analysys International meluncurkan / terutama meluncurkan laporan informasi industri tentang arah ekonomi media baru
https://www.analysys.cn/article#analysis
Pusat Penelitian Informasi Internet China: Sebuah organisasi manajemen dan layanan yang didirikan dengan persetujuan dari otoritas kompeten nasional, dan sering menerbitkan beberapa laporan informasi Internet yang berharga
199IT: berisi banyak laporan data Internet, dan situs web navigasinya mengumpulkan banyak tautan situs web terkait data
Industri e-niaga
Ali Index: Sebuah platform analisis data di bawah Ali / mencerminkan tren pasar dari platform Taobao.
https://index.1688.com/
Alibaba Research Institute: Laporan data Alibaba tentang tren e-commerce dan arah lain dirilis, dan sebagian besar kontennya terkait dengan Alibaba
CBNDdata: Berdasarkan database komersial Alibaba, menghasilkan laporan analisis ekonomi industri
Industri hiburan
CBO China Box Office: Berdasarkan data box office domestik, statistik tentang peringkat box office, kehadiran, dan informasi lainnya.
Indeks IQiyi: di bawah iQiyi / Berdasarkan data pemutaran iQiyi, ini menampilkan informasi seperti tren pemutaran video dan potret penonton video.
DataEye: Berdasarkan data industri game domestik, laporan survei industri multi-sudut ditulis dan dirilis
https://www.dataeye.com/report
Industri mobil
Trader Index: Sebuah indeks data yang mencerminkan pasar penjualan mobil domestik dan memberikan referensi bagi pembeli mobil atau praktisi otomotif.
Industri Transportasi
Peta AutoNavi: Mendukung tampilan real-time dari kondisi lalu lintas domestik, dan AutoNavi secara berkala menyediakan serangkaian laporan data.
https://report.amap.com/detail.do?city=110000
Industri real estate
Fang Tianxia: Data situs web berasal dari China Index Research Institute dan data Indeks Tengah CREIS, yang menunjukkan data real estate domestik
https://fdc.fang.com/index/
Seluler
Mobile Observatory: Berdasarkan perilaku pengoperasian pengguna perangkat seluler, ia menyediakan aplikasi, peringkat akun resmi, dll., Dan juga merilis sejumlah besar laporan data.
IResearch APP Index: Mendukung tampilan data terminal seluler dari berbagai sudut seperti perangkat independen bulanan, perangkat independen rata-rata harian, dan total waktu efektif bulanan.
https://index.iresearch.com.cn/new/#/
Industri investasi
Lembaga Penelitian Investasi: Situs web ini mempertahankan frekuensi tinggi dan mendorong laporan analisis pengguna di bidang investasi.
https://www.chinaventure.com.cn/report/list.html
Database, platform, dan sumber data terkait mahkota baru yang disebutkan di atas semuanya berasal dari data publik, yang dapat diintegrasikan secara efektif dengan data lain, dan banyak proyek penelitian ilmiah yang berarti dapat diluncurkan. Saya berharap kolega Anda menggunakan penelitian akademis dan ilmiah untuk membantu front anti-epidemi global mengatasi kesulitan!
Sebagian informasi berasal dari "Brown School", hanya untuk pembelajaran dan komunikasi
Editor: Yu Tengkai
Proofreading: Lin Yilin
-Selesai-
Ikuti platform publik WeChat resmi dari Institut Ilmu Data Tsinghua-Qingdao " Pai Data AI "Dan nomor saudara perempuan" Data Pie THU "Dapatkan lebih banyak manfaat kuliah dan konten berkualitas.
- Menggunakan gerbang logika protein untuk mengubah sel menjadi komputer, cendekiawan muda Tiongkok belajar tentang Sains
- Mesin terjemahan pertama di dunia telah kembali dari evolusi, dan "detail gila" menangani dialek China klasik
- Tim AI Tsinghua meluncurkan platform keamanan AI untuk menipu algoritme bagian atas dan kemudian memperbaiki kerentanan dengan kuat
- Robot kecil membantu mengambil! Taman Sains dan Teknologi Zhongguancun Dongsheng, "senjata pencegahan" ini membantu melanjutkan pekerjaan dan produksi
- Pipa pemanas tidak panas, pipa air bocor ... "tim parkour" komunitas memperbaiki lebih dari 1.000 kali dalam 60 hari
- Bagaimana Anda mengevaluasi "Properti Sains dan Inovasi" dari Dewan Inovasi Sains dan Teknologi? Panduan SFC ada di sini