新冠肺炎席卷全球,各國采取的不同防疫措施引發廣泛爭議。你是否想了解如今各國的實時疫情情況?
近日,兩名中國博士開發的全球疫情可視化地圖登上了世界頂尖醫學期刊《柳葉刀》。該地圖追蹤、展示了各國疫情的實時動態數據,包括地點、確診人數、死亡和治愈人數等。
上線以來,該網站的全球日訪問量從一月底的2億次上升到三月初的12億次,甚至到達過20億次。來自世界各地的網民不斷涌入。
以下是南都記者與兩名開發者、約翰·霍普金斯大學系統科學與工程中心一年級的博士生董恩盛、杜鴻儒的對話整理。
【南都N視頻 | 中國博士開發的疫情地圖登《柳葉刀》 全球日訪問量曾達20億】文字:南都記者 陳志芳 視頻:南都記者 潘穎欣
網站最高日流量達20億
服務器隨中意美疫情爆發三次癱瘓
南都:一開始為什么會想做疫情可視化地圖?
董恩盛:老板(注:導師勞倫·加德納,Lauren Gardner)是研究疾病傳播過程的專家,我們就跟著她一起做。同時,我們的初衷是,希望通過追蹤數據,可以觀察一場疫情從生到死的整個過程。
南都:團隊有多少人?
董恩盛:主要負責的還是我們兩個人和導師?,F在有七個志愿者加入,后續還有一些感興趣的同學會加入到數據錄入、核對的過程中。
南都:在制作過程中有沒有發現數據變化的規律?
董恩盛:基本上我們每次服務器癱瘓,都是在疫情有所變化的時候??梢哉f,我們服務器宕機的節點與全球疫情變化的節點呈正相關關系。
第一次大約是武漢的疫情數據標準(注:臨床發現的新冠肺炎病例也加入到確診病例中)發生變化的時候,大家發現人數突然猛增,很多都到我們網站上看;第二次是意大利疫情爆發的時候,許多意大利民眾涌入網站,當時意大利的用戶數還超過了美國的;現在是第三次高潮,主要是美國疫情爆發,大家都挺關注美國的數據。
南都:目前有什么困難?
杜鴻儒:對我來說,目前最大的困難是,希望能盡快讓數據更新變成全自動化。
董恩盛:困難是從來沒有受到過這么多關注(笑)。因為現在流量太大了,經常把我們的系統整崩潰了。像3月12日,一天的全球訪問量就有20億。為此,我們已經換了三臺服務器。
鉆石公主號的撤離人員應如何標記?
這里有個隱私問題
南都:數據來源是哪里?是怎樣處理的?
董、杜:世界衛生組織、美國疾病預防控制中心、歐洲疾病預防控中心、中國衛健委、當地新聞報道和衛生部門、丁香園。
目前,我們使用了半自動化的實時數據流策略。我們會與計算機系的朋友合作,讓他們運用機器學習、自然語言處理等技術在網上搜索相關信息,但為了確保數據準確性,我們還會進行人工比對核實和手動更新。
南都:可視化的過程對你們來說難嗎?
董恩盛:我之前有可視化經歷,所以在技術思路上相對成熟。但在數據來源和數據結構搭建上還是遇到一些困難。一是數據的半自動化比較費事;二是需要考慮地圖上點的放置,不同國家的數據層級等問題。一些小功能的增加其實會讓數據有很大變動,或是增加服務器的負擔。
杜鴻儒:舉例來說,我們后來增加了數據更新時間。這其實是有難度的,因為我們的用戶來自世界各地。后來,我們把地圖時間調整為格林尼治時間(注:全世界的時間標準),但相應的也需要把以前的數據做很大的調整。從制作到第一次發布大約花了六、七個小時,但之后每一次改進花的時間都非常多。
南都:接下來疫情地圖還會做什么改進嗎?
董、杜:增加更多的可視化工具、進行進一步的數據公開。其中,可視化可能會精確到美國郡縣級(注:相當于中國的市級單位),但因為涉及到隱私問題,我們也會再考慮。
舉例來說,我們之前在處理鉆石公主號的患者標記位置時,就遇到了一個“隱私烏龍”。當時,部分鉆石號旅客撤回到美國。由于患者具體位置不明,我們就選擇了將點標記在美國相對而言的一個地理中心——堪薩斯州。但有些美國人比較喜歡探索,會放大地圖,放大到最后發現這個點落在他們小區上。他們以為自己小區竟然有新冠肺炎病例,但實際上不是這樣的。當時小區上報給當地衛生部門,又再層層上報,最后我們學校的新聞官告訴我們趕緊調整一下。于是,我們將點暫時放回了鉆石公主號最后的停靠位置,日本橫濱港。
現在我們的處理是,地圖放大到一定程度,標記的點就看不到了,不讓他們把自己家和這個點形成對應關系。
鉆石公主號的標注位置。
南都:鉆石公主號的數據為什么單獨處理?
董恩盛:這其實是跟國際媒體的報道有關系。一開始大家把鉆石公主號的所有案例歸結為日本當地的案例,之后又把日本國內的案例與鉆石公主號分開了。我們就重新調整了數據,這也造成可視化的時候,日本統計數據有了斷崖式下降。但這個不是數據本身的問題,而是初期全球統計的一個偏差。
“朋友轉過來說挺好的,最后發現是我們做的”
南都:你們專業的具體研究內容是什么?
杜、董:我們兩個的主要方向是疾病模型,也就是用數學模型和計算機代碼來解釋一些流行病學、公共健康方面的問題。研究側重的不是醫學本身,而是會對全球流行病的發展趨勢做基本的判斷和推測。
南都:什么時候開始發現自己做的疫情可視化地圖受到了廣泛關注?
董恩盛:一開始是發現學校內部發了新聞稿件,接著學校主網站的頭版頭條推送了我們的疫情地圖。
后來開始出現了“逆向傳播”的現象,比如我的朋友會轉發給我,說“要不你看一下這個東西,挺好的”,我的西班牙助教也是前幾天問我有沒有看過這個圖,是他一個西班牙朋友推薦給他的。我就告訴他們是我們做的。
南都:登上《柳葉刀》是怎樣的一個過程?
董恩盛:其中有個小故事。我們之前有一篇關于麻疹的文章,當時處于《柳葉刀》投稿過程中。但這時,新冠肺炎爆發了,幾乎《柳葉刀》所有編輯都在忙新冠肺炎的文章。我們老板就比較著急,發郵件問《柳葉刀》主編關于麻疹文章的進展如何。主編回應說他們忙于新冠肺炎文章,但天天都在看我們的地圖。于是,我們老板覺得必須有一篇文章向大家介紹,做疫情可視化地圖的經過,讓大家了解我們的數據來源和處理過程,對我們有信心。
南都:還有其他疫情可視化的工具讓你們印象深刻的嗎?
董、杜:國內的可視化做的比較好,比如丁香園。他們也方便了學生、學者的研究。另外的話,其實我們的新冠肺炎可視化地圖是在中國以外的比較早的一家,所以反而是其他國家、機構有學習到我們的可視化結果。
南都:接下去還有什么成果發布?
杜鴻儒:我們現在還在研究新冠肺炎的疾病模型,想研究疾病是怎么爆發的、增長速度如何、真正開始的日期等。
董恩盛:其實疫情可視化地圖只是我們研究過程的一個輔助工具,沒想到引起這么大關注。這導致我們的工作重點也偏向可視化,但其實我們想做更多的流行病學分析。
免責聲明:本網站所轉載的文字、圖片與視頻資料版權歸原創作者所有,如果涉及侵權,請第一時間聯系本網刪除。

官方微信
《中國腐蝕與防護網電子期刊》征訂啟事
- 投稿聯系:編輯部
- 電話:010-62316606-806
- 郵箱:fsfhzy666@163.com
- 中國腐蝕與防護網官方QQ群:140808414