新華網 正文
繪制全球疫情實時地圖的中國留學生
2020-05-08 08:08:36 來源: 新華每日電訊
關注新華網
微博
Qzone
評論
圖集

  董恩盛(右)和杜鴻儒(左)在約翰斯·霍普金斯大學疫情追蹤地圖背後付出大量心血和勞動。(受訪者供圖)

  美國約翰斯·霍普金斯大學的新冠肺炎疫情追蹤地圖,平均每日全球點擊量高達10億次。其核心團隊是兩位風華正茂的中國年輕人和他們的年輕女導師。董恩盛,30歲;杜鴻儒,25歲,都是去年秋天進入約翰斯·霍普金斯大學的在讀一年級博士生

  身為中國學子,董恩盛和杜鴻儒對新冠疫情的擔憂和關注,早于大部分美國科學家。正是這樣的專業敏感度和對疫情資訊的敏感度疊加,使得他們較早意識到制作世界疫情地圖的意義和價值

  美東時間5月7日,美國約翰斯·霍普金斯大學的疫情追蹤地圖顯示,全球新冠病毒感染確診病例已超過375萬,死亡病例超過26萬;美國確診病例超過122萬,死亡病例超過7.3萬。

  地圖底色黑沉,而疫情血紅。一個個數字簡單又抽象,每一刻鐘更新一次,不斷變大,大得讓人茫然。它們又沉甸甸,刺痛眼睛。

  新冠病毒帶來的死亡已發生逾26萬次,其中絕大多數是悄無聲息的,孤獨的。患者在臨終病房裏,見不到親人,死後沒有葬禮,生平事跡不會見諸報端。過于龐大的死亡數字,猶如黑洞,使死者失去名字和面孔。

  然而,數字仍然是重要的。不僅對各國政府和公共衛生機構的決策者很重要,對制作風險評估和疫情走勢預測模型、進行社會人口學分析及其他領域的研究者很重要,也對疫情陰影籠罩之下的所有人都是如此。

  這張仍在不斷豐富細化的疫情地圖,平均每日全球點擊量高達10億次,最高日點擊量達到45億次。它是各國政府、研究人員和主流媒體引用最多的疫情數據來源。這張疫情地圖,還帶動了美國各州及世界多國政府或民間機構制作類似疫情圖和提高數據精確度,從而提升了民眾的知情權。

  地圖背後

  不過,很多人最近才知道,這張火遍全球的疫情追蹤地圖的核心團隊,是兩位風華正茂的中國年輕人和他們的年輕導師。

  董恩盛,30歲;杜鴻儒,25歲。他們都是去年秋天進入約翰斯·霍普金斯大學的在讀一年級博士生。兩人名字都很有儒家文化色彩。

  他們的導師名叫勞倫·加德納(Lauren Gardner),副教授,年僅35歲,學建築出身。去年到約翰斯·霍普金斯大學任教前,她是澳大利亞新南威爾士大學(UNSW)悉尼分校土木工程專業的高級講師,目前只帶了這兩名來自中國的學生。

  他們所在院係,名叫土木和係統工程係,聽上去似乎和傳染病學、病毒學八竿子打不著。但沒有什麼真的只是突然發生。

  董恩盛説,這是全球第一張實時更新的疫情世界地圖,創意的正式産生,來自1月21日上午他和導師在圖書館喝咖啡——這是師生例行見面交流方式。兩人都有同樣的想法,“一拍即合”。

  而在與導師見面前,他已著手搜集數據和進行準備工作,“一開始就是出于學術研究的目的,很單純。”

  當晚,董恩盛花了七八個小時輸入數據、制作追蹤圖,一直幹到淩晨三四點鐘。經過審核修改等程式,導師于美東時間22日首次在社交媒體推特上發布了第一版疫情世界地圖——恰趕上北京時間1月23日武漢宣布“封城”。

  董恩盛説,最開始幾乎沒有現成模板可以套用,他不停地輸入數據、坐標。當數據一一呈現在世界地圖上,他漸漸意識到,就在全球范圍內進行實時更新的流行病地圖而言,這屬于首創。

  和導師喝杯咖啡,開上七八個小時夜車,就能啟動一項世界首創,有這麼輕松和簡單嗎?

  美國總統選舉時,政要們在為某名競選人背書時,有句慣用套話,就是稱讚此人“一生都在為此做準備”。董恩盛和杜鴻儒都很年輕,但就他們的學習和工作經歷而言,還真可以套用這句話。

  董恩盛説,他本科畢業于重慶西南大學地理係,2012年赴美國留學。獲得碩士學位後,他曾先後在美國地方政府的IT及衛生部門、軟件公司、電力公司、電信公司等實習和工作。

  他接受過正規的地理和統計方面學術訓練,目前研究領域包括網絡科學、移動性建模、機器學習、空間分析和可視化及傳染病的跨學科研究。新冠疫情爆發前,他就曾參與預測美國和太平洋島嶼國家和地區的麻疹風險及斯裏蘭卡的登革熱疫情。

  杜鴻儒也具有跨學科背景。他是天津大學化工學院2017屆畢業生,曾就讀于英國愛丁堡大學化工材料科學專業和美國威斯康星大學麥迪遜分校工業工程及運籌學專業。

  他長于數學模型和路徑優化,主要研究方向包括流行病大數據處理、通過網絡優化和數學建模來研究和預測全球流行病的發展。他在2月1日加入疫情地圖團隊,數據自動更新代碼就是他動手編寫的。

  他説,不妨把病毒傳播設想成一種網絡,州縣都是網絡節點,每個節點之間的人口流動構成連線。不管通過數學建模預測疫情趨勢,還是進行人口社會學分析,係統科學角度都很重要。

  身為中國學子,董恩盛和杜鴻儒對新冠疫情的擔憂和關注,早于大部分美國科學家。正是這樣的專業敏感度和對疫情資訊的敏感度疊加,使得他們較早意識到制作世界疫情地圖的意義和價值。而之前的學術訓練與經驗積累,也使他們在導師帶領下,不僅可以有腦洞“想到”,也水到渠成地有能力“做到”。

  但“做到”並不比“想到”更容易。從1月下旬到現在,為疫情地圖的升級、完善和維護,並在疫情數據上展開相關研究,董恩盛和杜鴻儒付出了大量心血和勞動。

  在手動輸入階段,他們每天都要工作大約10個小時。3月中旬向全自動數據更新轉換時,每天工作量達到十五六個小時,導師也和他們一起工作到淩晨三四點鐘。即便在團隊擴大到大約50人、數據實現實時自動更新後,光是每天審核和修正數據工作,少則五六個小時,多則要十個小時。

  魔鬼往往藏在細節裏。4月13日,約翰斯·霍普金斯大學新冠疫情數據統計網站造了一起烏龍事件,錯將全球確診人數報至200萬人以上,原因是將佛羅裏達州實際病例數21019誤填為123019,從而造成10萬多例的誤差。但不久後,他們又將數字回調至約190萬。

  在疫情地圖維護中,核查數據以確保準確是重要一環。杜鴻儒介紹説,由于美國疾控中心數據滯後,他們主要依靠抓取美國地方媒體和各州衛生官員推特報告的數據,其他國家和地區的疫情則依據Worldometers等網站和當地媒體。由于更新時間早于官方數據,在電腦自動更新次日,團隊就針對美國疫情數據與各州疾控中心數據核查,其他國家和地區數據則與世界衛生組織數據進行核查。

  董恩盛説,為保證數據準確,他們還採取了四個措施,一是保留數據原始記錄,每次更新都有回溯記錄可查,二是總結時間序列表格,三是列出所有修正記錄,四是組織人工核查。

  值得一提的是,約翰斯·霍普金斯大學疫情世界地圖背後,還活躍著更多中國年輕人的身影。

  據董恩盛和杜鴻儒介紹,目前,運營團隊約有50人,其中數據核實團隊的志願者,主要是各個院係的中國留學生。而中國方面提供的疫情數據,對國際研究的貢獻更是不可磨滅。新冠疫情應對,對中國開展跨學科的國際傳染病研究,加強全球公共衛生參與,提高政府部門和研究機構疫情數據可視化、國際化程度等,都提供了新的契機。

  脫穎而出

  在董恩盛和杜鴻儒看來,約翰斯·霍普金斯大學疫情地圖脫穎而出,要歸功于多方面因素,綜合起來有以下八個主要原因:

  一是動手早,在世界范圍裏先人一步,而與之後出現的其他疫情地圖相比,數據更準確、更快;二是在流行病學方面比較專業,美國疫情精確到縣級,對研究者和公眾用處很大;三是在地圖繪制方面表現出的專業性;四是數據公開透明,所有數據上傳至GitHub,為全球所有政府決策部門和科研人員提供了開源數據;五是確保更新及時,用戶參與度高,德、法、意等非英語語種國家的許多用戶會主動向他們報告當地媒體報道的最新疫情,比等待官方審核渠道的確診數字快得多;六是疫情地圖的設計,黑色與紅色對比度較高,構成視覺上的強烈衝擊;七是約翰斯·霍普金斯大學在全球醫學和公共衛生領域都享有很高聲譽,使得疫情圖從一開始,就具有普通大學難以單憑學校名聲獲得的權威性;八是從最初的導師推特到各國媒體的報道,産生了社交網絡和媒體傳播的滾雪球效應。

  從日內瓦世界衛生組織總部,到紐約聯合國總部和華盛頓白宮的疫情會,乃至《紐約時報》等美國主流媒體,也大都採用他們的統計。

  不過,董恩盛特別指出,疫情地圖和疫情數據並不能完整反映一個國家對抗疫情的能力。目前,國際社會缺乏全球性的疫情報告指導性文件,也沒有統一的報告標準。各國、各地統計口徑不一樣,病毒檢測水準不一樣,各國民眾對疫情的看法也不一樣。

  在歐洲和美國,同樣存在不少數據統計上的混亂、缺失與重疊現象。比如,美國監獄係統分為聯邦監獄和地方監獄,聯邦監獄疫情是否計入了各州縣統計不得而知,因涉犯人隱私和相關法律,多地也不願公布監獄疫情。在州、縣交界地區,出院或轉院患者往往跨州,如何統計也是難題。此外,考慮到可能重復計算,美軍疫情尚未統計在疫情圖中。

  在世界范圍內,有時會出現“數據參考迴圈”,即相關網站的數據可能就來源于約翰斯·霍普金斯大學疫情地圖,因而需要仔細甄別,不斷提升直接獲取數據的能力。

  董恩盛認為,美國疫情雖然嚴重,但從科研和大數據創新角度看,不少做法值得借鑒。

  比如,各種疫情預測模型分析層出不窮,相關研究可謂“八仙過海,各顯神通”。不論面向學術界還是公眾,這種數學模型分析是非政治化的,不管預測對錯,都可以創造公共衛生對策的討論空間,催生很多新觀點、新對策。

  追求多學科智力融合,“跨界”特色突出。在美國,本科就可以跨專業選課,像董恩盛這樣拿到理學碩士而又攻讀工學博士的例子,在美國並不鮮見。而要避免疫情圖的單一呈現,恰恰需要地理、電腦和疾病傳播等多方面的學術背景。

  實際上,約翰斯·霍普金斯大學係統科學和工程中心是去年更名的,這一舉措本身就突出了“跨界”色彩。董恩盛説,係統工程本身在美國就屬于一個新領域,除疾病傳播,還與公共衛生學院和美國醫院係統開展了包括CT掃描、人工智慧等多個項目的合作。

  此外,在科研領域,不搞論資排輩,讓有能力者能夠相對順利地脫穎而出。這對培育科研創新氛圍也十分重要。董恩盛、杜鴻儒和他們的導師加德納,都是去年進入約翰斯·霍普金斯大學的“新人”,年紀輕輕。他們推出的疫情地圖,迅速得到從撥款、伺服器維護、圖書館資源、運營團隊建設等校方提供的多方面支援。

  約翰斯·霍普金斯大學在全球公共衛生領域的聲譽,固然給了他們優越的平臺,但他們作為“新血”帶來的銳氣、活力與幹勁,也反過來為學校品牌增添了含金量。

  董恩盛和杜鴻儒都對導師加德納副教授十分欽佩,稱讚有加。據他們介紹,這位年輕女導師,經常淩晨兩三點都在工作,審核和指導學生工作,處理錯誤反饋郵件,與有關各方進行協調,向政府和國會進行報告……雖然自己有很高的學術熱情和專業敏銳度,加德納並不抹煞學生的工作與貢獻,為學生提供很多機會,並且注意幫助和保護學生。

  更難能可貴的是,他們“很有原則”,堅持數據公開,拒絕將疫情地圖商業化。一些美國一流大公司提供高額資金和優厚的合作條件,看似“共贏”,但團隊依然婉拒,堅持公開共用,反對過度與商業掛鉤。正是這樣的原則性,使得約翰斯·霍普金斯大學疫情追蹤地圖獲得了更廣泛的公眾影響力。

  五月轉眼已至。如今,約翰斯·霍普金斯大學疫情追蹤地圖已升級多個版本,數據分類更加豐富、詳盡。在世界疫情地圖中,不僅有超過180個國家和地區的確診病例數排行,還有各國州、省確診病例數量排行,除累計確診病例數,還有尚未康復患者數、發病率、確診病例中的死亡比率、檢測率和住院率等重要數據。在美國疫情地圖中,不僅有各州確診病例數及人口佔比和致死率等數據,還有美國確診病例數最高的50個縣排行和死亡病例數最高的20個縣排行。

  此外,還有專門版塊分析一係列判斷疫情傳播態勢的重要數據,包括美國各州疫情的族裔分布;按每10萬人口計算的確診病例數和死亡病例數的全球比較;全球10個疫情最重國家中,決定疫情曲線如何攤平的每日新增病例數據等……

  杜鴻儒説,可靠的數據是研究和決策的基礎。從約翰斯·霍普金斯大學疫情追蹤地圖獲得的海量訪問量,可以看到人們對可靠、客觀資訊的巨大需求。隨著疫情地圖影響力的擴大,他感到壓力更大,在數據更新和核查時更謹慎。這是一次全球共同面對的重大公共衛生事件,疫情地圖的意義超越了學術研究本身。

  董恩盛説,疫情爆發以來,他一直埋頭忙于更新數據和升級疫情地圖,“都忘記生活是什麼樣子”。“對我來説,工作從來沒有停過,越來越多,越來越重,有時突然抬起頭一看,疫情就在身邊,世界真是變化好快。”

  疫情中的青春年華,相信對董恩盛和杜鴻儒都會刻骨銘心。疫情終將過去,世界變化的步伐不會放慢。祝福兩位中國年輕人能夠越走越遠。(記者徐劍梅)

+1
【糾錯】 責任編輯: 詹婧
新聞評論
載入更多
北京:垃圾分類在社區
北京:垃圾分類在社區
三峽水庫持續騰庫防汛
三峽水庫持續騰庫防汛
樂享“五一”假期
樂享“五一”假期
倫敦亮燈致敬醫護人員
倫敦亮燈致敬醫護人員

010020030300000000000000011100001125954971