Tyng-Ruey Chuang

Tyng-Ruey Chuang at

http://media.academia.tw/u/trc/m/sat-column-2020-12/

〈防疫資料與工具的開放使用〉

2020-12 莊庭瑞

全球因為嚴重特殊傳染性肺炎(COVID-19,簡稱新冠肺炎)致死的人數,到今年 11 月下旬已超過 138 萬,確診人數超過 5800 萬。目前在許多地區,疫情進入第三波尖峰,難以控制。不可群聚、居家工作的生活樣態,成為眾人防疫的日常模式。每日更新、可信任、涵蓋全球各區的精細確診與死亡人數,是防堵疫情的重要資訊,這些數字由誰維護?使用上可有限制?

網站「從資料看世界」(Our World in Data)每日更新全球各國行政區的確診病例數與死亡人數,並提供與新冠肺炎相關的各種分析圖表,例如各國每百萬人口的新確診數、每日每千人口的檢測量;這些資料由英國牛津馬丁學院羅瑟(Max Roser)帶領的團隊維護。「從資料看世界」創立於 2010 年,10 年來持續收錄與永續發展相關的資料集,包括貧窮、疾病、氣候變遷資料等。網站上的原始資料來自眾多研究人員與機構(例如新冠肺炎全球病例數源自歐盟疾病管制局),經過團隊成員的統整分析,把網站上所有的資料集、陳述和圖表以及開發的程式,提供給任何人自由下載使用。「從資料看世界」是「公共財」,網站的介紹頁面如此寫著。

精確地說,這網站上的文字和圖表視同著作,以「創用 CC 姓名標示 4.0」(CC BY 4.0)公眾授權條款釋出,所有人都可自由複製改作並散佈,只要標明出處即可。程式則採用美國麻省理工學院(MIT)授權條款,使用上的權限跟CC授權類似。資料集則依原始來源的規範使用;事實性資料一般來說屬於「公眾領域」(Public Domain),沒有使用限制。這種取之於眾、用之於眾的原則與做法,在學術期刊論文的開放取用上也逐漸落實(參見 2020 年 6 月號〈公衛危機下的知識取用〉)。

在專利方面,美國的非營利組織Creative Commons在今年4月聯合多個夥伴,推出「COVID 開放誓言」(Open COVID Pledge),呼籲專利所有人在疫情還未全面平息之前,授權給任何人自由使用其受專利保護的技術,應用在與新冠肺炎的檢測、預防、圍堵、治療等方面,期望早日終結這次的大流行病。這呼籲獲得IBM、微軟與英特爾等科技公司響應,紛紛以「COVID 開放授權條款」(Open COVID License),釋放部份專利與著作的使用權利給公眾。美國山迪亞國家實驗室和美國航太總署(NASA)所屬的噴射推進實驗室也都加入這行列;山迪亞國家實驗室釋出數千款口罩與面部遮罩設計的效果評估資訊、NASA 則開放多款 3D 列印呼吸器的設計圖供人下載自製呼吸器。

國際間共享使用新型冠狀病毒的核酸序列資訊更是值得一提。「全球共享流感資料倡議組織」(GISAID)協作平台於 2008 年成立,鼓勵科學家快速分享各種流感病毒與其變異的核酸序列。只要同意這網站的資料庫取用條款,無論你是資料的提供者或使用者,都可以無償使用網站上所有病毒核酸序列資料。這項資料庫取用條款所要求的,也不外乎:資料的使用者需註明提供病毒序列的來源實驗室,同時病毒序列的提供者需允許他人把所提供的資料運用在研究上。經由這種群體互助的方式,GISAID 上最早一筆新冠病毒核酸序列資料來自去年 12 月 24 日。截至今年 11 月中旬為止,已收錄超過20萬筆病毒序列,提供者來自100 多個國家。

來自各地的病毒序列資料是共同的研究基礎,眾人得以探究病毒的地區變異和傳播途徑,不分國家地區與研究機構。根據這些資料,許多研究團隊開發了資訊工具來分析並呈現病毒株的差異與分佈。Nextstrain 團隊獲得廣泛注意,以網頁介面、視覺化方式,互動呈現病毒在時間與空間上的變異歷程。此團隊開發的程式碼授權給公眾自由複製修改使用(以 GNU AGPL 授權條款釋出),並放在 GitHub 這個程式開發者常用的協作平台。

全球新冠肺炎患者眾多,身上的病毒經各地研究人員採集、定序與共享,整理分析後的事實知識,經由這些實務方法,而可歸於眾人使用。

(刊於《科學人》2020 年 12 月號。)