國際觀察|解讀《自然》刊登文章:《模型發展宣言》
引言
受新冠肺炎疫情影響,模型在預測疫情走勢,支撐政策制定等方面發揮舉足輕重作用,模型開發的社會責任進一步凸顯。為此,《自然》隆重推出基于數學建模的宣言,特地刊登了一篇名為《確保模型為社會服務的五個原則宣言》文章,向全球發布基于模型發展和應用的最佳實踐方法。深圳市城市交通規劃設計研究中心(簡稱“深圳交通中心”)特對文章進行了解讀與轉載,文章對引導交通模型師、數據分析師乃至交通規劃師成為合格、負責的社會服務型人才具有一定參考價值。
《自然》除了刊登傳統的研究型文章以外,還提供了包括“書籍與藝術”、“新聞與觀點”、“技術特色”、“評論”等板塊內容,多以“約稿”的形式刊登,本篇文章則發表在《自然》“評論”板塊。該板塊文章一般是關于議程設置,權威且具有挑戰性的專家文章,呼吁國際社會就有關科學研究及其政治、倫理和社會影響的熱點問題采取行動。目的是解決全球性的重要問題,制定路線圖。
一、為了保證模型客觀透明,有必要建立一套社會規范
COVID-19流行病充分說明了非常態下,當緊迫性、風險、價值和不確定性問題相互沖突時,科學的運作將如何發生變化。在新冠狀病毒大流行之前,統計學家正在辯論如何預防諸如黑客攻擊之類的不當行為,尤其是這些行為已經嚴重影響到政策制定。如今,計算機建模備受矚目,政客們宣稱基于“科學”提出政策,利用一些數學模型預測感染、住院及死亡人數等。然而,殘酷的現實是人類對COVID-19的感染傳播,季節性以及免疫的了解甚少,更不用說理解在復雜社會中各種干預措施的作用影響了。
為了確保模型不會成為政治原因的附屬品,防止將預測結果作為支撐預定議程的政治工具,模型師、決策者和公民們都需要建立新的社會規范?!蹲匀弧酚?020年6月25日隆重推出基于數學建模的宣言,向全球推薦關于模型發展和應用的五個基本原則,確保模型質量為歷史和社會負責:不允許建模者提供超出其模型確定性以外的結論,而且絕不允許政客們將其過失歸咎到他們選擇的模型上。
二、模型發展應遵循的五個原則
數學模型如果使用得當,可以很好地服務于社會。天氣預報中使用的計算機模型就是最好的一個例證,它基于對現實中數百萬個預測進行測試而百煉成鋼,貢獻著巨大的社會經濟發展效益。盡管如此,天氣預報結果還是存在很多不確定性,我們大家都清楚并能理性對待。
《自然》宣言是為數學建模推出的最佳實踐的宣言,提供了確保模型應用于政策的最佳方法。五個簡單原則的發表將幫助社會從建模中獲取其真正所需的質量和價值。
1.Mind the assumptions:重視模型前提假設
模型的輸入通?;谄渌麑嵺`,而忽略了前提假設。這些前提假設在一些情景下適用,而在其他情景不適用,比如適用于民用核風險的模型可能無法充分評估地震風險?;诓缓侠砑僭O前提的輸入會導致模型出現結果錯誤,而且通常模型預測中的不確定性遠大于最初確定的不確定性。解決這些問題的一種方法是執行全局不確定性和敏感性分析。模型師在建模時必須對這些全局不確定性和敏感性進行分析,并且充分描述模型結果并使其可查,因為所有不確定因素(變量,數學關系和邊界條件等)都會影響模型的預測結果。
總之,防止模型隱藏其假設(包括政治傾向)的最好方法是制定一套社會規范。
2.Mind the hubris:避免盲目追求模型復雜度
大多數模型師都知道,需要在模型的有效性和它試圖捕捉的廣度之間要進行權衡。但是,一些研究者被“模型越復雜越好”的想法所吸引,復雜性本身常常被視為目的。模型參數的增加導致不確定性的增加(不確定性級聯效應),誤差的累積甚至會發展到模型結果完全無法使用的程度。如果災難性的預測是錯誤的,模型師和應用者是應追究其責任的。
模型并非越復雜越好,過于復雜的模型則毫無意義。在艾滋病毒感染的情況下,相關研究表明,基于性行為頻率的一種更簡單的針對濫交的模型比更復雜的模型更為可靠。一個極端復雜的案例是美國能源部使用的一種模型,用于評估在尤卡山處置庫處置放射性廢物的風險。它被稱為總體系統性能評估,包括286個子模型以及數千個參數,監管機構要求它預測“一百萬年”的安全性。然而,一個關鍵變量(水滲透到地下儲藏層所需的時間)的不確定性達到了三個數量級,它使得這個極度復雜的放射模型變得毫無意義。
因此,模型的發展不可一味追求其復雜度,應尋求復雜度與有效性間的有誤差的最佳平衡。
3.Mind the framing:明確模型的系統框架
模型的結果將至少部分反映開發人員的興趣,學科方向和偏見。沒有任何一種模型可以滿足所有目的。模型師都知道選擇不同的模型工具會影響預測結果,所以每個模型不可能是中立的。因此,需要一套公開透明的共同承諾,模型師不可隱瞞構建每個模型的構建初衷。承諾應涵蓋如何搭建模型,公開模型參數的內在邏輯,評估模型的不確定性以及輸出結果。目前國際社會已針對多個學科制定了規范方針,要求流程要考慮利益相關者,容納多種觀點并促進透明度,以及敏感性和不確定性的分析。每當有新的利益相關者將模型用于新的領域時,都必須重新進行校驗和驗證。
當模型不再是黑匣子時,使用它的人必須做出反應以評估各個參數及其之間的關系。這樣就可以傳達不同的框架和假設如何映射到不同的推論,而不僅僅是從過于復雜的模型中獲得一個簡單的數字。
4.Mind the consequences:正確理解模型結果
過于看重量化可能會產生適得其反的結果,對數字的極度關注甚至會把一門學科從基本正確推向完全錯誤。不加選擇地使用統計測試方法可以顛覆合理的判斷。例如,通過幫助高風險的金融產品看起來安全,模型在2007-2008年度促成了全球經濟脫軌。一旦片面關注于模型結果,其他可能的解釋和評估便會從視野中消失。當其他選擇被邊緣化時,可能會引起模型師的自滿與政治化。就像COVID-19的建模預測,重癥監護病床的可用性,經濟、就業和公民自由等等問題都在發揮作用,盡管這些無法簡單的量化并被輸入到模型中。
虛假的精準度會誘發錯誤的判斷,盡管模型師的思考實驗很重要,但現實中必須正確理解模型結果。模型的不透明會損害結果的公信力,而量化社會學領域的一個關鍵即確保社會對模型數字的信任。
5.Mind the unknowns:承認“無知”是一種美德
在西方哲學史上的大多數時間里,無知的自我意識被認為是一種美德,庫薩的哲學家尼古拉斯(Nicholas)稱其為博學的“無知”。即使在今天,討論不確定的與交流已知的同樣重要。
不承認“無知”會人為地限制政策選擇,并會導致意外結果的發生。例如當主管經濟學家承認他們的模型無法預測最后一次經濟衰退時,責任將降臨到政府官員頭上。忽略模型不確定性可能會給政客提供放棄問責的機會。針對無法實現的問題,模型師應該有勇氣回答“您的問題沒有數字答案”,就像美國政府的流行病學家安東尼·福西在受到政客調查時所做的那樣。承認“無知”是一種美德,也是人類對自然的敬畏。
三、模型挖掘問題比回答問題更重要
數學模型是人類探索未知而廣泛應用的一種好方法,但它們同時也是導致錯誤結論的一種危險方式。因此,模型的假設前提和局限性必須公開,模型的開發應用必須誠實地評估,尤其是模型的不確定性。透明的模型構建過程和職業道德與知識能力同樣重要。好的模型建設不能僅由建模人員來完成,因為這是一項社會活動,需要其它人員的參與和反饋。我們呼吁的不是結束量化、非政治性的模型發展,而是要求模型全面而坦率的公開。嚴格遵循上述五原則有助于將數學模型作為有價值的利用工具,幫助我們實現模型發展的總體目標。忽略這些原則而不能充分認識其優勢和局限性,模型預測就成為了特洛伊木馬,也徹底失去了其應用效益和社會價值。
參考文獻
[1] Saltelli A , Bammer G , Bruno I , et al. Five ways to ensure that models serve society: a manifesto[J]. Nature, 2020, 582(7813):482-484.