我在人文和藝術領域工作的朋友已經著手做一些不同尋常的事,那就是仔細研究數據,至少對他們而言的確如此。當然,這種變化與疫情相關。他們每天都要查閱新冠感染病例數,了解R系數下降的速度有多慢或者多快,以及此前一天,我們區域內有多少人完成了疫苗注射。
與此同時,有關所有形式其他數據的各式主張和反主張充斥著社交媒體。全球貧困究竟是在上升還是下降?什麽才是美國真實的失業率?這樣的審查有時會導致激烈的爭論,因為人們想要引用——或者挑戰——支撐其立場或世界觀的權威數據。
但在其他數據應用領域,人們極少關注數據的可靠性或解釋。最近引起我注意的一個引人矚目的例子涉及「驗證碼」(CAPTCHA)測試,該測試旨在保護網站免遭機器人攻擊,它要求測試對象通過識別包含船只、自行車或紅綠燈等常見特征圖像來證明自己的人類身份。如果你的選擇——哪怕是正確的——與利用你的選擇來訓練圖像識別算法的機器系統所做出的選擇不符,你將會被視為非人類。
在上述例子中,機器的錯誤顯而易見,盡管如果你想要訪問它所保護的網站,你根本沒有提出上訴的權利。但在其他情況下,如果機器學習系統或人類分析人員對數據的重視程度超過了數據本身所能承受的範圍,那麽,也許無法確定它們會得出什麽結論。
經濟學家爭先恐後地在研究中使用大數據,而許多決策者認為,人工智能為提高成本效益和改善政策結果創造了條件。但在我們將更多決策交給基於數據的機器學習和人工智能系統之前,我們必須清楚數據的局限性。
目前,人們很少關注經濟數據所固有的不確定性。盡管決策者普遍認識到,即便是像GDP增長這樣的基礎指標也可能具有很大不確定性並需要修正,但這並不能阻止人們在薄弱的基礎上進行推論。
例如,由於所採用的經濟結構和統計方法不同,對因疫情所產生的國內生產總值影響實施跨國比較非常困難。但仍然不斷有人提出有些經濟體能夠比其他經濟體更好地渡過危機。
或者思考一下「真實的」通脹率。關於如何以最佳方式構建價格指數的看似技術性爭論卻掩蓋了深層次的分配沖突,比方說,借款人和債券持有者或者勞動力和雇主之間的矛盾。
我們所採用的數據決定我們如何看待這個覆雜多變的世界。但數據僅僅能從某個特定的角度反映現實。在政策辯論中所採用的這類數據很少完全脫離它們所描繪的世界,雖然它們所提供的視野或清晰或模糊——但都無法脫離它們所提供的視野。
當前不信任經濟「專家」的一個可能理由是,基於熟悉數據系列自上而下的技術經濟評估與呈現自下而上景象的更細致數據所表現的平行世界呈現出越來越大的差異。標準經濟數據所表現的是平均經驗,而當人們的財富呈現兩極分化時,平均經驗就不再具有典型意義。
一般而言,循證政策的倡導者都意識到,現有數據存在內在不確定性。研究人員非常注意取樣、誤差範圍和所用數據搜集方法的局限性。但越接近政策和政治決策領域,虛假確定性往往就越高。前總統杜魯門遠非唯一一位對常常說「一方面…,另一方面」的經濟學家表現出不耐煩的美國總統。
但隨著我們在刑事司法、警務和福利等領域愈來愈依賴包括機器學習系統在內的技術官僚決策程序,目前,對基於數據的確定性的渴望正在變得越來越危險。民主國家往往依靠建設性的模糊不清來調和不同群體間的利益沖突,比方說,有關資產回報利益分配問題,或執法當局是否會在將無辜者投入監獄或讓罪犯逍遙法外等領域犯錯誤。數據權限聲明最大限度地縮小或者消除了模糊不清的範圍,從而造成了潛在的嚴重後果。
我完全支持更多更好的數據,這對政府推行疫情管理工作所起的作用是至關重要的。但我們越是利用數據來進行決策,就越應該對這樣一個事實保持敏感,即數據代表了一種專家或機器視角,上述視角所基於的類別由同樣參與社會地位遊戲的玩家所設計。若非如此,我們最終的決策過程就像那些流氓驗證碼測試一樣——堅持認為船就是自行車,而且讓其他人別無選擇只能同意。
Diane Coyle
劍橋大學公共政策學教授,其最新著作是市場、國家和人民:公共政策經濟學。