歡迎光臨中圖網(wǎng) 請(qǐng) | 注冊(cè)

暗數(shù)據(jù)

出版社:中信出版社出版時(shí)間:2022-01-01
開(kāi)本: 其他 頁(yè)數(shù): 332
中 圖 價(jià):¥46.9(6.8折) 定價(jià)  ¥69.0 登錄后可看到會(huì)員價(jià)
加入購(gòu)物車(chē) 收藏
運(yùn)費(fèi)6元,滿39元免運(yùn)費(fèi)
?新疆、西藏除外
本類(lèi)五星書(shū)更多>

暗數(shù)據(jù) 版權(quán)信息

暗數(shù)據(jù) 本書(shū)特色

適讀人群 :統(tǒng)計(jì)學(xué)從業(yè)者、金融科技企業(yè)從業(yè)者、對(duì)通識(shí)經(jīng)濟(jì)學(xué)感興趣的大眾讀者1. 作者被稱(chēng)為“暗數(shù)據(jù)之父” 作者漢德教授是英國(guó)科學(xué)院院士、統(tǒng)計(jì)學(xué)家,他也為金融、健康、藥學(xué)領(lǐng)域及政府分析大量資料,《暗數(shù)據(jù)》結(jié)集其中精華,堪稱(chēng)洞見(jiàn)制作,也有人將漢德教授稱(chēng)為“暗數(shù)據(jù)之父”。 2.統(tǒng)計(jì)學(xué)視角的通俗科普讀物 書(shū)中為讀者展現(xiàn)了一般人不易觀察到的統(tǒng)計(jì)學(xué)分析角度:在備受推崇的大數(shù)據(jù)時(shí)代,大多數(shù)人都沉浸在只要掌握足夠多的數(shù)據(jù)就行的幻覺(jué)中。這本書(shū)指出其中的盲點(diǎn),翻轉(zhuǎn)視角,開(kāi)辟另一片視野。 3.具有批判性思維 數(shù)據(jù)不可能體現(xiàn)完全客觀,也并非真理。這本書(shū)告訴讀者在閱讀任何資料時(shí),如何避免掉進(jìn)“客觀”的陷阱,對(duì)已獲取、看似可掌握的資料,保有懷疑精神。 4. 案例鮮活豐富 作者深入剖析生活中實(shí)例,從耳熟能詳或聳人聽(tīng)聞的經(jīng)典案例入手,案例豐富鮮活且耐人尋味:作者寫(xiě)作經(jīng)驗(yàn)豐富,以生動(dòng)有條理的敘事,引導(dǎo)讀者進(jìn)入主題,閱讀體驗(yàn)深刻且燒腦。 5. 了解暗數(shù)據(jù),揭示問(wèn)題的解決之道 涉及醫(yī)療、制藥、政府治理、社會(huì)政策、金融業(yè)、制造業(yè)等各領(lǐng)域的暗數(shù)據(jù)現(xiàn)象,揭示問(wèn)題的解決之道,就在于了解信息中不為人知的黑暗邊角是如何扭曲我們的認(rèn)知。

暗數(shù)據(jù) 內(nèi)容簡(jiǎn)介

各種缺失的數(shù)據(jù)成為暗數(shù)據(jù)。關(guān)注的就是那些你并未擁有的數(shù)據(jù)——也許是你想要擁有、希望擁有,或者認(rèn)為自己已經(jīng)擁有但實(shí)際上并未擁有的數(shù)據(jù)。 作者從統(tǒng)計(jì)學(xué)的角度,在書(shū)中提出并用許多例子證明:那些缺失的數(shù)據(jù)至少與你實(shí)際擁有的數(shù)據(jù)同樣重要。你看不見(jiàn)的數(shù)據(jù)有可能誤導(dǎo)你,有時(shí)甚至?xí)斐蔀?zāi)難性的后果。作者闡釋了這些情況如何發(fā)生,以及為什么會(huì)發(fā)生。 進(jìn)一步闡釋如何運(yùn)用暗數(shù)據(jù)視角,改變傳統(tǒng)的數(shù)據(jù)分析方式,更好地優(yōu)化決策,更合理地選擇行動(dòng)方案。

暗數(shù)據(jù) 目錄

前 言 / V
**部分 暗數(shù)據(jù):原因與結(jié)果
第1 章 暗數(shù)據(jù):塑造世界的無(wú)形力量 / 003
幽靈數(shù)據(jù) / 003
你真的擁有全部數(shù)據(jù)嗎? / 012
被忽略的“無(wú)事發(fā)生” / 016
暗數(shù)據(jù)的力量 / 020
就在我們身邊 / 022
第2 章 探索暗數(shù)據(jù):收集到的與沒(méi)收集到的 / 026
來(lái)自各方的暗數(shù)據(jù) / 026
數(shù)據(jù)廢氣、選擇和自我選擇 / 028
以小見(jiàn)大 / 039
實(shí)驗(yàn)數(shù)據(jù) / 051
注意人性的弱點(diǎn) / 060
第3 章 定義與暗數(shù)據(jù):你想知道什么? / 064
定義差異與錯(cuò)誤測(cè)量 / 064
你不能測(cè)量所有事物 / 071
篩查 / 080
基于過(guò)往表現(xiàn)的選擇 / 083
第4 章 非故意的暗數(shù)據(jù):說(shuō)一套,做一套 / 087
大視界 / 087
匯總 / 091
人為差錯(cuò) / 092
儀器限制 / 097
連接數(shù)據(jù)集 / 099
第5 章 方略性暗數(shù)據(jù):博弈、反饋和信息不對(duì)稱(chēng) / 102
博弈 / 102
反饋 / 109
信息不對(duì)稱(chēng) / 115
逆向選擇和算法 / 116
第6 章 故意的暗數(shù)據(jù):欺詐與欺騙 / 126
欺詐 / 125
身份盜用與網(wǎng)絡(luò)詐騙 / 129
個(gè)人財(cái)務(wù)詐騙 / 133
金融市場(chǎng)欺詐與內(nèi)幕交易 / 136
保險(xiǎn)詐騙 / 141
其他欺詐形式 / 145
第7 章 科學(xué)與暗數(shù)據(jù):科學(xué)發(fā)現(xiàn)的本質(zhì) / 149
科學(xué)的本質(zhì) / 149
早知道就好了 / 154
暗數(shù)據(jù)碰出新世界 / 162
暗數(shù)據(jù)打開(kāi)大視野 / 164
隱瞞事實(shí) / 177
撤回 / 192
出處和可信度:誰(shuí)告訴你的? / 194
第二部分 闡明和使用暗數(shù)據(jù)
第8 章 處理暗數(shù)據(jù):讓光照進(jìn)來(lái) / 201
希望 / 201
在已觀測(cè)數(shù)據(jù)與缺失的數(shù)據(jù)之間建立關(guān)聯(lián) / 202
識(shí)別數(shù)據(jù)缺失機(jī)制 / 211
利用已有數(shù)據(jù)開(kāi)展工作 / 212
超越數(shù)據(jù):如果你先死怎么辦? / 218
超越數(shù)據(jù):插補(bǔ) / 221
迭代 / 227
錯(cuò)誤數(shù)據(jù) / 230
第9 章 從暗數(shù)據(jù)中獲益:重構(gòu)問(wèn)題 / 236
隱藏?cái)?shù)據(jù) / 236
對(duì)自己隱藏?cái)?shù)據(jù):隨機(jī)對(duì)照試驗(yàn) / 237
可能發(fā)生的事 / 239
復(fù)制的數(shù)據(jù) / 243
想象的數(shù)據(jù):貝葉斯先驗(yàn)性 / 249
隱私與機(jī)密保護(hù) / 251
從暗處收集數(shù)據(jù) / 259
第10 章 暗數(shù)據(jù)分類(lèi):走出迷宮之路 / 263
暗數(shù)據(jù)分類(lèi)法 / 263
啟示 / 270
譯者后記 發(fā)自暗處的光 / 279
參考文獻(xiàn) / 285

展開(kāi)全部

暗數(shù)據(jù) 節(jié)選

幽靈數(shù)據(jù)先給大家講個(gè)笑話。幾天前,我在路上碰到一個(gè)老頭兒。他正在往路中央撒粉末,每隔50 英尺撒一小堆。我問(wèn)他在干什么。“這是驅(qū)象粉。”他回答,“大象*怕這個(gè),所以我用它來(lái)防大象。”“但是,這里沒(méi)有大象啊!蔽艺f(shuō)!斑@就對(duì)啦!”他答道,“驅(qū)象粉真靈啊!爆F(xiàn)在,言歸正傳。每年有近10 萬(wàn)人死于麻疹,每500 名麻疹患者中會(huì)有一個(gè)死于并發(fā)癥,剩下的人會(huì)遭受永久性的聽(tīng)力喪失或大腦損傷。所幸,這種病在美國(guó)很少見(jiàn)。舉個(gè)例子,1999 年只報(bào)告了99 例。但是,2019年1 月,一場(chǎng)麻疹的暴發(fā)導(dǎo)致華盛頓全州進(jìn)入緊急狀態(tài),同時(shí),其他州也發(fā)現(xiàn)了大量增加的病例。1 類(lèi)似情況其他地方也有報(bào)道。在烏克蘭,2019 年2 月中旬的一次麻疹暴發(fā)導(dǎo)致超過(guò)21 000 人被傳染。歐洲2017 年發(fā)現(xiàn)25 863 例,但是到了2018 年,感染病例已經(jīng)超過(guò)8.2 萬(wàn)例。3 從2016 年1 月1 日到2017 年3 月底,羅馬尼亞報(bào)告了4 000 多例麻疹感染者,還有18 個(gè)死亡病例。麻疹是一種危害極大的疾病,它擴(kuò)散時(shí)不易被察覺(jué),因?yàn)橹钡礁腥緮?shù)星期,你都不會(huì)出現(xiàn)明顯癥狀。它從你眼皮底下悄悄溜過(guò),你還沒(méi)反應(yīng)過(guò)來(lái),就已經(jīng)中招了。然而,這種疾病也是可以防控的。簡(jiǎn)單的疫苗接種就能讓你獲得麻疹病毒免疫力。確實(shí),以這種方式實(shí)施的全民防疫,在美國(guó)取得了極大的成功。事實(shí)上,在實(shí)施了這類(lèi)防疫項(xiàng)目的國(guó)家,絕大部分家長(zhǎng)從未見(jiàn)過(guò)或者經(jīng)歷過(guò)這種可預(yù)防疾病導(dǎo)致的可怕后果。但正因如此,當(dāng)疾病控制和預(yù)防中心(簡(jiǎn)稱(chēng)“疾控中心”)建議家長(zhǎng)給孩子接種疫苗以預(yù)防某種疾病時(shí),家長(zhǎng)們自然會(huì)將信將疑。因?yàn)榧部刂行奶岬降倪@種疾病,他們從未在身邊的朋友和鄰居身上看到或聽(tīng)到過(guò),而且,根據(jù)疾控中心的說(shuō)法,這種疾病在美國(guó)已經(jīng)不再是地方性流行病了。接種疫苗以預(yù)防某種疾病,但這種疾病在當(dāng)?shù)赜植淮嬖。這跟使用驅(qū)象粉有什么區(qū)別?然而與大象不同的是,得病的風(fēng)險(xiǎn)和以前一樣真實(shí)存在。僅僅因?yàn)槟切┘议L(zhǎng)賴(lài)以做出決定的信息和數(shù)據(jù)缺失了,所以風(fēng)險(xiǎn)才變得不可見(jiàn)。我把各種缺失的數(shù)據(jù)稱(chēng)為“暗數(shù)據(jù)”(dark data)。暗數(shù)據(jù)隱藏在我們的認(rèn)知之外,這意味著我們可能出現(xiàn)誤解,得出錯(cuò)誤的結(jié)論,做出糟糕的決定。簡(jiǎn)言之,我們的無(wú)知意味著犯錯(cuò)!鞍禂(shù)據(jù)”這個(gè)術(shù)語(yǔ)與物理學(xué)中的暗物質(zhì)相似。宇宙中大約27%的部分由暗物質(zhì)這種神秘物質(zhì)組成。暗物質(zhì)與光或其他電磁輻射不發(fā)生作用,因此不可見(jiàn)。因?yàn)榘滴镔|(zhì)無(wú)法被看到,所以天文學(xué)家長(zhǎng)久以來(lái)并未意識(shí)到它們的存在。直到后來(lái),對(duì)銀河系旋轉(zhuǎn)運(yùn)動(dòng)的觀測(cè)揭示出這樣的現(xiàn)象:較遠(yuǎn)處的恒星,并不比靠近中心的恒星轉(zhuǎn)動(dòng)得更慢。這與我們根據(jù)重力原理得出的預(yù)期不一致。這種異常轉(zhuǎn)動(dòng)可以用一種假設(shè)來(lái)解釋?zhuān)和ㄟ^(guò)我們用天文望遠(yuǎn)鏡能看到的恒星和其他天體來(lái)判斷,銀河系的質(zhì)量比看起來(lái)的大得多。我們看不見(jiàn)那些多出來(lái)的物體,所以稱(chēng)其為暗物質(zhì)。然而,暗物質(zhì)不是無(wú)意義的(我甚至認(rèn)為它是很重要的):在我們所在的銀河系中,暗物質(zhì)的數(shù)量可能比普通物質(zhì)的10 倍還多。暗數(shù)據(jù)和暗物質(zhì)有很多類(lèi)似之處:我們看不到那些數(shù)據(jù),它們沒(méi)有被記錄下來(lái),但是它們?nèi)匀粫?huì)對(duì)我們的判斷、決定和行為產(chǎn)生重大影響。正如后來(lái)一些例子顯示的那樣,除非我們意識(shí)到這種可能性,即我們周遭一直潛伏著未被認(rèn)知的事物,否則,后果可能是災(zāi)難性的,甚至是致命的。本書(shū)的目的就是探索暗數(shù)據(jù)是如何形成的以及它為什么會(huì)形成。我們將考察不同類(lèi)型的暗數(shù)據(jù),并研究它們的起因。首先,我們會(huì)探討采取什么措施可以避免暗數(shù)據(jù)的產(chǎn)生。其次,我們還將研究如果意識(shí)到暗數(shù)據(jù)被屏蔽,我們能做些什么。*后,我們還將看到,如果我們足夠聰明,那么我們也有可能從暗數(shù)據(jù)中獲益。盡管這些看起來(lái)既奇怪又矛盾,但是,恰當(dāng)利用未知事物和暗數(shù)據(jù)的確可以幫助我們做出更好的決定,更好地實(shí)施相關(guān)行動(dòng)。務(wù)實(shí)地說(shuō),這意味著我們可以通過(guò)巧妙地利用未知事物,過(guò)上更加健康的生活,賺更多錢(qián),降低風(fēng)險(xiǎn)。這并不意味著我們應(yīng)該向其他人隱瞞信息(盡管我們也將看到,被故意隱瞞的數(shù)據(jù)是一種常見(jiàn)的暗數(shù)據(jù)類(lèi)型)。暗數(shù)據(jù)比那種被刻意隱瞞的數(shù)據(jù)微妙得多,所有人都能因其獲益。暗數(shù)據(jù)有許多形態(tài),其成因也各種各樣;诔梢,我把暗數(shù)據(jù)分為15 種類(lèi)型。我的分類(lèi)并不是窮盡式的,因?yàn)榘禂?shù)據(jù)的成因非常多,列出所有類(lèi)型幾乎是不可能的。而且,任何特定的暗數(shù)據(jù)案例都會(huì)清晰地顯示出不止一種類(lèi)型——不同類(lèi)型的暗數(shù)據(jù)能夠共同起作用,甚至可以組合在一起產(chǎn)生不利的協(xié)同效應(yīng)。盡管如此,對(duì)這些暗數(shù)據(jù)類(lèi)型的認(rèn)識(shí),以及對(duì)顯示暗數(shù)據(jù)的案例的檢查,能幫助你判斷問(wèn)題何時(shí)出現(xiàn),從而保護(hù)你免遭其害。我在本章*后列出了暗數(shù)據(jù)分類(lèi)清單,按照相似性進(jìn)行了大致排序,并在第10 章對(duì)各種類(lèi)型進(jìn)行了詳細(xì)闡述。在本書(shū)中每種特定類(lèi)型出現(xiàn)的地方,我都進(jìn)行了說(shuō)明。但是,我刻意避免采用詳盡列舉的方式,因?yàn)槟菢訒?huì)造成干擾。我們?cè)賮?lái)看一個(gè)新案例。在醫(yī)學(xué)上,創(chuàng)傷屬于嚴(yán)重?fù)p傷,可能會(huì)造成長(zhǎng)期的嚴(yán)重后果。它是導(dǎo)致早逝和殘疾等影響壽命的*主要原因之一,也是40 歲以下人群*常見(jiàn)的死亡原因。創(chuàng)傷審查與研究網(wǎng)絡(luò)(TARN)的創(chuàng)傷病患數(shù)據(jù)庫(kù)是歐洲*大的醫(yī)學(xué)創(chuàng)傷數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)收集了來(lái)自200 多家醫(yī)院(其中包括英格蘭和威爾士93% 以上的醫(yī)院,以及愛(ài)爾蘭、荷蘭和瑞士等國(guó)家的醫(yī)院)的創(chuàng)傷病例。很明顯,對(duì)于研究創(chuàng)傷干預(yù)治療措施的預(yù)后和療效來(lái)講,這是個(gè)非常豐富的案例數(shù)據(jù)庫(kù)。葉夫根尼·米克斯醫(yī)生和他英國(guó)萊斯特大學(xué)的同事查閱了這個(gè)數(shù)據(jù)庫(kù)里的一些數(shù)據(jù)。4 從被考察的165 559 個(gè)創(chuàng)傷案例中,他們發(fā)現(xiàn)19 289 個(gè)病例的結(jié)果是未知的。在創(chuàng)傷研究中,“結(jié)果”指的是傷害發(fā)生至少30 天后病人是否依然存活。也就是說(shuō),超過(guò)11% 的病人的30 天后存活數(shù)據(jù)不得而知。這個(gè)案例展示了暗數(shù)據(jù)的一種常見(jiàn)形式,即第1 種暗數(shù)據(jù):已知的缺失數(shù)據(jù)。我們知道這些病人都有各自的結(jié)果,但我們不知道他們的結(jié)果是什么。沒(méi)關(guān)系,你可能會(huì)這樣想:讓我們來(lái)分析一下已知其結(jié)果的146 270 個(gè)病人,以此為基礎(chǔ)建立認(rèn)知和進(jìn)行預(yù)后。畢竟,146 270已經(jīng)是個(gè)不小的數(shù)字了,在醫(yī)學(xué)領(lǐng)域,這屬于“大數(shù)據(jù)”。因此,我們當(dāng)然會(huì)對(duì)此有信心:基于這些數(shù)據(jù)產(chǎn)生任何結(jié)論,都將確切無(wú)疑。但是,這樣行嗎?或許,缺失的19 289 個(gè)病例比其他病人更特殊。畢竟,這些病例的確具有某種特殊性,因?yàn)樗麄兊慕Y(jié)果都是未知的,因此,我們懷疑他們可能在其他方面也有所不同,是有一定理由的。因此,相對(duì)于整個(gè)創(chuàng)傷病人群體,針對(duì)這146 270 個(gè)具有已知結(jié)果的患者進(jìn)行的任何分析,都可能具有誤導(dǎo)性。所以,基于這個(gè)分析而采取的治療措施,也有可能是錯(cuò)誤的,也許還會(huì)導(dǎo)致醫(yī)生產(chǎn)生錯(cuò)誤的判斷,開(kāi)出不正確的處方,采用不恰當(dāng)?shù)闹委煼桨福o病人造成不利甚至致命的后果。舉一個(gè)不切實(shí)際的、極端的例子:假設(shè)這146 270 名已知結(jié)果的患者在未經(jīng)治療的情況下,全都存活并康復(fù)了,但19 289 名未知結(jié)果的患者在入院后兩天內(nèi)全部死亡。如果忽略那些未知結(jié)果的患者,我們就會(huì)順理成章地得出結(jié)論:沒(méi)什么可擔(dān)心的,所有創(chuàng)傷患者都康復(fù)了。在此基礎(chǔ)上,我們將不會(huì)對(duì)任何新收治的創(chuàng)傷患者采取治療措施,而是寄希望于自然康復(fù)。然后,我們會(huì)為超過(guò)11% 的死亡病例而感到震驚和困惑。在故事繼續(xù)深入之前,我想請(qǐng)讀者們放心。我的極端設(shè)想只是*糟糕的場(chǎng)景,我們有理由期待現(xiàn)實(shí)情況不會(huì)那么糟,米克斯醫(yī)生和他的同事都是分析缺失數(shù)據(jù)的專(zhuān)家。他們非常清楚這種風(fēng)險(xiǎn),因此一直致力于開(kāi)發(fā)統(tǒng)計(jì)學(xué)方法來(lái)應(yīng)對(duì)這種問(wèn)題,我將在本書(shū)后面的章節(jié)詳述類(lèi)似的方法。然而,從這個(gè)故事中得到的啟示是:事情可能并非像它們看上去的那樣。確實(shí),如果本書(shū)對(duì)你有什么啟示,那么它大概會(huì)是:雖然大量采集數(shù)據(jù)很有幫助,但是量并不代表一切。就理解正在運(yùn)行的事物而言,比起你已經(jīng)掌握的數(shù)據(jù),更重要的可能是那些你沒(méi)掌握的數(shù)據(jù)和尚不知曉的東西。在我們將要看到的任何例子中,暗數(shù)據(jù)問(wèn)題都不僅僅是大數(shù)據(jù)問(wèn)題,小的數(shù)據(jù)集也會(huì)出現(xiàn)這些問(wèn)題。它們無(wú)所不在。這個(gè)創(chuàng)傷病患數(shù)據(jù)庫(kù)的故事可能有點(diǎn)兒夸張,但它的意義在于向我們發(fā)出警示。也許,19 289 名患者的結(jié)果沒(méi)有被記錄下來(lái),正是因?yàn)樗麄兌荚?0 天內(nèi)死亡了。畢竟,如果結(jié)果來(lái)源于患者入院30 天后接受的訪問(wèn),那么,已經(jīng)死亡的患者根本不會(huì)回答問(wèn)題。除非意識(shí)到這種可能性,否則,我們永遠(yuǎn)不會(huì)有患者死亡的記錄。聽(tīng)起來(lái)可能有點(diǎn)兒傻,但是事實(shí)上,這種情況經(jīng)常出現(xiàn)。舉例來(lái)說(shuō),為某類(lèi)接受特定治療的患者確定預(yù)后而建立的模型,要基于先前接受此類(lèi)治療的患者的結(jié)果。但是,如果沒(méi)有足夠的時(shí)間讓先前所有病人都得出結(jié)果,那么會(huì)怎么樣呢?對(duì)那些病人來(lái)說(shuō),其*終結(jié)果將成為未知結(jié)果。所以,僅僅建立在已知結(jié)果的患者數(shù)據(jù)上的模型,可能會(huì)對(duì)我們產(chǎn)生誤導(dǎo)。 類(lèi)似現(xiàn)象也出現(xiàn)在問(wèn)卷調(diào)查上,沒(méi)被回答的問(wèn)卷,才是難題的根源。研究人員通常會(huì)有一份完整的人員名單,列出了他們理想化的答題者。但通常情況下,并不是每個(gè)人都會(huì)回復(fù)問(wèn)卷。如果那些答題的人和沒(méi)有答題的人在某些方面有所不同,那么研究人員有理由懷疑這些統(tǒng)計(jì)數(shù)據(jù)不能完全代表民眾意向。畢竟,如果某雜志向它的訂閱者發(fā)起問(wèn)卷調(diào)查,只問(wèn)一個(gè)問(wèn)題:你會(huì)回復(fù)雜志的調(diào)查問(wèn)卷嗎?即使在所有的回收問(wèn)卷中,100% 的人回答“是”,我們也不能把這種情形解釋為所有訂閱者都回復(fù)了此類(lèi)調(diào)查。前述案例闡明了第1 種類(lèi)型的暗數(shù)據(jù)。我們知道,所有創(chuàng)傷患者的數(shù)據(jù)都存在,盡管這些數(shù)據(jù)沒(méi)有全部被記錄下來(lái)。我們知道,問(wèn)卷調(diào)查的所有對(duì)象都有其答案,盡管他們不一定回復(fù)。也就是說(shuō),我們知道那些數(shù)據(jù)存在確定值,我們只是不知道那些數(shù)值具體是什么。下面要討論另外一種不同類(lèi)型的暗數(shù)據(jù)(第2 種暗數(shù)據(jù):未知的缺失數(shù)據(jù))。許多城市都有路面坑洞問(wèn)題。水流進(jìn)路面的小裂縫,并在冬季結(jié)冰,造成裂縫擴(kuò)大,然后經(jīng)過(guò)汽車(chē)輪胎的碾軋,裂縫進(jìn)一步擴(kuò)大。這會(huì)導(dǎo)致惡性循環(huán),*終在路面上形成由于輪胎和車(chē)軸的碾軋形成的坑洞。波士頓市下決心用現(xiàn)代技術(shù)解決這個(gè)問(wèn)題。他們發(fā)布了一款智能手機(jī)應(yīng)用程序,利用手機(jī)的內(nèi)部加速器來(lái)監(jiān)測(cè)汽車(chē)軋過(guò)路面坑洞時(shí)產(chǎn)生的顛簸,然后利用GPS(全球定位系統(tǒng))把路面坑洞的位置自動(dòng)發(fā)送給城市管理部門(mén),F(xiàn)在,公路維護(hù)人員可以準(zhǔn)確地知道要去哪里修補(bǔ)路面坑洞了。這個(gè)出色的問(wèn)題解決方案,建立在現(xiàn)代數(shù)據(jù)分析技術(shù)的基礎(chǔ)上,不過(guò),它忽略了一個(gè)事實(shí):擁有汽車(chē)和昂貴的智能手機(jī)的人,多集中在富裕地區(qū)。因此,貧困地區(qū)的路面坑洞很可能不會(huì)被發(fā)現(xiàn),它們的位置不會(huì)被發(fā)送出去,一些地區(qū)的路面坑洞可能永遠(yuǎn)無(wú)法得到修復(fù)。這種方法不但沒(méi)有從整體上解決路面坑洞問(wèn)題,甚至可能加劇社會(huì)不平等。這種情況不同于創(chuàng)傷患者案例。在創(chuàng)傷患者案例中,我們明確知道某些數(shù)據(jù)缺失了。而在這里,我們并沒(méi)有意識(shí)到這一點(diǎn)。下面是另外一個(gè)這種類(lèi)型的暗數(shù)據(jù)例子。2012 年10 月下旬,颶風(fēng)“桑迪”5 襲擊了美國(guó)東海岸。當(dāng)時(shí),它造成了美國(guó)歷史上第二大損失,是有記錄以來(lái)*大的大西洋颶風(fēng)!吧5稀痹斐闪舜蠹s750 億美元的損失,導(dǎo)致8 個(gè)國(guó)家共200 多人死亡!吧5稀辈懊绹(guó)24 個(gè)州,從佛羅里達(dá)到緬因、密歇根、威斯康星等,并且導(dǎo)致金融市場(chǎng)因?yàn)殡娏χ袛喽P(guān)閉。它還間接導(dǎo)致了約9 個(gè)月之后的出生率激增。同時(shí),那也是一次現(xiàn)代媒體的勝利。伴隨颶風(fēng)“桑迪”的,是一場(chǎng)實(shí)時(shí)播報(bào)颶風(fēng)情況的Twitter(推特)風(fēng)暴。Twitter 的獨(dú)特意義在于即時(shí)告訴你正在發(fā)生什么事情、事情發(fā)生在哪里以及發(fā)生在誰(shuí)身上。這種社交媒體平臺(tái)是一種實(shí)時(shí)跟進(jìn)事件進(jìn)展的有效手段。這正是颶風(fēng)“桑迪”肆虐期間的寫(xiě)照。從2012 年10 月27 日到2012 年11 月1 日,Twitter 上發(fā)布了超過(guò)2 000 萬(wàn)條播報(bào)颶風(fēng)情況的帖子。很明顯,我們可能會(huì)認(rèn)為,這是一個(gè)理想的平臺(tái),讓我們持續(xù)不斷地了解風(fēng)暴發(fā)展情況,以確定哪些地區(qū)受到了嚴(yán)重影響,哪些地區(qū)需要緊急救援。但是,后來(lái)的分析表明,Twitter 上關(guān)于颶風(fēng)“桑迪”的內(nèi)容,大多數(shù)來(lái)自曼哈頓,只有少量?jī)?nèi)容來(lái)自洛克威、科尼島等區(qū)域。這是否意味著洛克威、科尼島的受災(zāi)情況輕一些?雖然曼哈頓的地鐵和街道都被水淹沒(méi)了,但是,那里并非受災(zāi)*嚴(yán)重的區(qū)域,甚至在整個(gè)紐約范圍內(nèi)也算不上。真相是,之所以某些地區(qū)在Twitter 上發(fā)布的內(nèi)容較少,并不是因?yàn)槟切┑貐^(qū)受災(zāi)較輕,而僅僅是因?yàn)槟抢飺碛兄悄苁謾C(jī)、使用Twitter 的人更少。事實(shí)上,我們可以再次設(shè)想一種極端情況:如果一個(gè)社區(qū)被“桑迪”徹底摧毀了,就根本不會(huì)有任何關(guān)于該社區(qū)的內(nèi)容被發(fā)布在Twitter 上。這種情況反而會(huì)給人一種“那里的每個(gè)人都很好”的印象?梢(jiàn),暗數(shù)據(jù)才是真相。與第1 種類(lèi)型的暗數(shù)據(jù)一樣,第2 種暗數(shù)據(jù),那些我們不知道哪些數(shù)據(jù)缺失了的例子,也是無(wú)處不在的。想想未被發(fā)現(xiàn)的欺詐行為,或者那些未能證明兇案發(fā)生的刑事犯罪調(diào)查。對(duì)于前兩種類(lèi)型的暗數(shù)據(jù),你可能會(huì)有點(diǎn)兒似曾相識(shí)的感覺(jué)。在一次著名的新聞發(fā)布會(huì)上,美國(guó)國(guó)防部前部長(zhǎng)唐納德·拉姆斯菲爾德將它們概括為一句話。他說(shuō):“既有已知的未知,也就是說(shuō),我們知道有些事情我們不知道;也有未知的未知——那些我們不知道自己不知道的東西! 6 拉姆斯菲爾德的話略顯佶屈聱牙,因此頗受媒體嘲諷。但他說(shuō)得很有道理,而且肯定是真的。先前說(shuō)到的這兩種類(lèi)型,只是一個(gè)開(kāi)頭。在接下來(lái)的章節(jié)里,我們將陸續(xù)介紹其他類(lèi)型的暗數(shù)據(jù)。這兩種類(lèi)型加上后面將提到的其他類(lèi)型,就是本書(shū)的全部。正如我們所見(jiàn),暗數(shù)據(jù)具有許多種形式。除非我們意識(shí)到,數(shù)據(jù)可能是不完整的,觀察某一事物并不意味著觀察一切事物,測(cè)量過(guò)程可能是不準(zhǔn)確的,被測(cè)量的東西可能不是我們真正想要測(cè)量的對(duì)象,否則,我們對(duì)當(dāng)下事物的認(rèn)知,很有可能只是一種被嚴(yán)重誤導(dǎo)的表象。沒(méi)有人聽(tīng)見(jiàn)樹(shù)在森林中倒下的聲音,并不意味著沒(méi)有發(fā)出聲音。

暗數(shù)據(jù) 作者簡(jiǎn)介

戴維·漢德(David Hand),倫敦帝國(guó)學(xué)院數(shù)學(xué)榮譽(yù)教授、資深研究員,英國(guó)皇家統(tǒng)計(jì)學(xué)會(huì)前主席,英國(guó)科學(xué)院院士。漢德教授學(xué)術(shù)成就非凡,曾出版著作7部。

暫無(wú)評(píng)論……
書(shū)友推薦
返回頂部
中圖網(wǎng)
在線客服