91在线免费看_2021午夜国产精品福利_国产视频精品视频_1024cl地址一地址二地址三2019

第1節(jié) 定律思維

大數(shù)據(jù)中潛伏著很多潛在的規(guī)律,只有找到這些規(guī)律,大數(shù)據(jù)才有價(jià)值。建設(shè)新數(shù)據(jù)時(shí)代和平臺(tái)的必要手段,就是通過(guò)積累數(shù)據(jù),預(yù)測(cè)提升服務(wù)和管理水平來(lái)實(shí)現(xiàn)。

此前,在大數(shù)據(jù)中,有兩個(gè)較為突出的定律:一秒定律或秒級(jí)定律和摩爾定律。

什么叫一秒定律或秒級(jí)定律呢?指的是對(duì)處理速度有要求,一般要在秒級(jí)時(shí)間給出準(zhǔn)確的分析結(jié)果。如果時(shí)間過(guò)長(zhǎng),就會(huì)失去原有的“一秒定律或秒級(jí)定律”的價(jià)值。也正是這個(gè)速度要求,才區(qū)分出大數(shù)據(jù)挖掘技術(shù)和傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)的不同。

那什么叫摩爾定律呢?指的是簡(jiǎn)單地評(píng)估出半導(dǎo)體技術(shù)進(jìn)展的經(jīng)驗(yàn)法則,其重要的意義是對(duì)于長(zhǎng)期來(lái)說(shuō)的,IC制程技術(shù)是以一直線的方式向前推展,使得IC產(chǎn)品能持續(xù)降低成本,增加功能和提升性能。

1998年,臺(tái)灣積體電路制造公司董事長(zhǎng)張忠謀曾說(shuō)過(guò):摩爾定律在過(guò)去30年是非常有效的,在未來(lái)10~15年也依然適用。但很快,就有新的研究結(jié)果推翻了他的言論。研究發(fā)現(xiàn),摩爾定律的時(shí)代將會(huì)結(jié)束。由于研究和實(shí)驗(yàn)室的成本需求非常高昂,而有財(cái)力投資在創(chuàng)建和維護(hù)芯片工廠的企業(yè)少之又少。再加上,制程越來(lái)越接近半導(dǎo)體的物理極限,將很難再縮小化。

大數(shù)據(jù)時(shí)代正在聚集改變的能量,其定律也在發(fā)生著一定的變化。社科院世界經(jīng)濟(jì)與政治研究所副所長(zhǎng)何帆在一次講座中,曾說(shuō)過(guò)這樣的話(huà):

大數(shù)據(jù)時(shí)代,人們更要重視統(tǒng)計(jì)學(xué)。比如說(shuō),隨著大數(shù)據(jù)時(shí)代的來(lái)臨,人們開(kāi)始重視大數(shù)據(jù),要重視統(tǒng)計(jì)學(xué)。可當(dāng)數(shù)據(jù)變得足夠強(qiáng)大后,人們突然發(fā)現(xiàn),社會(huì)上的一切現(xiàn)象都是有一定的統(tǒng)計(jì)規(guī)律的。它無(wú)法像物理學(xué)可以準(zhǔn)確地描述出前后的因果關(guān)系,而只是一個(gè)統(tǒng)計(jì)的規(guī)律。關(guān)于這點(diǎn),有人就玩笑似的說(shuō)過(guò):只要統(tǒng)計(jì)學(xué)學(xué)好了,再去學(xué)別的都戰(zhàn)無(wú)不勝,因?yàn)樯鐣?huì)上的一切現(xiàn)象都有一個(gè)統(tǒng)計(jì)規(guī)律。

與此同時(shí),有人就覺(jué)得疑問(wèn):為什么要強(qiáng)調(diào)統(tǒng)計(jì)學(xué)呢?那是因?yàn)槿藗冊(cè)谡J(rèn)知能力中,統(tǒng)計(jì)思維算是最差勁的。要知道,人的大腦中有一些功能比較優(yōu)良,甚至超過(guò)人們自身的想象,比如人們的語(yǔ)言能力。著名的語(yǔ)言學(xué)家喬姆斯基就曾經(jīng)說(shuō)過(guò):“語(yǔ)言不是你學(xué)來(lái)的,而是你天生就會(huì)的。要是從一出生,開(kāi)始學(xué)語(yǔ)言的話(huà),那是根本學(xué)不會(huì)的。事實(shí)上,一個(gè)人在出生的時(shí)候,大腦中就已經(jīng)預(yù)裝了一套操作系統(tǒng),那就是語(yǔ)言的操作系統(tǒng)。因此可以說(shuō),語(yǔ)言是人們天生就會(huì)的。再比如,人們察言觀色的能力,也是天生就會(huì)的,但有一些是人們不會(huì)或不愿意學(xué)的!

諾貝爾經(jīng)濟(jì)學(xué)的美國(guó)心理學(xué)家丹尼爾·卡尼曼寫(xiě)過(guò)一本書(shū),書(shū)名是《思考,快與慢》。在這本書(shū)中,有這樣的言論,大致意思是說(shuō):人有很多思維都是靠直覺(jué)的快思維,這是人們經(jīng)過(guò)數(shù)百年、千年慢慢演化而來(lái)的,最終被留下和被記憶的直接感受,就是所謂的第六感覺(jué)。舉個(gè)例子:當(dāng)一個(gè)人在深夜行走時(shí),會(huì)敏銳地察覺(jué)到周邊的變化。一旦感受到危險(xiǎn)或不安的情緒時(shí),就會(huì)立即逃跑,甚至大喊大叫。而與此同時(shí),人的大腦之中還有另外一套操作系統(tǒng),是用來(lái)做邏輯推理以及進(jìn)行統(tǒng)計(jì)分析的,只是這個(gè)系統(tǒng)不怎么完善。于是,人們天生就缺乏邏輯推理能力和統(tǒng)計(jì)思維能力。

所以,在大數(shù)據(jù)飛速發(fā)展的今天,人們應(yīng)該鍛煉自己的邏輯推理能力和統(tǒng)計(jì)思維能力!

為什么大數(shù)據(jù)變成了一個(gè)最熱門(mén)的詞匯?能夠讓大數(shù)據(jù)變成一個(gè)熱門(mén)詞匯,主要的原因有兩個(gè)。

第一個(gè)原因是,由于IT革命后,人們有了處理數(shù)據(jù)的多方面能力,有對(duì)計(jì)算機(jī)數(shù)據(jù)的處理能力、對(duì)計(jì)算機(jī)的存儲(chǔ)能力以及對(duì)計(jì)算機(jī)的計(jì)算的能力,等等。再加上,人類(lèi)儲(chǔ)存信息量的增長(zhǎng)速度要比世界經(jīng)濟(jì)增長(zhǎng)的速度快四倍(這僅僅是在金融危機(jī)爆發(fā)之前的世界經(jīng)濟(jì)增長(zhǎng)的速度)。而計(jì)算機(jī)數(shù)據(jù)處理能力的增長(zhǎng)速度,要比世界經(jīng)濟(jì)增長(zhǎng)的速度快九倍。

第二個(gè)原因是,社會(huì)上的一切現(xiàn)象以及企業(yè)的發(fā)展,能夠被數(shù)據(jù)化的東西越來(lái)越多。在最早時(shí),僅僅是數(shù)字可以被數(shù)據(jù)化,于是就有了阿拉伯的計(jì)數(shù),后來(lái)又出現(xiàn)了二進(jìn)位,再后來(lái)人們發(fā)現(xiàn)文字也可以處理成數(shù)據(jù),于是又發(fā)現(xiàn)圖像也可以處理成數(shù)據(jù)。比如,有人要去旅行,但是不知道要去的地方的具體位置和周邊的信息,那就可以利用搜索引擎搜索;當(dāng)人們?cè)谂c微信中的朋友聊天,用微博分享一天的見(jiàn)聞……就已經(jīng)被數(shù)據(jù)化了。因此,這就是為什么現(xiàn)在要談大數(shù)據(jù)時(shí)代,那是因?yàn)榇髷?shù)據(jù)能夠處理和分析的東西太多了,多到人們無(wú)可預(yù)計(jì)。

社科院世界經(jīng)濟(jì)與政治研究所副所長(zhǎng)何帆說(shuō):“當(dāng)你能夠被數(shù)據(jù)化的東西越來(lái)越多,當(dāng)你能夠拿到的數(shù)據(jù)越來(lái)越多時(shí),就跟原來(lái)不一樣了。原來(lái)的統(tǒng)計(jì)學(xué)得有一個(gè)抽樣,因?yàn)槟悴豢赡苣玫秸w,因?yàn)檎w太多了,而且無(wú)法去計(jì)算。而現(xiàn)在,當(dāng)存儲(chǔ)能力無(wú)限擴(kuò)大,處理數(shù)據(jù)的計(jì)算能力不斷進(jìn)步,致使現(xiàn)在我們所處理的往往不是一個(gè)樣本數(shù)據(jù),而是一個(gè)整體的數(shù)據(jù)。”

不僅如此,何帆還總結(jié)出了大數(shù)據(jù)的三個(gè)規(guī)律:第一個(gè)規(guī)律是知其然而不必知其所以然,外行打敗內(nèi)行;第二個(gè)規(guī)律是徹底的價(jià)格歧視,商家比你更了解你自己;第三個(gè)規(guī)律是打破專(zhuān)家的信息優(yōu)勢(shì),病人給醫(yī)生解惑。

關(guān)于第一個(gè)規(guī)律,他先舉了一個(gè)葡萄酒的案例—如何品葡萄酒。

在以往,靠品酒方面的專(zhuān)家拿起葡萄酒時(shí),會(huì)先聞一聞,準(zhǔn)確說(shuō)出酒的什么味道、富有什么樣的香味。接著,品酒專(zhuān)家會(huì)看是不是掛杯。最后,他會(huì)準(zhǔn)確地說(shuō)出:葡萄酒的產(chǎn)地,大約是什么年份的。但是,當(dāng)品酒師在品新酒的時(shí)候,由于葡萄酒真正的品質(zhì)還沒(méi)有形成,因此,他的鑒定是不那么準(zhǔn)確的。此外,當(dāng)一個(gè)品酒師的聲譽(yù)越來(lái)越高的時(shí)候,由于要顧及自己聲譽(yù)和名望,所以在大多情況下,他不敢做大膽的推測(cè)和判斷。

在普林斯頓大學(xué),有一位經(jīng)濟(jì)學(xué)家很喜歡收藏葡萄酒。有一天,他想試試自己能不能預(yù)測(cè)出某年某地的葡萄酒品質(zhì)如何,于是,他就去查找大量的數(shù)據(jù),經(jīng)過(guò)分析和研究后得出一個(gè)秘訣—葡萄酒的品質(zhì)與冬天的降雨量、收獲季節(jié)的降雨量、生長(zhǎng)期的平均氣溫、土壤的成分等因素有關(guān)。1989年,葡萄酒的新酒剛剛下來(lái),他就大膽預(yù)測(cè):今年的葡萄酒是世紀(jì)佳釀。在1990年,他又大膽地預(yù)測(cè)出:今年的葡萄酒比1989年的好。要知道,一般的品酒師都不敢如此判斷,但他卻如此大膽,因而著實(shí)為自己帶來(lái)了一些非議。不過(guò)事實(shí)證明,他說(shuō)的完全正確!

有句話(huà)叫:要知其然,還要知其所以然。但是在大數(shù)據(jù)時(shí)代,人們可以知其然,卻不一定非要知其所以然。如果你去問(wèn)普林斯頓大學(xué)的教授:為什么說(shuō)這個(gè)酒好?這個(gè)酒到底有什么香味?酒回甘是什么?他未必會(huì)說(shuō)得很清楚。但是他能夠知其然,所以才能夠大膽地做判斷。這是為什么呢?這或許是人們以往的認(rèn)知里,執(zhí)意去要尋找一些線性的、雙邊的直接因果關(guān)系,而忽略了其他方面的東西。而人們忽略的方面,恰恰又是最需要的。事實(shí)告訴人們:萬(wàn)物之間的聯(lián)系比人們想象中的要復(fù)雜得多,它可能是非線性的,也可能是多元化的。所以說(shuō),出問(wèn)題的不是大數(shù)據(jù),而是人們?cè)瓉?lái)的認(rèn)知模式。那么,在這個(gè)時(shí)候,人們?cè)趺崔k呢?最佳的辦法,就是退而求其次,要先去尋找相關(guān)關(guān)系,再去找是否有因果關(guān)系。

第二個(gè)規(guī)律,是徹底的價(jià)格歧視。商家比你更了解你自己,他也有著自己的見(jiàn)解。比如說(shuō),一個(gè)機(jī)構(gòu)是專(zhuān)門(mén)做信用卡的刷卡記錄的,當(dāng)他們積累了大量的數(shù)據(jù)后,經(jīng)過(guò)分析和處理,就會(huì)找到很多規(guī)律。再比如,一個(gè)人的離婚與否,和信用卡上的還款記錄以及駕駛車(chē)輛出車(chē)禍的概率有一定關(guān)系。這還真是個(gè)奇怪的規(guī)律。在大數(shù)據(jù)時(shí)代,比較有名的規(guī)律就是:尿布和啤酒的銷(xiāo)售量有一定的關(guān)系。啤酒和尿布怎么會(huì)聯(lián)系在一起?市場(chǎng)調(diào)查人員經(jīng)過(guò)一番調(diào)查后才發(fā)現(xiàn):原來(lái)當(dāng)有新生兒出世后,買(mǎi)尿布的這個(gè)任務(wù)就給新爸爸了。盡管新生的寶貝出世以后,爸爸親手照顧孩子的機(jī)會(huì)并不多,但他也有一種自豪感。在去買(mǎi)尿布的時(shí)候,為了慶祝,他會(huì)順手去買(mǎi)啤酒。如果店家在尿布貨架的旁邊直接擺上啤酒,啤酒的銷(xiāo)量就會(huì)提高;專(zhuān)門(mén)賣(mài)母嬰用品的部門(mén)會(huì)搜集一些顧客的信息,然后分析研究得出一些結(jié)論。比如,一位女性大約在什么時(shí)間段會(huì)懷孕,她可能會(huì)買(mǎi)更多的母嬰用品以及一些營(yíng)養(yǎng)品,甚至?xí)?gòu)買(mǎi)一些沒(méi)有香味的洗發(fā)劑,最后預(yù)測(cè)出潛在的客戶(hù)到底在哪里。

可以說(shuō),在大數(shù)據(jù)時(shí)代,一切預(yù)測(cè)和分析都動(dòng)搖了人們以往的方法論。原來(lái)經(jīng)濟(jì)學(xué)里說(shuō)過(guò),商家不能搞價(jià)格歧視。這不是從道義上來(lái)說(shuō),而是因?yàn)椋谶^(guò)去,商家很難對(duì)不同的顧客進(jìn)行價(jià)格歧視,所以要制定統(tǒng)一的價(jià)格。不過(guò),這是過(guò)去的規(guī)律,在大數(shù)據(jù)的時(shí)代,這個(gè)規(guī)律被徹底顛覆。在大數(shù)據(jù)的時(shí)代,商家可以針對(duì)每一個(gè)個(gè)體的消費(fèi)者定價(jià),因?yàn)樗认M(fèi)者更了解消費(fèi)者自身的行為。比如說(shuō),某天你會(huì)收到一條信息,說(shuō)是你的車(chē)很久沒(méi)去做保養(yǎng)了,希望你能夠重視這件事,并快去店里給愛(ài)車(chē)做保養(yǎng)并消費(fèi);在你準(zhǔn)備去旅行,搜索旅行資料時(shí),一些旅行社就會(huì)給你打電話(huà),給你推薦適合你的旅行方案。此時(shí),你肯定會(huì)感到疑問(wèn):他們?cè)趺粗肋@些事?或者,他們?cè)趺磿?huì)這么了解你的狀態(tài)?其實(shí),這都是大數(shù)據(jù)在幫他們的忙。能夠合理運(yùn)用大數(shù)據(jù)的商家,都是一個(gè)合格的“偷心”者,會(huì)抓住你的喜好,然后偷走你的“心”。

第三個(gè)規(guī)律,就是打破專(zhuān)家的信息優(yōu)勢(shì),病人給醫(yī)生解惑。在這個(gè)規(guī)律中,社科院世界經(jīng)濟(jì)與政治研究所副所長(zhǎng)何帆說(shuō):“我們接著再講一個(gè)案例,電視連續(xù)劇《豪斯醫(yī)生》的醫(yī)學(xué)顧問(wèn)是紐約時(shí)報(bào)的一位專(zhuān)欄作家。他是倡導(dǎo)尋證醫(yī)學(xué)的一個(gè)代表人物,尋證醫(yī)學(xué)就是根據(jù)證據(jù)來(lái)治病。過(guò)去看病時(shí),要先研究病理學(xué),再研究治療辦法,而且有很多是一代一代口傳下來(lái)的。老師告訴我們說(shuō),維生素B12口服的效果不好,必須打針。為什么?不知道,反正是當(dāng)年,老師的老師就是這么告訴老師的。所以,你的老師也這么告訴你,你就這么再告訴你的學(xué)生。但是后來(lái)發(fā)現(xiàn),這里頭有很多問(wèn)題!

的確,這也是醫(yī)患之間的糾紛如此之多的原因之一。實(shí)際上,醫(yī)院的誤診比例是比較高的。在美國(guó),有一份研究稱(chēng):美國(guó)醫(yī)院誤診比例是1/3,有20%的人由于誤診死亡。為什么醫(yī)院的誤診概率會(huì)如此之高?那是因?yàn)椋哼^(guò)去的一些醫(yī)生在治療中完全靠經(jīng)驗(yàn),有很多想法和判斷都是主觀的。確實(shí),醫(yī)學(xué)并不是一門(mén)科學(xué),而是一個(gè)個(gè)復(fù)雜的生命體,醫(yī)生沒(méi)辦法精確到把每一位病人治好。后來(lái),醫(yī)生也開(kāi)始另辟蹊徑,通過(guò)數(shù)據(jù)找出規(guī)律。很快,在19世紀(jì),就有一位醫(yī)生發(fā)現(xiàn)這樣的一個(gè)規(guī)律:如果醫(yī)生先去了停尸房,再回來(lái)給產(chǎn)婦接生的話(huà),那產(chǎn)婦的死亡率就會(huì)增高。而醫(yī)生在清潔手以后再接生的話(huà),產(chǎn)婦的死亡率就會(huì)下降。在那個(gè)時(shí)代,人們還不知道細(xì)菌和病菌的危害,只知道在手術(shù)前后都要洗手。當(dāng)然,也沒(méi)有哪個(gè)病理學(xué)能夠告訴醫(yī)生“洗手跟降低死亡率有很大的關(guān)系”。慢慢地,病人的死亡率大幅度下降。而這,就是尋找依據(jù)的思路,減少醫(yī)生的自主權(quán)利,讓一切變得有規(guī)律起來(lái)。

由于互聯(lián)網(wǎng)的存在,再加上大數(shù)據(jù)的幫助,有時(shí),病人對(duì)病情的掌握程度比醫(yī)生還要高。

在美國(guó)曾有這樣的一個(gè)報(bào)道:有個(gè)病人被推到病房里頭后,一群醫(yī)生對(duì)他會(huì)診,經(jīng)過(guò)一番研究后,醫(yī)生們都說(shuō)不出個(gè)所以然來(lái)。最后,當(dāng)主治醫(yī)生問(wèn)這個(gè)病人“你認(rèn)為自己得的是什么病”的時(shí)候,病人立即回答:我這個(gè)病就是IPEX!對(duì)此,醫(yī)生很是疑問(wèn),就問(wèn)病人是怎么知道的。病人說(shuō)很簡(jiǎn)單,“我只是將自己的癥狀在搜索引擎中一搜,就知道了”。

相信有不少人聽(tīng)到這個(gè)結(jié)果時(shí),啼笑皆非。醫(yī)生都不知道的病情和結(jié)果,病人竟能準(zhǔn)確地說(shuō)出來(lái)。可見(jiàn),大數(shù)據(jù)有強(qiáng)大的傳播和分析能力。在以往,醫(yī)生能夠治病,是因?yàn)樗兄鴮?zhuān)業(yè)的知識(shí)、專(zhuān)業(yè)的見(jiàn)解以及實(shí)踐性。而現(xiàn)在,除了實(shí)踐性以外,病人也會(huì)知道很多信息。當(dāng)遇到一些庸醫(yī)時(shí),你完全可以拿著自己打印出來(lái)的資料跟他說(shuō):“你的診斷錯(cuò)了,根據(jù)我的癥狀看,應(yīng)該是這個(gè)病,而不是你所說(shuō)的那個(gè)病!边@完全顛覆了原來(lái)信息不對(duì)稱(chēng)的情況。所以,大數(shù)據(jù)時(shí)代的第三個(gè)規(guī)律就是打敗、打破了專(zhuān)家的信息優(yōu)勢(shì)。

最后,何帆還說(shuō):“對(duì)于大數(shù)據(jù),很多企業(yè)都認(rèn)為,擁有大量的數(shù)據(jù)才是獲得價(jià)值的根本。然而,事實(shí)并非如此,擁有大數(shù)據(jù)思維,遠(yuǎn)比大量的數(shù)據(jù)更有價(jià)值,這才是大數(shù)據(jù)的王牌定律!

最新書(shū)評(píng) 查看所有書(shū)評(píng)
發(fā)表書(shū)評(píng) 查看所有書(shū)評(píng)
請(qǐng)自覺(jué)遵守互聯(lián)網(wǎng)相關(guān)的政策法規(guī),嚴(yán)禁發(fā)布色情、暴力、反動(dòng)的言論。
評(píng)價(jià):
表情:
用戶(hù)名: 密碼: 驗(yàn)證碼: