前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇大數(shù)據(jù)時代概念范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

事實上,大數(shù)據(jù)不是最近才出現(xiàn)的概念。1989年,Gartner提出BI概念。2008年,Gartner將BI概念進(jìn)一步升級為高級分析(Advanced Analytics)。2011年,麥肯錫闡釋大數(shù)據(jù)概念。雖然名稱不同,實質(zhì)沒有變化,只是在處理數(shù)據(jù)方面更大量、多樣、實時。大數(shù)據(jù)的興起離不開近年來技術(shù)生態(tài)土壤的巨大變革。大量數(shù)據(jù)的產(chǎn)生賦予了數(shù)據(jù)處理分析更高的實時性、有效性要求,推動大數(shù)據(jù)技術(shù)發(fā)展。
大數(shù)據(jù)具有前所未有的大量化、快速化和多樣化三大特點,目前,大數(shù)據(jù)在電信、金融、醫(yī)療、零售等領(lǐng)域應(yīng)用價值凸顯,引來投資者對大數(shù)據(jù)的密切關(guān)注。IDC預(yù)計,大數(shù)據(jù)技術(shù)與服務(wù)市場銷售量將從2010年32億美元增長到2015年169億美元,增長率是一般IC市場的7倍。對于如此可觀的一個新市場,無論是國家層面還是大數(shù)據(jù)相關(guān)企業(yè),都應(yīng)該加快布局,積極應(yīng)對:
國家層面,加快大數(shù)據(jù)行業(yè)引導(dǎo)政策出臺。大數(shù)據(jù)技術(shù)領(lǐng)域的競爭,事關(guān)國家安全和未來。在大數(shù)據(jù)領(lǐng)域的落后,意味著失守產(chǎn)業(yè)戰(zhàn)略制高點,意味著數(shù)字無險可守,意味著國家安全將在數(shù)字空間出現(xiàn)漏洞。奧巴馬政府的“大數(shù)據(jù)研發(fā)計劃”,目標(biāo)是改進(jìn)人們從海量和復(fù)雜的數(shù)據(jù)中獲取知識的現(xiàn)有能力,從而加快美國在科學(xué)與工程領(lǐng)域發(fā)明的步伐,增強國家安全,轉(zhuǎn)變現(xiàn)有的教學(xué)和學(xué)習(xí)方式。我國目前已經(jīng)在物聯(lián)網(wǎng)“十二五”規(guī)劃上把信息處理技術(shù)作為4項關(guān)鍵技術(shù)創(chuàng)新工程之一提出來,但還沒有大數(shù)據(jù)方面的專門規(guī)劃和政策支持。將大數(shù)據(jù)上升為國家戰(zhàn)略,加強頂層設(shè)計和政策支持,是大數(shù)據(jù)時代的客觀要求。
關(guān)鍵詞:大數(shù)據(jù)時代;數(shù)據(jù)分析;眾籌模式;云計算
中圖分類號:G223 文獻(xiàn)標(biāo)識碼:A 文章編號:1001-828X(2014)09-0000-01
一、大數(shù)據(jù)的基本概念
維基百科對大數(shù)據(jù)的定義為:大數(shù)據(jù)是指利用常用軟件工具捕獲、管理和處理數(shù)據(jù)所耗時間超過可容忍時間的數(shù)據(jù)集.但大數(shù)據(jù)是一個不斷演變的概念,本文認(rèn)為在移動互聯(lián)與大數(shù)據(jù)時代的背景下,大數(shù)據(jù)的本質(zhì)含義是指數(shù)據(jù)的使用者為達(dá)到商業(yè)目的或政治目的,依據(jù)以往信息猜測未來,對信息進(jìn)行優(yōu)化、高效化并最終捕捉住利益的一種方法。
二、大數(shù)據(jù)時代的挑戰(zhàn)
(一)復(fù)雜的數(shù)據(jù)環(huán)境
大數(shù)據(jù)產(chǎn)業(yè)鏈龐大而復(fù)雜,可以分為六大類(大數(shù)據(jù)基礎(chǔ)設(shè)施類、大數(shù)據(jù)分析類、大數(shù)據(jù)應(yīng)用類、大數(shù)據(jù)數(shù)據(jù)源類、跨基礎(chǔ)設(shè)施分析、開源項目)。來源廣泛、類型復(fù)雜的數(shù)據(jù)環(huán)境使得數(shù)據(jù)源的處理、抽取、集成變得艱難,再加上大數(shù)據(jù)存儲和處理中存在能耗問題又制約著大數(shù)據(jù)的發(fā)展,復(fù)雜程度遠(yuǎn)超過傳統(tǒng)關(guān)系數(shù)據(jù)庫。而且,現(xiàn)實中數(shù)據(jù)模式和數(shù)據(jù)內(nèi)容的動態(tài)演化狀態(tài)以及日益復(fù)雜的硬件環(huán)境會限制行業(yè)專家對數(shù)據(jù)分析、數(shù)據(jù)理解結(jié)果的獲取能力。
(二)大數(shù)據(jù)管理
大數(shù)據(jù)正在變革各行業(yè)的技術(shù)架構(gòu)、商業(yè)模式及組織方式。不同企業(yè)和政府部門掌握不同的數(shù)據(jù),并將數(shù)據(jù)存儲在不同的服務(wù)器上,彼此之間相互不連通,形成一個個“數(shù)據(jù)孤島”。信息時代下,企業(yè)把數(shù)據(jù)看成核心私有財產(chǎn),害怕被竊取復(fù)制而造成如今數(shù)據(jù)的封閉性問題。但大數(shù)據(jù)是通過研究數(shù)據(jù)的相關(guān)性來發(fā)現(xiàn)客觀規(guī)律,這依賴于被研究數(shù)據(jù)的廣泛性。整個數(shù)據(jù)平臺價值的體現(xiàn),需要個體或集體的配合,通過數(shù)據(jù)開放共享、交叉復(fù)用,實現(xiàn)有效的可視化管理,從而獲得最大的數(shù)據(jù)價值。
(三)大數(shù)據(jù)隱私問題
隱私保護(hù)成為大數(shù)據(jù)時代更具挑戰(zhàn)的一大問題。一方面數(shù)據(jù)的公開有利于政府了解國民經(jīng)濟的運作,有利于企業(yè)抓住客戶需求從而提供更加專業(yè)化的產(chǎn)品或服務(wù),也有利于個人對信息的搜索定位。另一方面互聯(lián)網(wǎng)發(fā)展使得人們習(xí)慣將信息以數(shù)據(jù)的形式產(chǎn)生、存儲和傳播,數(shù)據(jù)足跡的累積性和關(guān)聯(lián)性增加了隱性數(shù)據(jù)的暴露性。數(shù)據(jù)公開與隱私保護(hù)的矛盾性,要求大數(shù)據(jù)時代的數(shù)據(jù)挖掘應(yīng)建立在不暴露用戶敏感信息的前提下,避免通過數(shù)據(jù)抽取和集成來實現(xiàn)用戶隱私的獲取。當(dāng)然,個人數(shù)據(jù)處理者對其行為承擔(dān)的責(zé)任感并不突出,這也說明了大數(shù)據(jù)時代的隱私保護(hù)面臨著技術(shù)和人力層面的雙重考驗。
三、大數(shù)據(jù)時代的商機
(一)數(shù)據(jù)分析公司崛起
數(shù)據(jù)分析作為整個大數(shù)據(jù)處理流程的核心,能從異構(gòu)數(shù)據(jù)源中分析產(chǎn)生大數(shù)據(jù)的價值。隨著海量數(shù)據(jù)的出現(xiàn),人們對數(shù)據(jù)的需求越來越明顯,而這需求背后需要進(jìn)行復(fù)雜的分析過程才能獲得有價值的信息。大數(shù)據(jù)時代背景下,傳統(tǒng)分析技術(shù)公司紛紛做出調(diào)整以應(yīng)對多數(shù)據(jù)集和核心數(shù)據(jù)集的實時處理。早在美國就出現(xiàn)了一批數(shù)據(jù)分析公司,而數(shù)據(jù)分析公司的職責(zé)有以下五點:第一,建立數(shù)據(jù)體系,對公司呼叫中心數(shù)據(jù)進(jìn)行監(jiān)控、預(yù)估、深度挖掘與分析;第二,對各種數(shù)據(jù)進(jìn)行持續(xù)的跟蹤分析,以支撐業(yè)務(wù)發(fā)展和策略調(diào)整;第三,定期對業(yè)務(wù)數(shù)據(jù)、開發(fā)過程數(shù)據(jù)進(jìn)行跟蹤并完成各項報表;第四,建立業(yè)績預(yù)測模型,并預(yù)警;第五,對日常數(shù)據(jù)進(jìn)行異常分析,找出原因并及時作出應(yīng)對措施。
大數(shù)據(jù)在金融機構(gòu)的運營中的作用也愈加明顯。金融機構(gòu)紛紛運用大數(shù)據(jù)來擴大市場份額。以銀行為例,在詐騙偵測、風(fēng)險管理、客服中心效率優(yōu)化、客戶分類優(yōu)化產(chǎn)品、客戶流失分析、情感分析、客戶體驗分析七個方面已經(jīng)開始利用大數(shù)據(jù)分析的結(jié)果,為金融機構(gòu)做出明智的決策并創(chuàng)造價值。
(二)數(shù)據(jù)調(diào)查精準(zhǔn)化
以前,數(shù)據(jù)調(diào)查主要靠統(tǒng)計工作者來完成,這個工作量相當(dāng)?shù)凝嫶?,而且在調(diào)查過程中的開支也非常大,然而最終的效果不一定會很理想,因為發(fā)生范圍內(nèi)的誤差還是很正常的,但是大數(shù)據(jù)調(diào)查可以實現(xiàn)對全部數(shù)據(jù)的分析,做到精準(zhǔn)化預(yù)測。例如,通過大數(shù)據(jù)進(jìn)行預(yù)測病情蔓延、數(shù)據(jù)挖掘和分析研究等相關(guān)情況,從而提前做好準(zhǔn)備。另一方面,客戶端服務(wù)器結(jié)構(gòu)和云計算結(jié)構(gòu)的蓬勃發(fā)展,也使得大數(shù)據(jù)在精細(xì)化營銷和運營中起到促進(jìn)作用,進(jìn)而開展更加專業(yè)的服務(wù)。
(三)眾籌模式逐漸形成
眾籌模式作為新模式,利用互聯(lián)網(wǎng)和SNS傳播特性,讓小企業(yè)、藝術(shù)家或個人向公眾籌款項目,進(jìn)而獲得資金援助,追夢網(wǎng)便是利用投資者的資金支持小企業(yè)的典范。當(dāng)然,眾籌的概念并不局限于此,未來的眾籌可以實現(xiàn)眾多消費者決生產(chǎn),通過高度分散透明的互聯(lián)網(wǎng)集資方式,降低項目籌資的資金成本,以眾籌、合作等模式獲取大規(guī)模行業(yè)數(shù)據(jù),并提供面向大眾的數(shù)據(jù)交易、訂閱及應(yīng)用平臺。當(dāng)然,還可以融入智能社會,將眾籌模式和智能發(fā)展緊密結(jié)合,借助移動互聯(lián)網(wǎng)、大數(shù)據(jù)與云計算的融合,建立智能平臺,實現(xiàn)智慧營銷。
四、結(jié)語
大數(shù)據(jù)標(biāo)志一個新時代的到來,它不只是要處理海量數(shù)據(jù)與追求豐富的物質(zhì)資源,更要解決目前所面臨的難題并獲取商機。通過建立模型、深入分析挖掘來尋找那些有可能改變企業(yè)運營方式的信息與價值轉(zhuǎn)換,進(jìn)而展開一場更激烈的信息戰(zhàn)。
參考文獻(xiàn):
[1]陳如明.大數(shù)據(jù)時代的挑戰(zhàn)、價值與應(yīng)對策略[J].移動通信,2012(17).
[2]李永健.大數(shù)據(jù)――中國企業(yè)必須抓住的機遇[J].中國商貿(mào),2013(02).
[3]鄔賀銓.大數(shù)據(jù)時代的機遇與挑戰(zhàn)[J].求是,2013(04).
[4]張光茫.大數(shù)據(jù)時代的思考與啟示――讀涂子沛《大數(shù)據(jù)》[J].水利天地,2012(09).
[5]周震剛.中國大數(shù)據(jù)市場10大預(yù)測[J].通訊世界,2012(10).
[6]閆成印.物聯(lián)網(wǎng)帶動大數(shù)據(jù)發(fā)展[J].互聯(lián)網(wǎng)天地,2012(11).
當(dāng)我看到這本書的名字《塊數(shù)據(jù)》時,我就想我一定要好好閱讀。現(xiàn)今"大數(shù)據(jù)"、"云計算"的聲音不絕于耳時。我了解過大數(shù)據(jù),快速的閱讀了這本《塊數(shù)據(jù)》??偟膩碚f,還是收獲頗多的。原先我了解的不過是大數(shù)據(jù)的應(yīng)用。尤其例如中央電視臺利用大數(shù)據(jù)分析春運人們的流動走向。方便簡單的示意圖就把各個城市的流動量做好統(tǒng)計,簡便的分析出什么地方的客流量大,什么地方的客流量相對較下。這樣很容易做好資源分配工作,極大地解決了歷年讓我們頭疼的春運難的問題,就從這簡單的一點,我們也肯定大數(shù)據(jù)時代要來臨啦!
這本書跟我們系統(tǒng)的解釋了塊數(shù)據(jù)概念,從一個全新的角度來看待大數(shù)據(jù)。第一章講述的是塊數(shù)據(jù)的定義與特征,首先講述什么是大數(shù)據(jù),其次講述‘條數(shù)據(jù)’概念——越長大越孤獨。最后引出‘塊數(shù)據(jù)’的概念。未來的大數(shù)據(jù)時代時的數(shù)據(jù)形式。為我們引領(lǐng)了一種"塊"思維的方式。講述了塊數(shù)據(jù)的三個自我智慧。第二章講述塊數(shù)據(jù)的素描。一是高度關(guān)聯(lián)性。不管什么樣的人,做不同的事都是相關(guān)的。二是立體性。其次,是可以隨時隨地的活性、以人或物的活動主體性、以及塊數(shù)據(jù)的開放性。第三章講述塊數(shù)據(jù)的價值。商業(yè)模式的發(fā)展、社會領(lǐng)域的應(yīng)用、轉(zhuǎn)變政府的職能、改變社會公共文化。第四章講述塊數(shù)據(jù)面臨的挑戰(zhàn)。頂層機制設(shè)計問題、數(shù)據(jù)結(jié)構(gòu)化的挑戰(zhàn)、數(shù)據(jù)安全凸出、公民隱私保護(hù)、行業(yè)重大變革。讓我們體會到塊數(shù)據(jù)的艱辛、挑戰(zhàn)不斷。第五章講述塊數(shù)據(jù)的形成原因。不斷提速的寬帶、各個城市的無線不斷普及、物聯(lián)網(wǎng)的飛速發(fā)展都加劇了塊數(shù)據(jù)的形成。第六章講述了塊數(shù)據(jù)匯聚和處理。例如打造公共平臺、打破數(shù)據(jù)瓶頸、增益數(shù)據(jù)塊價值。第七章講述塊數(shù)據(jù)的開放與市場交易機制的構(gòu)建,使數(shù)據(jù)資深化。第八章講述塊數(shù)據(jù)的商業(yè)應(yīng)用,服務(wù)業(yè)、工業(yè)、農(nóng)業(yè)、文化教育、醫(yī)療健康、就業(yè)創(chuàng)業(yè)、社會保障、交通出行、城市安全等領(lǐng)域。第十章講述政府的治理領(lǐng)域,可以打造一個透明、智慧、法治、有責(zé)任的政府。
本書寫的非常詳細(xì),全面而系統(tǒng)的詮釋了在大數(shù)據(jù)時代下的塊數(shù)據(jù)的形成、集聚、運行模式及塊數(shù)據(jù)的應(yīng)用。將像本書提到的,受摩爾定律驅(qū)動的信息技術(shù)的不斷廉價化、互聯(lián)網(wǎng)的普及以及其延伸所帶來的信息技術(shù)無處不在的應(yīng)用,催生了大數(shù)據(jù)時代的到來。進(jìn)而是信息化進(jìn)入以數(shù)據(jù)的廣泛關(guān)聯(lián)、跨域融合和深度應(yīng)用為特征的智慧化階段。本書從一個新穎的角度——塊數(shù)據(jù),來看待大數(shù)據(jù)以及未來發(fā)展,頗有創(chuàng)意!也發(fā)人思考。
貴州大學(xué)大數(shù)據(jù)與信息工程學(xué)院
通信與信息系統(tǒng)
隨著我國互聯(lián)網(wǎng)的發(fā)展,云計算、物聯(lián)網(wǎng)已成為耳熟能詳?shù)脑~匯;但是對大多數(shù)人只是聽過這些詞匯但是卻不能理解他們的含義。大數(shù)據(jù)時代已成為一個不可阻擋的趨勢,對于圖書館服務(wù)行業(yè)來說是一種機遇也是一種挑戰(zhàn),圖書館行業(yè)的發(fā)展應(yīng)該主動面對這一現(xiàn)狀,應(yīng)該主動面對大數(shù)據(jù)時代所帶來的挑戰(zhàn),積極應(yīng)對。我們都知道現(xiàn)階段數(shù)據(jù)的發(fā)展以冪指數(shù)方程的趨勢發(fā)展,大數(shù)據(jù)時代將成為圖書館行業(yè)發(fā)展的核心,因為它支撐著圖書館在新時期下的發(fā)展。但是面對這一大數(shù)字時代帶來挑戰(zhàn),應(yīng)如何積極的面對,成為圖書館發(fā)展行業(yè)首要考慮的問題。本文主要針對這一問題進(jìn)行討論,望能夠找到有效的解決方案,促進(jìn)圖書館行業(yè)的發(fā)展。
1 什么是大數(shù)據(jù)時代
1.1 大數(shù)據(jù)時代的概念
對于很多人來說,大數(shù)據(jù)時代這一詞匯是很熟悉的,但是對于它的含義確是很陌生的。大數(shù)據(jù)時代其實很難用一個完整的定義,我們通??山忉尀椋捍髷?shù)據(jù)(Big data)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關(guān)系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。大數(shù)據(jù)分析常和云計算聯(lián)系到一起,因為實時的大型數(shù)據(jù)集分析需要像MapReduce一樣的框架來向數(shù)十、數(shù)百或甚至數(shù)千的電腦分配工作。從這大數(shù)據(jù)時代的解析我們能夠看到,大數(shù)據(jù)時代不是單單的一種技術(shù),但是各種信息的綜合體,是一個巨型的資料庫。
最早提出“大數(shù)據(jù)”這一詞匯的是一個全球知名咨詢公司麥肯錫,他表示到:數(shù)據(jù)已滲透到各個領(lǐng)域,成為促進(jìn)社會發(fā)展的重要因素。面對這樣的形式,人們加以合理的利用海量的數(shù)據(jù)資源,將會把世界的發(fā)展推向一個新紀(jì)元。
1.2 大數(shù)據(jù)時代的特點
我們由大數(shù)據(jù)的概念很容易的了解到,它是一個多種數(shù)據(jù)庫的聚合體。有些人就根據(jù)大數(shù)據(jù)的概念將其特點歸結(jié)為一下三點:量大、多樣、實時,有人直接將這三點簡單的成為3V特征(三個特征的首字母都是V開頭,簡稱為3V)。但是我認(rèn)為大數(shù)據(jù)時代的特點除了這三點外還其他的,諸如數(shù)據(jù)價值密度高、處理數(shù)據(jù)快的特點。因此大數(shù)據(jù)時代特點我們可以總結(jié)為:①數(shù)據(jù)量大,也就是說數(shù)據(jù)的體量大,對于體量的衡量我們已經(jīng)不能用傳統(tǒng)的衡量方式了。②種類的多樣性,大數(shù)據(jù)庫的種類包含眾多的行業(yè),多個領(lǐng)域,而且具有文本、圖像、影視等多種樣式,這一特點尤其適用于圖書館的發(fā)展;③更新速度快,也就是我們說的實時性,大數(shù)據(jù)的更新每時每刻都在發(fā)生,保證了數(shù)據(jù)的實時性。④數(shù)據(jù)的價值密度高,涉及到傳輸、決策、感知、控制開放式循環(huán)的大數(shù)據(jù),大量的不相關(guān)信息對未來發(fā)展模式和趨勢的可預(yù)測性分析起著至關(guān)重要的作用。⑤處理速度快,數(shù)據(jù)持續(xù)到達(dá),數(shù)據(jù)分析要求實時處理而非批量式分析。
2 大數(shù)據(jù)時代下圖書館面臨的機遇與挑戰(zhàn)
我們由大數(shù)據(jù)時代的特點可知,隨著大數(shù)據(jù)時代的發(fā)展,處理速度和更新速度使得其利用價值在不斷地上升,在大時代數(shù)據(jù)對圖書館行業(yè)的發(fā)展有著很大的影響。
2.1 大數(shù)據(jù)時代下圖書館面臨著挑戰(zhàn)
在新的時代下要求圖書館服務(wù)行業(yè)要對其圖書館內(nèi)部資料有一個充分的了解,而且這種了解要緊緊跟隨著圖書館內(nèi)部資料的更新不斷改變。傳統(tǒng)的圖書館服務(wù)行業(yè)的特點就是人工管理占很大一部分,數(shù)據(jù)更新速度差,管理效率低下,比較浪費時間;由于人們對知識的渴望,圖書館的作用越來越大;圖書館場地的局限也是一個重要的問題;大數(shù)據(jù)時代的高效性、實時性是傳統(tǒng)的圖書館服務(wù)行業(yè)所不能比擬的,如何在大數(shù)據(jù)時代下更好的發(fā)展圖書館服務(wù)行業(yè)成為一個重要的問題。
2.2 大數(shù)據(jù)時代下圖書館面臨著機遇
其實在大數(shù)據(jù)時代下圖書館的發(fā)展,機遇與挑戰(zhàn)而言,機遇所占的比例不少于挑戰(zhàn)的比例。大數(shù)據(jù)時代下數(shù)據(jù)形式有多樣化、信息更新的實時性、快速的處理速度,大數(shù)據(jù)這些特點都將會促進(jìn)者圖書館服務(wù)行業(yè)的發(fā)展,未來會成為圖書館服務(wù)行業(yè)發(fā)展的核心部分。
3 圖書館行業(yè)應(yīng)該如何應(yīng)對大數(shù)據(jù)時代下的影響
面對大數(shù)據(jù)時代下的機遇與挑戰(zhàn),圖書館服務(wù)不能坐以待斃,應(yīng)該積極的面對挑戰(zhàn),勇于創(chuàng)先,實現(xiàn)機遇利用率的最大化。
3.1 創(chuàng)新圖書館管理方式,提高圖書館的智能化管理水平
傳統(tǒng)圖書館管理模式已不能適應(yīng)快速發(fā)展的社會,對于圖書館的管理,我們應(yīng)該做到與時俱進(jìn)。創(chuàng)新圖書館的管理方式是適應(yīng)社會發(fā)展的必然趨勢。我們可以充分利用大數(shù)據(jù)時代量大、快速、實時的特點,提高圖書館的智能化管理水平。數(shù)字化時代,文獻(xiàn)資源等進(jìn)行數(shù)字化、語義化處理是圖書館進(jìn)行數(shù)據(jù)處理的主要模式,在此基礎(chǔ)上借助網(wǎng)絡(luò)服務(wù),實現(xiàn)數(shù)據(jù)共享,從而最大程度滿足用戶需要。
大數(shù)據(jù)時代的到來可以快速的提升圖書館的服務(wù)水平,大數(shù)據(jù)可以以最快的速度更新圖書館的資源,并對資源進(jìn)行分類,讓人們根據(jù)自己的喜好可以快速的篩選出所需要的種類,節(jié)約借書人時間的同時也減少了圖書館行業(yè)的壓力。
3.2 高度關(guān)注圖書館用戶數(shù)據(jù)和信息
為了迎接大數(shù)據(jù)時代下挑戰(zhàn),要提升圖書館服務(wù)質(zhì)量;我們首先要注重的就是用戶的需求。我們都知道大數(shù)據(jù)內(nèi)的資料很多,但不一定都是客戶們需要的資源。因此我們要做到盡可能的滿足用戶們的需求。
做好用戶們的需求我們就要做好以下幾點:①根據(jù)用戶們的網(wǎng)頁訪問數(shù)量,統(tǒng)計、整理出哪些資源是比較受歡迎的,對其M行大量的收集。②了解用戶的愛好和價值取向,根據(jù)其不同的喜好可以向不同的人群進(jìn)行資料的推薦。
4 總結(jié)
在大數(shù)據(jù)時代下,雖然圖書館服務(wù)行業(yè)受到了很多的挑戰(zhàn),但是同時也遇到了很多的機遇,我們要相信,隨著圖書館服務(wù)行業(yè)的不斷發(fā)展和創(chuàng)新,一定能跟隨時代的潮流,為我們提供更優(yōu)質(zhì)的服務(wù)。
參考文獻(xiàn)
[1]韓翠峰.大數(shù)據(jù)時代圖書館的服務(wù)創(chuàng)新與發(fā)展[J].圖書館.2013(01)
關(guān)鍵詞:大數(shù)據(jù)時代;統(tǒng)計學(xué);發(fā)展
一、大數(shù)據(jù)時代下統(tǒng)計學(xué)概念概述
教科書上對統(tǒng)計學(xué)給出了這樣的定義“有效搜集整理分析隨機性數(shù)據(jù),對考察問題給出推斷與預(yù)測,最終為行動提供數(shù)據(jù)支持”,這就是統(tǒng)計學(xué)。從根本上看,統(tǒng)計學(xué)是一門與數(shù)據(jù)有關(guān)的學(xué)科。眾所周知,美國總統(tǒng)奧巴馬通過數(shù)據(jù)團隊的幫助得到連任的機會,阿里巴巴的馬云很早就把大數(shù)據(jù)作為企業(yè)發(fā)展戰(zhàn)略。隨著我們走進(jìn)大數(shù)據(jù)時代,網(wǎng)絡(luò)科技給搜集數(shù)據(jù)帶來方便,傳統(tǒng)的設(shè)備已經(jīng)無法容納大量的數(shù)據(jù),我們對其進(jìn)行更新,通過對大數(shù)據(jù)的分析,我們?yōu)樯鐣鬟f出有效的、有價值的信息,這一切為社會的發(fā)展起到了不可替代的推動作用。
統(tǒng)計是社會各界乃至各環(huán)節(jié)不可或缺的因素,在商品交換過程中,統(tǒng)計有先導(dǎo)作用,市場經(jīng)濟信息也需要統(tǒng)計學(xué)的幫助,大數(shù)據(jù)時代,我們的統(tǒng)計數(shù)據(jù)不再局限于隨機抽樣調(diào)查,電話調(diào)查等高成本的搜集方式,通過互聯(lián)網(wǎng)及移動終端,我們可以獲得更多數(shù)據(jù)樣本,可以說我們的社會進(jìn)入高速發(fā)展的時期,大數(shù)據(jù)時代下的統(tǒng)計學(xué)也進(jìn)入全新的發(fā)展階段。
二、統(tǒng)計學(xué)在大數(shù)據(jù)時代影響下的變革
1.從樣本的角度看,樣本概念得到深化
我們知道統(tǒng)計學(xué)離不開樣本,有效的樣本能夠正確反映情況,大數(shù)據(jù)時代樣本概念與傳統(tǒng)不再相同,通常我們得到諸多網(wǎng)絡(luò)數(shù)據(jù),一種為靜態(tài),即直接在客戶端創(chuàng)建的數(shù)據(jù),無需提取即可使用,成本低,另一種為動態(tài)數(shù)據(jù),即數(shù)據(jù)隨著時間的推移而變化,最終表現(xiàn)為所有數(shù)據(jù)的總和,可見此時的樣本不局限于隨機抽樣,直接可以做選定分析。
2.從類型方面看,呈擴大之勢
在過去數(shù)據(jù)通常指結(jié)構(gòu)化數(shù)據(jù),有固定的標(biāo)準(zhǔn),大數(shù)據(jù)時代數(shù)據(jù)不僅局限于固定的結(jié)構(gòu),還有異構(gòu)數(shù)據(jù),再有存儲方式也發(fā)生了改變,大數(shù)據(jù)可以直接將探測的信號容納進(jìn)去,由網(wǎng)絡(luò)系統(tǒng)作為工具,可以識別各類結(jié)構(gòu)或非結(jié)構(gòu)的數(shù)據(jù)并進(jìn)行快速存儲。
3.收集概念得到擴展
傳統(tǒng)的統(tǒng)計過程中,我們有目的的進(jìn)行數(shù)據(jù)收集,效率低,成本高,隨著大數(shù)據(jù)時代來臨,我們將收集步驟化,第一預(yù)先處理好數(shù)據(jù)的識別與處理,第二做好分析,提煉出所需要的信息,最后做好存儲,就這么簡單。面對大量的數(shù)據(jù),我們的分析、識別等都需要注意,大數(shù)據(jù)不代表萬能,我們還是要注意數(shù)據(jù)的安全性,盡量控制收集成本。
4.數(shù)據(jù)來源較傳統(tǒng)不同
曾經(jīng)我們根據(jù)研究目的去做統(tǒng)計收集數(shù)據(jù),這些數(shù)據(jù)源都是已知的,在核對方面相對容易。大數(shù)據(jù)時代,我們得到數(shù)據(jù)變得容易,但通過互聯(lián)網(wǎng)收集數(shù)據(jù)后,目的性變?nèi)酰蠖鄶?shù)記錄沒有源頭,很難識別記錄身份,可見,大數(shù)據(jù)時代做好數(shù)據(jù)來源登記開始變得重要。
5.量化方式也發(fā)生變化
對于傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù),量化方式是成熟的,可以將收集到數(shù)據(jù)直接分析得出結(jié)果,大數(shù)據(jù)時代,很多異化結(jié)構(gòu)數(shù)據(jù)幾乎無法做直接分析取得結(jié)論,當(dāng)下,很多結(jié)算及專家在研究處理非機構(gòu)化數(shù)據(jù),力爭將大數(shù)據(jù)時代統(tǒng)計推向新的高端。
6.分析思維發(fā)生改變
從分析過程看,傳統(tǒng)分析需要進(jìn)行三步走,即定性、定量,最終定性。大數(shù)據(jù)時代,統(tǒng)計分析過程僅需要兩步即定量、定性;從證實分析方面看,傳統(tǒng)思路為假設(shè)、驗證,事實證明傳統(tǒng)證實分析有很大誤差,而大數(shù)據(jù)時代,我們的思維為發(fā)現(xiàn),總結(jié),這是整合,發(fā)現(xiàn)最終定論的過程,在此過程中會有很多發(fā)現(xiàn)。
7.統(tǒng)計軟件變得越來越多
傳統(tǒng)統(tǒng)計學(xué)中,我們比較熟悉的軟件有SPSS、SAS、STATA等,大數(shù)據(jù)時代,我們分析技術(shù)為非關(guān)系型,主要以數(shù)據(jù)中心為基礎(chǔ),將軟件與大數(shù)據(jù)結(jié)合,分析過程得到很大簡化。綜上,大數(shù)據(jù)時代給了我們更多的主動權(quán),這些更促使我們推動大數(shù)據(jù)時代統(tǒng)計的發(fā)展進(jìn)步。
三、大數(shù)據(jù)時代下統(tǒng)計學(xué)面臨的挑戰(zhàn)
大數(shù)據(jù)時代給我們帶來了更多的好處,統(tǒng)計學(xué)的大數(shù)據(jù)化是大勢所趨,但傳統(tǒng)與更新的交錯間還有一些不相容的方面,對于革新我們還是要從各個方面做謹(jǐn)慎考慮與慎重調(diào)整。
首先從樣本標(biāo)準(zhǔn)的角度看,大數(shù)據(jù)時代我們可以輕松得到很多樣本,此量大到可以視為總體,隨著互聯(lián)網(wǎng)科技的不斷發(fā)展,大樣本標(biāo)準(zhǔn)也應(yīng)隨著發(fā)展,傳統(tǒng)統(tǒng)計學(xué)將界限定在30,大于30為大樣本,小于30為小樣本,大數(shù)據(jù)時代這個界限略顯低,沒辦法清除干凈干擾信息,這會影響分析結(jié)果,因此,加強數(shù)據(jù)來源的同時還要更新大樣本標(biāo)準(zhǔn),將更大規(guī)模的樣本數(shù)量代替舊有的數(shù)量,以適應(yīng)大數(shù)據(jù)時代的要求。
其次從樣本選取與形式的角度看,傳統(tǒng)統(tǒng)計學(xué)固定結(jié)構(gòu)化數(shù)據(jù)內(nèi)藏著一定的統(tǒng)計規(guī)律,盡管我們能夠發(fā)現(xiàn)研究對象的數(shù)量關(guān)系,但并不是所有的事物都有量化指標(biāo),一些被量化的指標(biāo)也不一定能夠清楚的解讀研究對象,目前大數(shù)據(jù)采集數(shù)據(jù)超過80%為有結(jié)構(gòu)數(shù)據(jù),傳統(tǒng)的統(tǒng)計數(shù)據(jù)庫沒有辦法對這些數(shù)據(jù)做很好的處理,而大數(shù)據(jù)通過建立非結(jié)構(gòu)數(shù)據(jù)庫,對數(shù)據(jù)做有效轉(zhuǎn)化,發(fā)揮多元化分析作用,無形中降低了樣本的選取標(biāo)準(zhǔn),將統(tǒng)計范圍擴大化。
最后統(tǒng)計軟件的開發(fā)是一項挑戰(zhàn)。我們常用的統(tǒng)計軟件主要以構(gòu)建模型之間的變量與數(shù)量關(guān)系的方式分析研究對象,如我們熟悉的SPSS等。大數(shù)據(jù)時代,我們很多以數(shù)據(jù)為基礎(chǔ)做非關(guān)系分析技術(shù),谷歌利用MAPREDUCE實現(xiàn)了月處理400PB數(shù)據(jù)的工作量,雅虎也利用云計算平臺實現(xiàn)了100PB的存儲工作,未來大量的數(shù)據(jù)處理需要更快捷更科學(xué)的軟件,對于軟件的研發(fā)與升級將是一種挑戰(zhàn)。
四、大數(shù)據(jù)時代下統(tǒng)計學(xué)的發(fā)展與機遇
1.大數(shù)據(jù)時代下統(tǒng)計質(zhì)量更高
從國際數(shù)據(jù)標(biāo)準(zhǔn)SDDS中得到的統(tǒng)計質(zhì)量標(biāo)準(zhǔn)可以看到,適用、準(zhǔn)確、時效、平衡是統(tǒng)計質(zhì)量的內(nèi)涵。其中適用是指統(tǒng)計信息符合要求,統(tǒng)計信息最大化的滿足客戶的用途,大數(shù)據(jù)的覆蓋很大程度上促進(jìn)適用功能的提升;傳統(tǒng)角度我們說時效性主要指統(tǒng)計的時間更短,讓客戶及時了解統(tǒng)計信息,大數(shù)據(jù)時代網(wǎng)絡(luò)化完全滿足時效性各類要求;準(zhǔn)確是指估值與真值之間的差別,數(shù)據(jù)中存在誤差在一定范圍內(nèi)屬于正常,大數(shù)據(jù)時代我們的全面性最大程度包容了誤差,也縮小的了誤差,統(tǒng)計更加真實可信;平衡性也被稱之為協(xié)調(diào)性,大數(shù)據(jù)時代,數(shù)據(jù)結(jié)果的核對與檢驗都經(jīng)得起客戶的不斷核查,可以使數(shù)據(jù)的平衡性得到很大提升。
2.大數(shù)據(jù)時代統(tǒng)計成本降低
首先,從數(shù)據(jù)收集角度看,大數(shù)據(jù)時代可以不再依靠人力做電話調(diào)查或問卷調(diào)查,甚至有些普查動用全國力量,耗費大量人力財力,通過互聯(lián)網(wǎng)、移動通信等,我們大大降低人力成本,數(shù)據(jù)收集快,成本低,準(zhǔn)確性也高;其次從數(shù)據(jù)利用角度看,傳統(tǒng)統(tǒng)計過程中,一旦資料過期就需要再起啟動抽樣分析過程,對外公布手段也有局限性,大數(shù)據(jù)時代,我們收集數(shù)據(jù)更輕松,且數(shù)據(jù)可多次被利用,綜合比算,數(shù)據(jù)的成本大大降低。
3.大數(shù)據(jù)時代統(tǒng)計學(xué)作用范圍擴大
傳統(tǒng)統(tǒng)計學(xué)有各種局限性,比如受成本、觀念等影響,統(tǒng)計學(xué)主要用于行業(yè)與部分統(tǒng)計,隨著大數(shù)據(jù)時代的來臨,統(tǒng)計學(xué)被應(yīng)用到各行各業(yè),比如、金融、醫(yī)學(xué)、計算機行業(yè)等,從這個角度看,社會的新計劃讓信息傳遞發(fā)生質(zhì)變,統(tǒng)計學(xué)作用價值得到認(rèn)可并服務(wù)擴大,這樣推動自身發(fā)展的同時更服務(wù)社會服務(wù)人民,為整個國家發(fā)展進(jìn)步起到不可估量的作用。
參考文獻(xiàn)