婷婷超碰在线在线看a片网站|中国黄色电影一级片现场直播|欧美色欧美另类少妇|日韩精品性爱亚洲一级性爱|五月天婷婷乱轮网站|久久嫩草91婷婷操在线|日日影院永久免费高清版|一级日韩,一级鸥美A级|日韩AV无码一区小说|精品一级黄色毛片

首頁 > 文章中心 > 正文

大數(shù)據(jù)時代統(tǒng)計學發(fā)展研究

前言:本站為你精心整理了大數(shù)據(jù)時代統(tǒng)計學發(fā)展研究范文,希望能為你的創(chuàng)作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

大數(shù)據(jù)時代統(tǒng)計學發(fā)展研究

統(tǒng)計學在現(xiàn)實的生活中應用十分廣泛,以至于如今很多人把統(tǒng)計學的范圍擴展為用數(shù)據(jù)表示的現(xiàn)象。在如今的經(jīng)濟發(fā)展中一些金融分析師會利用一系列的數(shù)據(jù)對客戶提供咨詢服務,證券分析師可以利用數(shù)據(jù)來分析股市的信息,然后對股市的行情進行預測。在與我們息息相關的農(nóng)業(yè)領域,水稻的產(chǎn)量以及有機物的培養(yǎng)環(huán)境都可以利用數(shù)據(jù)進行探究。以上都是與我們相關的實例,這些實例都是與統(tǒng)計學分不開的,這些實例都是統(tǒng)計學中的應用實例??傊y(tǒng)計學的運用可以貫穿各行各業(yè)。統(tǒng)計學的發(fā)展與大數(shù)據(jù)之間有著很密切的關系。如今隨著信息時代的發(fā)展,很多信息都是利用數(shù)字來進行表述的,因此可以看出來數(shù)據(jù)其實就是信息的載體,也是數(shù)據(jù)學分析的對象,如今的統(tǒng)計學工作實際就是收集數(shù)據(jù)、整理數(shù)據(jù)、分析數(shù)據(jù)、解釋數(shù)據(jù)。如果沒有數(shù)據(jù)統(tǒng)計學就像植物失去土壤一樣難以存在,同樣離開了統(tǒng)計學以后,數(shù)據(jù)就會顯得沒有意義。數(shù)據(jù)在如今的大環(huán)境下變得越來越廣泛,其增長也是漫無邊際的。隨著社會的不斷發(fā)展,以及信息時代的不斷進步,人們開始意識到了數(shù)據(jù)的重要性。目前最為實用的數(shù)據(jù)很多,不但可以提高生產(chǎn)力的發(fā)展水平,還能夠利用數(shù)據(jù)的分析來解決國家的民生問題,因此這種大數(shù)據(jù)下的統(tǒng)計學發(fā)展十分重要。

一、大數(shù)據(jù)時代的內(nèi)涵及其意義

(一)大數(shù)據(jù)時代的內(nèi)涵

大數(shù)據(jù)其實就是一個大樣本和高維便利的數(shù)據(jù)集合,針對一些樣本的問題,利用統(tǒng)計學原理進行抽樣、分析,來達到所需要的精度,但是對于一些維數(shù)高的問題需要運用統(tǒng)計學原理進行選擇降維、壓縮、分解。從另一種角度講大數(shù)據(jù)包含很多方面,它是多領域的數(shù)據(jù)綜合,其中包含自然科學、人文科學等一系列的混合數(shù)據(jù),各個學科之間進行融會貫通,相互穿插。一些傳統(tǒng)的統(tǒng)計學方法只適合分析單個計算機的數(shù)據(jù)存儲,然而目前的大數(shù)據(jù)環(huán)境下改變了這一現(xiàn)象。如今大數(shù)據(jù)環(huán)境下包括了數(shù)據(jù)流環(huán)境、磁盤存儲環(huán)境、分布存儲環(huán)境、多線條環(huán)境等。目前大數(shù)據(jù)環(huán)境下最主要的目的就是把數(shù)據(jù)轉變?yōu)槿藗內(nèi)菀锥玫闹R,來探索數(shù)據(jù)產(chǎn)生的源頭和機制,從而制定相應的對策。由于要把信息轉變?yōu)橹R需要一個漫長的時間,因此如今有很多人搜集當今社會的大量的數(shù)據(jù)存放在相應的存儲器中,甚至有些人并不知道如何去分析所搜集的數(shù)據(jù),但是他們把這些數(shù)據(jù)當成一段發(fā)展的歷史,把如今高速發(fā)展的過程記錄下來,供以后應用。

(二)大數(shù)據(jù)時代給社會帶來的變革

如今大數(shù)據(jù)環(huán)境下給人們帶來了很大的變革,目前各行各業(yè)的勞動者們都開始利用研究問題來驅動搜集數(shù)據(jù),利用搜集來的數(shù)據(jù)進行分析來解決問題。因此以這種發(fā)展的趨勢可以看出,在以后人們會慢慢地利用搜集數(shù)據(jù)來驅動問題的解決,就像我們出門查天氣、查交通一樣,未來的勞動者們會通過大數(shù)據(jù)的分析來決策一些研究性的問題?,F(xiàn)在國內(nèi)外很多統(tǒng)計學專家、甚至一些大學教授都開始利用計算機中相應的軟件來搜索、分析一些研究性成果。在古希臘哲學家是百科全書式的人物,在文藝復興時期開始細化了一些單一科學的科學家。如今大數(shù)據(jù)時代勢必會再次產(chǎn)生百科全書式的人物,大數(shù)據(jù)將慢慢地減弱專家在各個領域的影響,甚至導致專家的消亡,比如,現(xiàn)在很多統(tǒng)計學家、物理學家、計算機專家等開始利用他們敏銳的數(shù)據(jù)處理和分析能力進入生命科學界,在以后假如我們有成千上萬本書和它的外文譯本,即使我們不懂外文也能夠通過一些翻譯軟件進行翻譯,把它翻譯成我們懂得的語言,大數(shù)據(jù)中包含很多數(shù)據(jù)集,為我們以后的生活提供很大的便利。

二、大數(shù)據(jù)的研究動向、信息問題

(一)研究動向

目前美國一些機構開始提出了大數(shù)據(jù)環(huán)境下的一些挑戰(zhàn)性的問題,即處理高度分布的數(shù)據(jù)資源,追蹤數(shù)據(jù)的來源以及核實數(shù)據(jù)、處理樣本等。他們開始把數(shù)據(jù)處理的方式進行改進,開發(fā)并行和分布式的算法。我國也十分重視大數(shù)據(jù)科學的發(fā)展,國家多次組織召開會議探討大數(shù)據(jù)科學發(fā)展的前景,并且設立了大數(shù)據(jù)專項研究計劃。國家自然科學基金的一些專項科學項目開始設立,在業(yè)界以及一些咨詢公司都在尋找大數(shù)據(jù)合作的機會。大數(shù)據(jù)的分析需要多個領域進行結合,已經(jīng)不是單一的一個科學領域,統(tǒng)計學家不但要認真研究計算機的實時決策還要把計算機與統(tǒng)計學的相關知識進行緊密的結合。相反計算機專家也要時刻了解統(tǒng)計學的相關知識。

(二)大數(shù)據(jù)的信息問題

隨著大數(shù)據(jù)信息時代的到來,人們也不斷地對大數(shù)據(jù)進行探究。由于大數(shù)據(jù)中不只是包含一種數(shù)據(jù),它是很多數(shù)據(jù)的一個集合體。為了能夠把搜集到了各個方面的數(shù)據(jù)融合起來,必須對數(shù)據(jù)的來源以及數(shù)據(jù)的獲取方式進行探究,利用這些探究的結果來進行數(shù)據(jù)的分析。如今數(shù)據(jù)的來源一般都是多方面、多渠道的,難免會產(chǎn)生較大的誤差,這樣也就產(chǎn)生了一些問題,比如數(shù)據(jù)搜集的準則與決策不相符,甚至有些數(shù)據(jù)根本不是原始搜集的數(shù)據(jù),而是經(jīng)過分析推斷而來的數(shù)據(jù),這種數(shù)據(jù)更會產(chǎn)生較大的誤差。由于數(shù)據(jù)的量是非常大的,然而并不是數(shù)據(jù)量越大所包含的信息就越多,如果所獲的數(shù)據(jù)中含有一些偏差較大的信息,就會破壞原始的數(shù)據(jù),因此從這一方面我們應該意識到在數(shù)據(jù)的搜集過程中應該避免得到一些破壞性的信息。在大數(shù)據(jù)時代中會產(chǎn)生一些缺失的數(shù)據(jù),數(shù)據(jù)的缺失難免會對數(shù)據(jù)的分析產(chǎn)生影響,不同的研究搜集的數(shù)據(jù)會有一些重疊的部分,比如經(jīng)濟、社會、保險、醫(yī)學等研究的問題不同,搜集的變量和集合不相同,但是他們肯定會有一些共同用處的數(shù)據(jù)。在對數(shù)據(jù)進行分析時,其中有2種數(shù)據(jù)需要進行具體的分析,一類是觀察的數(shù)據(jù),一類是試驗的數(shù)據(jù),這兩種數(shù)據(jù)包含兩種不同的信息,這樣依然會導致一些人對數(shù)據(jù)的認知錯誤。由于數(shù)據(jù)的本身是有一定的范圍的,數(shù)據(jù)搜集以后就已經(jīng)確定了它的這一屬性,因此如果想需要范圍以外的含義就必須進行推斷。

三、大數(shù)據(jù)的處理、抽樣與分析

(一)數(shù)據(jù)的預處理

大數(shù)據(jù)環(huán)境下對數(shù)據(jù)的處理包括很多方面,比如,數(shù)據(jù)清洗、數(shù)據(jù)矯正、數(shù)據(jù)填補等,其中數(shù)據(jù)矯正是一種非常有效的數(shù)據(jù)處理方式,它可以大大減少系統(tǒng)的誤差。如今互聯(lián)網(wǎng)領域中數(shù)據(jù)的獲取是非常復雜的,在大量的、復雜的數(shù)據(jù)進行分析時難免會產(chǎn)生一些差異性,為了盡可能地使得這些數(shù)據(jù)不產(chǎn)生偏倚性,就必須利用計算機來對這些數(shù)據(jù)進行矯正。矯正的方法就是把一些從互聯(lián)網(wǎng)上搜集的數(shù)據(jù)作為一些補充的資源進行更新,這種更新速度要快,而且是實時的更新。

(二)大數(shù)據(jù)的分析與整合

在對大數(shù)據(jù)分析時,針對一些高維的問題需要進行降維、分解。還要探究一些壓縮數(shù)據(jù)的方法,經(jīng)過壓縮的數(shù)據(jù)可以直接進行傳輸和操作。這一系列的過程除了可以用常規(guī)的方法以外還可以利用一些數(shù)據(jù)的實時分析以及一些先進的算法進行操作??紤]計算機內(nèi)存和外存的數(shù)據(jù)傳送問題、分布數(shù)據(jù)和并行計算的方法。如何無信息損失或無統(tǒng)計信息損失地分解大數(shù)據(jù)集,獨立并行地在分布計算機環(huán)境進行推斷,各個計算機的中間計算結果能相互聯(lián)系溝通,構造全局統(tǒng)計結果。研究多個數(shù)據(jù)資源的融合算法,研究利用數(shù)據(jù)流尋找模型變化時間點的動態(tài)變化模型。

四、結束語

在一個新的事物到來以后勢必會對社會的發(fā)展帶來一定的沖擊,會慢慢地把一些傳統(tǒng)的關鍵和技術進行淹沒,比如,數(shù)碼相機的出現(xiàn)取代了傳統(tǒng)的膠片相機,使得影像業(yè)幾乎消亡。在大數(shù)據(jù)環(huán)境下將會對傳統(tǒng)的統(tǒng)計學進行嚴格的考驗,統(tǒng)計學會不會像以往的哲學那樣,只有一些歷史的光環(huán),而不再作為人們分析和利用大數(shù)據(jù)的資源。目前來看很多的學科都開始慢慢地涌入大數(shù)據(jù)時代,如果統(tǒng)計學的發(fā)展不進行改革的話也會慢慢的被邊緣化。目前統(tǒng)計學的主要的目標就是通過大范圍的獲取數(shù)據(jù),然后利用計算機對獲取的數(shù)據(jù)進行分析,來發(fā)現(xiàn)真理,統(tǒng)計的方法和理論有過高的要求,在大數(shù)據(jù)的環(huán)境下存在各種隨機和非隨機的誤差,根本無法滿足這些要求。大數(shù)據(jù)已經(jīng)給統(tǒng)計學帶來了很大的機遇,我們不但要洞察到這種機遇,還要看到現(xiàn)在的統(tǒng)計學中的一些基本的分析方法已經(jīng)不能滿足現(xiàn)在的數(shù)據(jù)分析,如今一些分布式的大數(shù)據(jù)已經(jīng)給統(tǒng)計學帶來了很大的挑戰(zhàn),由此看來一些統(tǒng)計學家要積極應對目前的這種現(xiàn)狀,不應該把傳統(tǒng)的數(shù)據(jù)環(huán)境作為目前研究的目的,必須積極地去學習新生的事物,只有這樣才能面對未來的挑戰(zhàn)有一席之地。

作者:彭先萌 單位:湖北工業(yè)職業(yè)技術學院

文檔上傳者

相關期刊

數(shù)據(jù)

省級期刊 審核時間1個月內(nèi)

北京市統(tǒng)計局

大數(shù)據(jù)

統(tǒng)計源期刊 審核時間1個月內(nèi)

工業(yè)和信息化部

數(shù)據(jù)法學

部級期刊 審核時間1個月內(nèi)

中國人民公安大學法學院