前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇股票分析報告范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

9月28日,SAP全球企業(yè)官、 全球高級副總裁、SAP中國研究院總裁孫小群在接受記者采訪時表示:“基于HANA,有些應用場景下,用戶的數(shù)據(jù)訪問、分析速度增長了一萬倍。有人問‘一萬倍又能怎么樣?’SAP認為,它意義深遠、價值巨大,產(chǎn)業(yè)乃至整個社會都將因其而深刻變革?!?/p>
股票分析師將成企業(yè)管理者
“做個理想化的類比:現(xiàn)在坐動車從上海到北京需要5小時,如果火車速度能夠增長一萬倍,那么從上海到北京真的可以眨眼即到了,那樣的話,首當其沖的是房地產(chǎn)價格要發(fā)生翻天覆地的變化,因為人們不再需要在城中心買房子。它將對整個社會、經(jīng)濟和生活產(chǎn)生深遠的影響?!睂O小群興致盎然地介紹說,“HANA幫助數(shù)據(jù)訪問、分析速度增長一萬倍將對企業(yè)管理產(chǎn)生怎樣的作用,我們真地需要好好地咀嚼、思考、體會?!?/p>
孫小群用SAP剛剛簽約的合作伙伴的例子向記者展開介紹。該合作伙伴為金融企業(yè)股票市場分析師提供金融服務。眾所周知,股票分析師是通過非常復雜的數(shù)學算法和模型對大量的市場交易和行情數(shù)據(jù)做分析,從而做出評估和預測。通過引入HANA,這種復雜的分析運算的數(shù)據(jù)量和速度都有了驚人的增長?;贖ANA為股市分析提供實時服務將對整個股市產(chǎn)生重大影響?
“以前一個分析師很可能自己去查資料、讀市場分析報告、做研究,自己消化吸收后再運用數(shù)學模型算出來,這很可能是幾個星期或者一個月的工作量。現(xiàn)在,這些工作不用分析師做了,用計算機和互聯(lián)網(wǎng)服務來自動化、快速地實現(xiàn)原來需要人工完成的大量工作。在這種趨勢下,隨著股市行情服務的升級,股票分析師們將從行業(yè)分析走向企業(yè)管理,因為他們對整個行業(yè)以及行業(yè)內(nèi)企業(yè)的了解和真正的企業(yè)管理者是相差不多的?!睂O小群轉(zhuǎn)述合作伙伴的觀點。
這種趨勢不止會對股票分析師產(chǎn)生影響,也會對所有股民產(chǎn)生影響。HANA的應用將逐漸從To B 的企業(yè)級應用走向通過To B To C的方式影響消費者,孫小群認為。
“HANA速度很快,原來做不到的事或者需要用大型機以很高的價格做的事情現(xiàn)在都可以實現(xiàn)了。” SAP中國研究院高級技術(shù)顧問李勇在采訪過程中也以DNA檢測的例子闡明HANA將讓應用從陽春白雪逐步走向大眾可享的范疇。
不只是內(nèi)存數(shù)據(jù)庫
關鍵詞:大數(shù)據(jù) 企業(yè) 競爭情報 數(shù)據(jù)挖掘
中圖分類號: G250.2 文獻標識碼: A 文章編號: 1003-6938(2012)06-0009-06
1 引言
隨著信息技術(shù)的不斷發(fā)展,互聯(lián)網(wǎng)的普及利用,各種終端設備記錄了人類社會復雜頻繁的信息行為從而產(chǎn)生了驚人的數(shù)據(jù)量。據(jù)國際數(shù)據(jù)公司(IDC)的研究報告稱,2011年全球被創(chuàng)建和被復制的數(shù)據(jù)總量為1.8ZB,并預測到2020年,全球?qū)碛?5ZB(1ZB=10億TB)的數(shù)據(jù)量[1]。大數(shù)據(jù)已經(jīng)滲透到每一個行業(yè)和領域,被視為“未來的新石油” ,逐漸成為重要的生產(chǎn)因素。隨著消費者、企業(yè)、各個經(jīng)濟領域不斷挖掘大數(shù)據(jù)的潛力,我們正處在一個巨大浪潮的尖峰,這個浪潮就是大數(shù)據(jù)驅(qū)動的技術(shù)創(chuàng)新、生產(chǎn)率提高、經(jīng)濟增長以及新的競爭形勢和新價值的產(chǎn)生[2]。近年來,大數(shù)據(jù)技術(shù)研究和應用迅速發(fā)展,許多國家已經(jīng)意識到了大數(shù)據(jù)的重要性,并作為戰(zhàn)略性技術(shù)大力推動其發(fā)展,大數(shù)據(jù)時代已悄然而至。
2 大數(shù)據(jù)的含義與特征
目前對大數(shù)據(jù)還沒有標準的定義,通常認為它是一種數(shù)據(jù)量很大、數(shù)據(jù)形式多樣化的非結(jié)構(gòu)化數(shù)據(jù)。亞馬遜網(wǎng)絡服務、數(shù)據(jù)科學家John Rauser曾提到一個簡單的定義:大數(shù)據(jù)是任何超過了一臺計算機處理能力的龐大數(shù)據(jù)量[3]。維基百科定義為:大數(shù)據(jù)是指無法在一定時間內(nèi)用常規(guī)軟件工具對其內(nèi)容進行抓取、管理和處理的數(shù)據(jù)集合[4]。百度百科定義為:大數(shù)據(jù)通常用來形容一個公司創(chuàng)造的大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù),這些數(shù)據(jù)在下載到關系型數(shù)據(jù)庫用于分析時會花費過多時間和金錢。從各種各樣類型的數(shù)據(jù)中快速獲得有價值信息的能力,就是大數(shù)據(jù)技術(shù)[5]。IBM從三個基本特性角度來定義大數(shù)據(jù),即:“3V”:體量(Volume),速度(Velocity)和多樣性(Variety)。也有人為大數(shù)據(jù)包括三個要素,即:大分析(Big Analytic)、大帶寬(Big Bandwidth)和大內(nèi)容(Big Content)[6]。
概括起來,大數(shù)據(jù)的特征主要體現(xiàn)在如下幾個方面:
(1)數(shù)據(jù)總量規(guī)模增長巨大。同一類型的數(shù)據(jù)在快速增長,目前在傳感器網(wǎng)絡、地理信息導航系統(tǒng)、社會網(wǎng)絡(如微博)、即時通訊(如QQ)、電子商務(如淘寶)、數(shù)字圖書館、網(wǎng)絡日志等領域都產(chǎn)生了龐大的數(shù)據(jù),規(guī)模在不斷擴大。如淘寶目前每天活躍數(shù)據(jù)量已經(jīng)超過50TB,共有4億條產(chǎn)品信息和2億多名注冊用戶在上面活動。零售巨頭沃爾瑪每小時都要處理100多萬筆客戶交易,數(shù)據(jù)庫估計超過2500萬億字節(jié)——相當于美國國會圖書館書籍數(shù)的167倍,而移動互聯(lián)網(wǎng)用戶發(fā)送和上傳的數(shù)據(jù)量達到1.3EB[7]。
(2)數(shù)據(jù)增長的速度呈指數(shù)級持續(xù)增長。目前很多領域的數(shù)據(jù)都以驚人的速度增長,根據(jù)WinterCorp的調(diào)查顯示,最大的數(shù)據(jù)倉庫中的數(shù)據(jù)量每兩年增加3倍(年均增長率為173%),其增長速度遠超摩爾定律增長速度。照此計算,2015年最大數(shù)據(jù)倉庫中的數(shù)據(jù)量將逼近100PB[8]。大數(shù)據(jù)的動態(tài)性強,要求分析處理應快速響應,在動態(tài)變化的環(huán)境中快速完成分析過程,有些甚至必須實時分析,否則這些結(jié)果可能就是過時、無效的。如導航定位系統(tǒng)、股票分析系統(tǒng)等對數(shù)據(jù)實時處理有著較高的要求,大數(shù)據(jù)分析和處理的方法必須能快速地適應相關業(yè)務更新頻率加快的需求。
(3)新的數(shù)據(jù)來源和數(shù)據(jù)類型在不斷增加。目前產(chǎn)生大數(shù)據(jù)的領域在不斷增加,數(shù)據(jù)類型不僅包括普通文本、照片、動畫、音頻與視頻等,還有像位置信息、鏈接信息等新類型的數(shù)據(jù)。伴隨著社交網(wǎng)絡、移動計算和傳感器等新技術(shù)不斷的應用,大數(shù)據(jù)中有許多是非結(jié)構(gòu)化數(shù)據(jù)或半結(jié)構(gòu)化數(shù)據(jù),沒有特定的描述模型,數(shù)據(jù)結(jié)構(gòu)是不固定、不完全或不規(guī)則的。
(4)數(shù)據(jù)的價值日益突現(xiàn)。大數(shù)據(jù)猶如一座富礦,通過海量數(shù)據(jù)的處理、整合分析,可以發(fā)現(xiàn)新的知識,從而創(chuàng)造新的更大的價值。大數(shù)據(jù)為許多行業(yè)帶來新的商機和發(fā)展機遇,充分利用大數(shù)據(jù)可為企業(yè)帶來強大的競爭力。大數(shù)據(jù)分析能從龐大的數(shù)據(jù)中發(fā)現(xiàn)稀疏而有高價值的知識和規(guī)律,為預測和決策提供相關支持。如視頻監(jiān)控的數(shù)據(jù)量通常十分大,雖然絕大部分可能沒有實際利用價值,但幾秒鏡頭捕捉到某罪犯體貌特征,可能對公安部門而言就是十分珍貴的。大數(shù)據(jù)分析就是要進行披沙揀金,發(fā)現(xiàn)這些珍貴的信息。
綜上所述,對于大數(shù)據(jù)中“大”的理解,主要有兩個方面,第一是指大量的、快速增長的數(shù)據(jù),第二則是數(shù)據(jù)中所蘊含的價值量較大??梢?,大數(shù)據(jù)之“大”,并不光是指數(shù)據(jù)的數(shù)量之大,它的意義還在于數(shù)據(jù)的價值之大。
3 大數(shù)據(jù)對企業(yè)競爭情報的影響
情報研究是利用數(shù)據(jù)和信息提煉出有價值的情報,為決策提供有關方案,也就是對數(shù)據(jù)進行處理、組織和解釋,以揭示其潛在的知識,轉(zhuǎn)化為可執(zhí)行利用的情報。企業(yè)競爭情報分析就是從原始的數(shù)據(jù)中發(fā)現(xiàn)關于競爭環(huán)境、競爭對手和競爭策略情報的過程,從而形成高附加價值的產(chǎn)品。因此,大數(shù)據(jù)分析在對象、運用的方法和目標等方面都與企業(yè)競爭情報研究有許多交集,大數(shù)據(jù)的興起必然對企業(yè)競爭情報產(chǎn)生深刻的影響。
3.1 企業(yè)提升競爭力需要大數(shù)據(jù)的支持
數(shù)據(jù)競爭已經(jīng)成為企業(yè)提升核心競爭力的利器。來自各個方面零碎的龐大數(shù)據(jù)融合在一起,可以構(gòu)建出企業(yè)競爭的全景圖,洞察到競爭環(huán)境和競爭對手的細微變化,從而快速響應,制定有效競爭策略。龐大的數(shù)據(jù)更具有統(tǒng)計意義,能為各種預測模型提供支持,從而能預測未來的發(fā)展趨勢,幫助企業(yè)獲得先機。相關的數(shù)據(jù)整合在一起,能不斷產(chǎn)生新的信息和知識,有助于提高生產(chǎn)率、降低經(jīng)營成本。如2008年初,阿里巴巴平臺上整個買家的詢盤數(shù)急劇下滑,自然導致買盤的下降,說明歐美對中國采購量在下滑。海關是賣了貨出去以后再獲得數(shù)據(jù),而阿里巴巴提前半年時間就從詢盤上推斷出世界貿(mào)易發(fā)生變化了[9]。企業(yè)的競爭不再只是勞動生產(chǎn)率的競爭,而是知識生產(chǎn)率的競爭。數(shù)據(jù)是信息的載體,是知識的源泉,是企業(yè)創(chuàng)造價值和利潤的原材料,因此,基于知識的競爭將集中體現(xiàn)在基于數(shù)據(jù)的競爭上。正如馬云所說,未來是數(shù)據(jù)競爭的時代,誰擁有數(shù)據(jù),誰就擁有未來。如今各行各業(yè)都出現(xiàn)了以數(shù)據(jù)分析為競爭力的企業(yè),它們都是在數(shù)據(jù)分析的基礎上與其他企業(yè)展開競爭,以提升核心競爭能力,保持或獲得行業(yè)領先地位,如谷歌、寶潔、沃爾瑪?shù)仁澜缰?。沃爾瑪就建立了一個超大的數(shù)據(jù)中心,其存儲能力高達4PB以上,通過大數(shù)據(jù)分析,沃爾瑪掌握了顧客的購買習慣,不同商品一起購買的概率,購買者在商店所穿行的路線、購買時間和地點,從而確定商品的上架布局以及對分類進行優(yōu)化;決定對各個商店的不同商品進行增減,以保持最優(yōu)的庫存,降低成本;洞察銷售全局,瞬間捕獲到各種細微的變化,從而快速響應,制定營銷策略;利用大數(shù)據(jù)工具對供應鏈進行分析以選擇供應商、優(yōu)化物流配送方案和進行價格談判等;利用大數(shù)據(jù)分析工具對熱銷商品品種和庫存的趨勢進行分析,以選定需要補充的商品,分析顧客購買趨勢和季節(jié)性購買模式,以確定降價商品,并對其數(shù)量和運作做出反應[10]??梢?,大數(shù)據(jù)已經(jīng)成為企業(yè)的核心資產(chǎn),對數(shù)據(jù)的掌控可以形成對市場的支配,并且獲取巨大的回報。大數(shù)據(jù)是企業(yè)用于提升核心能力的重要手段,而為提升企業(yè)競爭優(yōu)勢的大數(shù)據(jù)分析是企業(yè)競爭情報研究的重要范疇。
4.2 注重數(shù)據(jù)的清洗與過濾
大數(shù)據(jù)時代企業(yè)所要處理的數(shù)據(jù)比較多,但數(shù)據(jù)的質(zhì)量往往參差不齊,如有些數(shù)據(jù)不一致或不準確、數(shù)據(jù)陳舊以及人為造成的錯誤等,通常被稱之為“臟數(shù)據(jù)”。由于數(shù)據(jù)挖掘是數(shù)據(jù)驅(qū)動,因而數(shù)據(jù)質(zhì)量顯得十分重要?!芭K數(shù)據(jù)”往往導致分析結(jié)果的不正確,進而影響到?jīng)Q策的準確性。由于大部分的數(shù)據(jù)庫是動態(tài)的,許多數(shù)據(jù)是不完整的、冗余的、稀疏甚至是錯誤的,這將會給數(shù)據(jù)的知識發(fā)現(xiàn)帶來困難。由于人為因素的影響,如數(shù)據(jù)的加工處理以及主觀選取數(shù)據(jù)等,從而使得數(shù)據(jù)具有某些噪聲,會影響數(shù)據(jù)分析模式抽取的準確性。大量冗余數(shù)據(jù)也會影響到分析的準確性和效率。因此,在數(shù)據(jù)挖掘分析時,首先需要進行數(shù)據(jù)預處理,也就是要對數(shù)據(jù)進行凈化和過濾,刪除一些無關的數(shù)據(jù)。數(shù)據(jù)清洗是一個減少錯誤和不一致性、解決對象識別的過程[12]。一般通過概率統(tǒng)計等原理查找數(shù)值異常的記錄。如在網(wǎng)站的日志文件數(shù)據(jù)處理中,可以通過檢查URL的后綴刪除認為不相關的數(shù)據(jù),可使用一個缺省的后綴名列表幫助刪除文件,去掉一些不能反映用戶行為的記錄,過濾一些請求錯誤和失敗的記錄等。
在大數(shù)據(jù)時代,不能不計成本盲目的收集各種海量的數(shù)據(jù),否則將成為一種嚴重的負擔。數(shù)據(jù)的體量只是大數(shù)據(jù)的一個特征,而數(shù)據(jù)的價值、傳遞速度和持續(xù)性才是關鍵。為了達到這些目標,企業(yè)競爭情報收集可以采用最小數(shù)據(jù)集的方法,指通過收集具有代表性的最少的數(shù)據(jù),更好地掌握一個觀察對象所有的特點或者一個事件所處狀態(tài),其核心是針對被觀察的對象建立一套精簡實用的數(shù)據(jù)指標,采用一定取樣標準選擇和過濾相關數(shù)據(jù)??傊ㄟ^對數(shù)據(jù)質(zhì)量的控制和管理,可以提高數(shù)據(jù)分析的準確性,進一步提高競爭情報工作的效益。
4.3 關注新數(shù)據(jù)類型的分析方法
在大數(shù)據(jù)時代,企業(yè)無論是日常運營,還是重大戰(zhàn)略決策,都會在各種各樣的信息系統(tǒng)中留下各種數(shù)據(jù)記錄,這些數(shù)據(jù)通過技術(shù)整合起來,可以再現(xiàn)一個企業(yè)的運行軌跡和發(fā)展全景。競爭情報研究就是發(fā)現(xiàn)有價值的知識和模式,洞察企業(yè)競爭環(huán)境,預測未來,從而獲得競爭優(yōu)勢。隨著信息技術(shù)的普及應用,新的數(shù)據(jù)類型不斷產(chǎn)生,下面一些新的數(shù)據(jù)類型和分析方法值得關注。
(1)實時數(shù)據(jù)。如微博、短信等大量的動態(tài)數(shù)據(jù)流,是一種十分重要的競爭情報源。數(shù)據(jù)流挖掘是對數(shù)據(jù)進行單遍現(xiàn)行掃描,快速處理數(shù)據(jù),提供實時近似結(jié)果的技術(shù)。如窗口技術(shù)采用分而治之的策略,將流數(shù)據(jù)按照特定的需求分配到不同的窗口,進入窗口內(nèi)的數(shù)據(jù)才會被處理,以減少分析處理的數(shù)據(jù)量;而概要數(shù)據(jù)結(jié)構(gòu)技術(shù)將數(shù)據(jù)流進行概括統(tǒng)計的數(shù)據(jù)結(jié)構(gòu)代表原始數(shù)據(jù),而不是保留數(shù)據(jù)流中的全部數(shù)據(jù),從而減少處理的數(shù)據(jù)量[13]。在大數(shù)據(jù)時代,競爭情報分析的數(shù)據(jù)許多是連續(xù)、快速、隨時間變化的,對如此巨大的數(shù)據(jù)流,企圖存儲或者掃描所有的數(shù)據(jù)都是不實際的,只有采用動態(tài)的數(shù)據(jù)流挖掘分析技術(shù)才能有效解決數(shù)據(jù)的沖擊,獲得實時近似的結(jié)果。數(shù)據(jù)流挖掘技術(shù)能為競爭情報提供實時查詢服務和處理,從而促使企業(yè)的“觸角”保持足夠的敏捷性。
(2)動態(tài)數(shù)據(jù)。從時間的維度發(fā)現(xiàn)有關變化規(guī)律。時間序列分析是指從大量不同時間重復測得的數(shù)據(jù)中發(fā)現(xiàn)前后數(shù)據(jù)相似或者有規(guī)律的模式、趨勢和突變的方法,主要的技術(shù)主要是相似模式發(fā)現(xiàn),包括相似模式聚類和相似模式搜索時間序列,采用的主要挖掘方法主要有小波變換法和經(jīng)驗模態(tài)分解法[14]等。在大數(shù)據(jù)時代,各種數(shù)據(jù)源源不斷的產(chǎn)生,比如交易數(shù)據(jù)、網(wǎng)站訪問日志等,從中必然會呈現(xiàn)出時間上的規(guī)律,企業(yè)希望從積累了大量的歷史數(shù)據(jù)中分析出一些模式,以便從中發(fā)現(xiàn)商業(yè)機會,通過趨勢分析,甚至預先發(fā)現(xiàn)一些正在新涌現(xiàn)出來的機會,比如企業(yè)可以通過數(shù)據(jù)時間序列分析了解產(chǎn)品銷售的旺季和淡季,制定針對性的營銷策略,減少生產(chǎn)和銷售的波動性,從而獲得利潤和競爭優(yōu)勢。
(3)關聯(lián)數(shù)據(jù)。關聯(lián)數(shù)據(jù)發(fā)現(xiàn)技術(shù)是分析數(shù)據(jù)之間的聯(lián)系,將孤立、離散的數(shù)據(jù)點結(jié)合產(chǎn)生數(shù)據(jù)鏈或者數(shù)據(jù)圖,隨后從多個數(shù)據(jù)源中查出匹配給定關聯(lián)模式的實例、最后再對匹配的實例評估。目前已應用的主要方法有:圖論的稀有度監(jiān)測法、圖熵法和基于謂詞的邏輯歸納推理法等[15]。關聯(lián)發(fā)現(xiàn)技術(shù)特別適合于動態(tài)的數(shù)據(jù)發(fā)現(xiàn)未知的模式,而大數(shù)據(jù)中隱含了大量未知、潛在的關系,新模式的發(fā)現(xiàn)有利于企業(yè)采取“藍?!睉?zhàn)略,搶占先機,從而獲得競爭優(yōu)勢。
(4)社會網(wǎng)絡數(shù)據(jù)。社會網(wǎng)絡分析也叫鏈接挖掘,是通過網(wǎng)絡中的關系分析探討網(wǎng)絡的結(jié)構(gòu)及屬性特征,其挖掘重要任務的是基于鏈接的節(jié)點排序、基于鏈接節(jié)點的分類、節(jié)點聚類、鏈接預測、子圖發(fā)現(xiàn)等[16]。在大數(shù)據(jù)時代,大量相關的數(shù)據(jù)聚合在一起,相互支撐解釋和印證,形成了復雜的數(shù)據(jù)網(wǎng)絡,數(shù)據(jù)之間的關系具有非常重要的價值,如通過消費者行為的鏈接數(shù)據(jù)挖掘能發(fā)現(xiàn)傳銷顧客網(wǎng)絡,從而制定找出利潤最大化的顧客群,又如從人際關系的網(wǎng)絡節(jié)點的中心度來分析競爭對手,從而制定相關的競爭策略等。
4.4 促進數(shù)據(jù)分析的可視化
數(shù)據(jù)可視化技術(shù)指的是運用計算機圖形學和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像顯示出來,并進行交互處理的方法和技術(shù),其本質(zhì)是從抽象數(shù)據(jù)到可視化結(jié)構(gòu)的映射。在大數(shù)據(jù)時代,數(shù)據(jù)只是原材料,其真正的價值需要通過知識和情報來實現(xiàn)。企業(yè)競爭情報分析的結(jié)果必須是可理解的,才能較為容易地轉(zhuǎn)化為生產(chǎn)力??梢暬梢苑从硵?shù)據(jù)的語義關系,加快數(shù)據(jù)的處理速度,使龐大的數(shù)據(jù)得到充分有效利用;可以在人與數(shù)據(jù)間實現(xiàn)交互,幫助人們觀察到數(shù)據(jù)中隱含的問題,為發(fā)現(xiàn)和理解有關規(guī)律提供有力工具??梢暬垢偁幥閳蟾右子诶斫夂瓦\用。采用一定的分析模型將相關的數(shù)據(jù)組織在一起,直觀地表達競爭情報和競爭情報之間的邏輯關系,如進行一些關聯(lián)分析,以生動形象的方式顯示描繪人物、公司和事件之間的聯(lián)系,探索事件、人、地點、產(chǎn)品和組織間潛在關系并預測可能產(chǎn)生的結(jié)果,輔助決策過程??梢暬勺鳛橐环N基礎技術(shù)嵌入到企業(yè)競爭情報分析工具中,人們總是希望看到研究報告中的生動圖像,而不是一大堆枯燥的數(shù)據(jù),企業(yè)競爭情報研究結(jié)果通過可視化方式,采用不同數(shù)據(jù)維度提供給不同層次的決策者使用,便于理解,支持企業(yè)高效運營。因此,可視化技術(shù)是大數(shù)據(jù)時代企業(yè)競爭情報研究的有效工具。
4.5 探索大數(shù)據(jù)新的分析技術(shù)和工具的應用
大數(shù)據(jù)時代企業(yè)競爭情報面臨的數(shù)據(jù)量是無法比擬的,對一些實時性要求較高的決策,分析方法的速度和效率顯得十分重要。傳統(tǒng)的競爭情報分析方法顯然難于處理不斷增長的、龐大的、異構(gòu)的數(shù)據(jù),只有借助新的處理技術(shù)才能實現(xiàn)數(shù)據(jù)提取和清洗、分析和利用。目前大數(shù)據(jù)相關技術(shù)研究已取得一定的進展。如“MapReduce”是一種簡潔的并行計算模型,它在系統(tǒng)層面解決了擴展性、容錯性等問題,通過接受用戶編寫的函數(shù),自動地在可伸縮的大規(guī)模集群上并行執(zhí)行,從而可以處理和分析大規(guī)模的數(shù)據(jù)?!癕apReduce”具有簡潔的模型、良好的擴展性、容錯性和并行性,可以進行復雜深入的數(shù)據(jù)分析,隨著其性能的不斷改進和分析能力的不斷增強,能夠幫助人們從大數(shù)據(jù)中分析和發(fā)現(xiàn)有用的知識[17]。如何提高數(shù)據(jù)挖掘算法的效率和適應性,使挖掘方法具有一定規(guī)模的伸縮性,是數(shù)據(jù)分析較為突出的問題。應用實時性技術(shù)和分布并行算法技術(shù)是提高數(shù)據(jù)挖掘方法效率和實用化的有效途徑。此外,統(tǒng)計分析語言標準化也有助于提高數(shù)據(jù)分析效果。如R語言是主要用于統(tǒng)計分析、繪圖的語言和操作環(huán)境,其功能包括數(shù)據(jù)存儲和處理系統(tǒng)、數(shù)組運算工具、完整連貫的統(tǒng)計分析工具。R語言針對大數(shù)據(jù)將廣泛使用的統(tǒng)計算法進行了優(yōu)化,能夠在短暫的時間內(nèi)從大量的數(shù)據(jù)中發(fā)現(xiàn)有意義的信息[18]。目前業(yè)界對大數(shù)據(jù)的處理分析方法已開始進行了一些探索,并且開發(fā)了一些相關的工具。企業(yè)競爭情報研究應該針對大數(shù)據(jù)的特點,吸收和融合數(shù)據(jù)挖掘分析新的技術(shù)方法,不斷創(chuàng)新和發(fā)展。
5 結(jié)語
企業(yè)競爭情報可以幫助企業(yè)洞察競爭環(huán)境,發(fā)現(xiàn)新的競爭對手、判斷競爭的發(fā)展性動向,及時做出相關的反應,從而獲得較大的競爭優(yōu)勢。大數(shù)據(jù)提供了一個全新的信息生態(tài)環(huán)境,給企業(yè)競爭情報研究帶來了深刻的影響,促使其不斷地創(chuàng)新和變革,以適應企業(yè)在大數(shù)據(jù)時代獲取核心競爭力的需求。大數(shù)據(jù)時代的企業(yè)競爭情報研究將走傳統(tǒng)情報分析方法與大數(shù)據(jù)技術(shù)相結(jié)合的發(fā)展道路。目前基于大數(shù)據(jù)的企業(yè)競爭情報研究剛剛起步,許多問題仍然需要進一步探討。
參考文獻:
[1]F.Gantz and D.Reinsel.The 2011 Digital Universe Study: Extracting Value from Chaos[EB/OL].[2012-08-18].ww
/collateral/demos/microsites/emc-digitaluniver
se-2011/index.htm.
[2]Big data:the next frontier for innovation,competition and productivity[R].McKinsey Global Institute,2011.
[3]Philip Russom.big data analytics[EB/OL].[2012-08-01].
.
[4]Big data[EB/OL].[2012-08-18].
[6]涂蘭敬.專家觀點:“大數(shù)據(jù)”與“龐大數(shù)據(jù)”的區(qū)別[J].網(wǎng)絡與信息,2011,(12):37-38.
[7]國金證券.“大數(shù)據(jù)”行業(yè)專題分析報告[EB/OL].[2012-08-01]..
[8]王珊等.架構(gòu)大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望[J].計算機學報,2011,34(10):15-16.
[9]國金證券.“大數(shù)據(jù)”行業(yè)專題分析報告[EB/OL].[2012-08-01]..
[10]涂子沛.大數(shù)據(jù)[M].廣西師范大學出版社,2012:161,
304-306.
[11]畢強.網(wǎng)絡信息集成服務研究綜述[J].情報理論與實踐,2004,(1):21-25.
[12]郭志懋.數(shù)據(jù)質(zhì)量和數(shù)據(jù)清洗研究綜述[J].軟件學報.2012,12(11):22-28.
[13]JiaweiHan Micheline Kamber.范明,孟小峰譯.數(shù)據(jù)挖掘概念與技術(shù)[M].北京:機械出版社,2007:306-320.
[14]倪志偉等.動態(tài)數(shù)據(jù)挖掘[M].北京:科學出版社,2010:31,232.
[15]張公讓.商務智能與數(shù)據(jù)挖掘[M].北京:北京大學出版社,2010:151-159.
[16]約翰·斯科特.劉軍譯.社會網(wǎng)絡分析法[M].重慶:重慶大學出版社,2007:1-6.
[17]覃雄派等.大數(shù)據(jù)分析——RDBMS 與MapReduce 的競爭與共生[J].軟件學報,2012,2(1):33-42.