婷婷超碰在线在线看a片网站|中国黄色电影一级片现场直播|欧美色欧美另类少妇|日韩精品性爱亚洲一级性爱|五月天婷婷乱轮网站|久久嫩草91婷婷操在线|日日影院永久免费高清版|一级日韩,一级鸥美A级|日韩AV无码一区小说|精品一级黄色毛片

首頁(yè) > 文章中心 > 數(shù)據(jù)挖掘技術(shù)探討論文

數(shù)據(jù)挖掘技術(shù)探討論文

前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇數(shù)據(jù)挖掘技術(shù)探討論文范文,相信會(huì)為您的寫作帶來(lái)幫助,發(fā)現(xiàn)更多的寫作思路和靈感。

數(shù)據(jù)挖掘技術(shù)探討論文

數(shù)據(jù)挖掘技術(shù)探討論文范文第1篇

關(guān)鍵詞: 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘; 研討型; 教學(xué)模式; 教學(xué)實(shí)踐

中圖分類號(hào):N42 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1006-8228(2012)12-52-02

Analysis on research-oriented teaching model in data warehousing and data mining

Huang Meili

(Zhejiang Agriculture and Forestry University, Lin'an, Zhejiang 311300, China)

Abstract: As a comprehensive and practical course, data warehousing and data mining is opened not so long ago, so teaching methods of this course for undergraduate students are rarely seen. Based on the characteristics of this course, combined with teaching experience of several years, the application of research-oriented teaching model is mainly discussed and several typical students’ learning outcomes are listed. Finally, some places which need to be cautious are put forward.

Key words: data warehousing and data mining; research-oriented; teaching model; teaching practice

0 引言

20世紀(jì)90年代興起的數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘是數(shù)據(jù)庫(kù)研究、開(kāi)發(fā)和應(yīng)用中最活躍的兩個(gè)領(lǐng)域。隨著其理論及應(yīng)用技術(shù)和產(chǎn)品的不斷成熟與發(fā)展,數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘不僅成為高等院校計(jì)算機(jī)專業(yè)、信息技術(shù)與信息管理類專業(yè)碩士、博士研究生的專業(yè)課程,而且相繼在本科相關(guān)專業(yè)高年級(jí)學(xué)生中開(kāi)設(shè)了該課程。

該課程是一門綜合性和實(shí)踐性很強(qiáng)的課程,其內(nèi)容新且廣,對(duì)于本科教學(xué)有一定的難度。本文針對(duì)課程自身特點(diǎn)及高年級(jí)學(xué)生學(xué)習(xí)及能力培養(yǎng)需要,結(jié)合自身教學(xué)實(shí)踐,探討以激發(fā)學(xué)生學(xué)習(xí)興趣為著眼點(diǎn)、學(xué)生分析解決問(wèn)題能力培養(yǎng)為目的的研討型教學(xué)模式。

文中章節(jié)1具體介紹課程內(nèi)容、教學(xué)過(guò)程中存在的問(wèn)題及研討型教學(xué)模式;在章節(jié)2中,以自身的教學(xué)實(shí)踐為例,給出研討型教學(xué)實(shí)踐效果及該方法應(yīng)用的注意事項(xiàng);最后,是結(jié)論部分。

1 本科數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程教學(xué)

1.1 課程教學(xué)內(nèi)容

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程涉及兩方面的教學(xué)內(nèi)容:①數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和基于數(shù)據(jù)倉(cāng)庫(kù)的聯(lián)機(jī)分析處理應(yīng)用技術(shù)。具體包括數(shù)據(jù)倉(cāng)庫(kù)的基本概念、創(chuàng)建技術(shù)和方法、數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)以及OLAP的基本概念、多維數(shù)據(jù)庫(kù)、OLAP的實(shí)現(xiàn)技術(shù)。②數(shù)據(jù)挖掘的基本概念、基本方法和基本技術(shù)(包括分類、預(yù)測(cè)、關(guān)聯(lián)、聚類等),以及數(shù)據(jù)挖掘的應(yīng)用。

1.2 課程在本科教學(xué)過(guò)程中存在的問(wèn)題

⑴ 教學(xué)內(nèi)容不統(tǒng)一

由于該課程是一門綜合性很強(qiáng)的課程,涉及到的學(xué)科知識(shí)很廣,加上在本科教學(xué)中開(kāi)設(shè)的時(shí)間并不長(zhǎng),也沒(méi)有得到大家一致認(rèn)可的相應(yīng)教材供使用,使得開(kāi)設(shè)該課程的不同高校的教學(xué)內(nèi)容與教學(xué)重點(diǎn)各不相同,即便是同一學(xué)校不同教師對(duì)于教學(xué)內(nèi)容的把握上也有很大差異。

⑵ 傳統(tǒng)教學(xué)方法的不適用性

雖然本課程涉及內(nèi)容寬泛,而且是在已具備自主學(xué)習(xí)能力的本科高年級(jí)學(xué)生中開(kāi)設(shè)的,但是課程的教學(xué)方法卻多采用傳統(tǒng)的以教師講授為主、學(xué)生為輔的教學(xué)模式。

從本科教學(xué)過(guò)程中存在的問(wèn)題可見(jiàn):課程授課對(duì)象及課程自身的特點(diǎn),決定了傳統(tǒng)教學(xué)方法的不適用性[1-3]。因此,有必要探討新的教學(xué)模式在具體教學(xué)實(shí)施過(guò)程中的應(yīng)用。

1.3 研討型教學(xué)模式

雖然課程涉及到的學(xué)科內(nèi)容廣且深,但是對(duì)于已學(xué)習(xí)高等數(shù)學(xué),并熟悉數(shù)據(jù)庫(kù)知識(shí)和具備程序設(shè)計(jì)能力的高年級(jí)學(xué)生而言,還是能較好地掌握數(shù)據(jù)倉(cāng)庫(kù)的建模以及經(jīng)典數(shù)據(jù)挖掘算法的實(shí)現(xiàn)與簡(jiǎn)單應(yīng)用。因此,在課程的教學(xué)實(shí)踐中,我們把該部分內(nèi)容作為課堂教學(xué)的重點(diǎn);對(duì)于一些較難的和新的挖掘算法與技術(shù),及其應(yīng)用和最新發(fā)展趨勢(shì),則作為學(xué)生研討內(nèi)容。

作為傳統(tǒng)的教師講解教學(xué)模式的有益補(bǔ)充和提高,開(kāi)展研討型的教學(xué)模式,可以按照如下四個(gè)環(huán)節(jié)開(kāi)展:

⑴ 教師出題&學(xué)生選題;

⑵ 相關(guān)文獻(xiàn)查閱;

⑶ 報(bào)告撰寫;

⑷ 課堂匯報(bào)與討論。

第一步,由教師出題,學(xué)生選題。在學(xué)期初,就由教師給出研討的主題供學(xué)生選擇。這樣既可以避免學(xué)生選題過(guò)于盲目,也可以避免最后課堂討論階段的研討內(nèi)容偏離課程教學(xué)主題。

第二步,相關(guān)文獻(xiàn)查閱。在接下來(lái)的課程教學(xué)期間,學(xué)生除了保證基本的學(xué)習(xí)內(nèi)容的掌握之外,還需要利用課余時(shí)間,利用各種手段查閱與選題相關(guān)的文獻(xiàn),為報(bào)告的撰寫和匯報(bào)階段做充分的準(zhǔn)備。

第三步,報(bào)告撰寫。經(jīng)過(guò)大量的文獻(xiàn)閱讀后,學(xué)生需撰寫文獻(xiàn)閱讀報(bào)告,報(bào)告的撰寫格式可以參考畢業(yè)設(shè)計(jì)的要求。

第四步,課堂匯報(bào)與討論。在課程后期,教師在每次課堂上抽取一定的時(shí)間,供學(xué)生課堂匯報(bào),然后其他學(xué)生與教師一起針對(duì)學(xué)生的匯報(bào)內(nèi)容展開(kāi)討論。該環(huán)節(jié)的開(kāi)展,既開(kāi)拓了學(xué)生的視野,又可以有效地避免部分學(xué)習(xí)不認(rèn)真的學(xué)生的應(yīng)付行為。

從教師出題到最后的學(xué)生課堂匯報(bào)與討論,每個(gè)環(huán)節(jié)都要求學(xué)生的親自參與。這樣,在課時(shí)有限的情況下,以研討型的教學(xué)模式開(kāi)展教學(xué),既可以保證教學(xué)內(nèi)容的講授,又能使學(xué)生主動(dòng)參與到課堂教學(xué)中來(lái),激發(fā)了學(xué)生的學(xué)習(xí)主動(dòng)性,拓寬了學(xué)生的視野。

2 研討型教學(xué)實(shí)踐效果及注意事項(xiàng)

2.1 教學(xué)及其效果

我校在大四計(jì)算機(jī)專業(yè)學(xué)生中開(kāi)設(shè)該課程。其中,理論32學(xué)時(shí),實(shí)驗(yàn)16學(xué)時(shí),共計(jì)48學(xué)時(shí)。教材采用韓家煒先生編著的《數(shù)據(jù)挖掘:概念與技術(shù)》一書(shū)[4]。該教材是得到業(yè)內(nèi)廣泛認(rèn)可的經(jīng)典教科書(shū),但教材內(nèi)容偏重理論。為了在有限的課時(shí)內(nèi),讓學(xué)生盡可能掌握基本教學(xué)內(nèi)容,使得研討型教學(xué)模式得以開(kāi)展,我們以李志剛編著的《數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的原理與應(yīng)用》作為相關(guān)內(nèi)容的輔助教材[5]。具體地,按如下方式進(jìn)行。

2.1.1 教學(xué)內(nèi)容及學(xué)時(shí)分配

教學(xué)內(nèi)容圍繞數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘兩條主線展開(kāi)。涉及的相關(guān)內(nèi)容及學(xué)時(shí)分配如表1所示。

2.1.3 考核方式

期末總成績(jī)=平時(shí)成績(jī)25%+文獻(xiàn)報(bào)告25%+期末卷面成績(jī)50%

在最近兩年的研討型教學(xué)模式實(shí)踐中,我們選出有代表性的學(xué)生作品,如表3所示。

2.2 教學(xué)注意事項(xiàng)

研討型教學(xué)模式適用于“數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘”課程的教學(xué),但是在相應(yīng)課程中開(kāi)展研討型的課程教學(xué)模式需注意以下幾點(diǎn)。

⑴ 注意授課對(duì)象的選擇。文獻(xiàn)資料的查閱、文獻(xiàn)閱讀報(bào)告的撰寫以及課堂匯報(bào)是研討型教學(xué)模式開(kāi)展過(guò)程中的主要環(huán)節(jié),而這些環(huán)節(jié)要求學(xué)生所需具備的能力,不適于在低年級(jí)學(xué)生中開(kāi)展。

⑵ 注意教學(xué)模式的選用。研討型教學(xué)模式不能代替?zhèn)鹘y(tǒng)的教師講解的教學(xué)模式,而應(yīng)是兩者的有機(jī)結(jié)合。

⑶ 注意考核方式的改革。研討型教學(xué)模式的開(kāi)展,除占用一定的課堂教學(xué)時(shí)間之外,還需要學(xué)生花費(fèi)大量的課外時(shí)間用以查閱文獻(xiàn)資料、撰寫報(bào)告等。如果采用傳統(tǒng)的以考試為主的考核方式,那么在實(shí)踐過(guò)程中可能會(huì)遇到部分學(xué)生的抵制。因此,為了提高研討型教學(xué)模式的效果,需要對(duì)傳統(tǒng)的以期末筆試成績(jī)?yōu)橹鞯脑u(píng)價(jià)方式進(jìn)行適當(dāng)改革,向研討內(nèi)容及成果傾斜,以提高學(xué)生的積極性。

3 結(jié)束語(yǔ)

研討型教學(xué)模式的開(kāi)展,可以有效地避免傳統(tǒng)教學(xué)方法下以教師講解為主,以學(xué)生為輔的填鴨式教學(xué)模式,較好地解決數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘課程在本科教學(xué)過(guò)程中遇到的問(wèn)題。

經(jīng)過(guò)近幾年在本科計(jì)算機(jī)專業(yè)畢業(yè)班對(duì)該課程采用研討型教學(xué)模式的實(shí)踐表明,該模式的開(kāi)展不僅有效地激發(fā)了學(xué)生的學(xué)習(xí)興趣,開(kāi)拓了學(xué)生的視野,而且能夠很好地為學(xué)生的畢業(yè)設(shè)計(jì)環(huán)節(jié)中有關(guān)文獻(xiàn)查詢、論文撰寫及答辯等奠定基礎(chǔ)。從列舉的近兩年的代表性學(xué)生研討內(nèi)容及成果中可以看到,該教學(xué)模式在高年級(jí)學(xué)生中開(kāi)展是現(xiàn)實(shí)可行的,而且也是有效的。

研討型教學(xué)模式的開(kāi)展,需要占用一定的教學(xué)時(shí)間,如何在有限的課時(shí)內(nèi)保證教學(xué)內(nèi)容,并擠出足夠的時(shí)間開(kāi)展研討是教師必須考慮的問(wèn)題;與此同時(shí),學(xué)生為準(zhǔn)備研討內(nèi)容需要花費(fèi)大量的課余時(shí)間,因此,如何調(diào)動(dòng)學(xué)生的積極性也是該模式能否成功應(yīng)用的關(guān)鍵因素之一。上述兩方面的問(wèn)題,都有待在今后的教過(guò)實(shí)踐中,進(jìn)一步深入細(xì)化該模式,以更好地達(dá)到教學(xué)培養(yǎng)目標(biāo)。

參考文獻(xiàn):

[1] 徐金寶.對(duì)應(yīng)用型本科生開(kāi)設(shè)數(shù)據(jù)挖掘課程的嘗試[J].計(jì)算機(jī)教育,

2007.7:27-29

[2] 胡建軍.淺談數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的本科教學(xué)[J].廣西科學(xué)院學(xué)報(bào),

2007.23(3):209-210,214

[3] 韋艷艷,張超群.“數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘”課程教學(xué)實(shí)踐與探索[J].高

教論壇,2011.1:94-96,99

[4] 李志剛,馬剛.數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的原理及應(yīng)用[M].高等教育出版

社,2008.

數(shù)據(jù)挖掘技術(shù)探討論文范文第2篇

關(guān)鍵詞:競(jìng)爭(zhēng)情報(bào);企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng);熱點(diǎn);趨勢(shì)

1 .競(jìng)爭(zhēng)情報(bào)系統(tǒng)概述

企業(yè)競(jìng)爭(zhēng)在當(dāng)前日趨激烈,作為企業(yè)競(jìng)爭(zhēng)制勝先導(dǎo)和基礎(chǔ)的競(jìng)爭(zhēng)情報(bào),正愈來(lái)愈受到企業(yè)和學(xué)術(shù)理論界的重視,不少的企業(yè)正在或?qū)⒁⒆约旱母?jìng)爭(zhēng)情報(bào)系統(tǒng)。

目前我國(guó)最流行的競(jìng)爭(zhēng)情報(bào)系統(tǒng)的定義可以歸納為兩種。第一種定義認(rèn)為競(jìng)爭(zhēng)情報(bào)系統(tǒng)就是計(jì)算機(jī)系統(tǒng)。王沙騁等指出,企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)是指將反映企業(yè)自身、競(jìng)爭(zhēng)對(duì)手和企業(yè)外部環(huán)境的時(shí)間狀態(tài)和變化的數(shù)據(jù)、信息及情報(bào)進(jìn)行收集、存儲(chǔ)、處理及分析,并以適當(dāng)?shù)姆绞浇o企業(yè)有關(guān)戰(zhàn)略管理人員的計(jì)算機(jī)應(yīng)用系統(tǒng),是基于計(jì)算機(jī)和網(wǎng)絡(luò)環(huán)境的、由先進(jìn)的信息技術(shù)支持的企業(yè)競(jìng)爭(zhēng)情報(bào)輔助分析計(jì)算機(jī)系統(tǒng)。我國(guó)討論競(jìng)爭(zhēng)情報(bào)涉及計(jì)算機(jī)網(wǎng)絡(luò)的專家多數(shù)持這種看法,國(guó)外也有很多人持這種看法。

第二種定義把競(jìng)爭(zhēng)情報(bào)系統(tǒng)視為人機(jī)系統(tǒng)。這種觀點(diǎn)是我國(guó)競(jìng)爭(zhēng)情報(bào)的先驅(qū)包昌火先生提出來(lái)的:競(jìng)爭(zhēng)情報(bào)系統(tǒng)是以人的智能為主導(dǎo)、信息網(wǎng)絡(luò)為手段、增強(qiáng)企業(yè)競(jìng)爭(zhēng)力為目標(biāo)的人機(jī)結(jié)合的競(jìng)爭(zhēng)戰(zhàn)略決策支持和咨詢系統(tǒng)。按包昌火先生的定義,競(jìng)爭(zhēng)情報(bào)系統(tǒng)核心就是人和計(jì)算機(jī)。

澳門理工學(xué)院社會(huì)經(jīng)濟(jì)研究所曾忠祿先生分析綜合了以上三大類定義的優(yōu)缺點(diǎn),他認(rèn)為,目前競(jìng)爭(zhēng)情報(bào)系統(tǒng)的定義是存在缺陷的,它們都只包括了競(jìng)爭(zhēng)情報(bào)體系的部分內(nèi)容,缺乏全面性外,它們還有另外一個(gè)缺陷,即忽略了競(jìng)爭(zhēng)情報(bào)系統(tǒng)各構(gòu)成因素之間的相互聯(lián)系和互相依賴關(guān)系。缺乏將各部分聯(lián)系起來(lái)的“關(guān)系”,它們就不能成為“系統(tǒng)”。他認(rèn)為,競(jìng)爭(zhēng)情報(bào)系統(tǒng)是為用戶的需要?jiǎng)?chuàng)造情報(bào)產(chǎn)品的體系,它由相互聯(lián)系、相互影響的功能、結(jié)構(gòu)(資源)和方法(流程)組成,各構(gòu)成部分有機(jī)地聯(lián)系在一起,并隨著外部環(huán)境的變化而動(dòng)態(tài)發(fā)展。這里的用戶可以是企業(yè),也可以是政府機(jī)構(gòu),或自己組織內(nèi)部的某一部門或上級(jí)單位;情報(bào)產(chǎn)品既可以是文字的,也可以是圖像的、口頭的或其他方式的;創(chuàng)造過(guò)程既包括信息收集、分析,也包括撰寫情報(bào)報(bào)告等。

2. 十年來(lái)我國(guó)競(jìng)爭(zhēng)情報(bào)系統(tǒng)研究相關(guān)熱點(diǎn)及部分成果

隨著市場(chǎng)競(jìng)爭(zhēng)的深入發(fā)展和日趨激烈,企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)的理論與實(shí)踐必將愈來(lái)愈受到企業(yè)界和學(xué)術(shù)理論界的高度重視。本文選取了最近十年來(lái)刊登在《情報(bào)科學(xué)》、《情報(bào)雜志》、《情報(bào)學(xué)報(bào)》、《圖書(shū)情報(bào)工作》等幾本情報(bào)學(xué)主要核心期刊上關(guān)于競(jìng)爭(zhēng)情報(bào)系統(tǒng)的論文,對(duì)其進(jìn)行歸納總結(jié),找出了我國(guó)競(jìng)爭(zhēng)情報(bào)系統(tǒng)研究的主要幾個(gè)熱點(diǎn)問(wèn)題。主要熱點(diǎn)包括一下幾個(gè)方面:

2.1 競(jìng)爭(zhēng)情報(bào)與數(shù)據(jù)挖掘

簡(jiǎn)單地講,數(shù)據(jù)挖掘是一種利用各種分析工具建構(gòu)數(shù)據(jù)分析模型,從而在大型的數(shù)據(jù)庫(kù)(或數(shù)據(jù)倉(cāng)庫(kù))中提取人們感興趣的知識(shí)的過(guò)程。這些知識(shí)是隱含的、事先未知的、潛在有用的信息,提取的知識(shí)一般可以表達(dá)為概念、規(guī)則、規(guī)律、模式等形式。

當(dāng)前競(jìng)爭(zhēng)情報(bào)系統(tǒng)的情報(bào)源越來(lái)越多,包括企業(yè)內(nèi)部數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)、外部網(wǎng)絡(luò)、外部數(shù)據(jù)庫(kù)等等。競(jìng)爭(zhēng)情報(bào)系統(tǒng)需要向用戶提供面向主題的數(shù)據(jù)挖掘及深層的數(shù)據(jù)分析,要實(shí)現(xiàn)這些功能,就要將競(jìng)爭(zhēng)情報(bào)系統(tǒng)建立在數(shù)據(jù)挖掘技術(shù)基礎(chǔ)上。而數(shù)據(jù)挖掘?qū)?shù)據(jù)要求比較高,因此要在原有競(jìng)爭(zhēng)情報(bào)系統(tǒng)基礎(chǔ)上加強(qiáng)對(duì)數(shù)據(jù)的處理,以滿足數(shù)據(jù)挖掘的要求。目前國(guó)內(nèi)在此方面的研究多集中在web數(shù)據(jù)挖掘在競(jìng)爭(zhēng)情報(bào)系統(tǒng)中的應(yīng)用,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到競(jìng)爭(zhēng)情報(bào)系統(tǒng)的構(gòu)建。并提出了不同的基于Web挖掘技術(shù)的企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)結(jié)構(gòu)模型。

蒲群瑩在2005年第1期的情報(bào)雜志上提出的競(jìng)爭(zhēng)情報(bào)系統(tǒng)模型是建立在大量競(jìng)爭(zhēng)情報(bào)數(shù)據(jù)基礎(chǔ)上的競(jìng)爭(zhēng)情報(bào)系統(tǒng),包含四個(gè)子系統(tǒng),即競(jìng)爭(zhēng)情報(bào)收集子系統(tǒng)、數(shù)據(jù)轉(zhuǎn)換子系統(tǒng)、分析子系統(tǒng)、服務(wù)子系統(tǒng)(如圖1所示)。

圖1 基于數(shù)據(jù)挖掘的競(jìng)爭(zhēng)情報(bào)系統(tǒng)模型

1. 收集子系統(tǒng)。競(jìng)爭(zhēng)情報(bào)收集子系統(tǒng)主要包括各企業(yè)信息源以及各種信息收集工具,主要負(fù)責(zé)收集來(lái)自企業(yè)內(nèi)部和外部的信息。

2. 數(shù)據(jù)轉(zhuǎn)換子系統(tǒng)。數(shù)據(jù)轉(zhuǎn)換子系統(tǒng)主要功能是為數(shù)據(jù)挖掘提供符合要求的數(shù)據(jù),為下一步數(shù)據(jù)挖掘提供了良好的環(huán)境。

3. 分析子系統(tǒng)。經(jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù),送入競(jìng)爭(zhēng)情報(bào)分析子系統(tǒng)中,該子系統(tǒng)主要包括數(shù)據(jù)分析以及模式發(fā)現(xiàn)工具,數(shù)據(jù)挖掘是其核心技術(shù)。

4. 服務(wù)子系統(tǒng)。競(jìng)爭(zhēng)情報(bào)服務(wù)子系統(tǒng)是為整個(gè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)提供一個(gè)信息交流和共享的平臺(tái),它包括對(duì)內(nèi)和對(duì)外兩部分。

  目前看來(lái),數(shù)據(jù)挖掘是競(jìng)爭(zhēng)情報(bào)系統(tǒng)處理海量數(shù)據(jù)唯一可行的技術(shù),迄今為止這項(xiàng)技術(shù)并沒(méi)有發(fā)展成熟,將它應(yīng)用到企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)中還需要經(jīng)過(guò)很長(zhǎng)時(shí)間的探索,但是探討將兩者相結(jié)合的應(yīng)用模式是非常必要的。

2.2 競(jìng)爭(zhēng)情報(bào)系統(tǒng)與人際網(wǎng)絡(luò)

競(jìng)爭(zhēng)情報(bào)系統(tǒng)的橫向描述為組織網(wǎng)絡(luò)、信息網(wǎng)絡(luò)、人際網(wǎng)絡(luò)三大網(wǎng)絡(luò)(如圖2所示)。美國(guó)著名的公關(guān)專家李文斯頓給人際網(wǎng)絡(luò)的定義:建立人際網(wǎng)絡(luò)是一個(gè)互相交換資訊、意見(jiàn)、想法與相互介紹朋友、熟人、資源共享,也互相感激的關(guān)系。

圖2 競(jìng)爭(zhēng)情報(bào)系統(tǒng)橫向描述結(jié)構(gòu)圖

在競(jìng)爭(zhēng)情報(bào)系統(tǒng)中建立人際網(wǎng)絡(luò)的必要性主要表現(xiàn)在:通過(guò)人際交流,可以充分獲取信息,挖掘正式交流中所不能體現(xiàn)的情感信息,還可以實(shí)現(xiàn)隱含知識(shí)的轉(zhuǎn)移和傳遞。人際網(wǎng)絡(luò)是重要的非公開(kāi)情報(bào)源,是企業(yè)獲取競(jìng)爭(zhēng)情報(bào)非常重要的途徑和工具,而對(duì)于它在競(jìng)爭(zhēng)情報(bào)系統(tǒng)中的重要性,競(jìng)爭(zhēng)情報(bào)人員最近才認(rèn)識(shí)到。事實(shí)上,人際網(wǎng)絡(luò)的重要性體現(xiàn)在競(jìng)爭(zhēng)情報(bào)工作的全過(guò)程,貫穿于情報(bào)收集、分析和服務(wù)這個(gè)情報(bào)循環(huán)(Intelligence Cycle)中,尤其突出地反映在情報(bào)收集階段。

隨著我國(guó)經(jīng)濟(jì)社會(huì)的發(fā)展,企業(yè)的競(jìng)爭(zhēng)將越來(lái)越激烈,但是這些企業(yè)越來(lái)越意識(shí)到必須采取競(jìng)合策略才能更好地生存和發(fā)展,因此人際網(wǎng)絡(luò)與競(jìng)爭(zhēng)情報(bào)成為我國(guó)競(jìng)爭(zhēng)情報(bào)系統(tǒng)研究的熱點(diǎn)之一。

2.3 集成競(jìng)爭(zhēng)情報(bào)系統(tǒng)—面向企業(yè)信息集成(EII)的CIS

面向EII的集成化CIS以現(xiàn)代信息技術(shù)為手段,為部門之間、企業(yè)與集成環(huán)境內(nèi)其它供應(yīng)鏈節(jié)點(diǎn)之間、供應(yīng)鏈集成環(huán)境之間提供有效的競(jìng)爭(zhēng)情報(bào)服務(wù)與集成化的決策支持。同時(shí),根據(jù)戰(zhàn)略目標(biāo)和競(jìng)爭(zhēng)環(huán)境的變化對(duì)企業(yè)資源重新組合集成,突破部門、組織、地域、時(shí)間和硬件設(shè)備的束縛, 實(shí)現(xiàn)以企業(yè)戰(zhàn)略目標(biāo)和用戶需求為中心的集成與協(xié)同,形成敏捷的市場(chǎng)反應(yīng)能力。與傳統(tǒng)CIS相比,面向企業(yè)信息集成的CIS具有高度的集成性、敏捷性、實(shí)時(shí)性、持續(xù)性、網(wǎng)絡(luò)化、虛擬化以及智能化。

面對(duì)企業(yè)信息集成的發(fā)展,搭建集成CIS平臺(tái),提供廣泛深入的信息服務(wù)和決策支持已經(jīng)成為一種新的發(fā)展方向。同時(shí),這種集成化的CIS由于融合了先進(jìn)的網(wǎng)絡(luò)信息技術(shù)和管理理念,使其為企業(yè)部門之間、企業(yè)與外部供應(yīng)鏈節(jié)點(diǎn)之間以及不同供應(yīng)鏈集成體系之間的協(xié)作提供了集成化、平臺(tái)化和系統(tǒng)化的信息環(huán)境,同時(shí)還可以根據(jù)企業(yè)戰(zhàn)略規(guī)劃和競(jìng)爭(zhēng)環(huán)境的變遷對(duì)內(nèi)外資源進(jìn)行全面有效的整合處理和集成配置,使CIS配合企業(yè)信息集成發(fā)展的需求,進(jìn)行動(dòng)態(tài)決策調(diào)整、分布式信息服務(wù)和集成化的決策支持的實(shí)現(xiàn)成為可能。、

2.4 基于Internet與Intranet的企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)研究

在網(wǎng)絡(luò)環(huán)境下,企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)(ECIS)以內(nèi)聯(lián)網(wǎng)(Intranet)為平臺(tái),通過(guò)互聯(lián)網(wǎng)(Internet)與外部相連,應(yīng)用信息技術(shù)和現(xiàn)代組織創(chuàng)新理論,建立起以競(jìng)爭(zhēng)環(huán)境、競(jìng)爭(zhēng)對(duì)手和競(jìng)爭(zhēng)策略信息的獲取和分析為主要內(nèi)容的具有快速反應(yīng)能力的工作體系。根據(jù)網(wǎng)絡(luò)環(huán)境下企業(yè)競(jìng)爭(zhēng)情報(bào)的需求特點(diǎn),ECIS的基本功能應(yīng)當(dāng)包括競(jìng)爭(zhēng)環(huán)境監(jiān)測(cè)、市場(chǎng)變化預(yù)警、技術(shù)動(dòng)向跟蹤、競(jìng)爭(zhēng)對(duì)手分析、競(jìng)爭(zhēng)策略制訂和企業(yè)信息安全等六個(gè)方面。

根據(jù)對(duì)國(guó)內(nèi)外企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)運(yùn)行與服務(wù)模式的分析,在網(wǎng)絡(luò)環(huán)境下比較典型的服務(wù)模式主要有:競(jìng)爭(zhēng)信息掃描、戰(zhàn)略早期預(yù)警、競(jìng)爭(zhēng)知識(shí)庫(kù)建設(shè)、競(jìng)爭(zhēng)對(duì)手分析和競(jìng)爭(zhēng)策略模擬五種模式。

3. 企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)的發(fā)展趨勢(shì)

從企業(yè)戰(zhàn)略管理的角度來(lái)看,把CIS建設(shè)成企業(yè)的“中央情報(bào)局”,使之成為企業(yè)領(lǐng)導(dǎo)集團(tuán)經(jīng)營(yíng)戰(zhàn)略和競(jìng)爭(zhēng)決策的思想庫(kù)和參謀部,這將是企業(yè)CIS的主要目標(biāo)和未來(lái)發(fā)展方向。

3.1 網(wǎng)絡(luò)化方向

從企業(yè)競(jìng)爭(zhēng)情報(bào)系統(tǒng)的具體運(yùn)作角度來(lái)說(shuō),CIS的網(wǎng)絡(luò)化趨勢(shì)體現(xiàn)在系統(tǒng)運(yùn)行的信息搜集和信息服務(wù)兩個(gè)階段中:信息搜集的網(wǎng)絡(luò)化方面,企業(yè)可以定制適合自己的自動(dòng)搜索軟件,定期檢索與本企業(yè)、本行業(yè)相關(guān)的網(wǎng)上情報(bào)源。這樣既在一定程度上保證了信息搜集的完備性,又大大減少了信息搜集人員的工作量,使其可以專注于其他信息源的搜集處理,如加強(qiáng)對(duì)非公開(kāi)信息的搜集工作力度。在信息服務(wù)的網(wǎng)絡(luò)化方面,企業(yè)決策層應(yīng)該可以不受時(shí)間、地域限制地接受所需的情報(bào)服務(wù)。未來(lái)更理想的服務(wù)模式是CIS根據(jù)用戶的不同,提供特定的推送服務(wù),為不同的決策人員提供不同的定制服務(wù)界面;而企業(yè)內(nèi)的其他員工也可根據(jù)自己的需要,定制適合自己需要的Intranet服務(wù)。

3.2 智能化方向

隨著信息技術(shù)水平的不斷提高,各種新方法、新工具會(huì)應(yīng)用到競(jìng)爭(zhēng)情報(bào)系統(tǒng)中,比如智能化的自動(dòng)搜集軟件就是競(jìng)爭(zhēng)情報(bào)系統(tǒng)智能化的一種表現(xiàn)。另外,系統(tǒng)的智能化分析功能、學(xué)習(xí)功能和檢索功能的加入也都是未來(lái)競(jìng)爭(zhēng)情報(bào)系統(tǒng)的重要發(fā)展方向。

3.3 決策化方向

競(jìng)爭(zhēng)情報(bào)系統(tǒng)的工作重心將從單純的、分散的日常性情報(bào)工作轉(zhuǎn)向目的性很強(qiáng)的競(jìng)爭(zhēng)對(duì)手跟蹤、重大課題深入分析、競(jìng)爭(zhēng)策略研究等方面,并日益成為企業(yè)決策的重要依據(jù)。

3.4 集成化方向

企業(yè)將在實(shí)物資源、財(cái)務(wù)資源和人力資源三類系統(tǒng)之間實(shí)現(xiàn)恰當(dāng)?shù)募?,這樣將會(huì)使其能夠在組織的協(xié)同作用方面以及在與競(jìng)爭(zhēng)能力相關(guān)的產(chǎn)品、服務(wù)、市場(chǎng)反應(yīng)、管理決策等方面都獲得顯著改善。

4. 結(jié)語(yǔ)

數(shù)據(jù)挖掘技術(shù)探討論文范文第3篇

關(guān)鍵詞:學(xué)業(yè)預(yù)警系統(tǒng);B/S架構(gòu);數(shù)據(jù)挖掘;.NET技術(shù)

中圖分類號(hào):TU 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):16723198(2012)10016401

1緒論

1.1 選題背景

由于各方面的因素,每年到了畢業(yè)的前夕,仍有相當(dāng)比例的學(xué)生不能完成基本的學(xué)分績(jī)點(diǎn),從而不能正常地畢業(yè)。學(xué)校為了使這些學(xué)生能夠順利地畢業(yè),采取了“清考”等措施,但這些措施是被動(dòng)的,帶有較大的負(fù)面影響,并且也增加了教學(xué)成本。

為了解決這一問(wèn)題,學(xué)校提出了學(xué)業(yè)預(yù)警系統(tǒng),但目前的學(xué)業(yè)預(yù)警系統(tǒng)僅僅提供了學(xué)生的成績(jī),而沒(méi)有有效地信息技術(shù)支持,需要人工來(lái)查找和發(fā)現(xiàn)學(xué)分績(jī)點(diǎn)過(guò)低的學(xué)生,使得這種預(yù)警系統(tǒng)的效率不高,達(dá)不到學(xué)校的預(yù)期目的,仍不能有效地消除“清考”現(xiàn)象。

1.2 本課題研究的主要內(nèi)容

本文是以學(xué)分制下學(xué)生培養(yǎng)方案和學(xué)生成績(jī)數(shù)據(jù)庫(kù)為支撐,依托數(shù)據(jù)挖掘技術(shù)的有關(guān)方法和實(shí)施工具,自動(dòng)搜索數(shù)據(jù)庫(kù),并根據(jù)關(guān)聯(lián)規(guī)則對(duì)學(xué)生的課程學(xué)習(xí)進(jìn)行預(yù)測(cè),從而更加智能的對(duì)學(xué)生的學(xué)業(yè)進(jìn)行深入的研究,并根據(jù)專家系統(tǒng)對(duì)每個(gè)學(xué)生的相關(guān)信息進(jìn)行分析給出相關(guān)的建議。

1.3 文章結(jié)構(gòu)

第一章討論選題背景和主要研究工作及全文結(jié)構(gòu)。

第二章是系統(tǒng)需求分析,提出系統(tǒng)要實(shí)現(xiàn)的功能。

第三章主要介紹學(xué)業(yè)預(yù)警系統(tǒng)的總體設(shè)計(jì)思路、系統(tǒng)的框架結(jié)構(gòu)等。

第四章對(duì)系統(tǒng)實(shí)現(xiàn)過(guò)程中用到的系統(tǒng)軟件產(chǎn)品的選擇做了簡(jiǎn)要說(shuō)明。

第五章為結(jié)束語(yǔ),總結(jié)論文所開(kāi)展的工作和下一步工作設(shè)想。

2系統(tǒng)需求分析

2.1 系統(tǒng)總體目標(biāo)

學(xué)業(yè)預(yù)警系統(tǒng)的總體目標(biāo):本系統(tǒng)能夠自動(dòng)錄入學(xué)生學(xué)業(yè)信息,并根據(jù)學(xué)生已修課程給出相關(guān)課程的預(yù)測(cè)成績(jī),并能自動(dòng)計(jì)算績(jī)點(diǎn)與平均分,如發(fā)現(xiàn)可疑學(xué)生數(shù)據(jù)(績(jī)點(diǎn)或平均分不夠)可以對(duì)學(xué)生發(fā)出預(yù)警,并且向院系工作人員及輔導(dǎo)員發(fā)送預(yù)警信息,督促學(xué)生學(xué)習(xí),達(dá)到使學(xué)生能夠順利里畢業(yè)的目的。

2.2 系統(tǒng)可行性分析

2.2.1 技術(shù)可行性

學(xué)業(yè)預(yù)警系統(tǒng)所用的數(shù)據(jù)挖掘技術(shù)能夠自動(dòng)錄入及查詢信息,能夠節(jié)約人力和物力,并且此技術(shù)已相當(dāng)成熟,有專門的開(kāi)發(fā)平臺(tái)作支撐。

2.2.2 經(jīng)濟(jì)可行性

現(xiàn)今,計(jì)算機(jī)的價(jià)格已經(jīng)十分低廉,性能卻有著長(zhǎng)足的進(jìn)步,它已經(jīng)被應(yīng)用于許多領(lǐng)域。所以,系統(tǒng)所需的開(kāi)發(fā)費(fèi)用并不是很昂貴,然而這套系統(tǒng)的成功投入使用可以節(jié)約大量人力,提高信息管理的質(zhì)量,也方便學(xué)校的管理。

2.3 系統(tǒng)需求

2.3.1 功能劃分

錄入信息:錄入本院學(xué)生學(xué)業(yè)信息及專業(yè)培養(yǎng)方案。

學(xué)業(yè)信息查看:學(xué)院登錄系統(tǒng)查看學(xué)生的相關(guān)學(xué)業(yè)信息及預(yù)警信息。

個(gè)人預(yù)警信息查詢:學(xué)生登陸系統(tǒng)查看自己的預(yù)警信息。

預(yù)測(cè)成績(jī)查詢:學(xué)生登陸系統(tǒng)查看系統(tǒng)對(duì)自己的學(xué)業(yè)做出的預(yù)測(cè)。

用戶權(quán)限管理:系統(tǒng)為學(xué)生及院系工作人員設(shè)置不同的權(quán)限。

成績(jī)管理:后臺(tái)操作人員對(duì)學(xué)生的成績(jī)進(jìn)行管理。

2.3.2 功能描述

圖12.4 性能需求

2.4.1 數(shù)據(jù)精確度

要按照嚴(yán)格的數(shù)據(jù)格式輸入,否則系統(tǒng)不給予響應(yīng)進(jìn)行處理。

系統(tǒng)管理員具有數(shù)據(jù)修改權(quán)限,其他用戶在系統(tǒng)開(kāi)放時(shí)間過(guò)后無(wú)權(quán)進(jìn)入系統(tǒng)。

2.4.2 時(shí)間特性

一般操作的響應(yīng)時(shí)間應(yīng)在1~2秒內(nèi),對(duì)軟磁盤和打印機(jī)的操作也應(yīng)在可接受的時(shí)間內(nèi)完成。

3 系統(tǒng)設(shè)計(jì)

3.1 系統(tǒng)設(shè)計(jì)的原則和目標(biāo)

適應(yīng)目前及今后一段時(shí)期信息化管理的要求,系統(tǒng)化、結(jié)構(gòu)化、模塊化,保證整個(gè)系統(tǒng)的完整性、一致性,可適時(shí)更新升級(jí),以滿足需求變化的需要。

(1)符合人們的思維習(xí)慣。

(2)便于各種事物的安排處理。

(3)易于擴(kuò)展。

3.2 系統(tǒng)架構(gòu)設(shè)計(jì)

通過(guò)需求分析學(xué)業(yè)預(yù)警系統(tǒng)采用B/S結(jié)構(gòu)。本系統(tǒng)在構(gòu)架上采用分層的體系結(jié)構(gòu),將軟件分為三個(gè)層次,表現(xiàn)層(Presentation)從用戶收集信息,將用戶信息傳送給業(yè)務(wù)服務(wù)層;Web層用來(lái)響應(yīng)瀏覽器客戶發(fā)來(lái)的請(qǐng)求,并調(diào)用業(yè)務(wù)層組件,將業(yè)務(wù)層組件返回的結(jié)果發(fā)送給瀏覽器客戶;數(shù)據(jù)層(Data)提供接口進(jìn)行永久數(shù)據(jù)的存儲(chǔ)。

3.3 數(shù)據(jù)庫(kù)設(shè)計(jì)

根據(jù)學(xué)業(yè)預(yù)警系統(tǒng)需求分析,設(shè)計(jì)對(duì)應(yīng)的數(shù)據(jù)表:

(1)學(xué)生信息表:存放與學(xué)生信息相關(guān)的信息數(shù)據(jù)。

(2)專業(yè)培養(yǎng)方案表:存放與專業(yè)培養(yǎng)方向相關(guān)的信息數(shù)據(jù)。

(3)學(xué)生學(xué)業(yè)表:存放學(xué)生的詳細(xì)學(xué)業(yè)信息數(shù)據(jù)。

(4)院系信息表:存放有關(guān)學(xué)生所屬院系的基礎(chǔ)信息數(shù)據(jù)。

(5)管理員信息表:存放管理員的相關(guān)信息數(shù)據(jù)。

3.4 小結(jié)

本章首先提出了系統(tǒng)總體設(shè)計(jì)時(shí)遵循的設(shè)計(jì)思想即符合人們的思維習(xí)慣、便于事務(wù)的安排、易于擴(kuò)展、便于人工干預(yù),并按照上述設(shè)計(jì)思想,在確定了學(xué)業(yè)預(yù)警系統(tǒng)功能的結(jié)構(gòu)基礎(chǔ)上,對(duì)與系統(tǒng)相關(guān)的數(shù)據(jù)庫(kù)表做了介紹。共設(shè)計(jì)了5個(gè)數(shù)據(jù)庫(kù)基本表,各表之間通過(guò)外鍵連接。

4 系統(tǒng)實(shí)現(xiàn)

前面我們闡述了學(xué)業(yè)預(yù)警功能的需求,這里我們選取幾個(gè)相關(guān)功能對(duì)管理功能的實(shí)現(xiàn)進(jìn)行詳細(xì)描述。

4.1 開(kāi)發(fā)平臺(tái)的搭建

CPU:Intel PentiumD 925

內(nèi)存:DDR 400 1G

操作系統(tǒng):Microsoft Windows Server 2003

開(kāi)發(fā)工具: Visual Studio 2010

數(shù)據(jù)庫(kù):SQL Server 2000

4.2 用戶權(quán)限設(shè)計(jì)

4.2.1 基于角色的訪問(wèn)控制策略

安全訪問(wèn)控制策略占據(jù)著至關(guān)重要的作用。為了保證資源的安全,系統(tǒng)一要確認(rèn)使用者的身份是否合法:二要判定該使用者是否有權(quán)使用或更改某一項(xiàng)信息資源。基于角色的訪問(wèn)控制策略簡(jiǎn)單來(lái)說(shuō)就是在用戶(user)和訪問(wèn)許可權(quán)限(permission)之間引入角色的(role)的概念,把用戶和權(quán)限通過(guò)角色聯(lián)系起來(lái),用戶被賦予某種角色,也就擁有相應(yīng)的權(quán)限。

4.2.2 身份驗(yàn)證

本系統(tǒng)中用戶身份信息是由以下字段組成:用戶登錄賬號(hào)、密碼,這些字段在數(shù)據(jù)庫(kù)中作為一個(gè)數(shù)據(jù)表,用戶每次登錄時(shí),需輸入登錄賬號(hào)和密碼,采用表單提交用戶輸入的賬號(hào)和密碼,并通過(guò)數(shù)據(jù)庫(kù)訪問(wèn)該數(shù)據(jù)表,進(jìn)行身份標(biāo)識(shí)與鑒別,并利用數(shù)據(jù)驗(yàn)證控件進(jìn)行驗(yàn)證。

4.2.3 授權(quán)

授權(quán)是指準(zhǔn)許或拒絕特定用戶訪問(wèn)資源的過(guò)程。在該體系結(jié)構(gòu)中,授權(quán)主要包括兩種方式:“模塊訪問(wèn)安全性”和“模塊功能操作安全性”,且這種兩種方式都是基于用戶所隸屬的角色來(lái)實(shí)現(xiàn)的。

5 結(jié)束語(yǔ)

本文對(duì)學(xué)業(yè)預(yù)警系統(tǒng)的總體規(guī)劃、需求分析、系統(tǒng)設(shè)計(jì)等方面進(jìn)行了詳細(xì)研究。通過(guò)研究,加深了對(duì)各種開(kāi)發(fā)模式的了解,初步了解了實(shí)現(xiàn)三層客戶機(jī)/服務(wù)器模式的系統(tǒng)開(kāi)發(fā)技術(shù)。

參考文獻(xiàn)

[1]陳曉紅.管理信息系統(tǒng)教程[M].北京:清華大學(xué)出版社,2003.

[2]任泰明.基于B/S結(jié)構(gòu)的軟件開(kāi)發(fā)技術(shù)[M].西安:西安電子科技大學(xué)出版社,2006.

[3]彭東主.SQL Server 2000應(yīng)用開(kāi)發(fā)技術(shù)指南[M].北京:清華大學(xué)出版社,2000.

數(shù)據(jù)挖掘技術(shù)探討論文范文第4篇

中圖分類號(hào):R2-03 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1005-5304(2013)04-0103-05

由于中醫(yī)診斷主要根據(jù)醫(yī)生的經(jīng)驗(yàn)來(lái)決定,因此,在臨床施治過(guò)程中存在較大的主觀性和不確定性等問(wèn)題。在中醫(yī)診斷領(lǐng)域引進(jìn)數(shù)據(jù)挖掘技術(shù),不但符合現(xiàn)在多學(xué)科交叉發(fā)展的潮流,在解決實(shí)際問(wèn)題上,無(wú)疑也是中醫(yī)客觀化進(jìn)程中的又一催化劑。作為一門融合人工智能、機(jī)器學(xué)習(xí)和數(shù)理統(tǒng)計(jì)等方法的新型學(xué)科技術(shù),數(shù)據(jù)挖掘在克服人類本身認(rèn)知和思維長(zhǎng)度的基礎(chǔ)上,充分利用海量臨床數(shù)據(jù),通過(guò)模擬臨床診斷推理過(guò)程來(lái)挖掘臨床診斷數(shù)據(jù)中繁雜的證、癥關(guān)系,對(duì)尋求中醫(yī)專家的辨證規(guī)律有重要價(jià)值。目前,在該領(lǐng)域涉及到的數(shù)據(jù)挖掘方法較多,主要有貝葉斯網(wǎng)絡(luò)、人工神經(jīng)網(wǎng)絡(luò)、粗糙集理論、關(guān)聯(lián)分析、決策樹(shù)、聚類分析、判別分析、支持向量機(jī)、多標(biāo)記學(xué)習(xí)、隨機(jī)森林等。筆者現(xiàn)對(duì)這些方法的相關(guān)應(yīng)用綜述如下。

1 常見(jiàn)數(shù)據(jù)挖掘方法

1.1 貝葉斯網(wǎng)絡(luò)

貝葉斯網(wǎng)絡(luò)是通過(guò)簡(jiǎn)明的圖形方式結(jié)合統(tǒng)計(jì)理論來(lái)定性表示變量間復(fù)雜因果或概率關(guān)系的一種數(shù)據(jù)分析方法,包括網(wǎng)絡(luò)集和概率集兩部分。該方法具強(qiáng)大的執(zhí)行高效推理任務(wù)的功能,能充分利用先驗(yàn)知識(shí),而使其在診斷領(lǐng)域的應(yīng)用價(jià)值極大。在解決中醫(yī)定量診斷問(wèn)題上,其體現(xiàn)出的功能主要表現(xiàn)在:揭示眾多癥癥之間以及癥與證間的復(fù)雜關(guān)系,探究證候的主要癥狀和次要癥狀,定量確定其診斷價(jià)值,這有助于確定證候診斷的標(biāo)準(zhǔn)和規(guī)范,而且建立的證候診斷模型以概率形式給出診斷結(jié)果,能有效輔助專家作出決策。因此,該方法對(duì)促進(jìn)中醫(yī)診斷學(xué)發(fā)展所做的貢獻(xiàn)不可忽視。張氏等[1]對(duì)255例肺癌患者證候以癥狀之間的關(guān)聯(lián)性及關(guān)聯(lián)強(qiáng)度為基礎(chǔ),利用貝葉斯網(wǎng)絡(luò)概括出了肺癌的證候要素,包括病機(jī)要素9個(gè)、病位要素5個(gè)及病機(jī)要素之主要癥狀與次要癥狀。曲氏等[2]對(duì)611例抑郁癥患者的中醫(yī)證候進(jìn)行了研究,采用貝葉斯網(wǎng)絡(luò)對(duì)抑郁癥中醫(yī)癥狀進(jìn)行評(píng)定,發(fā)現(xiàn)擬定的中醫(yī)證型包含了抑郁癥的核心癥狀和周邊癥狀的不同組合方式,體現(xiàn)了抑郁癥臨床多變的證候特點(diǎn)。范氏等[3]對(duì)收集到的1512例類風(fēng)濕關(guān)節(jié)炎(RA)患者的臨床數(shù)據(jù)采用基于聚類的貝葉斯網(wǎng)絡(luò)模型,提取出了RA的7項(xiàng)主特征及4型的類特征,為中醫(yī)辨證分型及RA中醫(yī)診斷標(biāo)準(zhǔn)提供了臨床依據(jù)。龔氏等[4]對(duì)2501例2型糖尿病的臨床數(shù)據(jù)運(yùn)用該方法分析,發(fā)現(xiàn)空腹血糖異?;颊呒疤腔t蛋白異?;颊呔躁幪摕崾⒍嘁?jiàn),而餐后2 h血糖異?;颊邉t以陰虛多見(jiàn)。王氏等[5]應(yīng)用此方法通過(guò)分析474例血瘀證臨床診斷數(shù)據(jù)進(jìn)行血瘀證定量診斷,發(fā)現(xiàn)了血瘀證的7個(gè)關(guān)鍵癥狀,并與此同時(shí)建立“是否血瘀證”的分類器模型,經(jīng)交叉驗(yàn)證發(fā)現(xiàn)此分類器診斷準(zhǔn)確率達(dá)96.6%。郭氏等[6]認(rèn)為,證候的復(fù)雜性表現(xiàn)為證候各因素之間的高維高階性,他們運(yùn)用貝葉斯網(wǎng)絡(luò)技術(shù)對(duì)肺系疾病證候構(gòu)成因素之間關(guān)聯(lián)形式進(jìn)行了研究,發(fā)現(xiàn)各因素間的聯(lián)結(jié)形式是線性相關(guān)與非線性相關(guān)并存的,它們相互交織,形成復(fù)雜的網(wǎng)絡(luò)結(jié)構(gòu),表現(xiàn)出典型的非線性特征。

1.2 人工神經(jīng)網(wǎng)絡(luò)

人工神經(jīng)網(wǎng)絡(luò)是在對(duì)人腦神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)認(rèn)識(shí)理解的基礎(chǔ)上人工構(gòu)造的新型信息處理系統(tǒng)。目前的神經(jīng)網(wǎng)絡(luò)模型有:用于分類、預(yù)測(cè)和模式識(shí)別的前饋式神經(jīng)網(wǎng)絡(luò)模型,用于聯(lián)想記憶和優(yōu)化計(jì)算的反饋式神經(jīng)網(wǎng)絡(luò)模型,以及用于聚類的自組織映射方法。其中前饋式神經(jīng)網(wǎng)絡(luò)模型是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)之一。對(duì)于將其應(yīng)用于中醫(yī)診斷領(lǐng)域,陳氏[7]認(rèn)為,中醫(yī)學(xué)辨證施治本質(zhì)上就是對(duì)眾多數(shù)據(jù)信息進(jìn)行處理并提取規(guī)律的過(guò)程,而人工神經(jīng)網(wǎng)絡(luò)恰恰具備較好獲得數(shù)據(jù)規(guī)律的能力。人工神經(jīng)網(wǎng)絡(luò)模型的優(yōu)勢(shì)主要體現(xiàn)于其黑箱結(jié)構(gòu),這賦予人工神經(jīng)網(wǎng)絡(luò)強(qiáng)大的非線性擬合能力,使其能夠任意精度逼近非線性函數(shù)。

但不足的是,在中醫(yī)研究中,人工神經(jīng)網(wǎng)絡(luò)不能進(jìn)行變量篩選,對(duì)其得到的結(jié)果也只是局部最優(yōu)而非全局最優(yōu)。如李氏等[8]對(duì)142例脾氣虛弱及肺脾氣虛證HIV/AIDS患者的主要實(shí)驗(yàn)指標(biāo)、四診信息的主要癥狀和舌象運(yùn)用Clementine中的特征選擇節(jié)點(diǎn)進(jìn)行篩選,建立脾氣虛弱和肺脾氣虛的人工神經(jīng)網(wǎng)絡(luò)模型,發(fā)現(xiàn)該模型能較好地診斷艾滋病患者脾氣虛弱和肺脾氣虛證型,其樣本模型訓(xùn)練集診斷的正確率和測(cè)試集診斷的正確率分別為87.25%和80.00%。傅氏等[9]認(rèn)為,運(yùn)用數(shù)據(jù)驅(qū)動(dòng)模式建立中風(fēng)人工神經(jīng)網(wǎng)絡(luò)模型,將為進(jìn)行繁雜多變的中風(fēng)證候的動(dòng)態(tài)研究、掌握證候的動(dòng)態(tài)演變規(guī)律及在不同時(shí)點(diǎn)進(jìn)行療效評(píng)價(jià)提供一個(gè)新的探索方向。許氏等[10]通過(guò)對(duì)心血管疾病中醫(yī)臨床信息數(shù)據(jù)庫(kù)中的臨床信息和證候類別之間的關(guān)系進(jìn)行分析,發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)尤其是OCON網(wǎng)絡(luò)對(duì)該病常見(jiàn)的中醫(yī)證型的識(shí)別率最高,其中心氣虛證和心陽(yáng)虛證分別高達(dá)92.4%、82.9%。有研究運(yùn)用人工神經(jīng)網(wǎng)絡(luò)分析RA、糖尿病腎病(DN),分別建立RA和DN證候的BP網(wǎng)絡(luò)模型,并采用三倍交叉驗(yàn)證的方法,發(fā)現(xiàn)這2種模型平均診斷準(zhǔn)確率分別為90.72%、92.21%[11-12]。余氏[13]通過(guò)文獻(xiàn)資料和臨床資料收集選用人工神經(jīng)網(wǎng)絡(luò)等方法開(kāi)展2型糖尿病證候診斷標(biāo)準(zhǔn)模型建立及對(duì)比研究,所建模型在臨床數(shù)據(jù)測(cè)試樣本的正確辨識(shí)率為73%。

1.3 粗糙集理論

粗糙集理論主要用于分析研究不完備數(shù)據(jù),這是繼概率論、模糊集、灰色理論之后又一個(gè)刻畫不確定、不完備系統(tǒng)的有力數(shù)學(xué)工具。基于其具有能有效處理各種不確定、不完備信息的強(qiáng)大能力,有研究者認(rèn)為將其用于分析中醫(yī)癥狀-辨證要素間相關(guān)性,建立定性定量標(biāo)準(zhǔn),有很大前景[14]。其最大優(yōu)點(diǎn)在于不需要問(wèn)題所需處理數(shù)據(jù)之外的任何先驗(yàn)信息,能夠在保留關(guān)鍵信息的前提下求得知識(shí)的最小表達(dá)式。因此,將粗糙集理論引入中醫(yī),運(yùn)用到中醫(yī)診斷上,將可能是實(shí)現(xiàn)中醫(yī)診斷智能化的又一個(gè)發(fā)展方向。

陳氏等[15]以450例老年人細(xì)菌性肺炎患者在就診過(guò)程中的285項(xiàng)指標(biāo)為研究對(duì)象,采用粗糙集方法對(duì)已經(jīng)過(guò)初始數(shù)據(jù)處理的各數(shù)據(jù)進(jìn)行挖掘分析,得到7種中老年肺炎的證候診斷標(biāo)準(zhǔn),為療效評(píng)價(jià)指標(biāo)提供了客觀依據(jù)。陳氏等[16]從與原發(fā)性高血壓相關(guān)的古今醫(yī)案中收集237例病案,對(duì)其癥狀和體征進(jìn)行數(shù)據(jù)預(yù)處理,運(yùn)用基于粗糙集理論的KDD決策分析系統(tǒng)Rosetta軟件約簡(jiǎn)病證屬性,獲取到了原發(fā)性高血壓肝陽(yáng)上亢證的專家知識(shí),為進(jìn)一步研究原發(fā)性高血壓肝陽(yáng)上亢證奠定基礎(chǔ)。劉氏[17]運(yùn)用粗糙集理論對(duì)脾胃系疾病的證候診斷進(jìn)行相關(guān)研究,建立了可進(jìn)行辨證分型的計(jì)算機(jī)軟件,并通過(guò)這一軟件量化標(biāo)準(zhǔn)來(lái)判斷患者所屬證候,為治療脾胃系疾病辨證提供可靠依據(jù)。謝氏[18]建立了一個(gè)基于粗集理論的中醫(yī)診斷專家系統(tǒng)模型,以模擬中醫(yī)專家診斷的過(guò)程。秦氏等[19]把粗糙集應(yīng)用于中醫(yī)類風(fēng)濕證候診斷,并在類風(fēng)濕病的各證候診斷上應(yīng)用。

1.4 關(guān)聯(lián)分析

在數(shù)據(jù)挖掘方法中,關(guān)聯(lián)分析常用來(lái)挖掘特征之間或者數(shù)據(jù)之間的相互依賴關(guān)系,對(duì)給定的事務(wù)數(shù)據(jù)庫(kù)找出滿足最小支持度和最小置信度的關(guān)聯(lián)規(guī)則。與其他數(shù)據(jù)分析方法不同的是,關(guān)聯(lián)規(guī)則的引入,可以從大量貌似繁雜癥與證的數(shù)據(jù)中,找到隱形的關(guān)聯(lián),極大促進(jìn)中醫(yī)診斷學(xué)的發(fā)展;并且其所得結(jié)果清晰有用,同時(shí)支持間接數(shù)據(jù)挖掘;可處理變長(zhǎng)的數(shù)據(jù),為尋找診斷數(shù)據(jù)中的隱性關(guān)聯(lián)帶來(lái)了方便,其計(jì)算的消耗量也可以預(yù)見(jiàn)[20]。

肖氏等[21]設(shè)計(jì)了一種基于遺傳算法的正相關(guān)關(guān)聯(lián)規(guī)則挖掘算法,發(fā)現(xiàn)胃部不適癥狀與處方、證候重要關(guān)聯(lián)關(guān)系。陳氏等[22]通過(guò)對(duì)400例肝硬變患者進(jìn)行關(guān)聯(lián)分析,找出符合最小支持度和最小置信度并形成規(guī)則的中醫(yī)證候氣滯/氣郁證和血瘀證,這表明肝硬變和氣滯證、血瘀證之間關(guān)聯(lián)度非常高。鐘氏等[20]采用關(guān)聯(lián)規(guī)則的分析算法,探求胃炎癥狀與“中虛氣滯”辨證之間的關(guān)系,得到在中虛氣滯證中,口干欲飲這個(gè)癥狀對(duì)辨證的影響最大。

1.5 決策樹(shù)

決策樹(shù)算法是一種逼近離散值函數(shù)的方法,常用來(lái)形成分類器和預(yù)測(cè)模型,是建立在信息論基礎(chǔ)之上對(duì)數(shù)據(jù)進(jìn)行分類的一種方法。岳氏[23]通過(guò)選取300例確診為小兒肺炎患者的數(shù)據(jù)為基礎(chǔ),成功構(gòu)建了基于決策樹(shù)算法的小兒肺炎指紋辨證分類模型,準(zhǔn)確率達(dá)84.5%。鐘氏等[20]從中醫(yī)胃炎數(shù)據(jù)中篩選出“中虛氣滯”的病歷,通過(guò)決策樹(shù),以“中虛氣滯”為目標(biāo)屬性,根據(jù)病歷中癥狀辨證是否與目標(biāo)屬性相同設(shè)置“yes”和“no”兩值,再通過(guò)設(shè)置的訓(xùn)練樣例運(yùn)用ID3算法構(gòu)建決策樹(shù),以判斷未知中醫(yī)證型的病例是否歸屬“中虛氣滯”。查氏等[24]將397例已確診活動(dòng)期RA患者隨機(jī)分為中藥和西藥治療組,通過(guò)對(duì)其初診中西醫(yī)癥狀及檢查結(jié)果采用決策樹(shù)進(jìn)行證病信息和療效的相關(guān)關(guān)系探索,得出可從證候信息的角度獲得藥物治療的最佳適應(yīng)證,從而實(shí)現(xiàn)個(gè)體化治療。徐氏等[25]對(duì)406例慢性胃炎病例用bootstrap抽樣擴(kuò)增,采用基于信息熵的決策樹(shù)c4.5算法建立中醫(yī)辨證模型,測(cè)試集模型分類符合率為81.25%。

1.6 聚類分析

聚類分析的實(shí)質(zhì)就是聚集數(shù)據(jù)成類,使類間的相似性最小,而盡可能增大類內(nèi)的相似性。其優(yōu)點(diǎn)是:作為一種探索性的統(tǒng)計(jì)分析方法,聚類分析方法可以在對(duì)數(shù)據(jù)沒(méi)有先驗(yàn)知識(shí)的情況下對(duì)數(shù)據(jù)資料進(jìn)行分類,根據(jù)數(shù)據(jù)的內(nèi)在相似或相關(guān)程度,可使得類別內(nèi)數(shù)據(jù)“差異”盡可能小,類別間“差異”盡可能大,對(duì)中醫(yī)藥領(lǐng)域中的癥狀組合規(guī)律、證候規(guī)律等方面的研究具有一定的推動(dòng)作用。但由于中醫(yī)證候復(fù)雜程度較大,聚類分析在解決這些問(wèn)題時(shí)存在的局限性表現(xiàn)在:①多結(jié)果,主觀性大。此分析方法無(wú)法根據(jù)數(shù)據(jù)內(nèi)部特點(diǎn)自主確定分為幾類,需要研究者依據(jù)其學(xué)科知識(shí)和經(jīng)驗(yàn)來(lái)確定到底聚為幾類、聚到哪一類為最佳;此外,選擇不同的類間距離和變量間距離的定義方法,結(jié)果將大有不同,因此,多次嘗試、反復(fù)分析對(duì)于此類分析方法來(lái)說(shuō)是必須的。②單分配,即變量只能被聚到某一類。在研究癥狀的聚類問(wèn)題時(shí),中醫(yī)的一個(gè)癥狀常需要能被聚到不同的類中,但聚類分析只能將一個(gè)癥狀歸入某一個(gè)類別里面。

李氏等[26]應(yīng)用系統(tǒng)聚類的方法對(duì)276例乙肝后肝硬化的癥狀、體征進(jìn)行分析研究,得出乙肝后肝硬化基本中醫(yī)證候有濕熱內(nèi)蘊(yùn)證、肝腎陰虛證、肝郁脾虛證、脾虛濕盛證、脾腎陽(yáng)虛證、血瘀證、氣(陽(yáng))虛證共7類。盧氏等[27]通過(guò)制定“中醫(yī)證候臨床觀察表”,對(duì)106例兒童中間型β地中海貧血患者進(jìn)行中醫(yī)證候調(diào)查,采用聚類分析等統(tǒng)計(jì)學(xué)方法得出廣州地區(qū)中間型β地中海貧血患兒中醫(yī)證候分布特點(diǎn)為氣血兩虛證>肝腎陰虛證>脾腎陽(yáng)虛證>陰陽(yáng)兩虛證,這為進(jìn)一步規(guī)范化辨證論治提供了一定依據(jù)。何氏等[28]采用臨床流行病學(xué)的方法,對(duì)143例冠心病PIC術(shù)后患者的癥狀、體征等臨床資料進(jìn)行了聚類分析,得出冠心病PIC術(shù)后患者證候分為氣虛痰濁、腎虛血瘀、肝氣郁結(jié)、脾氣虧虛、心氣虧虛、氣陰虧虛共6類。黃氏等[29]應(yīng)用變量聚類分析的數(shù)理統(tǒng)計(jì)方法,對(duì)慢性疲勞綜合征(CFS)進(jìn)行了中醫(yī)辨證分型,并對(duì)收集到的237例CFS患者的癥狀、舌象和脈象等臨床資料進(jìn)行了變量聚類分析,得出變量聚類分析能幫助CFS在中醫(yī)證候中合理分為精髓空虛、陰液虧虛、脾腎陽(yáng)虛和肝火亢盛共4型,解釋比例為61.68%。

1.7 判別分析

與其他統(tǒng)計(jì)學(xué)方法不同的是,判別分析的主要目的是建立一個(gè)線性組合,使其可用最優(yōu)化的模型來(lái)概括分類之間的差異。該方法常用來(lái)根據(jù)已知數(shù)據(jù)的分類情況判斷未知待分析數(shù)據(jù)的歸屬問(wèn)題等,在證候的研究方面應(yīng)用最廣。

胡氏等[30]根據(jù)所收集的413例亞健康失眠患者的中醫(yī)證型對(duì)證候變量進(jìn)行逐步判別分析,建立判別函數(shù)式,得出亞健康失眠中醫(yī)證型判別函數(shù)與臨床診斷吻合良好,逐一回代法判別總一致率達(dá)81.1%。夏氏等[31]對(duì)77例慢性再生障礙性貧血(CAA)患者進(jìn)行辨證分型分組,應(yīng)用逐步判別分析方法建立CAA中醫(yī)證型判別方程,篩選出了與判別方程最相關(guān)的6個(gè)免疫學(xué)和血常規(guī)指標(biāo)。酈氏等[32]以腦梗死中醫(yī)證型標(biāo)準(zhǔn)化研究結(jié)果為基礎(chǔ),采用逐步判別分析,建立了腦梗死各證型與觀察指標(biāo)間的數(shù)學(xué)判別方程。趙氏等[33]對(duì)收集符合RA診斷標(biāo)準(zhǔn)的患者按照辨證對(duì)變量進(jìn)行逐步判別分析,建立了一個(gè)具有較好的判別效果的判別模型。薛氏等[34]選用已進(jìn)行頻數(shù)分析的文獻(xiàn)207篇進(jìn)行肝病證候的判別分析,認(rèn)為肝郁脾虛證辨證標(biāo)準(zhǔn)難以脫離疾病特點(diǎn)。

1.8 支持向量機(jī)

支持向量機(jī)是基于統(tǒng)計(jì)學(xué)習(xí)和結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則的學(xué)習(xí)機(jī)器,可以通過(guò)核函數(shù)將低維輸入空間的數(shù)據(jù)特征投射到高維數(shù)據(jù)控件,并求得最優(yōu)分類的超平面。該算法的關(guān)鍵思想是利用核函數(shù)把一個(gè)復(fù)雜的分類任務(wù)映射,使之轉(zhuǎn)化成一個(gè)線性可分問(wèn)題。在許多實(shí)際學(xué)習(xí)問(wèn)題中,它允許擴(kuò)大的空間維數(shù)非常大,在某些情況下可能無(wú)窮大,能較好地解決小樣本、非線性、高維數(shù)和局部最小等問(wèn)題。支持向量機(jī)方法較適用于中醫(yī)診斷數(shù)據(jù)的現(xiàn)狀和對(duì)中醫(yī)臨床經(jīng)驗(yàn)的總結(jié)。

徐氏等[35]以中醫(yī)心系503個(gè)樣本為例,利用支持向量機(jī)進(jìn)行中醫(yī)心系證候分類研究,結(jié)果表明,該方法在證候分類中能達(dá)到較高的準(zhǔn)確率。王氏等[36]以名醫(yī)診治冠心病典型醫(yī)案115例建立冠心病名醫(yī)診療數(shù)據(jù)庫(kù),運(yùn)用支持向量機(jī)方法提取到名醫(yī)診治冠心病8個(gè)主要證候要素并確定其定量診斷,闡釋了證候要素應(yīng)證組合規(guī)律。殷氏等[37]對(duì)舌診數(shù)據(jù)進(jìn)行主成分提取,分別建立Logistic回歸和支持向量機(jī)模型,發(fā)現(xiàn)在小樣本情況下支持向量機(jī)模型更優(yōu),敏感度達(dá)92.8%,特異度達(dá)92.3%。楊氏等[38]精選1個(gè)家系虛寒證的相關(guān)基因信息,選擇間接比較實(shí)驗(yàn)方案進(jìn)行基因芯片實(shí)驗(yàn),對(duì)5例虛寒證和5例正常人差異表達(dá)基因的表達(dá)值進(jìn)行建模,使用支持向量機(jī)、K近鄰分類法等方法,將家系中其他人樣本帶入,發(fā)現(xiàn)其能夠正確判別。在舌象診斷鑒別上,謝氏[39]依據(jù)支持向量機(jī)理論,以徑向基函數(shù)作為核函數(shù)構(gòu)造多分類分類器,將舌象的特征參數(shù)作為輸入樣本,對(duì)病證進(jìn)行分類,并以肝病病證分類做了仿真。

1.9 多標(biāo)記學(xué)習(xí)方法

與其他分類方法不同的是,多標(biāo)記學(xué)習(xí)方法的每個(gè)研究對(duì)象不再對(duì)應(yīng)于單一的概念標(biāo)記,而是由單個(gè)示例(屬性向量)表示并對(duì)應(yīng)于多個(gè)概念標(biāo)記,即一個(gè)樣本和多個(gè)類標(biāo)相關(guān)聯(lián)。鑒于現(xiàn)實(shí)社會(huì)涉及到的很多真實(shí)對(duì)象往往都具多語(yǔ)義、多分類目標(biāo)性,如疾病的證候、證型,待分類的文檔、網(wǎng)頁(yè),生物信息學(xué)中的基因等,因此,多標(biāo)記學(xué)習(xí)方法的成熟對(duì)促進(jìn)這些領(lǐng)域的發(fā)展也就顯得十分重要。然而該方法存在的一個(gè)主要問(wèn)題是不能充分利用各訓(xùn)練樣本所含概念標(biāo)記之間的相關(guān)性,從而有效提高學(xué)習(xí)系統(tǒng)的泛化能力;此外,由于其存在復(fù)雜程度較大,運(yùn)用該方法進(jìn)行研究尚存在降維方法和特征選擇方法較少的不足。

針對(duì)中醫(yī)臨床證候兼夾的多標(biāo)記特點(diǎn),研究人員首次將多標(biāo)記學(xué)習(xí)算法引入到中醫(yī)問(wèn)診的客觀化研究。該研究將多標(biāo)記學(xué)習(xí)結(jié)合頻次分析,應(yīng)用于冠心病的問(wèn)診證候模型建立,有效提高了診斷模型的識(shí)別率;在此基礎(chǔ)上,還結(jié)合中醫(yī)數(shù)據(jù)特點(diǎn),提出了多標(biāo)記學(xué)習(xí)算法(REAL),并結(jié)合信息增益等特征選擇方法,挑選出常見(jiàn)證候的20個(gè)最優(yōu)特征,顯著提高了慢性胃炎的證候的識(shí)別率[40-41]。邵氏等[42]運(yùn)用多標(biāo)記學(xué)習(xí)結(jié)合混合優(yōu)化的特征選擇算法(HOML),用于冠心病中醫(yī)問(wèn)診數(shù)據(jù)分析,建立了中醫(yī)冠心病數(shù)據(jù)模型,并獲得了冠心病問(wèn)診癥狀的最優(yōu)特征子集。

1.10 隨機(jī)森林

隨機(jī)森林是決策樹(shù)算法的一種改進(jìn),其綜合思想是組合多棵bootstrap樣本建立的決策樹(shù)的預(yù)測(cè),通過(guò)投票給出有效的錯(cuò)判率估計(jì)、分類器強(qiáng)度、相關(guān)性和變量的重要性等指標(biāo)。該方法對(duì)每個(gè)被分析的數(shù)據(jù)都給出了重要性的評(píng)分,在某種程度上有利于有效的特征變量的挑選,降低數(shù)據(jù)維度。隨機(jī)森林作為一種自然的非線性建模工具,具有很高的預(yù)測(cè)準(zhǔn)確率,能很好地容忍異常值和噪聲,不易出現(xiàn)過(guò)擬合,降低分類錯(cuò)誤率;也不會(huì)出現(xiàn)在bootstrap樣本中的OOB數(shù)據(jù),還能為樣本提供一個(gè)數(shù)據(jù)內(nèi)部估計(jì),可用來(lái)高效估計(jì)組合分類器中的泛化誤差,有助于理解分類精度以及如何提高精度。

洪氏等[43]通過(guò)引入隨機(jī)森林方法,對(duì)《慢性疲勞(CF)中醫(yī)臨床癥狀分級(jí)量化表》中的95個(gè)癥狀進(jìn)行數(shù)據(jù)編碼,選取CF常見(jiàn)證候要素的主要癥狀并衡量癥狀對(duì)各證候要素的貢獻(xiàn)程度,得到了CF脾虛證、心虛證、肝郁證以及氣虛證4個(gè)證候要素的癥狀集,將各癥狀集作為模型輸入,各模型預(yù)測(cè)準(zhǔn)確率分別為96.13%、94.75%、95.89%、94.26%。鄒氏等[44]借用特定脾虛證臨床數(shù)據(jù)集證明基于特征提取的分類集成模型比其他集成方法具更低的錯(cuò)誤率,認(rèn)為特征提取在降低錯(cuò)誤率上作出了明顯的貢獻(xiàn),但其結(jié)果是否適用于其他小樣本數(shù)據(jù)尚未證實(shí)。王氏等[45]通過(guò)文獻(xiàn)調(diào)研,推測(cè)使用隨機(jī)森林提取亞健康關(guān)鍵癥狀或指標(biāo)可幫助亞健康狀態(tài)的判斷。

2 討論

中醫(yī)臨床診斷數(shù)據(jù)存在的一個(gè)顯著特點(diǎn)是證候夾兼、數(shù)據(jù)多而繁雜、各數(shù)據(jù)之間的關(guān)系藏而不現(xiàn)。因此,借助現(xiàn)代化的信息技術(shù)手段,綜合運(yùn)用數(shù)理統(tǒng)計(jì)分析方法以進(jìn)一步挖掘四診以及證候之間的隱性關(guān)聯(lián)具有重要意義。然而,在數(shù)理統(tǒng)計(jì)方法研究發(fā)展正處于高峰期的信息化時(shí)代,如何根據(jù)待分析的數(shù)據(jù)庫(kù)的特點(diǎn)選擇正確恰當(dāng)?shù)姆椒ㄊ钱?dāng)前數(shù)據(jù)挖掘首先要考慮的問(wèn)題。

一個(gè)樣本量較大的數(shù)據(jù)庫(kù),當(dāng)需要進(jìn)行一定的數(shù)據(jù)分類時(shí),可能有必要對(duì)上述方法進(jìn)行探索。聚類分析可滿足對(duì)數(shù)據(jù)進(jìn)行一定的癥狀的組合、證候規(guī)律的挖掘;若是在已知數(shù)據(jù)的分類情況下需要對(duì)待分析數(shù)據(jù)進(jìn)行分類,判別分析恰有這方面的優(yōu)勢(shì);決策樹(shù)則在實(shí)現(xiàn)數(shù)據(jù)分類挖掘過(guò)程中的可視化方面凸顯其優(yōu)勢(shì);隨機(jī)森林可在決策樹(shù)的基礎(chǔ)上進(jìn)一步提高有效特征變量的提取率,同時(shí)還能避免數(shù)據(jù)預(yù)處理過(guò)程中的過(guò)擬合現(xiàn)象。當(dāng)然,在臨床數(shù)據(jù)分析過(guò)程中也經(jīng)常出現(xiàn)數(shù)據(jù)樣本量較小、維度較高等現(xiàn)象,支持向量機(jī)方法在中醫(yī)領(lǐng)域的引進(jìn)則為這些數(shù)據(jù)的分析帶來(lái)新的契機(jī)。除了對(duì)數(shù)據(jù)進(jìn)行分類挖掘外,數(shù)據(jù)之間的關(guān)聯(lián)討論也是數(shù)據(jù)分析必不可少的,尤其在中醫(yī)診斷中探討各癥、證之間的關(guān)聯(lián)領(lǐng)域的應(yīng)用;在隱性關(guān)聯(lián)分析的眾多分析方法中,多標(biāo)記學(xué)習(xí)法有效解決了證候夾兼的現(xiàn)象;粗糙集理論有利于建立定量定向標(biāo)準(zhǔn);人工神經(jīng)網(wǎng)絡(luò)在識(shí)別證型上主要體現(xiàn)其強(qiáng)大的非線性擬合能力;此外,在探究癥與證關(guān)系上,貝葉斯網(wǎng)絡(luò)還是診斷領(lǐng)域的常用之法,該方法還可幫助我們進(jìn)一步探討癥狀集中的主次癥。

總之,集各種數(shù)據(jù)挖掘方法之長(zhǎng)于一體來(lái)對(duì)某一數(shù)據(jù)庫(kù)進(jìn)行挖掘分析將為中醫(yī)界數(shù)據(jù)挖掘技術(shù)的成熟帶來(lái)不可預(yù)料的進(jìn)展。目前,大部分?jǐn)?shù)據(jù)挖掘方法都只是被單一采用,即使有同時(shí)運(yùn)用多種挖掘方法進(jìn)行數(shù)據(jù)分析,也只是對(duì)某一數(shù)據(jù)系統(tǒng)運(yùn)用多種方法相互比較,所獲得的結(jié)果效用度較小。多重方法相互交融、相互補(bǔ)充、綜合運(yùn)用于某一數(shù)據(jù)分析系統(tǒng)中的研究在在中醫(yī)領(lǐng)域尚不很成熟,或許可以成為數(shù)據(jù)挖掘在中醫(yī)藥研究中的進(jìn)一步的模式和規(guī)則,為數(shù)理統(tǒng)計(jì)在中醫(yī)藥知識(shí)的創(chuàng)新和發(fā)展中開(kāi)辟一條新的途徑。

參考文獻(xiàn):

[1] 張?chǎng)?,陳波,馬勝林,等.基于貝葉斯網(wǎng)絡(luò)的肺癌證候研究[C]//慶祝浙江省中西醫(yī)結(jié)合學(xué)會(huì)成立三十周年論文集粹.杭州:浙江省中西醫(yī)結(jié)合學(xué)會(huì),2011:50-52.

[2] 曲森,啟盛,包祖曉.貝葉斯網(wǎng)絡(luò)模型在中醫(yī)證候研究中的應(yīng)用[C]//世界中聯(lián)第三屆中醫(yī)、中西醫(yī)結(jié)合老年醫(yī)學(xué)學(xué)術(shù)大會(huì)論文集.北京:世界中醫(yī)聯(lián)合會(huì),2010:61-63.

[3] 范建平,李常洪,吳美琴,等.貝葉斯網(wǎng)絡(luò)在中醫(yī)診斷中的應(yīng)用研究[J].管理科學(xué)學(xué)報(bào),2008,11(6):143-150.

[4] 龔燕冰,倪青,高思華,等.Ⅱ型糖尿病主要理化指標(biāo)與中醫(yī)證候相關(guān)性的貝葉斯網(wǎng)絡(luò)分析[J].中華中醫(yī)藥雜志,2010,25(1):3l-33.

[5] 王學(xué)偉,瞿海斌,王階.一種基于數(shù)據(jù)挖掘的中醫(yī)定量診斷方法[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2005,28(1):4-7.

[6] 郭蕾,王學(xué)偉,王永炎,等.論高維高階與證候的復(fù)雜性[J].中華中醫(yī)藥雜志,2006,21(2):76-78.

[7] 陳偉青.淺論人工神經(jīng)網(wǎng)絡(luò)在中醫(yī)學(xué)上的應(yīng)用[J].河南中醫(yī)學(xué)院學(xué)報(bào), 2004,19(11):12-13.

[8] 李玉森,施學(xué)忠,楊永利,等.人工神經(jīng)網(wǎng)絡(luò)在HIV/AIDS患者主要虛證診斷中的應(yīng)用[J].中華中醫(yī)藥雜志,2012,27(5):1269-1271.

[9] 傅勤慧,裴建,惠建榮,等.中風(fēng)證候動(dòng)態(tài)研究現(xiàn)狀與展望:數(shù)據(jù)與模型驅(qū)動(dòng)模式的應(yīng)用[J].中西醫(yī)結(jié)合學(xué)報(bào),2011,9(12):1292-1300.

[10] 許朝霞,王憶勤,顏建軍,等.基于支持向量機(jī)和人工神經(jīng)網(wǎng)絡(luò)的心血管疾病中醫(yī)證候分類識(shí)別研究[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2011,34(8):539-543.

[11] 白云靜,申洪波,孟慶剛.基于共軛梯度下降算法的類風(fēng)濕性關(guān)節(jié)炎BP神經(jīng)網(wǎng)絡(luò)癥候模型研究[J].中國(guó)中醫(yī)藥信息雜志,2010,17(3):96-97.

[12] 白云靜,申洪波,孟慶剛,等.基于人工神經(jīng)網(wǎng)絡(luò)的中醫(yī)證候非線性建模研究[J].中國(guó)中醫(yī)藥信息雜志,2007,14(7):3-4.

[13] 余學(xué)慶.基于智能計(jì)算的2型糖尿病中醫(yī)證候診斷方法研究[D].北京:北京中醫(yī)藥大學(xué),2007.

[14] 晏峻峰,朱文鋒.粗糙集理論在中醫(yī)證素辨證研究中的應(yīng)用[J].中國(guó)中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2006,12(2):90-93.

[15] 陳楚湘,沈建京,陳冰,等.運(yùn)用粗糙集理論建立中老年肺炎中醫(yī)癥候診斷標(biāo)準(zhǔn)[C]//第二中國(guó)控制會(huì)議論文集.上海:中國(guó)自動(dòng)化學(xué)會(huì)控制理論專業(yè)委員會(huì),2010:40-42.

[16] 陳素玲,付爽,高云,等.基于粗糙集理論的原發(fā)性高血壓肝陽(yáng)上亢證辨證系統(tǒng)的建立[J].山東中醫(yī)藥大學(xué)學(xué)報(bào),2010,34(3):201-203.

[17] 劉泉.粗糙集在脾胃系疾病中醫(yī)辨證中的應(yīng)用研究[D].武漢:湖北中醫(yī)學(xué)院,2008.

[18] 謝國(guó)明.基于粗集理論的中醫(yī)診斷模型的建立[J].數(shù)理醫(yī)藥學(xué)雜志, 2005,18(4):302-304.

[19] 秦中廣,毛宗源,鄧兆智.粗糙集在中醫(yī)類風(fēng)濕證候診斷中的應(yīng)用[J].中國(guó)生物醫(yī)學(xué)工程學(xué)報(bào),2001,20(4):357-363.

[20] 鐘穎,胡雪蕾,陸建峰.基于關(guān)聯(lián)規(guī)則和決策樹(shù)的中醫(yī)胃炎診斷分析[J].中國(guó)中醫(yī)藥信息雜志,2008,15(8):97-99.

[21] 肖光磊,陸建峰,李文林,等.正相關(guān)關(guān)聯(lián)規(guī)則及其在中醫(yī)藥中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(6):227-233.

[22] 陳明,楊慧芳,余蕾.基于關(guān)聯(lián)規(guī)則的肝硬變辨證數(shù)據(jù)挖掘研究[J].河南中醫(yī)雜志,2009,29(3):258-260.

[23] 岳路.決策樹(shù)算法在小兒肺炎中醫(yī)臨床診斷中的研究與應(yīng)用[D].濟(jì)南:山東大學(xué),2011.

[24] 查青林,何羿婷,喻建平,等.基于決策樹(shù)分析方法探索類風(fēng)濕性關(guān)節(jié)炎證病信息與療效的相關(guān)關(guān)系[J].中國(guó)中西醫(yī)結(jié)合雜志,2006,26(10):871-986.

[25] 徐蕾,賀佳,孟虹,等.基于信息熵的決策樹(shù)在慢性胃炎中醫(yī)辨證中的應(yīng)用[J].中國(guó)衛(wèi)生統(tǒng)計(jì),2004,21(6):329-331.

[26] 李毅,劉艷,寇小妮,等.乙肝后肝硬化癥狀學(xué)聚類研究[J].中醫(yī)藥導(dǎo)報(bào),2012,18(2):14-16.

[27] 盧焯明,錢新華.以聚類分析法研究?jī)和虚g型β地中海貧血的中醫(yī)證候分布規(guī)律[J].中華中醫(yī)藥雜志,2012,27(3):607-611.

[28] 何慶勇,王階.基于聚類分析的冠心病介入術(shù)后中醫(yī)證候分類及診斷[J].中醫(yī)雜志,2008,49(10):918-921.

[29] 黃小波,李宗信,陳文強(qiáng),等.慢性疲勞綜合征的中醫(yī)證候聚類分析[J].中華中醫(yī)藥雜志,2006,21(10):592-594.

[30] 胡萬(wàn)華,陳克龍,趙娜,等.亞健康失眠患者中醫(yī)證型的判別分析[J].中醫(yī)雜志,2012,53(2):142-144.

[31] 夏樂(lè)敏,王運(yùn)律.慢性再生障礙性貧血中醫(yī)證型判別方程的建立與使用[J].中華中醫(yī)藥學(xué)刊,2012,30(2):409-411.

[32] 酈永平,溫淑云.腦梗死證型量化分級(jí)的判別方程研究[J].中國(guó)中醫(yī)急癥,2012,21(1):81-82.

[33] 趙寶利,黃可兒,趙敏.類風(fēng)濕關(guān)節(jié)炎中醫(yī)辨證分型的判別分析[J].中華中醫(yī)藥雜志,2012,27(1):240-242.

[34] 薛飛飛,汪南.基于判別分析的肝病肝郁脾虛證證候特點(diǎn)的文獻(xiàn)研究[J].中華中醫(yī)藥雜志,2011,26(6):1260-1263.

[35] 徐,王億勤,鄧峰.基于SVM的中醫(yī)心系證候分類研究[J].世界科學(xué)技術(shù)―中醫(yī)藥現(xiàn)代化,2010,12(5):713.

[36] 王階,吳榮,周雪忠.基于支持向量機(jī)的名老中醫(yī)治療冠心病證候要素研究[J].北京中醫(yī)藥大學(xué)學(xué)報(bào),2008,31(8):540.

[37] 殷彬,方思行.脾虛證診斷的數(shù)學(xué)模型[J].暨南大學(xué)學(xué)報(bào):自然科學(xué)版,2006,26(3):363-367.

[38] 楊麗萍,黃睿,張洛欣,等.用特征功能模塊法挖掘一個(gè)虛寒證家系的基因表達(dá)譜[J].中華中醫(yī)藥雜志,2010,25(5):683-685.

[39] 謝錚桂.基于多分類支持向量機(jī)的中醫(yī)舌診診斷的研究[J].計(jì)算機(jī)與數(shù)字工程,2008,36(11):60.

[40] Liu GP, Li GZ, Wang YQ. Modelling of inquiry diagnosis for coronary heart disease in TCM by using multi-label learning[J]. BMC Complementary and Alternative Medicine,2010,10:37.

[41] Liu GP, Yan JJ, Wang YQ, et al. Application of multi-label learning using the relevant feature for each label (REAL) algorithm in the diagnosis of chronic gastritis[J]. Evidence- Based Complementary and Alternative Medicine,2012,6:3-5.

[42] 邵歡,李國(guó)正,劉國(guó)萍,等.多標(biāo)記中醫(yī)問(wèn)診數(shù)據(jù)的癥狀選擇[J].中國(guó)科學(xué):信息科學(xué),2011,41(11):1372-1387.

[43] 洪燕珠,周昌樂(lè),張志楓,等.基于隨機(jī)森林法的慢性疲勞證候要素特征癥狀的選擇[J].中醫(yī)雜志,2010,51(7):634-638.

[44] 鄒永杰,周繼鵬,王桂香,等.基于特征提取的分類集成在脾虛證診斷中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2010,27(3):22-25.

數(shù)據(jù)挖掘技術(shù)探討論文范文第5篇

【關(guān)鍵詞】 共享數(shù)據(jù); 聚變時(shí)代; 經(jīng)濟(jì)統(tǒng)計(jì)

【中圖分類號(hào)】 C81 【文獻(xiàn)標(biāo)識(shí)碼】 A 【文章編號(hào)】 1004-5937(2016)22-0026-03

第十屆全國(guó)企業(yè)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)年會(huì)于2016年7月16―18日在蘭州隆重召開(kāi)。會(huì)議由全國(guó)企業(yè)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)會(huì)主辦,蘭州財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院、重慶允升科技大數(shù)據(jù)研究中心和重慶譽(yù)鋒宸數(shù)據(jù)信息技術(shù)有限公司聯(lián)合承辦。會(huì)議的主題是:“共享數(shù)據(jù)聚變時(shí)代下的經(jīng)濟(jì)統(tǒng)計(jì)理論及應(yīng)用研究”。全國(guó)近百所高校、政府和企事業(yè)單位的200位專家學(xué)者參會(huì)。

國(guó)家統(tǒng)計(jì)局副局長(zhǎng)許憲春博士針對(duì)我國(guó)當(dāng)前經(jīng)濟(jì)發(fā)展態(tài)勢(shì)作了《2016年上半年經(jīng)濟(jì)形勢(shì)分析》報(bào)告,北京師范大學(xué)邱東教授針對(duì)空間經(jīng)濟(jì)比較中由購(gòu)買力平價(jià)推斷存在的賓大效應(yīng)等問(wèn)題作了《BHPPP中的純價(jià)比假設(shè)與賓大效應(yīng)的弱存在》報(bào)告,廈門大學(xué)楊燦教授基于投入產(chǎn)出分析的擴(kuò)展框架作了《產(chǎn)業(yè)關(guān)聯(lián)測(cè)度與關(guān)鍵產(chǎn)業(yè)甄別》報(bào)告,暨南大學(xué)劉建平教授針對(duì)我國(guó)政府統(tǒng)計(jì)調(diào)查體系在新時(shí)代面臨的問(wèn)題作了《深化我國(guó)政府統(tǒng)計(jì)調(diào)查體系改革的思考與建議》報(bào)告,浙江財(cái)經(jīng)大學(xué)李金昌教授針對(duì)大數(shù)據(jù)時(shí)代下如何理解統(tǒng)計(jì)學(xué)等問(wèn)題作了《統(tǒng)計(jì)學(xué)與大數(shù)據(jù)》報(bào)告,上海財(cái)經(jīng)大學(xué)徐國(guó)祥教授針對(duì)大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)的發(fā)展作了《大數(shù)據(jù)、云計(jì)算背景下的統(tǒng)計(jì)改革與創(chuàng)新》報(bào)告,山西財(cái)經(jīng)大學(xué)李寶瑜教授針對(duì)當(dāng)前統(tǒng)計(jì)建模要求前提條件苛刻等問(wèn)題作了《特征樣本重復(fù)抽樣建模方法設(shè)計(jì)與應(yīng)用》報(bào)告,江西財(cái)經(jīng)大學(xué)羅世華教授利用分形方法在非線性時(shí)間序列中的研究作了《多重分形時(shí)間序列非線性特征辨識(shí)及其應(yīng)用研究》的報(bào)告。本屆會(huì)議入選論文68篇,分為經(jīng)濟(jì)統(tǒng)計(jì)與政府統(tǒng)計(jì)、大數(shù)據(jù)與統(tǒng)計(jì)學(xué)科發(fā)展以及統(tǒng)計(jì)學(xué)理論及應(yīng)用等專題展開(kāi)交流。主要學(xué)術(shù)觀點(diǎn)綜述如下:

一、經(jīng)濟(jì)統(tǒng)計(jì)與政府統(tǒng)計(jì)理論及應(yīng)用研究

南京審計(jì)大學(xué)賈曉峰在《江蘇最終需求結(jié)構(gòu)與產(chǎn)業(yè)結(jié)構(gòu)之間互動(dòng)變化定量研究》中,運(yùn)用江蘇最新公布的2012年投入產(chǎn)出等數(shù)據(jù),分析了江蘇最終需求結(jié)構(gòu)與產(chǎn)業(yè)結(jié)構(gòu)的變化情況,運(yùn)用投入產(chǎn)出模型深入研究了江蘇最終需求結(jié)構(gòu)與產(chǎn)業(yè)結(jié)構(gòu)之間互動(dòng)變化的數(shù)量關(guān)系及內(nèi)在機(jī)理,設(shè)計(jì)出多種方案進(jìn)行情景模擬分析,并提出了相應(yīng)對(duì)策。

楚雄師范學(xué)院張無(wú)畏在《基于三角形中線的三次產(chǎn)業(yè)結(jié)構(gòu)變遷路徑研究》中,利用三角形中線對(duì)三次產(chǎn)業(yè)結(jié)構(gòu)變化的六種形式及其內(nèi)部關(guān)系進(jìn)行了研究,結(jié)果表明:六種形式之間的變化路徑以及各種形式之間可能發(fā)生轉(zhuǎn)化,一定是漸進(jìn)的,不能跨越;每一種形式的數(shù)學(xué)約束可以用一組不等式表示;用三角形的三條中線來(lái)劃分三次產(chǎn)業(yè)結(jié)構(gòu)的六種形式,能簡(jiǎn)潔有效地表示這六種形式及其變化。

暨南大學(xué)劉建平、陳冬進(jìn)在《名錄庫(kù)調(diào)查――基于行政記錄的統(tǒng)計(jì)調(diào)查方法》中,為了破解抽樣調(diào)查和普查費(fèi)用不斷攀升、無(wú)回答率持續(xù)升高、調(diào)查效率和數(shù)據(jù)質(zhì)量越來(lái)越低、難以滿足社會(huì)日益增長(zhǎng)的需要等難題,提出將基于行政記錄的名錄庫(kù)調(diào)查作為我國(guó)官方統(tǒng)計(jì)調(diào)查的新思路,闡述了世界主要先進(jìn)國(guó)家使用行政記錄進(jìn)行統(tǒng)計(jì)調(diào)查的基本現(xiàn)狀,討論了建立名錄庫(kù)調(diào)查的基本理論和方法并與傳統(tǒng)的普查以及抽樣調(diào)查方法進(jìn)行了比較,總結(jié)了名錄庫(kù)調(diào)查在統(tǒng)計(jì)工作中的重要作用,最后提出深化我國(guó)政府統(tǒng)計(jì)改革的若干建議。

東北財(cái)經(jīng)大學(xué)屈超、楊森森在《技術(shù)進(jìn)步、技術(shù)效率與東北地區(qū)工業(yè)企業(yè)全要素生產(chǎn)率》中,基于數(shù)據(jù)包絡(luò)分析法(DEA)的Malmquist指數(shù)方法計(jì)算了2001―2011年?yáng)|北地區(qū)按注冊(cè)類型分組的工業(yè)企業(yè)的全要素生產(chǎn)率及其構(gòu)成變化,詳細(xì)考察了企業(yè)的技術(shù)效率,發(fā)現(xiàn)東北地區(qū)工業(yè)企業(yè)在觀察期內(nèi)全要素生產(chǎn)率提高的主要因素是技術(shù)進(jìn)步,技術(shù)效率的影響微乎其微;使用CCR模型和BCC模型,將技術(shù)效率分解為純技術(shù)效率和規(guī)模效率,并得出相關(guān)結(jié)論。

暨南大學(xué)夏帆在《中國(guó)三大經(jīng)濟(jì)圈產(chǎn)業(yè)聚集現(xiàn)象之檢驗(yàn)――基于微觀地理數(shù)據(jù)的分析》中,使用了Duranton和Overman(2005)提出的第三代測(cè)度方法對(duì)我國(guó)三大經(jīng)濟(jì)圈制造業(yè)的空間聚集現(xiàn)象進(jìn)行了檢驗(yàn),發(fā)現(xiàn)三大經(jīng)濟(jì)圈的大部分產(chǎn)業(yè)呈現(xiàn)出聚集特征,呈現(xiàn)分散特征的產(chǎn)業(yè)不多;通過(guò)對(duì)距離上聚集特征的考察,發(fā)現(xiàn)聚集總是傾向于在較小的范圍內(nèi)出現(xiàn),一般在50公里以內(nèi);分析了各個(gè)產(chǎn)業(yè)的聚集程度后發(fā)現(xiàn)三大經(jīng)濟(jì)圈聚集程度最強(qiáng)的十個(gè)產(chǎn)業(yè)各不相同,且都與各自的產(chǎn)業(yè)特色有關(guān)。

青島大學(xué)張迎春、袁偉萍、管琪在《基于最小間隔樹(shù)法的中國(guó)地區(qū)間購(gòu)買力平價(jià)試算》中指出,最小間隔樹(shù)法是國(guó)際比較測(cè)度各國(guó)購(gòu)買力平價(jià)的方法,有利于識(shí)別不同國(guó)家經(jīng)濟(jì)的相似性,并嘗試將其用于中國(guó)地區(qū)間購(gòu)買力平價(jià)的計(jì)算,得出相關(guān)結(jié)論。

上海財(cái)經(jīng)大學(xué)鄭正喜在《產(chǎn)業(yè)關(guān)聯(lián)效應(yīng)的虛擬測(cè)度理論辨析》中,辨析了產(chǎn)業(yè)關(guān)聯(lián)效應(yīng)的虛擬測(cè)度理論(HEM)研究方法,認(rèn)為其核心假設(shè)的實(shí)質(zhì)是改變被抽取產(chǎn)業(yè)的主體屬性,指出應(yīng)當(dāng)采用完全抽取的基礎(chǔ)假設(shè)才能構(gòu)建出相對(duì)合理的測(cè)度指標(biāo),并進(jìn)行了實(shí)證研究。

集美大學(xué)陸曉倩、王立鳳在《廈門潛力產(chǎn)業(yè)選擇及與臺(tái)灣產(chǎn)業(yè)對(duì)接問(wèn)題研究》中指出,選擇和培育合適的潛力產(chǎn)業(yè)可充分挖掘區(qū)域優(yōu)勢(shì),建立和發(fā)展區(qū)域主導(dǎo)產(chǎn)業(yè)并帶動(dòng)相關(guān)產(chǎn)業(yè)發(fā)展。同時(shí)運(yùn)用偏離―份額分析法考察廈門的產(chǎn)業(yè)結(jié)構(gòu)及第三產(chǎn)業(yè)細(xì)分行業(yè)增長(zhǎng)差異,結(jié)果顯示廈門市的第三產(chǎn)業(yè)尤其是生產(chǎn)業(yè)增長(zhǎng)優(yōu)勢(shì)明顯;借助區(qū)位商的定量標(biāo)準(zhǔn)探討廈門與臺(tái)灣在經(jīng)濟(jì)資源稟賦方面的異同,確定了廈門潛力產(chǎn)業(yè)選擇的重點(diǎn),并提出促進(jìn)廈門與臺(tái)灣潛力產(chǎn)業(yè)對(duì)接的策略。

重慶工商大學(xué)劉浩在《實(shí)施創(chuàng)新驅(qū)動(dòng)發(fā)展戰(zhàn)略――R&D資本化》中,通過(guò)對(duì)R&D核算方法調(diào)整的動(dòng)因,闡述了核算體系中增加研發(fā)支出核算具有的重大意義,系統(tǒng)整理了現(xiàn)有核算方法的利弊,在GDP框架下對(duì)R&D資本化的核算方法作了相應(yīng)分析,并結(jié)合我國(guó)實(shí)際情況,針對(duì)R&D活動(dòng)核算提出對(duì)策建議。

河北經(jīng)貿(mào)大學(xué)王會(huì)英在《河北省區(qū)域經(jīng)濟(jì)發(fā)展水平差異研究》中,選取產(chǎn)業(yè)結(jié)構(gòu)、經(jīng)濟(jì)效益、經(jīng)濟(jì)總量、居民生活水平和經(jīng)濟(jì)外向性5個(gè)方面的16個(gè)指標(biāo)構(gòu)建評(píng)價(jià)體系,采取客觀賦權(quán)方法建立加法合成評(píng)價(jià)模型,并基于2013年的統(tǒng)計(jì)數(shù)據(jù)對(duì)河北省的區(qū)域經(jīng)濟(jì)發(fā)展差異作了定量分析,提出了對(duì)策建議。

二、大數(shù)據(jù)時(shí)代統(tǒng)計(jì)學(xué)與統(tǒng)計(jì)學(xué)科發(fā)展研究

重慶工商大學(xué)李勇在《基于物聯(lián)網(wǎng)時(shí)代的工業(yè)大數(shù)據(jù)挖掘方法及應(yīng)用研究》中,針對(duì)互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的時(shí)代特征,從大數(shù)據(jù)來(lái)源、基本特征、處理技術(shù)和大數(shù)據(jù)思維4個(gè)維度提煉出大數(shù)據(jù)的概念;闡述了數(shù)據(jù)挖掘基本方法的優(yōu)勢(shì)和不足;分析了物聯(lián)網(wǎng)下工業(yè)大數(shù)據(jù)呈現(xiàn)的本質(zhì)特性;比較分析了消費(fèi)大數(shù)據(jù)和產(chǎn)業(yè)大數(shù)據(jù)的挖掘技術(shù)和分析方法的異同,指出工業(yè)大數(shù)據(jù)分析和挖掘中存在的難點(diǎn)和重點(diǎn);結(jié)合工業(yè)互聯(lián)網(wǎng)闡述了大數(shù)據(jù)挖掘技術(shù)的應(yīng)用。

云南財(cái)經(jīng)大學(xué)張敏的《多水平貝葉斯模型在大數(shù)據(jù)挖掘中的應(yīng)用》從線性回歸模型擴(kuò)展到多水平線性模型,將線性回歸統(tǒng)計(jì)學(xué)習(xí)方法的基本思路拓展到多水平線性模型,借助于貝葉斯統(tǒng)計(jì)方法和馬爾科夫鏈蒙特卡羅算法,將多水平線性模型應(yīng)用于大數(shù)據(jù)的挖掘中并進(jìn)行了實(shí)例應(yīng)用。

中南財(cái)經(jīng)政法大學(xué)劉洪在《應(yīng)用統(tǒng)計(jì)專業(yè)碩士(大數(shù)據(jù)分析方向)培養(yǎng)模式探索》中,從項(xiàng)目背景、國(guó)內(nèi)外相關(guān)項(xiàng)目現(xiàn)狀、數(shù)據(jù)分析師需具備的基本技能和課程體系設(shè)計(jì)4個(gè)方面,對(duì)當(dāng)前大數(shù)據(jù)分析方向的專業(yè)碩士研究生人才培養(yǎng)進(jìn)行了全方位的闡述和探索。

天津財(cái)經(jīng)大學(xué)楊貴軍在《“數(shù)據(jù)工程”方向課程設(shè)計(jì)》中,從全國(guó)統(tǒng)計(jì)學(xué)專業(yè)數(shù)據(jù)工程方向教學(xué)聯(lián)盟、“數(shù)據(jù)工程”概念提出的背景、數(shù)據(jù)工程師專業(yè)人才培養(yǎng)和“+數(shù)據(jù)工程”技能培訓(xùn)4個(gè)方面,詳細(xì)闡述了針對(duì)大數(shù)據(jù)時(shí)代如何從統(tǒng)計(jì)學(xué)科角度培養(yǎng)大數(shù)據(jù)人才。

重慶工商大學(xué)李禹鋒在《基于互聯(lián)網(wǎng)白酒消費(fèi)市場(chǎng)現(xiàn)狀的大數(shù)據(jù)分析》中,通過(guò)網(wǎng)絡(luò)爬蟲(chóng)技術(shù)收集和清洗數(shù)據(jù),借助詞云圖和文本挖掘技術(shù)等,對(duì)品牌銷售額、品牌銷量以及白酒香型、酒精度和規(guī)格的消費(fèi)傾向等進(jìn)行了分析,并對(duì)未來(lái)市場(chǎng)的消費(fèi)趨勢(shì)作了展望。

閩南師范大學(xué)陳立雙、祝丹在《大數(shù)據(jù)推動(dòng)下中國(guó)CPI測(cè)算方法創(chuàng)新趨向與挑戰(zhàn)》中,基于居民消費(fèi)領(lǐng)域大數(shù)據(jù)對(duì)居民消費(fèi)者價(jià)格指數(shù)帶來(lái)的機(jī)遇和挑戰(zhàn),分析了大數(shù)據(jù)在CPI測(cè)算中的可能應(yīng)用路徑,探討了大數(shù)據(jù)推動(dòng)中國(guó)CPI測(cè)算理論與方法的創(chuàng)新趨向和面臨的挑戰(zhàn),探討了大數(shù)據(jù)在中國(guó)CPI測(cè)算的方法論問(wèn)題。

三、統(tǒng)計(jì)理論與統(tǒng)計(jì)應(yīng)用研究

天津財(cái)經(jīng)大學(xué)楊貴軍、孟杰、蔡凱月在《人口年齡結(jié)構(gòu)、人力資本與人口紅利測(cè)度――基于超越對(duì)數(shù)生產(chǎn)函數(shù)模型的經(jīng)驗(yàn)分析》中,闡述了人口紅利是經(jīng)濟(jì)增長(zhǎng)的重要源泉,測(cè)度人口紅利對(duì)全面掌握中國(guó)人口變化規(guī)律、科學(xué)制定人口政策和經(jīng)濟(jì)政策具有重要的理論價(jià)值與實(shí)踐意義;指出現(xiàn)有研究普遍僅從人口年齡結(jié)構(gòu)角度測(cè)度人口紅利,忽視了勞動(dòng)力人力資本對(duì)經(jīng)濟(jì)增長(zhǎng)的貢獻(xiàn)。在綜合考慮人口年齡結(jié)構(gòu)和勞動(dòng)力人力資本兩個(gè)角度下,使用超越對(duì)數(shù)生產(chǎn)函數(shù)測(cè)度了中國(guó)的人口紅利,并得出相應(yīng)結(jié)論。

華中師范大學(xué)王江濤、馮元化在《如何確定即時(shí)波動(dòng)率核估計(jì)量的最優(yōu)窗寬》中指出,在即時(shí)波動(dòng)率的各種估計(jì)量中,非參數(shù)估計(jì)量因其能準(zhǔn)確地度量即時(shí)波動(dòng)率成為研究熱點(diǎn),但這類估計(jì)量在應(yīng)用中面臨最優(yōu)窗寬的確定問(wèn)題。其借鑒非參數(shù)回歸分析中窗寬選擇的思想,以即時(shí)波動(dòng)率的核估計(jì)量為例,構(gòu)建了一種能從數(shù)據(jù)中準(zhǔn)確計(jì)算出最優(yōu)窗寬具體值的算法,從理論分析和數(shù)值驗(yàn)證方面看,該算法具有良好的穩(wěn)定性、適應(yīng)性和收斂速度。

廈門理工學(xué)院陳安全和浙江工商大學(xué)李海濤在《一種新的四格表獨(dú)立性檢驗(yàn)――基于回歸模型的方法》中指出,傳統(tǒng)四格表的獨(dú)立性檢驗(yàn)采用卡方檢驗(yàn),若采用回歸模型技術(shù)將四格表中的定性變量量化后引入到模型中,同時(shí)利用回歸模型中的系數(shù)顯著性檢驗(yàn)來(lái)檢驗(yàn)四格表的獨(dú)立性,在一定條件下具有等效性和一致性。

楚雄師范學(xué)院梅瑩在《經(jīng)濟(jì)新常態(tài)下云南省新的消費(fèi)增長(zhǎng)點(diǎn)培育研究――云南省城鎮(zhèn)居民消費(fèi)現(xiàn)狀分析》中,針對(duì)云南省城鎮(zhèn)居民家庭人均可支配收入和人均全年消費(fèi)性支出的數(shù)據(jù),構(gòu)建了基于擴(kuò)展線性支出系統(tǒng)的靜態(tài)和動(dòng)態(tài)比較模型,得出相關(guān)結(jié)論。

重慶工商大學(xué)周世銘、付安瑤在《網(wǎng)絡(luò)意識(shí)形態(tài)傳播新特點(diǎn)現(xiàn)狀分析》中,通過(guò)文獻(xiàn)資料分析、網(wǎng)絡(luò)爬蟲(chóng)技術(shù)和問(wèn)卷調(diào)研分析,對(duì)舊媒體時(shí)代、互聯(lián)網(wǎng)時(shí)代和當(dāng)前新媒體時(shí)代中的主流意識(shí)形態(tài)、非主流意識(shí)形態(tài)、網(wǎng)絡(luò)意識(shí)形態(tài)三種意識(shí)形態(tài)傳播的方式和特點(diǎn)進(jìn)行了對(duì)比分析,提出目前意識(shí)形態(tài)傳播過(guò)程中呈現(xiàn)出新的傳播特點(diǎn)。

河北經(jīng)貿(mào)大學(xué)湯玉環(huán)在《基于VAR模型的經(jīng)濟(jì)發(fā)展與土地財(cái)政關(guān)系的實(shí)證研究――以河北省為例》中,基于河北省2002―2013年的數(shù)據(jù),建立經(jīng)濟(jì)發(fā)展與土地財(cái)政的VAR相關(guān)模型,通過(guò)研究河北省經(jīng)濟(jì)發(fā)展與土地財(cái)政的作用機(jī)制,探討土地財(cái)政對(duì)于經(jīng)濟(jì)發(fā)展的利弊作用,尋求地方財(cái)政與經(jīng)濟(jì)發(fā)展的均衡,以更好地促進(jìn)河北省的經(jīng)濟(jì)發(fā)展。

相關(guān)期刊更多

數(shù)據(jù)

省級(jí)期刊 審核時(shí)間1個(gè)月內(nèi)

北京市統(tǒng)計(jì)局

大數(shù)據(jù)

統(tǒng)計(jì)源期刊 審核時(shí)間1個(gè)月內(nèi)

工業(yè)和信息化部

數(shù)據(jù)法學(xué)

部級(jí)期刊 審核時(shí)間1個(gè)月內(nèi)

中國(guó)人民公安大學(xué)法學(xué)院