亚洲免费无码av|久久鸭精品视频网站|日韩人人人人人人人人操|97人妻免费祝频在找|成人在线无码小视频|亚洲黄片无码在线看免费看|成人伊人22网亚洲人人爱|在线91一区日韩无码第八页|日韩毛片精品av在线色婷婷|波多野主播在线激情婷婷网

歡迎訪問愛發(fā)表,線上期刊服務(wù)咨詢

統(tǒng)計(jì)學(xué)決策規(guī)則8篇

時間:2023-08-10 09:23:15

緒論:在尋找寫作靈感嗎?愛發(fā)表網(wǎng)為您精選了8篇統(tǒng)計(jì)學(xué)決策規(guī)則,愿這些內(nèi)容能夠啟迪您的思維,激發(fā)您的創(chuàng)作熱情,歡迎您的閱讀與分享!

篇1

關(guān)鍵詞:群體決策;信息集結(jié);博弈論;信息獲?。粚徸h;透明性

一、引言

群體決策的研究涉及多個學(xué)科,不同學(xué)科對群體決策的研究所采取的方法和著重點(diǎn)不一樣。在經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)領(lǐng)域?qū)θ后w決策的研究側(cè)重于偏好的集結(jié),較少考慮影響偏好形成的潛在背景信息。其中社會選擇理論與公共選擇理論利用數(shù)學(xué)分析的方法和福利經(jīng)濟(jì)學(xué)的一些基本原理,研究如何“公平合理地”將群體成員的偏好集結(jié)為群體的偏好并據(jù)以作出群體的選擇,這方面的研究源于Condorcet投票悖論的提出,從20世紀(jì)50年代開始經(jīng)過Arrow、Sen、Gibbard和Satterthwaite等人的進(jìn)一步發(fā)展,已形成完整的理論體系,通過對理性社會選擇本質(zhì)的剖析,促進(jìn)了人們對選舉、立法以及政治機(jī)構(gòu)運(yùn)作等問題的理解。

在管理科學(xué)領(lǐng)域,對群體決策的研究主要強(qiáng)調(diào)如何通過對群體成員以不同形式表達(dá)的偏好的集結(jié),使得群體成員就最終決策達(dá)成某種程度上的一致,而一致性則意味著“正確性”,這方面最具代表性的是社會決策圖式理論。

在社會心理學(xué)領(lǐng)域?qū)θ后w決策的研究主要采用實(shí)驗(yàn)性方法,通過對群體成員之間交互過程的分析研究群體決策的信息集結(jié)有效性,一般假定群體成員具有共同的目標(biāo),很少考慮決策過程中的策略,心理學(xué)研究的主要成果是對群體思維和群體極化現(xiàn)象的分析。

近年來國外出現(xiàn)了不少用博弈論作為理論工具研究群體決策信息集結(jié)問題的文獻(xiàn),這些文獻(xiàn)主要發(fā)表于經(jīng)濟(jì)學(xué)、政治學(xué)與政治經(jīng)濟(jì)學(xué)期刊,通過對群體決策過程中群體成員的動機(jī)和理的分析,給出了一些與人們的直覺完全相反的結(jié)論。筆者將對此領(lǐng)域的研究進(jìn)展從決策信息的獲取、審議過程中信息的披 露、透明性的影響與最優(yōu)決策規(guī)則四個方面進(jìn)行評述。需要說明的是,這四個方面緊密關(guān)聯(lián),特別是決策群體成員的信息披露動機(jī)直接受到?jīng)Q策過程對公眾是否透明以及最終的投票表決規(guī)則的影響,而群體成員的信息獲取動機(jī)則部分地取決于信息披露動機(jī),但由于利用博弈論分析群體決策問題的復(fù)雜性,現(xiàn)有的文獻(xiàn)主要還是相對集中于其中的一兩個方面。

文[1]是注意到此領(lǐng)域較早的綜述性文章,該文發(fā)表于1999年,討論了當(dāng)時出現(xiàn)不久的研究政治機(jī)構(gòu)信息集結(jié)作用的文獻(xiàn),其中對最先考慮策略性投票表決行為的文[2-5]等進(jìn)行了簡要介紹。同年9月份,《美國國家科學(xué)院院刊》發(fā)文評述了研究選舉的信息集結(jié)作用及因投票者私有信息的不準(zhǔn)確而導(dǎo)致的策略性投票表決行為的成果[6],其中提及的部分研究工作尚處于未發(fā)表狀態(tài)。文[7]對研究貨幣政策委員會決策過程中的動機(jī)問題的文獻(xiàn)進(jìn)行了系統(tǒng)討論。文[8]總結(jié)了貨幣政策委員會決策機(jī)制設(shè)計(jì)應(yīng)該考慮的各種因素,對與群體決策相關(guān)的經(jīng)濟(jì)學(xué)與社會心理學(xué)理論與實(shí)驗(yàn)分析文獻(xiàn)進(jìn)行了評述,其中討論了信息集結(jié)問題。應(yīng)該說文[9]是目前評述基于博弈論的群體決策信息集結(jié)研究文獻(xiàn)較為全面和細(xì)致的文章,該文從策略性投票、信息獲取、利益沖突和交流四個方面進(jìn)行了詳細(xì)評述,并討論了此領(lǐng)域的研究成果對貨幣政策委員會決策機(jī)制設(shè)計(jì)的參考價值。

本研究與文[9]的差別在于:第一,文[9]的討論基本上局限于基于博弈論的群體決策信息集結(jié)研究本身,而筆者從研究方法、研究對象與研究成果等方面將基于博弈論的群體決策信息集結(jié)研究與經(jīng)濟(jì)學(xué)、政治學(xué)、管理學(xué)以及社會心理學(xué)領(lǐng)域?qū)θ后w決策的傳統(tǒng)主流研究進(jìn)行了對比,分析了博弈論作為理論工具研究群體決策信息集結(jié)問題的優(yōu)缺點(diǎn),并深入探討了現(xiàn)有研究工作存在的不足之處,也即指出了此領(lǐng)域可能的研究方向,因此,筆者的深度與廣度有所超越。第二,文[9]對此領(lǐng)域研究成果的評述思路稍顯混亂,文獻(xiàn)分類較不合理。第三,筆者特別關(guān)注了研究決策過程的透明性對群體成員信息獲取與信息披露動機(jī)以及投票表決行為的影響的文獻(xiàn),而文[9]對此幾乎沒有涉及。第四,文[9]發(fā)表后此領(lǐng)域出現(xiàn)了不少具有重要參考價值的文獻(xiàn),筆者對這些最新的文獻(xiàn)給予了較為詳細(xì)的評述。

二、決策信息的獲取

(一) Condorcet陪審團(tuán)定理與搭便車問題

與決策問題相關(guān)的各類信息一般以分散的、局部的形式存在于社會系統(tǒng),群體決策的意義之一,是可能更充分地利用這些信息,因而更有可能作出正確的決策。不考慮其他因素,僅從信息集結(jié)的角度看,讓更多擁有信息的個體參與決策可以改善決策質(zhì)量,這種觀點(diǎn)符合人們的直覺,其形式化證明出自18世紀(jì)Condorcet給出的陪審團(tuán)定理。該定理認(rèn)為:群體決策可以有效集結(jié)信息,在多數(shù)決定規(guī)則下,增加群體成員數(shù)量可以增加作出正確決策的概率,并且隨著成員數(shù)量趨于無窮,作出正確決策的概率趨于1。

Condorcet陪審團(tuán)定理及其后來的很多拓展往往都有個潛在的假設(shè):群體決策者所掌握的與決策問題相關(guān)的信息是事前外部給定的,或是以零成本獲得的[9]。但對于許多現(xiàn)實(shí)決策情形,信息并不是不需要投入成本和努力就能輕易得到的,如審稿專家需要付出一定的時間和精力才能決定稿件是否符合錄用標(biāo)準(zhǔn),因此決策者必須決定是否付出以及付出多少代價以獲取信息。而在群體決策中,與決策問題相關(guān)的信息是公共物品,因而存在典型的所謂社會惰化(social loafing)現(xiàn)象或搭便車問題(freerider problem)。

文[10]對陪審團(tuán)決策中的信息獲取問題進(jìn)行了研究,認(rèn)為陪審員的信息準(zhǔn)確程度取決于陪審團(tuán)的大小,更大的陪審團(tuán)的陪審員具有更少的動機(jī)認(rèn)真聽取審判過程,所以更大的陪審團(tuán)作出正確判決的概率可能更小,從而導(dǎo)致陪審團(tuán)定理不再成立。文[11-17]進(jìn)一步研究了群體決策中的理性無知(rational ignorance)問題,對仍能有效集結(jié)信息時信息獲取成本或成本函數(shù)需要滿足的條件進(jìn)行了分析,這些文獻(xiàn)針對多數(shù)決定規(guī)則,假定所有群體成員具有完全相同的決策偏好。其中文[11,13-15]證明,當(dāng)全體或部分群體成員的信息獲取成本函數(shù)在獲取零信息處的二階導(dǎo)數(shù)為零,則Condorcet陪審團(tuán)定理仍然有效。

另外,文[18]通過一個僅有兩個成員的群體決策模型,指出群體成員間的交流可能會惡化信息獲取中的搭便車問題。在該文中,決策成員首先收集關(guān)于一項(xiàng)工程實(shí)施后果的信息,然后相互交流,再投票表決是否實(shí)施該項(xiàng)工程。文章指出,如果交流的作用僅限于信息集結(jié),則交流可能會減少作出正確決策的概率,特別是當(dāng)高質(zhì)量的信息很容易獲得時,交流會減少決策成員收集信息的動機(jī),加劇信息收集中的搭便車問題,但當(dāng)信息收集需要付出高昂的代價時,更多的交流通常會增加作出正確決策的概率。

(二)搭便車問題避免措施

因?yàn)樾畔@取活動一般是不可觀測的,搭便車者可以通過提供一個虛假的信息假裝已經(jīng)給予了足夠的投入,所以無法通過有效的懲罰措施以阻止搭便車問題,只能夠從決策群體的成員組成和決策規(guī)則等方面考慮避免該問題的發(fā)生。

文[19-20]的研究結(jié)論從決策群體人員組成方面為避免信息獲取中的搭便車問題提供了理論參考,指出具有極端偏好的成員相對來說更具有收集高成本信息的動機(jī),但這兩篇文獻(xiàn)的研究內(nèi)容不屬于嚴(yán)格意義上的群體決策,因?yàn)槠渲械奈瘑T會成員僅負(fù)責(zé)收集與報告信息,自身并沒有決策權(quán)。在文[19]中,委員會成員在信息收集之前相互間沒有偏好差異,在投入不可觀測的努力收集信息后形成各自不同的政策偏好,該文證明最優(yōu)的委員會規(guī)模和總的社會剩余有時會隨委員會成員偏好差異期望值的增大而增大,因?yàn)轭A(yù)期的偏好差異為成員提供了收集信息的動機(jī)。文[20]指出,如果信息收集的成本較低,委員會成員的偏好應(yīng)該與決策者的偏好類似,這是因?yàn)橐环矫媾c決策者偏好類似的成員會收集決策者想要的信息,另一方面由于偏好類似所以在報告時不會產(chǎn)生信息的扭曲問題;如果信息收集的成本較高,則委員會應(yīng)該由具有極端偏好的成員組成,只有這些成員才具有足夠強(qiáng)烈的動機(jī)付出代價收集信息,但因?yàn)樾湃螁栴},他們往往只會收集硬信息,即客觀上可驗(yàn)證的信息。對于在投票表決前需要對決策選項(xiàng)進(jìn)行審議的群體決策來說,文[20]的研究結(jié)論尤其具有參考價值。

從群體決策機(jī)制設(shè)計(jì)的角度看,如果存在信息獲取問題,則機(jī)制設(shè)計(jì)者必須既要考慮如何提供充分的激勵促使群體成員獲取信息,又要考慮如何有效集結(jié)成員所獲得的信息,以最大化群體決策的期望效用。

文[21]證明,采用適當(dāng)保守的決策規(guī)則可以促進(jìn)群體成員收集證據(jù),從而改善決策質(zhì)量。文[22-23]對存在信息獲取時的群體決策最優(yōu)規(guī)則與最優(yōu)群體成員數(shù)量進(jìn)行了研究。文[22]指出,盡管一致性規(guī)則使每個群體成員的投票選擇對最終結(jié)果都具有決定性影響力,但一致性規(guī)則并不能為獲取信息提供適當(dāng)?shù)募?,而且一致性?guī)則特別不適合于信息較不準(zhǔn)確的情形,也即更需要群體決策的情形,在只考慮單調(diào)純策略均衡的條件下,除非群體成員的信息足夠準(zhǔn)確,否則一致性規(guī)則或接近于一致性規(guī)則的規(guī)則不可能最優(yōu)。文[23]認(rèn)為,為了提供足夠的信息獲取激勵,對于相當(dāng)普遍的決策情形,事前最優(yōu)的決策機(jī)制事后可能是非最優(yōu)的,即不必然利用了所有群體成員獲取的信息導(dǎo)致從統(tǒng)計(jì)學(xué)角度有最優(yōu)的信息集結(jié),該事前最優(yōu)的決策機(jī)制是在激勵成員獲取信息與最大程度提取成員信息之間折中的產(chǎn)物。需要指出的是,文[21-23]均假定決策群體成員具有相同的偏好。

三、審議過程中信息的披露

決策群體,尤其是規(guī)模較小的群體,一般會在投票表決前對決策選項(xiàng)進(jìn)行審議,交流各自的私有信息。信息的共享能引起成員信念的收斂。但群體成員通常代表著不同的利益集體,具有不同的利益追求或偏好,因而具有操縱或隱藏私有信息的動機(jī),從而限制了信息共享的可能性,成員間策略性的信息操縱與反操縱甚至導(dǎo)致比純粹偏好沖突更大程度上的意見不一致。

絕大多數(shù)群體決策文獻(xiàn)對審議(deliberation)、交流(communication)、辯論(debate)、廉價磋商(cheap talk)等類似表述用語沒有進(jìn)行明確的區(qū)分,雖然這些用語在不同場合有一些微妙甚至較大的差異,如文[24]認(rèn)為審議是辯論的子集。

研究審議對群體決策的影響的文獻(xiàn)一般將決策過程建模為兩階段博弈:先審議后正式投票表決,通過對貝葉斯Nash均衡策略和均衡存在條件的分析,研究審議是否以及如何對群體決策發(fā)生作用。這類文獻(xiàn)一般假定無論是以公共利益還是以私人利益作為評判標(biāo)準(zhǔn),好的決策選擇總是部分取決于世界的真實(shí)狀態(tài),而世界的真實(shí)狀態(tài)對決策群體成員來說無法確切知道,他們僅不對稱地掌握了有關(guān)世界真實(shí)狀態(tài)的部分信息。在正式投票表決之前的審議過程可以使群體成員有機(jī)會告訴其他成員他們所掌握的私有信息,然后,根據(jù)各自已掌握的關(guān)于世界真實(shí)狀態(tài)的部分信息,群體成員形成自己對世界真實(shí)狀態(tài)的判斷,進(jìn)而根據(jù)自己的評判標(biāo)準(zhǔn)形成各自的決策選擇偏好,如果他們的決策選擇偏好不一致,就有可能在審議的過程中不披露自己的真實(shí)信息,或提供虛假的信息以誘導(dǎo)其他成員作出對自己有利的決策選擇。因此,此類文獻(xiàn)注重從信息集結(jié)角度對完全信息披露均衡和完全信息集結(jié)均衡的分析。

Coughlan在文[25]中認(rèn)為,當(dāng)所有群體成員的決策偏好完全相同或足夠接近,在審議過程中每個成員都具有真實(shí)披露私有信息的動機(jī)。文[26]則進(jìn)一步證明,只要群體成員主觀上認(rèn)為多數(shù)成員與他擁有共同偏好具有較大的可能性,客觀上的偏好差異不會影響信息的真實(shí)共享。然而,該文同時指出,審議并不總是能有效集結(jié)信息,特別是當(dāng)群體成員沒有較強(qiáng)的先驗(yàn)信念認(rèn)為自己的價值取向就是群體主流的價值取向時,可能出現(xiàn)有意的相互欺騙。需要說明的是,在文[26]給出的模型中,所有群體成員的偏好或者完全相同,或者完全相反,與此相符的現(xiàn)實(shí)群體決策情形很少,甚至幾乎沒有。文[24,27-28]證明一致性規(guī)則在很多情況下為群體成員在審議過程中策略性地隱藏信息提供了動機(jī),多數(shù)決定規(guī)則比一致性規(guī)則能引導(dǎo)出更多的信息共享。文[28]還證明,在相當(dāng)一般的條件下,審議使得除一致性規(guī)則以外的所有其他規(guī)則具有相同的序貫均衡集合,也即審議使得所有的無否決權(quán)規(guī)則在序貫均衡方面等價,從而說明如果群體成員在投票表決前有向所有成員公開宣布各自私有信息的機(jī)會,那么采用除一致性規(guī)則以外的其他任何決策規(guī)則,都會產(chǎn)生相同的決策結(jié)果。文[29]對陪審團(tuán)在審議階段信息的披露進(jìn)行了實(shí)驗(yàn)研究,以無約束力的意向性投票形式實(shí)現(xiàn)信息的交流,實(shí)驗(yàn)結(jié)果與理論分析基本近似。

另外,文[30]給出了一個兩成員的交流與決策模型,兩個成員投票表決是否組成具有不確定回報的合伙關(guān)系,他們的偏好不一致且為私有信息。文章分析了均衡的特征,發(fā)現(xiàn)在均衡時僅有部分信息被傳遞,交流對于雙方的福利是有益的。

對于很多現(xiàn)實(shí)決策問題,決策者可能擁有客觀上可驗(yàn)證的信息,即所謂硬信息(hard information)。文[31]對硬信息在具有偏好沖突的委員會中的交流進(jìn)行了研究,證明完全信息集結(jié)均衡在偏好為私有信息的情況下比在偏好為常識情況下更有可能存在,即允許更大程度上的偏好差異;另外該文證明,如果信息可驗(yàn)證,完全信息集結(jié)均衡的存在條件等同于完全信息披露均衡的存在條件。文[32]指出,在審議階段群體成員共享私有信息的動機(jī)一定程度上取決于其私有信息的可驗(yàn)證性,如果決策成員能夠?yàn)樽约旱男畔⑻峁?yàn)證材料,則一致性規(guī)則比其他規(guī)則提供了更強(qiáng)的信息共享激勵,更有可能實(shí)現(xiàn)完全信息共享。文章給出了在一致性規(guī)則下審議階段存在完全信息披露均衡的充分必要條件。

文[33]指出,盡管偏好與信息的差異可能使得部分成員在審議過程中具有錯誤表達(dá)私有信息的動機(jī),但給予群體成員適當(dāng)?shù)耐獠考钅芟祟悇訖C(jī),促進(jìn)信息與偏好的完全集結(jié),而且隨著群體規(guī)模的擴(kuò)大,外部激勵的強(qiáng)度可以很小,外部激勵的具體措施包括對成員決策能力的肯定等。

四、透明性的影響

隨著社會的進(jìn)步,公眾對涉及自身利益的重要決策過程的透明性提出了越來越高的要求。透明的決策過程意味著公眾可以評價決策群體成員的偏好、能力與貢獻(xiàn),從而引起決策者對自身聲譽(yù)的關(guān)注,而對聲譽(yù)的關(guān)注既可能促進(jìn)信息的獲取和真實(shí)信息的披露,但也有可能導(dǎo)致信息傳遞與投票表決行為的扭曲。

在文[34]中,委員會成員在前一時期表現(xiàn)出的決策能力影響了他在后一時期能否獲得連任,而作為委員會成員可為其帶來一定的效用。該文證明公開個人投票記錄可以促進(jìn)委員會成員努力獲取信息。文[35]認(rèn)為,僅公布最終決策結(jié)果,不公開個人投票記錄,會誘導(dǎo)委員會成員按照現(xiàn)有偏見作出投票選擇,因此,委員會的決策傾向于保守化,向公眾公開成員的投票記錄則能夠減少現(xiàn)有偏見對決策的影響。該文同時認(rèn)為,群體決策機(jī)制的設(shè)計(jì)應(yīng)該不僅考慮決策過程的透明性,也要考慮決策規(guī)則的適當(dāng)性,如果決策規(guī)則選擇合適,則不透明的決策過程可能比透明的決策過程得到更好的決策結(jié)果。在文[34-35]所給出的模型中,都沒有考慮委員會成員在投票表決前可能會相互交流各自的私有信息。

在文[36]中,委員會代表公眾對一項(xiàng)新工程的實(shí)施與否進(jìn)行表決,委員會成員既關(guān)心工程的實(shí)際價值,又關(guān)心委員會在公眾中的聲譽(yù),如果維持現(xiàn)狀,不實(shí)施新工程,則暴露出委員會成員意見的不一致,從而給委員會的聲譽(yù)帶來負(fù)面影響,而公眾僅能注意到委員會的決策結(jié)果,事后不能觀測到工程的實(shí)際價值。該文證明,在審議階段,部分成員對聲譽(yù)的過分關(guān)注可能使他們不愿真實(shí)披露私有信息,而是夸大工程的價值,導(dǎo)致更容易采取實(shí)施新工程的決策。文[37]認(rèn)為,公開委員會的具體審議記錄可能會降低決策質(zhì)量。由于委員會成員關(guān)心公眾對其決策能力的判斷,使得他們在正式會議交流過程中可能隱藏內(nèi)部存在的意見分歧,公眾對于決策過程透明性的要求,可能導(dǎo)致委員會在正式會議之前組織秘密的非正式預(yù)備會議,將真正實(shí)質(zhì)性的討論從公開的正式會議階段轉(zhuǎn)移到秘密的預(yù)備會議階段,從而對公眾消除委員會內(nèi)部意見的不一致,而非正式的會議更具有不穩(wěn)定性,因此,透明性要求并不一定能增加社會福利。

在文[38-40]中,外部利益關(guān)聯(lián)者可以觀察到公開委員會每個成員的具體投票記錄和決策結(jié)果,但對于秘密委員會則只能看到最終決策結(jié)果,而委員會成員既關(guān)心決策結(jié)果又關(guān)心外部利益關(guān)聯(lián)者所給予的回報。文[38]和[39]認(rèn)為,不公布委員會成員的個人投票記錄可以減少外部利益關(guān)聯(lián)者對決策的影響,在某些情況下秘密委員會優(yōu)于公開委員會。文[39]還特別指出,由于隨著群體成員數(shù)量的增加,單個成員的投票對最終決策具有決定性影響的概率減小,對單個成員而言不誠實(shí)投票的代價隨之減小,所以對于公開委員會來說,其成員更容易因外部利益關(guān)聯(lián)者承諾給予的回報而不誠實(shí)投票,因此Condorcet陪審團(tuán)定理可能不再成立。在文[40]中,對于秘密委員會,外部利益關(guān)聯(lián)者可以根據(jù)投票表決規(guī)則的閾值和最終決策結(jié)果對委員會成員的投票作出推斷。文章分析了秘密委員會的最優(yōu)決策規(guī)則,指出決策規(guī)則中增加選擇某一選項(xiàng)需要的投票比例可能會導(dǎo)致該選項(xiàng)更容易成為最終決策結(jié)果,傳統(tǒng)看法認(rèn)為降低決策規(guī)則的閾值可以防止委員會過于保守的看法未必正確,但對于公開委員會則不存在此問題。文[41]雖然不是直接研究透明性,但其研究結(jié)論與此處內(nèi)容相關(guān),該文通過一個博弈模型,說明在特定情況下,外部利益集團(tuán)可以不用付出任何代價就能操縱委員會的決策。

另外,不少文獻(xiàn)從理論與實(shí)證兩方面研究了決策過程的透明性對貨幣政策委員會決策的影響。文[7,42]對這方面的文獻(xiàn)進(jìn)行了綜述。文[42]區(qū)分了三種類型的透明性:決策目標(biāo)透明性;知識透明性,這里的知識指決策所依據(jù)的經(jīng)濟(jì)數(shù)據(jù)或經(jīng)濟(jì)模型等;操作透明性,包括委員會會議記錄與投票記錄的透明性以及決策結(jié)果的透明性等。該文評述的文獻(xiàn)有部分運(yùn)用了博弈理論作為分析工具。文[7]專門討論了貨幣政策委員會決策過程中的動機(jī)問題,指出貨幣政策委員會的最優(yōu)規(guī)模與透明性等仍有待進(jìn)一步研究。

類似于文[34],研究透明性對貨幣政策委員會決策信息集結(jié)有效性的影響的文獻(xiàn),一般認(rèn)為委員會成員希望得到社會公眾對其決策能力或決策偏好的正面評價,從而獲得連任的機(jī)會,如文[43]假設(shè)委員會成員希望公眾認(rèn)為他是通貨膨脹的強(qiáng)硬抵制者,而最近的文獻(xiàn)如文[44-46]等,則假設(shè)委員會成員希望公眾認(rèn)為他是具有較強(qiáng)決策能力者。文[44]認(rèn)為,公開審議過程的詳細(xì)記錄會使得貨幣政策委員會成員不愿意表達(dá)不同的意見,該文通過對美聯(lián)儲聯(lián)邦公開市場委員會在被要求公開會議記錄之前和之后的會議記錄的分析說明了理論結(jié)果的有效性。文[45-46]分析了投票記錄的公開對委員會成員投票表決行為的影響,認(rèn)為投票記錄對公眾的透明帶來的負(fù)面效應(yīng)占主導(dǎo)地位,透明性不能增加社會福利。

五、最優(yōu)決策規(guī)則

顯而易見,不同的決策規(guī)則極大地影響了群體決策的信息集結(jié)效率,尤其是決策群體成員的偏好或能力不完全一致時,決策規(guī)則更是直接影響了群體成員的投票選擇行為,進(jìn)而影響了決策結(jié)果的正確性。前述文獻(xiàn)大多不同程度地討論了決策規(guī)則的比較和選擇,除此以外,另有部分文獻(xiàn)對各種情況下的最優(yōu)決策規(guī)則進(jìn)行了研究。

文[47-48]從最大化期望效用的角度對固定規(guī)模的委員會形式集體決策的最優(yōu)決策規(guī)則進(jìn)行了分析,文[49-50]研究了在特定約束條件下的最優(yōu)決策規(guī)則。然而,這些早期的文獻(xiàn)都有個潛在的假設(shè):決策成員僅按照自身獲得的信息作出投票選擇。文[2,51]等指出,即使決策群體成員的偏好完全一致,也不能保證一定能夠如Condorcet陪審團(tuán)定理所預(yù)測的那樣有效集結(jié)各成員的信息,因?yàn)槿后w成員僅根據(jù)自身信息作出非策略性的選擇不符合理性要求,當(dāng)且僅當(dāng)所使用的決策規(guī)則為集結(jié)群體成員私有信息的最優(yōu)規(guī)則時,所有群體成員僅按自身信息投票才是Nash均衡,而最優(yōu)決策規(guī)則則取決于特定的決策情形。

文[52]證明,當(dāng)采用文[48]所定義的最優(yōu)決策規(guī)則時,所有成員僅按照自身獲得的信息投票表決形成Nash均衡,但僅按自身信息投票可能不是有效的,因?yàn)椴糠殖蓡T聯(lián)合決定策略性投票可以增加期望效用。文[53]討論了投票者對不同決策選項(xiàng)具有可用基數(shù)表示的效用時的誠實(shí)投票問題,試圖給出當(dāng)決策機(jī)制允許多種消息類型時誠實(shí)投票的準(zhǔn)確定義。為使投票者具有誠實(shí)投票的動機(jī),文[54]提出了一種在隨機(jī)選擇的投票表決集合上運(yùn)用多數(shù)決定規(guī)則得到最終決策的方法,在對所有投票者的表決結(jié)果運(yùn)用多數(shù)決定規(guī)則和僅對投票表決結(jié)果的隨機(jī)抽樣子集運(yùn)用多數(shù)決定規(guī)則之間進(jìn)行隨機(jī)選擇,可以激勵投票者誠實(shí)投票,從而得到Condorcet陪審團(tuán)定理的有效性收斂結(jié)果。

文[55]基于陪審員的私有信息和策略性表決行為構(gòu)建了一個陪審團(tuán)決策模型,證明一致同意規(guī)則可能會導(dǎo)致無辜被告得到有罪判決和有罪被告得到無罪判決這兩種錯誤的概率都增加。文[56]分析了決策群體所投票表決的決策選項(xiàng)不獨(dú)立于投票表決規(guī)則的情形:給定決策群體的投票表決規(guī)則,提案者向決策群體提出一個要么完全接受要么完全拒絕的議案,群體投票表決是接受還是拒絕該議案。該文證明由于一致同意規(guī)則能促使提案者提出更有吸引力的議案,所以增加了決策群體的期望效用,在某些情況下,一致同意規(guī)則甚至是Pareto最優(yōu)的表決規(guī)則,因?yàn)樗苍黾恿颂岚刚叩钠谕в?,即使提案者與決策群體的利益追求可能完全相反??偨Y(jié)考慮一致性規(guī)則的文獻(xiàn)[22,24,27,28,32,55,56],可見博弈分析得到的結(jié)論往往與人們直觀上的認(rèn)識截然相反,一致性規(guī)則是不是合適的決策規(guī)則完全取決于特定的決策情形。

既然投票表決規(guī)則直接影響了投票者的投票選擇行為,那么,對于群體決策機(jī)制的設(shè)計(jì)者來說,他在選擇投票表決規(guī)則時是否需要考慮投票者在各種表決規(guī)則下的投票行為,換言之,機(jī)制設(shè)計(jì)者關(guān)于投票者在各種規(guī)則下的博弈行為的信念是否會影響到最優(yōu)決策規(guī)則的選擇。文[57-58]對此問題進(jìn)行了研究,其中假設(shè)群體成員的決策偏好完全一致。文[57]分析了決策成員的能力存在差異且這種差異是常識的情況下的投票表決規(guī)則,指出最優(yōu)的匿名單調(diào)投票規(guī)則并不取決于成員是否按照自身信息投票或策略性投票。類似于文[57]的結(jié)論,文[58]認(rèn)為,決策機(jī)制設(shè)計(jì)者對最優(yōu)投票表決規(guī)則的選擇與機(jī)制設(shè)計(jì)者關(guān)于投票者在不同表決規(guī)則下的投票行為的信念無關(guān),在該文中,機(jī)制設(shè)計(jì)者為決策群體選擇投票表決規(guī)則,其目的是為了最大化決策群體的期望福利,文章證明,僅從信息集結(jié)的角度看,關(guān)于投票者在各種表決規(guī)則下的投票行為的不同假設(shè)對于最優(yōu)決策規(guī)則的選擇來說,結(jié)論是一樣的,不同的行為假設(shè)導(dǎo)致相同的結(jié)論。對于具有相同偏好的決策群體來說,文[57-58]的研究結(jié)論大大簡化了決策規(guī)則的選擇。

現(xiàn)實(shí)中的決策群體往往存在具有極端偏好的成員,這些成員的存在為信息的有效集結(jié)帶來較大的困難。文[59]對存在極端偏好者和中立者的群體面對二分決策問題時的最優(yōu)決策規(guī)則進(jìn)行了研究,考慮了決策成員之間存在轉(zhuǎn)移支付的情況,指出最優(yōu)投票表決規(guī)則相對于轉(zhuǎn)移支付可能性的大小來說是非單調(diào)的。文[60]對由兩類具有完全相反的偏好的成員所組成的委員會決策進(jìn)行了分析,對比了一致性規(guī)則與非一致性規(guī)則的信息集結(jié)效率。文[61]給出了一個現(xiàn)實(shí)中較難接受的非單調(diào)性決策規(guī)則――超多數(shù)懲罰(supermajority penalty)規(guī)則,當(dāng)選擇某一選項(xiàng)的投票過多時,將該選項(xiàng)作為群體決策最終結(jié)果的概率反而會下降,該文證明,當(dāng)對于每個選項(xiàng)都存在極端偏好者時,超多數(shù)懲罰規(guī)則是最優(yōu)匿名激勵相容規(guī)則。

前述文獻(xiàn)都假定群體成員的偏好相互獨(dú)立,而文[62]對群體成員具有相互關(guān)聯(lián)但不完全相同的偏好的情況進(jìn)行了分析,其中的決策選擇空間是連續(xù)的,該文分別討論了采用平均規(guī)則與中值規(guī)則時所對應(yīng)博弈的對稱貝葉斯Nash均衡的存在性問題,并比較了這兩種規(guī)則在不同偏好關(guān)聯(lián)程度下的性能。

由于從眾心理,群體成員經(jīng)常會根據(jù)對其他成員行為的觀察相應(yīng)調(diào)整自己的行為。文[63-64]對從眾心理對群體決策的影響進(jìn)行了研究,其中假定群體成員一方面希望選出好的決策選項(xiàng),另一方面又希望自己成為勝出的一方。文[63]分析了群體規(guī)模較大時同時投票機(jī)制與順序投票機(jī)制的均衡特征和信息集結(jié)質(zhì)量,文[64]指出這種從眾心理導(dǎo)致同時存在多個均衡,而且對于這些均衡中的多數(shù),信息不能被有效集結(jié)。文[64]從某種程度上說明了最優(yōu)決策規(guī)則設(shè)計(jì)的困難。

六、現(xiàn)有研究工作的不足之處

其一,社會選擇理論與公共選擇理論以及管理學(xué)領(lǐng)域?qū)θ后w決策的研究,主要考慮偏好集結(jié)的有效性,而其中的偏好則是指對決策選項(xiàng)的偏好,這種偏好取決于決策者對最終結(jié)果的更根本意義上的偏好和對世界真實(shí)狀態(tài)的信念。在現(xiàn)實(shí)社會中,純粹以偏好的有效集結(jié)為終極目標(biāo)的重要群體決策問題幾乎不存在,例如社會選擇理論與公共選擇理論最重要的應(yīng)用領(lǐng)域――選舉,既是偏好集結(jié)(這里指更根本意義上的偏好),更是信息集結(jié)。僅考慮偏好的集結(jié)問題,不考慮偏好的形成過程以及信息在偏好形成過程中的潛在作用,無法分析群體內(nèi)外部交流與互動等對決策的影響,無法解釋現(xiàn)實(shí)中的很多現(xiàn)象,因而對相關(guān)決策機(jī)制設(shè)計(jì)的指導(dǎo)作用較為有限。

其二,社會心理學(xué)從認(rèn)知的角度研究群體決策,其結(jié)論出自于對實(shí)驗(yàn)和經(jīng)驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)學(xué)分析,易于為人們接受。但由于從實(shí)驗(yàn)或經(jīng)驗(yàn)數(shù)據(jù)中利用統(tǒng)計(jì)學(xué)方法推導(dǎo)出群體的偏好分布參數(shù)極為困難,所以無法深入研究群體決策過程中因偏好不一致而導(dǎo)致的隱藏與扭曲私有信息等策略。

其三,與社會選擇理論和公共選擇理論一樣,用博弈論研究群體決策信息集結(jié)問題的文獻(xiàn)也是以理性選擇假設(shè)作為判斷與決策的微觀基礎(chǔ)。盡管所有群體成員嚴(yán)格按照貝葉斯規(guī)則更新自己的信念等完全理性假設(shè)對于心理學(xué)家和普通人來說都是難以接受的,但博弈論文獻(xiàn)還是以其數(shù)學(xué)分析的簡潔與嚴(yán)謹(jǐn)顛覆了很多直覺上的認(rèn)識,通過對群體決策者動機(jī)的分析,有助于我們理解決策機(jī)制的哪些方面可能會引起不利于決策目標(biāo)實(shí)現(xiàn)的策略,進(jìn)而有助于決策機(jī)制的改進(jìn)。隨著群體成員偏好差異程度和決策問題重要程度的增加,審議方式和決策規(guī)則趨向于書面化和正規(guī)化,群體思維與群體極化現(xiàn)象將很少出現(xiàn),決策結(jié)果也將更接近于博弈分析的預(yù)測。

目前對群體決策信息集結(jié)問題的研究尚處于起步階段,還有很多不完善之處,在某些方面甚至存在根本性的缺陷。

第一,可能是受到信息經(jīng)濟(jì)學(xué)研究的誤導(dǎo),本領(lǐng)域的很多理論與實(shí)驗(yàn)分析文獻(xiàn),包括一些奠基性的文獻(xiàn),混淆了信息與在信息基礎(chǔ)上形成的判斷。真實(shí)信息的披露不會引起其他群體成員以及公眾對自己決策能力的負(fù)面評價,更不會如判斷的披露那樣引起認(rèn)知上的從眾,如果決策者掌握了確鑿可靠的信息,則其不會因?yàn)槠渌嘶谄渌畔a(chǎn)生的不同看法而輕易改變自己的信念。

除個別文獻(xiàn)外,現(xiàn)有研究群體決策信息集結(jié)問題的文獻(xiàn)幾乎都是將審議完全等同于信息經(jīng)濟(jì)學(xué)領(lǐng)域的廉價磋商,將交流限制為每個群體成員同時向所有其他成員發(fā)送一輪公開的消息。在現(xiàn)實(shí)群體決策過程中,審議至少包括對各方面提供的信息的真實(shí)性的審議,以及對信息與世界真實(shí)狀態(tài)之間的邏輯關(guān)聯(lián)(即潛在的決策模型)的審議。因此,將審議建模為完全的廉價磋商的現(xiàn)實(shí)意義極為有限,對于偏好差異較大的群體更是如此。

第二,客觀上難以驗(yàn)證的信息的可接受性,取決于接收者對于信息發(fā)送者的偏好的信念,例如,人們有充分的理由懷疑壟斷企業(yè)單方面提供的企業(yè)運(yùn)營成本數(shù)據(jù)的真實(shí)性。另一方面,在很多情況下,信息的軟硬程度(可驗(yàn)證程度)與信息獲取者和信息接收者的成本投入相關(guān)。因此,群體成員獲取可驗(yàn)證信息與不可驗(yàn)證信息的動機(jī),以及群體成員對信息軟硬程度的投入,既取決于是否有審議階段以及審議方式和決策規(guī)則,也取決于群體成員的偏好和群體成員關(guān)于群體偏好差異程度的先驗(yàn)信念。諸如此類問題現(xiàn)有文獻(xiàn)幾乎沒有涉及。

群體決策在現(xiàn)代社會無處不在,如政府部門對重大戰(zhàn)略性問題的決策、公司董事會對重要項(xiàng)目投資與實(shí)施問題的決策、審判委員會對犯罪嫌疑人的判決、專家對科學(xué)基金項(xiàng)目申請書的評審等。從組織或社會的目標(biāo)出發(fā),針對特定的決策問題,為了盡可能作出正確的決策,應(yīng)該如何組成決策群體,選擇何種決策規(guī)則?此類群體決策的科學(xué)化與民主化問題很久以來一直是管理、政治、法律和經(jīng)濟(jì)等領(lǐng)域討論的中心,其研究結(jié)果對于各類政治、社會、經(jīng)濟(jì)組織的運(yùn)行機(jī)制設(shè)計(jì)具有重要的意義。

中國學(xué)者對群體決策的理論與方法進(jìn)行了大量的研究,提出了不少新的概念和方法,作出了很多重要貢獻(xiàn),國家自然科學(xué)基金委員會對群體決策理論與方法研究也較為重視,曾將其列為優(yōu)先資助領(lǐng)域。但根據(jù)現(xiàn)有的各類文獻(xiàn)和歷年的基金項(xiàng)目研究摘要,總體感覺國內(nèi)對決策群體成員的動機(jī)和理考慮較少,到目前為止還沒有發(fā)現(xiàn)國內(nèi)其他學(xué)者利用博弈論研究群體決策信息集結(jié)問題。

筆者試圖利用不完全信息博弈論和機(jī)制設(shè)計(jì)理論,研究決策群體成員的策略性信息獲取、信息傳遞和投票表決行為,揭示決策群體人員組成、審議方式、決策規(guī)則、透明性等決策機(jī)制的各個方面對群體決策的信息集結(jié)有效性的具體影響。并試圖從信息集結(jié)角度,為一些典型公共決策情形優(yōu)化決策機(jī)制。

參考文獻(xiàn):

[1] PIKETTY T. The informationaggregation approach to political institutions[J]. European Economic Review, 1999, 43(4-6):791-800.

[2] AUSTENSMITH D, BANKS J. Information aggregation, rationality, and the Condorcet jury theorem[J]. American Political Science Review, 1996, 90(1):34-45.

[3] FEDDERSEN T, PESENDORFER W. The swing voter’s curse[J]. American Economic Review, 1996, 86(3):408-424.

[4] FEDDERSEN T, PESENDORFER W. Voting behavior and information aggregation in elections with private information[J]. Econometrica, 1997, 65(9):1029-1058.

[5] MYERSON R. Extended Poisson games and the Condorcet jury theorem[J]. Games and Economic Behavior, 1998, 25(1):111-131.

[6] FEDDERSEN T, PESENDORFER W. Elections, information aggregation, and strategic voting[J]. Proceedings of the National Academy of Sciences of the United States of America, 1999, 96:10572-10574.

[7] FUJIKI H. The monetary policy committee and the incentive problem: A selective survey[J]. Monetary and Economic Studies, 2005, 23(S1):37-82.

[8] VANDENBUSSCHE J. Elements of optimal monetary policy committee design[EB/OL]. IMF Working Paper No. 06/277, 2006. (2006-06-30) 省略/external/pubs/ft/wp/2006/wp06277.pdf.

[9] GERLING K, GRNER H, KIEL A, SCHULTE E. Information acquisition and decision making in committees: A survey[J]. European Journal of Political Economy, 2005, 21(3):563-597.

[10] Mukhopadhaya K. Jury Size and the Free Rider Problem[J]. The Journal of Law, Economics, and Organization, 2003, 19:24-44.

[11] MARTINELLI C. Would rational voters acquire costly information?[J]. Journal of Economic Theory, 2006, 129(1):225-251.

[12] MARTINELLI C. Rational ignorance and voting behavior[J]. International Journal of Game Theory, 2007, 35(3):315-335.

[13] KITAHARA M, SEKIGUCHI Y. Condorcet’s jury theorem under costly information acquisition[EB/OL]. Working Paper, University of Tokyo, 2004. (2004-04-25).e.utokyo.ac.jp/cemano/research/DP/documents/coef54.pdf.

[14] KITAHARA M, SEKIGUCHI Y. Aggregate accuracy under majority rule with heterogeneous cost functions[J]. Economics Bulletin, 2006, 4(25):1-8.

[15] KITAHARA M, SEKIGUCHI Y. Condorcet jury theorem or rational ignorance[J]. Journal of Public Economic Theory, 2008, 10(2):281-300.

[16] BAG P, LEVINE P, SPENCER C. A note on: Jury size and the free rider problem[J]. Economics Bulletin, 2006, 4(3):1-12.

[17] TRIOSSI M. Costly information acquisition. Better to toss a coin?[EB/OL]. Working Paper, Collegio Carlo Alberto, 2010.(2010-03-15).webmanager.cl/prontus_cea/cea_2010/site/asocfile/ASOCFILE120100127120554.pdf.

[18] SWANK O, WRASAI P. Deliberation, information aggregation, and collective decision making[EB/OL]. Working Paper, Tinbergen Institute, 2003.(2003-06-20) .tinbergen.nl/discussionpapers/02006.pdf.

[19] CAI H. Costly participation and heterogeneous preferences in informational committees[J]. The RAND Journal of Economics. 2009, 40(1):173-189.

[20] BENIERS K, SWANK O. On the composition of committees[J]. Journal of Law, Economics, and Organization, 2004, 20(2): 353-378.

[21] LI H. A theory of conservatism[J]. Journal of Political Economy, 2001, 109(3):617-636.

[22] NICOLA P. Committee design with endogenous information[J]. Review of Economic Studies, 2004, 71(1):165-191.

[23] GERARDI D, YARIV L. Information acquisition in committees[J]. Games and Economic Behavior, 2008, 62(2):436-459.

[24] AUSTENSMITH D, FEDDERSEN T. Deliberation and voting rules[M]//AUSTENSMITH D, DUGGAN J. Social choice and strategic decisions. Berlin: Springer Berlin Heidelberg, 2005:269-316.

[25] COUGHLAN P. In defense of unanimous jury verdicts: Mistrials, communication, and strategic voting[J]. American Political Science Review, 2000, 94(2): 375-393.

[26] MEIROWITZ A. In defense of exclusionary deliberation: Communication and voting with private beliefs and values[J]. Journal of Theoretical Politics, 2007, 19(3): 301-327.

[27] AUSTENSMITH D, FEDDERSEN T. Deliberation, preference uncertainty, and voting rules[J]. American Political Science Review, 2006, 100: 209-217.

[28] GERARDI D, YARIV L. Deliberative voting[J]. Journal of Economic Theory, 2007, 134(1): 317-338.

[29] GUARNASCHELLI S, MCKELVEY R, PALFREY T. An experimental study of jury decision rules[J]. American Political Science Review, 2000, 94: 407-423.

[30] DORASZELSKI U, GERARDI D, SQUINTANI F. Communication and voting with doublesided information[J]. Contributions to Theoretical Economics, 2003, 3(1), Article 6.

[31] SCHULTE E. Information aggregation and preference heterogeneity in committees[J]. Theory and Decision, 2010, 69(1):97118.

[32] MATHIS J. Deliberation with partially verifiable information[EB/OL]. THEMA Working Papers No. 2006-03, (2006-08-20). ucergy.fr/IMG/2006-03.pdf.

[33] MEIROWITZ A. Designing institutions to aggregate preferences and information[J]. Quarterly Journal of Political Science, 2006, 1(4): 373-392.

[34] GERSBACH H, HAHN V. Information acquisition and transparency in committees[EB/OL]. CEPR Discussion Paper no. 6677, London, Centre for Economic Policy Research, (2009-06-20). papers.省略/sol3/papers.cfm?abstract_id=1084060.

[35] LEVY G. Decision making in committees: Transparency, reputation and voting rules[J]. American Economic Review, 2007, 97(1):150-168.

[36] VISSER B, SWANK O. On committees of experts[J]. The Quarterly Journal of Economics. 2007, 122(1):337-372.

[37] SWANK O, VISSER B. Is transparency to no avail? Committee decisionmaking, premeetings, and credible deals[EB/OL]. Working Paper, Tinbergen Institute, (2009-06-18). people.few.eur.nl/bvisser/articles/Transparency%20Dec%202009.pdf.

[38] SEIDMANN D. A Theory of voting patterns and performance in private and public committees[EB/OL]. CeDEx Discussion Paper 2009-06, (2009-10-15). nottingham.ac.uk/economics/cedex/papers/2009-06.pdf.

[39] FELGENHAUER M, GRUNER H. Committees and special interests[J]. Journal of Public Economic Theory, 2008, 10(2): 219-243.

[40] SEIDMANN D. Optimal quotas in private committees[J]. The Economic Journal, 2008, 118(525):16-36.

[41] DAL B E. Bribing voters[J]. American Journal of Political Science, 2007, 51(4):789-803.

[42] HAHN V. Transparency in monetary policy: A survey[J]. IFO Studien, 2002, 48(3):429-455.

[43] SIBERT A. Monetary policy committees: Individual and collective reputations[J]. The Review of Economic Studies, 2003, 70(3):649-665.

[44] MEADE E, STASAVAGE D. Publicity of debate and the incentive to dissent: Evidence from the US Federal Reserve[J]. The Economic Journal, 2008, 118(528):695-717.

[45] HAHN V. Committees, sequential voting and transparency[J]. Mathematical Social Sciences, 2008, 56(3):366-385.

[46] HANS G, HAHN V. Should the individual voting records of central bankers be published?[J]. Social Choice and Welfare, 2008, 30(4):655-683.

[47] NITZAN S, PAROUSH J. Optimal decision rules in uncertain dichotomous choice situation[J]. International Economic Review, 1982, 23:289-297.

[48] BENYASHAR R, NITZAN S. The optimal decision rule for fixedsize committees in dichotomous choice situations: The general result[J]. International Economic Review, 1997, 38:175-186.

[49] BENYASHAR R, KHULLER S, KRAUS S. Optimal collective dichotomous choice under partial order constraints[J]. Mathematical Social Science, 2001, 41:349-364.

[50] KRAUS S. Optimal collective dichotomous choice under quota constraints[J]. Economic Theory, 2002, 19:839-852.

[51] MCLENNAN A. Consequences of the Condorcet jury theorem for beneficial information aggregation by rational agents[J]. American Political Science Review, 1998, 92:413-418.

[52] BENYASHAR R. Information is important to Condorcet jurors[J]. Public Choice, 2006, 127(3):305-319.

[53] BALLESTER M, REYBIEL P. Does uncertainty lead to sincerity? Simple and complex voting mechanisms[J]. Social Choice and Welfare, 2009, 33(3):477-494.

[54] LASLIER J, WEIBULL J. Providing incentives for informative voting[EB/OL]. Working Paper, Ecole Polytechnique, (2006-10-10). hal.inria.fr/docs/00/24/30/42/PDF/2007-01-04-1531.pdf.

[55] FEDDERSEN T, PESENDORFER W. Convicting the innocent: The inferiority of unanimous jury verdicts under strategic voting[J]. The American Political Science Review, 1998, 92(1):23-35.

[56] BOND P, ERASLAN H. Strategic voting over strategic proposals[J]. Review of Economic Studies, 2009, 77(2):459-490.

[57] BENYASHAR R, MILCHTAICH I. First and second best voting rules in committees[J]. Social Choice and Welfare, 2007, 29(3):453486.

[58] COSTINOT A, KARTIK N. On optimal voting rules with homogeneous preferences[EB/OL]. Working Paper, Massachusetts Institute of Technology,(2009-05-25). econmit.edu/files/3732.

[59] MEHMET B, PARIMAL K B. Committee decisions with partisans and sidetransfers[J]. Theory and Decision, 2002, 52(3):267286.

[60] JAEHOON K. A model of adversarial committees[EB/OL]. Working Paper, University of Rochester, (2005-09-12).省略.rochester.edu/~jaek/Adversarial.pdf.

[61] CHWE M. Anonymous procedures for Condorcet’s model: Robustness, nonmonotonicity, and optimality[J]. Quarterly Journal of Political Science, 2010, 5(1):4570.

[62] GRNER H, KIEL A. Collective decisions with interdependent valuations[J]. European Economic Review, 2004, 48(5):1147-1168.

篇2

目前,中國除了上海之外,其它城市還沒有專營消費(fèi)信貸調(diào)查業(yè)務(wù)的報告機(jī)構(gòu)。1999年下半年,建設(shè)銀行濟(jì)南分行出臺的《個人信用等級評定辦法》在信用評估方面進(jìn)行了嘗試。該辦法對不同的指標(biāo)賦予不同的分值,對借款申請人的還款能力、信用狀況等做出綜合評價以決定貸款決策。隨著信貸業(yè)務(wù)的需要,國內(nèi)越來越多金融機(jī)構(gòu)以業(yè)務(wù)對象的個人信用記錄直接作決策參考,或附以一些評分方法,但畢竟以主觀經(jīng)驗(yàn)為主。而國外在信用評估方面已經(jīng)有人做了大量的工作,提出了有FICO評分模型、神經(jīng)網(wǎng)絡(luò)模型、貝葉斯分析模型等等各種評估模型,并采用了各種數(shù)學(xué)的、統(tǒng)計(jì)學(xué)的、信息學(xué)的方法,取得了一定的效果,特別是FICO評分模型,更是成為西方發(fā)達(dá)國家信用評分事實(shí)上的標(biāo)準(zhǔn)。

二、常用評估方法

1.標(biāo)準(zhǔn)數(shù)理統(tǒng)計(jì)模型

基于標(biāo)準(zhǔn)數(shù)理統(tǒng)計(jì)理論的信用評分模型是對大量的個人消費(fèi)貸款的歷史信用數(shù)據(jù)進(jìn)行科學(xué)的歸納、總結(jié)、計(jì)算而得到的量化分析公式。在美國,不同的行業(yè)有不同的信用評分模型來幫助專業(yè)人士進(jìn)行信用風(fēng)險管理,如表1所示:

表1美國不同行業(yè)常用信用評分模型表

從概念上講,信用評分就是利用消費(fèi)者過去的信用表現(xiàn)來預(yù)測其未來的信用行為,如圖1所示。

信用評分模型的關(guān)鍵是科學(xué)合理地選出信用變量,并產(chǎn)生一個公式。信用評分模型的統(tǒng)計(jì)方法有線性概率模型、logit模型、probit模型以及線性判別(Discriminant)分析方法。

(1)線性概率模型

線性概率模型假設(shè)違約概率Y與信用變量X之間的關(guān)系是線性的,用于解釋過去信用行為(違約或不違約)的信用變量及其重要性(系數(shù))被用來預(yù)測未來的信用行為。線性概率模型數(shù)學(xué)表達(dá)如下:

根據(jù)歷史樣本數(shù)據(jù)進(jìn)行優(yōu)化計(jì)算,得出系數(shù)βj的估算值。

(2)Logit信用評分模型

Logit信用評分模型是采用數(shù)理統(tǒng)計(jì)的logit回歸方法建模分析。logit信用評分模型的分析方法如下:

這里,Y∈{0,1}是二元響應(yīng)變量,表示信貸狀況;為logit概率累積分布函數(shù)。當(dāng)Xj屬于度量變量時,Xj表示為第j個可度量變量;當(dāng)Xj屬于范疇變量時,Xj表示為啞元變量向量。

(3)Probit信用評分模型

Probit模型同樣能夠把違約概率的預(yù)測值限制在0和1之間。它與logit模型的不同在于probit模型假設(shè)違約概率服從累積正態(tài)分布(cumulativenormaldistribution),即

(4)線性判別模型

判別模型根據(jù)過去觀察到的借貸者的信用特征,把他們劃分成高違約風(fēng)險和低違約風(fēng)險類別。線性判別模型(LinearDiscriminantModel)假定信用變量對這種劃分的影響是線性的。

2.數(shù)據(jù)挖掘技術(shù)

數(shù)據(jù)挖掘從大量數(shù)據(jù)中提取或“挖掘”知識,其任務(wù)可以分為描述和預(yù)測兩類,用于信用評估,可對客戶進(jìn)行分類、聚類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)、預(yù)測、偏差檢測等。其中多數(shù)用分類、關(guān)聯(lián)規(guī)則發(fā)現(xiàn)和預(yù)測方法進(jìn)行個人信用評估。

(1)分類

按分析對象的屬性、特征建立不同的組類描述事物。它基于對類標(biāo)記已知的數(shù)據(jù)對象的分析,導(dǎo)出描述并區(qū)分?jǐn)?shù)據(jù)類或概念的模型(或函數(shù)),用以預(yù)測類標(biāo)記未知的對象類。導(dǎo)出模式可以用分類規(guī)則、判定樹、數(shù)學(xué)公式或神經(jīng)網(wǎng)絡(luò)等形式表示。

(2)關(guān)聯(lián)規(guī)則發(fā)現(xiàn)

某種事物發(fā)生時其他事物會發(fā)生的一種聯(lián)系,這些規(guī)則展示屬性-值頻繁地在給定數(shù)據(jù)集中一起出現(xiàn)的條件,關(guān)聯(lián)規(guī)則形式:X=>Y,即“A1∧...∧Am=>B1∧...∧Bm”。

(3)預(yù)測

把握分析對象發(fā)展的規(guī)律,對未來的趨勢作出預(yù)見,其表示形式與分類同。

三、一種基于歷史記錄規(guī)則相似性的綜合評估方法

由于國內(nèi)銀行業(yè)現(xiàn)有客戶記錄多數(shù)是不完整的,所以使用單一的方法進(jìn)行評估未必能體現(xiàn)客戶真實(shí)的信用歷史狀況。為了將數(shù)據(jù)挖掘技術(shù)和數(shù)理統(tǒng)計(jì)完全基于記錄本身特征并與能夠體現(xiàn)專家判斷的評分很好地結(jié)合起來,本文提出一種基于關(guān)聯(lián)規(guī)則的相似推薦方法,實(shí)現(xiàn)如下:

1.應(yīng)用粗糙集理論對歷史數(shù)據(jù)記錄進(jìn)行屬性約簡及規(guī)則提取

粗糙集理論是數(shù)據(jù)表簡化和生成最小決策算法的有效方法,可以實(shí)現(xiàn)知識約簡,發(fā)現(xiàn)屬性表中的屬性依賴,從而在信息不完全環(huán)境下進(jìn)行知識發(fā)現(xiàn),其定義如下:

S=<U,A,F(xiàn),V>

其中,S:信息系統(tǒng)(決策表)

U:論域

A:屬性集合

F:UXAV的映射

V:屬性值域集合

采用決策偏好信息的挖掘方法(參見文獻(xiàn)[3]),對S進(jìn)行屬性約簡并提取規(guī)則,形成不同支持度S和信任度C決策規(guī)則集合DN{фΨ}(其中N代表提取的規(guī)則數(shù)量,可根據(jù)實(shí)際情況確定),且D是S不重復(fù)的子集,ф是條件屬性,Ψ是決策屬性,ф、Ψ∈A。

2.對測試記錄與步驟1提取的規(guī)則進(jìn)行相似性計(jì)算

相似性是某種關(guān)系強(qiáng)度的度量,可以通過數(shù)值比較來衡量(參見文獻(xiàn)[4])。因?yàn)闆Q策規(guī)則集合D不能完全覆蓋所有測試記錄屬性值組合,而且決策表對象結(jié)構(gòu)相同。測試集合SD中的任一組合(規(guī)則)Dd對照D中Dn進(jìn)行相似性計(jì)算,得出SIM1、SIM2...SIMn

其中,B:歸一化因子

(B=1/∑Wi)

Wi:屬性i貢獻(xiàn)因子

(體現(xiàn)數(shù)據(jù)特性或?qū)<医?jīng)驗(yàn),也可通過多種賦權(quán)綜合評價求得)

SD(Dd,Dn):已知Dd發(fā)生,Dn也在同一組發(fā)生的概率

3.多賦權(quán)綜合評價

對上述步驟求得參照各個規(guī)則的支持度S、信任度C及相似性SIM組成一個N個對象、3個指標(biāo)的矩陣XN×3。

(1)運(yùn)用變異系數(shù)法對X進(jìn)行客觀賦權(quán)

此時,第j個指標(biāo)的權(quán)重就是這種加權(quán)方法是為了突出各指標(biāo)的相對變化幅度,即變異程度。

(2)對X使用線性插值法進(jìn)行規(guī)范化處理,得到規(guī)范化矩形ZN×3,對其使用互補(bǔ)判斷矩陣排序法求屬性權(quán)重:

I=1運(yùn)用綜合賦權(quán)法將(1)、(2)兩個權(quán)向量進(jìn)行有機(jī)集成,得到綜合權(quán)向量W=(W1,W2,......,WN)。傳統(tǒng)的綜合賦權(quán)有乘法合成歸一化、線性加權(quán)組合法、基于spearman等級相關(guān)系數(shù)綜合賦權(quán)法等,也可采用基于灰色關(guān)聯(lián)度的客觀權(quán)重綜合集成法。

最終求出測試記錄對各個規(guī)則的評價值fi=∑wj×zij,(i=1,2,......,N),其中MAX(fi)就是與測試記錄最相似的規(guī)則,可將其決策偏好作為測試記錄的預(yù)期偏好。

篇3

Abstract: The classification research of regional shape after image segmentation is brought forward in this paper based on RS theory. Data discrimination is the character of RS,considering distributed information of class,and continual condition attributes are described according to information entropy theory. On the basis of that,redundancy attributes are eliminated by RS reduction algorithm. Reduction attributes and rules are gained. Finally,the result indicates that the classification is valid through selecting test sample and analyzing the imitation experiment.

關(guān)鍵詞:區(qū)域形狀;粗集;分類;信息熵

Key words: regional shape;rough set;classification;information entropy

中圖分類號:TP30 文獻(xiàn)標(biāo)識碼:A文章編號:1006-4311(2010)21-0028-02

0引言

在有關(guān)視覺信息的討論中,目標(biāo)的形狀具有特殊的意義。圖像分割后,圖像中一個區(qū)域的形狀就是該目標(biāo)邊界上的點(diǎn)所組成的模式。要對形狀進(jìn)行分類,首先要對目標(biāo)的形狀特征進(jìn)行描述。由于形狀很難給出精確的數(shù)學(xué)定義,所以對形狀的度量往往是相對的,而不是絕對的。為了對目標(biāo)的形狀描述更加精確,需要同時使用多種特征,然而特征越多,計(jì)算量越大,實(shí)現(xiàn)也越復(fù)雜。因此,能用最少的特征來完成形狀分類的目的有著重要的意義。

粗糙集理論是一種嶄新的智能信息處理理論,它為研究不精確知識的表達(dá)、學(xué)習(xí)、約簡,分類歸納等提供了一種新的方法。鑒于形狀描述的特點(diǎn)及粗糙集理論在處理不確定性信息方面的優(yōu)勢,本節(jié)提出一種基于粗集理論的區(qū)域形狀分類策略。將目標(biāo)圖像的統(tǒng)計(jì)學(xué)特性作為條件屬性,形狀分類作為決策屬性,并針對連續(xù)屬性進(jìn)行離散化,屬性約簡,最終從訓(xùn)練樣本中提取出決策規(guī)則,進(jìn)而對測試樣本進(jìn)行分析。

1基于粗集的處理過程

在給定一幅含有多個物體的數(shù)字圖像的條件下,處理過程由三個主要階段組成[1]:

①圖像分割的預(yù)處理階段

在該階段中檢測出各個物體,以獲得精確的分析目標(biāo)。

②特征抽取階段

對物體進(jìn)行度量。一個度量是指一個物體某個可度量性質(zhì)的度量值,而特征是一個或多個度量的函數(shù)。計(jì)算特征是為了對物體的一些重要特征進(jìn)行定量估計(jì)。特征抽取過程產(chǎn)生了一組特征,把它們組合在一起,就形成了特征向量,即產(chǎn)生條件屬性和決策屬性。

③分類階段

基于粗集的一種決策,主要確定每個物體應(yīng)該歸屬的類別,其中包括對知識的約簡,獲取及分析決策。

在物體從圖像中分割出來后,進(jìn)一步就可以對它的幾何特征進(jìn)行測量和分析,在此基礎(chǔ)上可以識別物體,也可以對物體分類,結(jié)合區(qū)域形狀的分析特征及粗集理論的特點(diǎn),給出基于粗集的區(qū)域形狀的分類處理過程,如圖1所示。

在特征抽取階段建立基于粗集理論的區(qū)域形狀分類信息系統(tǒng)S=(U,C,D,V,F),其中U為論域,是區(qū)域形狀對象的非空有限集合,C∪D=A為屬性集合,子集C和D分別稱為條件屬性和決策屬性,V=∪a∈Va是屬性值的集合,Va表示了屬性a∈A取值的范圍,F為U與A之間的關(guān)系集。信息系統(tǒng)的數(shù)據(jù)可以以關(guān)系表的形式來表示,即決策表[2]。決策表的列表示條件屬性和決策屬性。行表示對象,每個單元格表示對象的屬性值??梢钥闯?一個屬性對應(yīng)一個等價關(guān)系,一個決策表看作是一族等價關(guān)系,即知識庫。知識等價可以用不同的屬性集描述論域中的對象,表達(dá)關(guān)于論域相同的事實(shí)。

2仿真實(shí)驗(yàn)

2.1 區(qū)域形狀分類信息系統(tǒng)的建立

描述區(qū)域形狀特征的因素復(fù)雜且難以測量,本文采用對形狀變化比較敏感的形狀特征來描述區(qū)域形狀,并利用部分區(qū)域形狀特征建立決策表,其中,條件屬性C包括五個形狀特征,分別代表外觀比C1,形狀因子C2,偏心率C3,矩形度C4及飽和度C5,決策屬性D為形狀類別,分別是1為圓形,2為矩形,3為三角形,4為橢圓形。

2.2 基于信息熵的連續(xù)條件屬性離散化

區(qū)域形狀決策表中條件屬性是連續(xù)的,而粗集研究離散數(shù)據(jù),所以采用的離散算法好壞直接影響預(yù)測結(jié)果的正確性,一般意義上經(jīng)常采取等寬度或等頻率方法進(jìn)行離散,這種形式斷點(diǎn)形式簡單,但因?yàn)楹雎粤藢ο蟮念悇e信息,使其容易丟失信息,也就難以獲得較好的離散化結(jié)果。

本文采用基于信息熵的離散化方法[3],此方法是一種監(jiān)督的、自頂向下的分裂技術(shù)。它在計(jì)算和確定斷點(diǎn)時利用類分布信息。

設(shè)x?哿u為子集,其實(shí)例個數(shù)為|X|,其中決策屬性為j(j=1,2,…,r(d))的實(shí)例個數(shù)為kj,定義此子集的信息熵[4]為

H(X)=-pjlog2pj,pj=(1)

設(shè)P為已選取的斷點(diǎn)的集合,L為實(shí)例被斷點(diǎn)集合P所劃分成的等價類集合,B為候選斷點(diǎn)的集合,H為決策表信息熵,初值由公式(1)取為H=H(U)。

基于信息熵的數(shù)據(jù)離散化算法如下:

step1:P= ;L={U};H=H(U);

step2:對每一個c∈B,計(jì)算H(c,L);

step3:若H≤min{H(c,L)},則結(jié)束;

step4:選擇使H(c,L)最小的斷點(diǎn)cmin加到P中;H=H(c,L);B=B-{c};

step5:對所有X∈L,如果cmin把等價類X劃分為X1和X2,那么,從L中去掉X,把等價類X1和X2加到L中;

step6:如果L中各個等價類中的實(shí)例都具有相同的決策,則結(jié)束;否則轉(zhuǎn)到步2。

根據(jù)如上算法針對表1進(jìn)行基于信息熵的離散化,得到離散化區(qū)間如下:

①C1的斷點(diǎn):[*, 1.4115),[1.4115, 1.4922),[1.4922, 1.5278),[1.5278, 1.6528),[1.6528, *)

②C2的斷點(diǎn):[*, 1.2017),[1.2017, 1.5447),[1.5447, *)

③C3的斷點(diǎn):[*, 0.7066),[0.7066, 0.7201),[0.7201, 0.7955),[0.7955, *)

④C4的斷點(diǎn):[*, 0.7699),[0.7699, 0.7734),[0.7734, 0.7753),[0.7753, 0.8911),[0.8911, *)

⑤C5的斷點(diǎn):[*, 0.0984),[0.0984, 0.1410),[0.1410, 0.1658),[0.1658, *)

2.3 知識約簡和知識獲取

知識約簡是在保持決策表分類或決策能力不變的前提下,刪除冗余屬性,即進(jìn)行屬性約簡。本文采用約簡算法可以求出一個相對較小長度約簡,算法可以由用戶來定義屬性的權(quán)重。約定B表示約簡;S表示分辨函數(shù)中的每一個集合;w(S)表示S的權(quán)重。算法描述如下:

step1:算出給定決策表的分辨矩陣;

step2: ;

step3:令a為在S中出現(xiàn)頻率與權(quán)值w(S)乘積最大的屬性,如果兩個屬性的值一樣大,則隨機(jī)地取一個屬性;

step4:把屬性a添加到集合B中;

step5:將S中所有包含屬性a的項(xiàng)去掉;

step6:如果 ,則返回B,否則轉(zhuǎn)到3。

由此可得到(基于表2的)屬性約簡為{C2,C4,C5},即{形狀因子,矩形度,飽和度}。

知識約簡結(jié)果有利于進(jìn)一步進(jìn)行知識獲取,即決策規(guī)則的提取,除去冗余屬性值,所得決策規(guī)則如下:

Rule1:IF C2

Rule2:IF C2

Rule3:IF C2

Rule4:IF 1.2017

Rule5:IF 1.2017

Rule6:IF 1.2017=0.1658 THEN D=2

Rule7:IF C2>=1.5447 AND C4< 0.7699 AND 0.0984

Rule8:IF C2

Rule9:IF C2

選取測試樣本,應(yīng)用決策規(guī)則,通過對測試結(jié)果的分析可知,分類規(guī)則能以較高精度將測試樣本按其形狀正確分類,說明該分類決策是有效的。Rule1是一種特殊情況,在判斷圓形和橢圓形時,三個屬性值,形狀因子小于1.2017,矩形度小于0.7699,飽和度小于0.0984,即三個屬性值在最小區(qū)間范圍內(nèi),說明形狀相近。

3結(jié)論

主要利用粗集的約簡理論及分類功能,對圖像分割后的區(qū)域幾何形狀進(jìn)行分類,文中所用到的是規(guī)則的幾何圖形,因此形狀特征明顯,通過仿真實(shí)驗(yàn)證明,只用三個形狀特征就能以較高精度完成分類任務(wù),此方法是有效的。當(dāng)然對于復(fù)雜形狀,在以后的研究中,需要通過改進(jìn)算法,增加形狀特征的因素等手段進(jìn)一步進(jìn)行研究。

參考文獻(xiàn):

[1]CostaLF,CesarRM.ShaPeAnalysisandClassification:heoryandPraetiee.CRCPress 2001.

[2]史忠植.知識發(fā)現(xiàn)[M].第一版.北京:清華大學(xué)出版社,2002.

[3]謝宏,程浩忠,牛東曉.基于信息熵的粗糙集連續(xù)屬性離散化算法[J].計(jì)算機(jī)學(xué)報,2005,28(9):1570-1573.

篇4

關(guān)鍵詞:“憤悱術(shù)”;“產(chǎn)婆術(shù)”;啟發(fā)式教學(xué);顯著性檢驗(yàn);研究

一、前言

教師在課堂教學(xué)中要打破傳統(tǒng)束縛學(xué)生思維發(fā)展的舊模式,遵循以人為本的觀念,給學(xué)生思維提供最大的空間,項(xiàng)目根據(jù)“應(yīng)用有機(jī)化學(xué)”教學(xué)大綱,把培養(yǎng)學(xué)生的創(chuàng)新素養(yǎng)作為教學(xué)的重點(diǎn)。轉(zhuǎn)變學(xué)生的學(xué)習(xí)方式,既要讓他們“學(xué)會”,也要“會學(xué)”,因此我們在“應(yīng)用有機(jī)化學(xué)”課堂教學(xué)中,基于“憤悱術(shù)”和“產(chǎn)婆術(shù)”啟發(fā)式教學(xué)的課堂教學(xué)策略的基本理論依據(jù),設(shè)計(jì)了“應(yīng)用有機(jī)化學(xué)”課堂教學(xué)改革的幾種模式:主動性模式、主體性模式、情感性模式、可持續(xù)性模式、舉一反三學(xué)習(xí)模式[1][2]。

“應(yīng)用有機(jī)化學(xué)”“憤悱術(shù)”和“產(chǎn)婆術(shù)”的啟發(fā)式教學(xué)策略源于一般啟發(fā)式教學(xué)策略,是一般啟發(fā)式教學(xué)策略的應(yīng)用,具有一般啟發(fā)式教學(xué)策略的特點(diǎn)。通過對甲班進(jìn)行試驗(yàn),而乙班的教學(xué)方法保持原狀。根據(jù)期末考試成績,進(jìn)行顯著性檢驗(yàn)分析[3][4]。

二、以分析性統(tǒng)計(jì)檢驗(yàn)誤差,以確認(rèn)從樣本推斷總體的可靠性

(一)u檢驗(yàn)和t檢驗(yàn)理論依據(jù)

統(tǒng)計(jì)檢驗(yàn)是準(zhǔn)確解釋研究結(jié)果的前提,其方法可分為參數(shù)統(tǒng)計(jì)檢驗(yàn)和非參數(shù)統(tǒng)計(jì)檢驗(yàn)兩類。在中小學(xué)教育科研中,通常以參數(shù)統(tǒng)計(jì)檢驗(yàn)為主,其中u檢驗(yàn)和t檢驗(yàn)是兩種最常用的檢驗(yàn)方法。[5]

在教育統(tǒng)計(jì)中常以正態(tài)曲線分布下面積的95%或99%的理論u值為差異顯著性的臨界值,取0.05和0.01位兩個顯著水平。若樣本的u值等于或大于95%或99%的理論u值(分別為1.96和2.58),即表明樣本的平均數(shù)不超過 μ±1.96σ或 μ±2.58σ的區(qū)間。也就是說,樣本來自同一總體的可能性(即概率P小于0.05或0.01)。在統(tǒng)計(jì)上將P≤0.05的差異稱為顯著差異,將P≤0.01的差異稱為非常顯著差異。反之,若樣本的u值小于95%的理論z值,則表明樣本來自同一總體的概率P>0.05,統(tǒng)計(jì)上稱為差異不顯著。

由于u檢驗(yàn)要求樣組的規(guī)模較大(n>30,嚴(yán)格地說,應(yīng)以n>50為大樣本),因此,對于小樣本的檢驗(yàn)通常都采用比較兩個平均數(shù)以確定它們之間的差值是真的差值而不是偶然差數(shù)的t檢驗(yàn)。在同一概率下,自由度越大,t值就越小;在自由度相同的情況下,則概率越小,t值越大。

(二)本次受試樣本采用t檢驗(yàn)

t檢驗(yàn)方法檢驗(yàn)樣本之間有無真正的差異(由操縱自變量引起的差異,而不是由抽樣誤差等引起的差異),其基本程序?yàn)椋孩賹υ囼?yàn)樣本所在的總體提出假設(shè);②確定顯著水平;③在無效假設(shè)成立的前提下,研究統(tǒng)計(jì)量的抽樣分布,計(jì)算出檢驗(yàn)統(tǒng)計(jì)量;④估計(jì)相對概率P,根據(jù)小概率原理作出統(tǒng)計(jì)推斷。

1.建立虛無假設(shè)

差異檢驗(yàn)是以“反正”為特點(diǎn)的邏輯推理過程。其基本思想是,為了證實(shí)各樣本均數(shù)有顯著差異,可首先假設(shè)被比較的樣本均數(shù)(或百分?jǐn)?shù))沒有顯著差異,即假定它們是來自同一總體的,它們之間的差數(shù)為0,即便有差異,也純粹屬于隨機(jī)誤差,這種假設(shè),在統(tǒng)計(jì)上稱為“虛無假設(shè)”或“無效假設(shè)”(通常以H0表示)。倘若虛無假設(shè)成立的概率(通常以P表示)很?。≒≤0.05,或P ≤0.01),則根據(jù)小概率原理“概率很小的時間在一次實(shí)驗(yàn)中是幾乎不可能發(fā)生的”,就可拒絕虛無假設(shè),即原來假定的各樣本來自同一總體的可能性是極小的,從而可確定被比較的各數(shù)值之間的差異確實(shí)反映了自變量的處理效應(yīng)。反之,如果P值比較大(P>0.05),我們就將接受虛無假設(shè),認(rèn)為被比較的各數(shù)值之間的差異完全是由隨機(jī)誤差造成的。

2.計(jì)算t值

計(jì)算t值首先需要考慮所檢驗(yàn)的樣本是相互獨(dú)立的、互不關(guān)聯(lián)的,還是相互關(guān)聯(lián)的,并依據(jù)此選擇相應(yīng)的計(jì)算公式。這就是所謂的“獨(dú)立樣本”,是指兩個樣本的抽取互不影響,即受試者隨機(jī)地被分配于兩個樣本之中,它們之間沒有成對的關(guān)系。關(guān)于“相關(guān)樣本”主要有兩種情況:一種是對同一種研究對象進(jìn)行兩次檢測所得到的兩組數(shù)據(jù);另一種是對兩個并非通過隨機(jī)抽樣組成的配對組進(jìn)行同種檢測所得到的兩組結(jié)果。如果兩個配對組是通過隨機(jī)抽樣而構(gòu)造的等值組,則由同種檢測所得到的兩組數(shù)據(jù)只能屬于獨(dú)立樣本,而不能視作相關(guān)樣本。

3.進(jìn)行統(tǒng)計(jì)決策實(shí)例

即通過以t值與理論t值的比較,做出拒絕或接受虛無假設(shè)H0的決策。

如果采用的是t檢驗(yàn),則其決策程序?yàn)椋?/p>

(1)根據(jù)自由度df,從t值表中查出0.05顯著性水平上的臨界值t(df)0.05和早0.01顯著性水平上的臨界值t(df)0.01。

例如,對n=40的樣組進(jìn)行t檢驗(yàn),則其自由度df=40-1=39。據(jù)此,可從上表中分別查得:

t在0.05顯著性水平上的臨界值:t(39)0.05 = 2.020;

t在0.01顯著性水平上的臨界值:t(39)0.01 = 2.703。

(2)將計(jì)算所得的t值與查表所得的臨界值作比較,并根據(jù)下表進(jìn)行統(tǒng)計(jì)決策?,F(xiàn)在,讓我們通過實(shí)例來進(jìn)一步對統(tǒng)計(jì)檢驗(yàn)問題作出具體的說明。試分析新的教學(xué)方法在提高學(xué)生數(shù)學(xué)水平方面與原來的教學(xué)方法有無顯著差異。具體兩個班級期末考試成績數(shù)據(jù)見表1、表2。

由于n =40,為小樣本,可采用t檢驗(yàn)。檢驗(yàn)步驟如下:

(3)計(jì)算t值。由于乙班為沒有進(jìn)行試驗(yàn)的考試結(jié)果,所以以乙班為基準(zhǔn)進(jìn)行計(jì)算,計(jì)算結(jié)果為:t=(78.90-70.08)/1.49 =5.92。t檢驗(yàn)統(tǒng)計(jì)決策規(guī)則見表3。

≤0.05在0.05顯著性水平上拒絕虛無假設(shè)H0,差異顯著。|t|≥t(df)0.01 P≤0.01 在0.01顯著性水平上拒絕虛無假設(shè)H0,差異極顯著。

(4)統(tǒng)計(jì)決策。將實(shí)際所得的t值與理論t值相比較。比較結(jié)果為:

t=5.92≥t(df)0.01=3.499,即P≤0.01。在0.01顯著性水平上拒絕虛無假設(shè)H0,表明差異極顯著。

三、結(jié)語

在0.01顯著性水平上拒絕虛無假設(shè)H0,表示采用“憤悱術(shù)”和“產(chǎn)婆術(shù)”啟發(fā)式教學(xué)方法的學(xué)生在期末考試成績方面有非常顯著的差異,且甲班學(xué)生的成績明顯優(yōu)于乙班學(xué)生。

采用“憤悱術(shù)”和“產(chǎn)婆術(shù)”啟發(fā)式教學(xué)方法安排教學(xué)內(nèi)容的教法與原來的教法相比,其教學(xué)效果在一般情況下是有極其顯著差異意義的,即這種教學(xué)方法優(yōu)于原來的教學(xué)方法,因而是可行的。

參考文獻(xiàn):

[1]靳乃錚.啟發(fā)式教學(xué)[M].北京:北京師范大學(xué)出版社,2002.

[2]盧小男.信息技術(shù)環(huán)境下再論數(shù)學(xué)啟發(fā)式教學(xué)[D].大連:遼寧師范大學(xué),2010.

[3]焦家俊,任玉杰,錢旭紅.有機(jī)化學(xué)探索式教學(xué)實(shí)踐[J].化工高等教育,2007,24(4):82―84.

篇5

關(guān)鍵詞:生物統(tǒng)計(jì)學(xué);實(shí)驗(yàn)教學(xué);改革探索;實(shí)踐

中圖分類號 G642.0 文獻(xiàn)標(biāo)識碼 A 文章編號 1007-7731(2013)15-148-02

生物統(tǒng)計(jì)學(xué)是數(shù)理統(tǒng)計(jì)原理和方法在生物學(xué)中的應(yīng)用,不僅在生命科學(xué)領(lǐng)域、而且也在其他學(xué)科領(lǐng)域中得到廣泛應(yīng)用,是一門工具學(xué)科[1]。生物統(tǒng)計(jì)學(xué)的理論性和實(shí)踐性均較強(qiáng),涉及的基本原理、公式和概念較多,需有一定的數(shù)學(xué)基礎(chǔ)和邏輯推理能力才能學(xué)好,相對于其他專業(yè)課程,師生普遍反映難教、難學(xué)、難記[2]?!渡锝y(tǒng)計(jì)學(xué)》不容易理解和掌握,導(dǎo)致學(xué)生缺乏學(xué)習(xí)興趣和動力,考試前通過死記硬背接受理論知識,形成短暫記憶,隨著時間的延長,所學(xué)內(nèi)容逐漸忘記。這門課程講授完之后,學(xué)生不會靈活運(yùn)用其中的方法,也不會設(shè)計(jì)一個簡單的試驗(yàn),更不會將生物統(tǒng)計(jì)學(xué)的基本理論、技術(shù)和常用統(tǒng)計(jì)方法應(yīng)用到本科畢業(yè)論文設(shè)計(jì)中,導(dǎo)致理論教學(xué)與實(shí)踐應(yīng)用脫節(jié),顯然未達(dá)到教學(xué)目的。以往《生物統(tǒng)計(jì)學(xué)》教學(xué)以單純理論教學(xué)為主,不設(shè)或很少開設(shè)實(shí)驗(yàn)課。因此,筆者結(jié)合《生物統(tǒng)計(jì)學(xué)》的基本原理,利用計(jì)算機(jī)和統(tǒng)計(jì)軟件,開設(shè)了《生物統(tǒng)計(jì)學(xué)》實(shí)驗(yàn)課,并嘗試對該課程的實(shí)驗(yàn)教學(xué)方法進(jìn)行改革探索。

實(shí)踐教學(xué)環(huán)節(jié)非常有利于提高大學(xué)生的培養(yǎng)質(zhì)量,而《生物統(tǒng)計(jì)學(xué)》課程教學(xué)的實(shí)踐環(huán)節(jié)亟待加強(qiáng)。在《生物統(tǒng)計(jì)學(xué)》實(shí)驗(yàn)教學(xué)過程中,我們利用計(jì)算機(jī)輔助實(shí)驗(yàn)教學(xué),開設(shè)以下實(shí)驗(yàn)課:(1)《生物統(tǒng)計(jì)學(xué)》某章節(jié)理論知識講授完之后,利用計(jì)算機(jī)和相關(guān)統(tǒng)計(jì)軟件,開設(shè)相應(yīng)的實(shí)驗(yàn)課。在實(shí)驗(yàn)課上,教師通過統(tǒng)計(jì)軟件演示例題的計(jì)算和分析過程,并講授統(tǒng)計(jì)軟件的使用方法,學(xué)生根據(jù)所學(xué)理論知識,結(jié)合實(shí)例在計(jì)算機(jī)上借助統(tǒng)計(jì)軟件進(jìn)行操作,這樣使學(xué)生獲得知識更加直接與快速。(2)學(xué)生參與試驗(yàn)設(shè)計(jì)和科學(xué)試驗(yàn)。學(xué)生要在生產(chǎn)實(shí)踐或?qū)嶒?yàn)室中設(shè)計(jì)試驗(yàn),親自參與試驗(yàn)數(shù)據(jù)的采集,并對試驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)和分析,這樣有利于加深學(xué)生對所學(xué)內(nèi)容的理解?!渡锝y(tǒng)計(jì)學(xué)》教學(xué)開設(shè)了如下實(shí)驗(yàn):

1 利用Excel繪制常用統(tǒng)計(jì)圖

Excel繪制圖形功能強(qiáng)大,各種版本的Excel軟件均提供了14種標(biāo)準(zhǔn)圖表類型,每種圖表類型中又含有2~7種子圖表類型;還有20種自定義圖表類型可以套用。講授完試驗(yàn)資料的搜集和整理后,開設(shè)利用Excel繪制常用統(tǒng)計(jì)圖的實(shí)驗(yàn)課。學(xué)生在實(shí)驗(yàn)課上利用Excel繪圖時,可以對圖表區(qū)、繪圖區(qū)、數(shù)據(jù)系列、坐標(biāo)軸、圖例、圖表標(biāo)題的格式,例如文字的顏色、字體、大小,背景圖案、顏色等進(jìn)行修改和調(diào)整,使修飾后的圖形更加美觀好看,爽心悅目。當(dāng)圖和數(shù)據(jù)放在一張工作表上、學(xué)生改變繪制圖形的數(shù)據(jù)時,其圖形將發(fā)生相應(yīng)變化;將鼠標(biāo)放在圖中某數(shù)據(jù)點(diǎn)上,在鼠標(biāo)下方將彈出一個文本框給出數(shù)據(jù)點(diǎn)的具體數(shù)值;用鼠標(biāo)單擊繪圖區(qū)中的“數(shù)據(jù)系列”標(biāo)志,其圖所屬數(shù)據(jù)單元格將被彩色框線圍住,便于用戶查看圖形的數(shù)據(jù)引用位置。在“數(shù)據(jù)系列”點(diǎn)擊右鍵可以向散點(diǎn)圖、線圖、條形圖等添加趨勢線,并可給出趨勢線的方程與決定系數(shù)。

2 利用Excel進(jìn)行數(shù)據(jù)描述統(tǒng)計(jì)分析

講授完試驗(yàn)資料特征數(shù)的計(jì)算后,開設(shè)利用Excel進(jìn)行數(shù)據(jù)描述統(tǒng)計(jì)分析的實(shí)驗(yàn)課。首先選用與生活聯(lián)系緊密的數(shù)據(jù)資料,讓學(xué)生利用Excel計(jì)算這些數(shù)據(jù)的平均數(shù)、中位數(shù)和眾數(shù),測定和分析這些數(shù)據(jù)的集中趨勢,然后利用Excel測定樣本標(biāo)準(zhǔn)差、總體標(biāo)準(zhǔn)差和四分位數(shù),讓學(xué)生分析這些數(shù)據(jù)的離散趨勢。另外,讓學(xué)生利用Excel分析總體次數(shù)的分布形態(tài),計(jì)算總體平均值的置信區(qū)間,有助于識別總體的數(shù)量特征??傮w的分布形態(tài)可以從兩個角度考慮,一是分布的對稱程度,另一個是分布的高低。前者的測定參數(shù)稱為偏度或偏斜度,后者的測定參數(shù)稱為峰度。

3 利用Excel進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)

講授完統(tǒng)計(jì)推斷之后,利用Excel進(jìn)行統(tǒng)計(jì)假設(shè)檢驗(yàn)的實(shí)驗(yàn)課。統(tǒng)計(jì)假設(shè)檢驗(yàn)是根據(jù)隨機(jī)樣本中的數(shù)據(jù)信息來判斷其與總體分布是否具有指定的特征[1]。我們選擇實(shí)際案例,讓學(xué)生提出假設(shè),利用Excel中適當(dāng)?shù)慕y(tǒng)計(jì)方法計(jì)算檢驗(yàn)的統(tǒng)計(jì)量及其分布,確定顯著性水平和決策規(guī)則,最后推斷是否接受假設(shè),得出科學(xué)合理的結(jié)論,這個過程就稱為假設(shè)檢驗(yàn)或統(tǒng)計(jì)假設(shè)檢驗(yàn)。統(tǒng)計(jì)假設(shè)檢驗(yàn)的方法多樣,通過比較就會發(fā)現(xiàn)它們的基本方法和步驟大同小異,例如t檢驗(yàn)、u 檢驗(yàn)、x2檢驗(yàn)等,可以詳細(xì)講述其中1~3種假設(shè)檢驗(yàn)方法,其它假設(shè)檢驗(yàn)方法可以采用啟迪和推導(dǎo)方式讓學(xué)生利用統(tǒng)計(jì)軟件自行輕松地學(xué)習(xí)和操作。

4 利用Excel和SAS軟件進(jìn)行方差分析

講授完方差分析之后,開設(shè)利用Excel和SAS軟件進(jìn)行方差分析的實(shí)驗(yàn)課。利用Excel只能進(jìn)行單因素或雙因素(包括可重復(fù)雙因素和無重復(fù)雙因素)方差分析,而涉及雙因素隨機(jī)區(qū)組試驗(yàn)、三因素試驗(yàn)和裂區(qū)試驗(yàn)等試驗(yàn)數(shù)據(jù)的方差分析,即讓學(xué)生利用SAS軟件進(jìn)行多重方差分析。另外,Excel中的單因素或雙因素方差分析只能給出方差分析表,不能進(jìn)行平均數(shù)的多重比較,也無法用不同字母標(biāo)記法表示差異顯著性的結(jié)果,這些也都需要利用SAS軟件。

5 利用多種統(tǒng)計(jì)軟件進(jìn)行回歸分析

由一個或一組非隨機(jī)變量來估計(jì)或預(yù)測某一個隨機(jī)變量的觀測值時,所建立的數(shù)學(xué)模型及所進(jìn)行的統(tǒng)計(jì)分析,稱為回歸分析[1]。按變量個數(shù)的多少,回歸分析有一元回歸分析與多元回歸分析之分,多元回歸分析的原理與一元回歸分析的原理基本相似。按變量之間的關(guān)系,回歸分析可以分為線性回歸分析和非線性回歸分析。利用統(tǒng)計(jì)軟件進(jìn)行回歸分析時,首先讓學(xué)生如何確定因變量與自變量之間的回歸模型;如何根據(jù)樣本觀測數(shù)據(jù),估計(jì)并檢驗(yàn)回歸模型及未知參數(shù);在眾多的自變量中,讓學(xué)生判斷哪些變量對因變量的影響是顯著的,哪些變量的影響是不顯著的。在方差分析實(shí)驗(yàn)課上,先讓學(xué)生利用Excel進(jìn)行簡單的線性回歸分析,然后利用SPSS軟件進(jìn)行相關(guān)與回歸分析,最后利用SAS軟件進(jìn)行多元線性回歸分析和逐步回歸分析,使學(xué)生了解不同統(tǒng)計(jì)軟件的特點(diǎn)、功能和作用。

6 利用基本原理設(shè)計(jì)試驗(yàn)

試驗(yàn)的精確度高低取決于試驗(yàn)設(shè)計(jì)的各個方面,只有通過有效地控制試驗(yàn)誤差才能提高試驗(yàn)精確度。因此,教師有必要正確引導(dǎo)大學(xué)生在試驗(yàn)過程中要做到操作仔細(xì),這樣有利于提高學(xué)生的科研素質(zhì)。在試驗(yàn)工作中,從試驗(yàn)資料中發(fā)現(xiàn)潛在的規(guī)律性是極其重要的,這需要科學(xué)合理地運(yùn)用統(tǒng)計(jì)學(xué)的基本原理和方法。講授完試驗(yàn)設(shè)計(jì)之后,要求學(xué)生根據(jù)試驗(yàn)設(shè)計(jì)的基本原理,在生產(chǎn)實(shí)踐或?qū)嶒?yàn)室內(nèi)提出試驗(yàn)設(shè)計(jì)的基本思路,制定試驗(yàn)方案。然后,學(xué)生分組討論試驗(yàn)設(shè)計(jì)的可行性,并進(jìn)行糾正和修改。在試驗(yàn)前期,學(xué)生應(yīng)進(jìn)行試驗(yàn)前期準(zhǔn)備工作。在試驗(yàn)過程中,學(xué)生要考慮試驗(yàn)條件的差異對試驗(yàn)數(shù)據(jù)的影響,可根據(jù)試驗(yàn)設(shè)計(jì)的原理和技巧分析試驗(yàn)出現(xiàn)的問題,使學(xué)生獲得的理論知識與實(shí)際聯(lián)系起來,從而加深對理論知識的理解。試驗(yàn)結(jié)束后,獲得大量的試驗(yàn)數(shù)據(jù),需要選擇正確的統(tǒng)計(jì)方法分析試驗(yàn)資料,得出科學(xué)合理的結(jié)論,以達(dá)到研究目的。最后,教師根據(jù)學(xué)生設(shè)計(jì)的試驗(yàn)思路、方案、步驟及作出的試驗(yàn)報告給予評價。通過開設(shè)試驗(yàn)設(shè)計(jì)實(shí)踐課,可以使學(xué)生明確試驗(yàn)的目的、試驗(yàn)設(shè)計(jì)方法、試驗(yàn)因素及水平等內(nèi)容,有利于提高學(xué)生設(shè)計(jì)試驗(yàn)方案的能力。

實(shí)踐證明,開設(shè)《生物統(tǒng)計(jì)學(xué)》實(shí)驗(yàn)教學(xué)后,學(xué)生能夠在計(jì)算機(jī)上借助相關(guān)統(tǒng)計(jì)軟件親自統(tǒng)計(jì)試驗(yàn)數(shù)據(jù),利用所學(xué)的統(tǒng)計(jì)學(xué)方法分析和檢驗(yàn)試驗(yàn)結(jié)果,最后得出可靠的結(jié)論。最后畢業(yè)時,學(xué)生能根據(jù)試驗(yàn)設(shè)計(jì)的基本原理,可獨(dú)立完成畢業(yè)論文試驗(yàn)設(shè)計(jì),實(shí)施設(shè)計(jì)的試驗(yàn)方案,獲得試驗(yàn)數(shù)據(jù)資料。由于試驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析耗時,而且繁瑣,因而過去畢業(yè)生害怕對試驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。自從我們結(jié)合《生物統(tǒng)計(jì)學(xué)》的基本原理,利用計(jì)算機(jī)和計(jì)軟件開設(shè)了該課程的實(shí)驗(yàn)教學(xué)后,學(xué)生輕松地掌握了該課程的基本原理和統(tǒng)計(jì)分析方法,統(tǒng)計(jì)和分析數(shù)據(jù)的速度、精確度均大幅度提高。現(xiàn)在部分學(xué)生還能幫助教師進(jìn)行科研課題的數(shù)據(jù)處理和分析,畢業(yè)論文水平也大大提高。

《生物統(tǒng)計(jì)學(xué)》教學(xué)實(shí)驗(yàn)課的開設(shè),使學(xué)生從被動學(xué)習(xí)轉(zhuǎn)變?yōu)榉e極主動地學(xué)習(xí),培養(yǎng)了學(xué)生進(jìn)行科學(xué)試驗(yàn)設(shè)計(jì)的能力,初步掌握開展科學(xué)試驗(yàn)設(shè)計(jì)的方法;培養(yǎng)學(xué)生掌握正確收集、整理試驗(yàn)資料的方法,能利用生物統(tǒng)計(jì)方法對試驗(yàn)資料進(jìn)行正確的統(tǒng)計(jì)分析;培養(yǎng)學(xué)生掌握常見統(tǒng)計(jì)軟件的使用方法和統(tǒng)計(jì)方法?!渡锝y(tǒng)計(jì)學(xué)》實(shí)驗(yàn)課深受學(xué)生的歡迎,這也是對該課程實(shí)驗(yàn)教學(xué)的嘗試和改革探索的肯定。在該課程實(shí)驗(yàn)教學(xué)過程中,筆者深刻體會到要提高《生物統(tǒng)計(jì)學(xué)》課程的實(shí)驗(yàn)教學(xué)效果和質(zhì)量,教師需要投入時間與精力,鉆研實(shí)驗(yàn)教學(xué)內(nèi)容,提高教學(xué)水平,轉(zhuǎn)變實(shí)驗(yàn)教學(xué)理念,不斷探索和優(yōu)化多元化的實(shí)驗(yàn)教學(xué)方法。

參考文獻(xiàn)

[1]李春喜,邵云,姜麗娜.生物統(tǒng)計(jì)學(xué)[M].4版.北京:科學(xué)出版社,2008:1-3.

篇6

一、任務(wù)的復(fù)雜性與分析性程序績效

有關(guān)審計(jì)理論研究表明,工作業(yè)績會隨著任務(wù)復(fù)雜性的提高而降低,同時審計(jì)師的經(jīng)驗(yàn)會減輕任務(wù)的復(fù)雜性對績效的負(fù)面影響。然而,尚缺乏經(jīng)驗(yàn)證據(jù)證明任務(wù)復(fù)雜性與業(yè)績之間的關(guān)系是否會受到知識和激勵的綜合影響,只有與激勵、技能結(jié)合在一起研究,任務(wù)的復(fù)雜性才有實(shí)際意義。

(一)分析程序績效任務(wù)復(fù)雜性的提出 目前審計(jì)理論中關(guān)于任務(wù)復(fù)雜性的模型揭示了任務(wù)的復(fù)雜性、審計(jì)師的技能、激勵三者之間的相互作用機(jī)制。國外學(xué)者對任務(wù)復(fù)雜性、激勵、技能與業(yè)績之間的關(guān)系也進(jìn)行了許多經(jīng)驗(yàn)研究,得出了富有意義的成果:第一類經(jīng)驗(yàn)研究認(rèn)為,經(jīng)驗(yàn)和知識可以與任務(wù)的復(fù)雜性相互作用,在復(fù)雜的任務(wù)環(huán)境中,具有更多知識和經(jīng)驗(yàn)的審計(jì)師比更少知識和經(jīng)驗(yàn)的審計(jì)師其業(yè)績更好。該類研究沒有檢驗(yàn)激勵是如何與知識相互作用以減輕任務(wù)的復(fù)雜性對業(yè)績的影響。第二類研究則將激勵作為一個變量納入其視野,其結(jié)果暗示了激勵和任務(wù)的復(fù)雜性之間存在相互作用,但關(guān)于相互作用的證據(jù)是模糊的。

(二)分析程序績效任務(wù)復(fù)雜性的具體分析Pelham和Neter(1995)發(fā)現(xiàn),在任務(wù)復(fù)雜性程度較低時,作為被測試的大學(xué)本科在校生更不容易做出錯誤判斷。Ashton也指出,當(dāng)審計(jì)師執(zhí)行一個債券等級評估任務(wù)時,激勵的增加可以導(dǎo)致工作業(yè)績的提升,但前提是在一個不需要借助決策輔助系統(tǒng)的環(huán)境(即任務(wù)復(fù)雜性較低)中。與之相對照的是,Chang(1997)沒有發(fā)現(xiàn)任務(wù)的復(fù)雜性和激勵之間存在相互作用的關(guān)系。上述研究的缺陷在于,都沒有對完成特定任務(wù)所需要的知識進(jìn)行測度,并且沒有進(jìn)行經(jīng)驗(yàn)性的檢驗(yàn)以證實(shí)是否技能和激勵結(jié)合在一起是否可以減輕任務(wù)的復(fù)雜性對工作業(yè)績的影響。比較完整的關(guān)于任務(wù)復(fù)雜性的模型是Booner(1994)提出來的,她認(rèn)為任務(wù)的復(fù)雜性對工作業(yè)績的影響度是技能與激勵的函數(shù),預(yù)測了任務(wù)的復(fù)雜性與技能之間、任務(wù)的復(fù)雜性和激勵之間的雙向相互作用。就任務(wù)的復(fù)雜性和技能的相互作用而言,她認(rèn)為隨著任務(wù)復(fù)雜性的增加,技能對工作績效的正面推動作用也愈來愈大。該論斷認(rèn)為,恰當(dāng)?shù)募寄芩娇梢跃徑馊蝿?wù)的復(fù)雜性給業(yè)績造成的負(fù)面影響。當(dāng)技能處于高水平時,增加的任務(wù)復(fù)雜程度不會對業(yè)績產(chǎn)生顯著負(fù)面影響;當(dāng)技能水平很低時,隨著業(yè)務(wù)復(fù)雜程度的提高,業(yè)績將下降。就激勵和工作業(yè)績而言,當(dāng)工作復(fù)雜性提升時,激勵對業(yè)績的效果和影響將下降。這個論斷指出,當(dāng)任務(wù)的復(fù)雜性很低時,激勵最初可以導(dǎo)致很高的業(yè)績水平,而后隨著任務(wù)復(fù)雜性的提高,其對業(yè)績的影響性也逐漸下降。該領(lǐng)域的第三類研究則將關(guān)注重點(diǎn)集中在審計(jì)人員責(zé)任心、任務(wù)的復(fù)雜性與分析程序績效的關(guān)系的研究上,如Ton和Kao就認(rèn)為,業(yè)績和責(zé)任心之間的聯(lián)系只當(dāng)審計(jì)師擁有的技能與審計(jì)任務(wù)的復(fù)雜程度相匹配時,才能觀察出來,他們實(shí)驗(yàn)研究的結(jié)果與假設(shè)完全吻合,這就說明,技能、激勵和任務(wù)復(fù)雜性之間確實(shí)存在互動。

上述經(jīng)驗(yàn)研究文獻(xiàn)在揭示任務(wù)復(fù)雜性對分析性程序績效的影響時都將激勵、責(zé)任心、技能納入其研究視野,雖然都沒有具體闡明這些因素的相互作用機(jī)制,但都從不同角度充分揭示了任務(wù)的復(fù)雜性對分析性程序執(zhí)行績效的影響。從這些研究結(jié)果可知,任務(wù)的復(fù)雜性是影響分析性程序績效的重要變量。既然任務(wù)的復(fù)雜性會對審計(jì)師業(yè)績產(chǎn)生顯著影響,那么就有必要對各種分析性程序任務(wù)按復(fù)雜性程度的不同進(jìn)行劃分,在此基礎(chǔ)上進(jìn)一步探討提高績效的途徑。

二、任務(wù)復(fù)雜性的分類、決策輔助系統(tǒng)與分析程序績效

為進(jìn)一步提高分析性程序績效,指導(dǎo)審計(jì)師針對不同復(fù)雜程度的分析性程序任務(wù)采取不同的策略,有必要對分析性程序所面臨的任務(wù)按復(fù)雜性程度進(jìn)行劃分。

(一)任務(wù)復(fù)雜性的分類 Wright提出了一個關(guān)于任務(wù)的結(jié)構(gòu)化水平、決策過程和決策方案之間關(guān)系的模型。根據(jù)該模型,如果在某些任務(wù)中,解決問題的決策方案只包括有限數(shù)量的項(xiàng)目,則該任務(wù)就是結(jié)構(gòu)化的;而在某些任務(wù)中,所面臨的要解決的問題往往很難被精確定義,這類任務(wù)就稱為非結(jié)構(gòu)化任務(wù),介于兩者之間的是半結(jié)構(gòu)化任務(wù)。根據(jù)任務(wù)復(fù)雜性程度的不同可以將分析性程序任務(wù)劃分為三類,如表1所示。結(jié)構(gòu)化任務(wù)所面對的任務(wù)帶有很大的慣例性,這類任務(wù)可以充分地定義所要解決的問題,其線索是有限的,充分地說明可選擇的方案、選擇決策方案的過程中只需要很少的專業(yè)判斷;半結(jié)構(gòu)化任務(wù)包含有一定的重復(fù)性、可合理定義的問題,配備有限的指南可供使用,可供選擇的方案雖然很多,但可以詳細(xì)地說明,選擇方案需要一定程度的職業(yè)判斷;非結(jié)構(gòu)化任務(wù)是復(fù)雜性程度最大的一類,這類任務(wù)所要解決的是獨(dú)特的、未被定義的問題,很少或沒有指南可遵循,擁有無限的或未被定義的決策方案,選擇決策方案需要深刻的判斷力和洞察力。在執(zhí)行分析性程序任務(wù)時,如果原始假設(shè)束包含的假設(shè)數(shù)量極其龐大,而且報表數(shù)據(jù)之間的關(guān)系很復(fù)雜,使得難以得出精簡假設(shè)束時,此時面臨的任務(wù)就是非結(jié)構(gòu)化任務(wù),要圓滿解決它就必須收集更多的信息(如與被審計(jì)單位管理當(dāng)局進(jìn)行溝通),進(jìn)行更多的信息反饋,以進(jìn)一步確定異常波動原因。如果分析性程序所面臨的情況比較簡單時,也就是審計(jì)師可以很確定地依據(jù)所掌握的財(cái)務(wù)與非財(cái)務(wù)信息迅速判斷造成異常波動的所有可能原因,并采用相關(guān)技術(shù)確定最有可能的原因時,這種情況下,審計(jì)師所面臨的這類任務(wù)就叫做結(jié)構(gòu)化任務(wù)。在解決相關(guān)任務(wù)時,針對不同復(fù)雜程度的任務(wù),審計(jì)師都可以借助不同類型的決策輔助系統(tǒng)來提升尋找異常波動原因的效率。

篇7

關(guān)鍵詞:模式識別;本科教學(xué);教學(xué)實(shí)踐;教學(xué)改革

隨著電子信息技術(shù)的迅速發(fā)展和信息處理自動化需求的不斷擴(kuò)大,模式識別方法和技術(shù)在信息處理領(lǐng)域中的重要性越來越受到重視。在吸引了眾多研究者投身到模式識別研究領(lǐng)域的同時,模式識別的教學(xué)也從研究生教學(xué)逐漸延伸到了本科教學(xué)。模式識別作為計(jì)算機(jī)、電子信息技術(shù)等專業(yè)的專業(yè)基礎(chǔ)課程,已經(jīng)在越來越多的高等院校開設(shè)。本科模式識別課程主要討論以統(tǒng)計(jì)學(xué)為基礎(chǔ)的模式識別理論和方法,內(nèi)容包括:貝葉斯決策理論以及參數(shù)估計(jì)方法、以誤差函數(shù)最小化為原則的線性和非線性判別、近鄰規(guī)則、特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機(jī)、隨機(jī)方法、非度量方法、獨(dú)立于算法的機(jī)器學(xué)習(xí)等內(nèi)容[1]。由于模式識別研究領(lǐng)域的廣泛性,模式識別本科教學(xué)的內(nèi)容和側(cè)重點(diǎn)的安排目前尚處于探索階段。模式識別領(lǐng)域的發(fā)展日新月異,這就要求教師在授業(yè)解惑的同時能夠與時俱進(jìn)地介紹該領(lǐng)域的發(fā)展前沿,從而培養(yǎng)學(xué)生主動探索知識的興趣。

本文將結(jié)合本科模式識別教學(xué)的實(shí)踐,分析該課程在內(nèi)容設(shè)置方面面臨的問題并給出相應(yīng)的解決問題的建議;結(jié)合模式識別課程的特點(diǎn),提出了以應(yīng)用實(shí)例為先導(dǎo)的教學(xué)方法,以提高學(xué)生的學(xué)習(xí)興趣;針對不同類型的學(xué)生,提出了如何培養(yǎng)學(xué)生實(shí)踐能力和科研興趣的方法。

1模式識別教學(xué)內(nèi)容的層次劃分和講授方法

模式識別是一門理論與實(shí)踐緊密結(jié)合的學(xué)科,其理論基礎(chǔ)涉及高等數(shù)學(xué)、線性代數(shù)、數(shù)理統(tǒng)計(jì)、矩陣論、隨機(jī)過程、工程優(yōu)化方法、小樣本統(tǒng)計(jì)學(xué)習(xí)理論、模糊數(shù)學(xué)等學(xué)科[2]。然而除了高等數(shù)學(xué)、線性代數(shù)和數(shù)理統(tǒng)計(jì),其他課程都是研究生階段才會開設(shè)的數(shù)學(xué)基礎(chǔ)課。這就使得本科的模式識別教學(xué)面臨著尷尬的局面:既不能花過多的時間講數(shù)學(xué)基礎(chǔ)知識,又要把以這些數(shù)學(xué)知識為基礎(chǔ)的內(nèi)容講清楚。面對這一難題,我們在教學(xué)實(shí)踐中總結(jié)出了一套辦法,具體做法是將教學(xué)內(nèi)容劃分為基礎(chǔ)型、前沿型兩類;并采用弱化公式推導(dǎo),強(qiáng)調(diào)數(shù)學(xué)表達(dá)式物理含義的方法進(jìn)行講授。

基礎(chǔ)型教學(xué)指的是已經(jīng)發(fā)展完善的模式識別原理和方法?;A(chǔ)型內(nèi)容包括:貝葉斯決策理論、概率密度函數(shù)估計(jì)、線性判別、近鄰規(guī)則、獨(dú)立于算法的機(jī)器學(xué)習(xí)等內(nèi)容。貝葉斯決策理論和概率密度函數(shù)估計(jì)是以數(shù)理統(tǒng)計(jì)為基礎(chǔ)的[3],這一部分也是模式識別的重點(diǎn)內(nèi)容。線性判別是以高等數(shù)學(xué)和線性代數(shù)為基礎(chǔ),同時涉及工程優(yōu)化方法課程的部分內(nèi)容。在這部分內(nèi)容中,公式推導(dǎo)占據(jù)了相當(dāng)大的篇幅,而且推導(dǎo)過程是學(xué)生可以理解和掌握的。對于基礎(chǔ)型的內(nèi)容,可以采取理論推導(dǎo)和實(shí)際例子相結(jié)合的講授方式。在公式推導(dǎo)的過程中,尤其要強(qiáng)調(diào)公式的物理含義,同時給出幾個有趣的例子,在增強(qiáng)記憶加深理解的同時提高學(xué)生的學(xué)習(xí)興趣。

前沿型教學(xué)指的是正在發(fā)展中的模式識別原理和方法。前沿型內(nèi)容包括:特征提取和選擇、聚類分析、神經(jīng)網(wǎng)絡(luò)、支撐矢量機(jī)、隨機(jī)方法等內(nèi)容。這部分內(nèi)容或者是數(shù)學(xué)基礎(chǔ)超出了本科生的能力范圍,或者處于發(fā)展前沿,很多內(nèi)容正處于探討階段。對于前沿型的內(nèi)容,可以忽略公式推導(dǎo)過程,直接講授推導(dǎo)的結(jié)論以及結(jié)論的物理含義,同樣結(jié)合實(shí)際例子加深學(xué)生的理解。對于發(fā)展中的模式識別方法可以適當(dāng)介紹該領(lǐng)域的發(fā)展前沿,在開拓視野的同時激發(fā)學(xué)生的科研興趣,引導(dǎo)部分學(xué)生從事感興趣的科學(xué)領(lǐng)域的研究。

2實(shí)例先導(dǎo)的教學(xué)方法

模式識別方法是為了解決信息處理中面臨的識別問題而提出的。在講授方法之前,首先要明確將要介紹的模式識別方法的應(yīng)用背景和使用范圍,而不是像我們通常做的那樣,先介紹方法的理論基礎(chǔ)和流程,最后再給出一個例子,或者通過課后練習(xí)和作業(yè)的形式讓學(xué)生掌握課程介紹的理論和方法的應(yīng)用。針對本科模式識別課程的特點(diǎn),我們在教學(xué)實(shí)踐中摸索出了一套以實(shí)例為先導(dǎo)的教學(xué)方法,并與上機(jī)實(shí)驗(yàn)和課程設(shè)計(jì)相結(jié)合,大大提高了學(xué)生的學(xué)習(xí)興趣和動手能力,取得了良好的教學(xué)效果。

實(shí)例先導(dǎo)的教學(xué)方法是在介紹每一章或者相關(guān)的幾章內(nèi)容之前首先用一個實(shí)際的例子引出要學(xué)習(xí)的內(nèi)容,在相關(guān)內(nèi)容的學(xué)習(xí)結(jié)束之后給出解決實(shí)例問題的模式識別方法。例如:在講授貝葉斯決策理論之前,給出根據(jù)長度和光澤度等數(shù)值特征識別鮭魚和鱸魚的例子[4];在講授決策樹之前,給出根據(jù)顏色,形狀、尺寸等非度量特征識別水果的例子等等。通過學(xué)習(xí),找到了解決這類問題的一般方法,同時學(xué)生也通過實(shí)例記住并理解了該方法的適用范圍。又例如在講授特征的選擇與提取這一章時,先不講特征空間的映射和變換,而是從幾個實(shí)例出發(fā),說明并不是特征越多越好,而是要選擇合適的特征向量;特征的組合變換可以使復(fù)雜的分類問題轉(zhuǎn)化為簡單的問題等。從而讓學(xué)生更好地理解特征選擇和提取的目的和重要性。

在接觸到實(shí)際的模式識別問題時,會引發(fā)學(xué)生的思考。在授課過程中,教師可以針對具體問題組織學(xué)生進(jìn)行討論,看是否能夠利用已學(xué)過的模式識別方法解決該問題。若可以解決,則引導(dǎo)學(xué)生分析用已學(xué)方法解決該問題時存在的不足,從而引出下面將要介紹的新方法。這樣,在介紹新方法的同時,學(xué)生會很自然地將新方法與舊的方法進(jìn)行比較,分析各種方法的優(yōu)劣,有利于學(xué)生對教學(xué)內(nèi)容的深入理解和掌握。這種方法在講授解決同一類模式識別問題的不同方法時是適用的。如在講授貝葉斯決策時,可以通過對比的方式介紹幾種決策規(guī)則的特點(diǎn),又如在講授線性判別方法中各種形式的感知器算法時,也可以對比學(xué)習(xí)各種算法的優(yōu)劣。若該模式識別問題不能用已學(xué)的方法解決,則引導(dǎo)學(xué)生分析該模式識別問題的特點(diǎn),思考為何必須引入新的模式識別方法來解決該問題,學(xué)生是否能夠提出自己的解決方案。在分析和思考之后,教師再將解決該問題的思路引入到下面將要介紹的新方法上。這種方法在講授解決不同類型的模式識別問題時是適用的。如在講授非度量模式識別方法時,面對非度量語義屬性的模式識別問題是前面介紹的方法無法解決的,要引入非度量模式識別方法加以解決。

因此我們建議在教材的編寫上可以嘗試采用實(shí)例先導(dǎo)的方法。首先在引言部分給出一個實(shí)際例子,然后在介紹方法的部分結(jié)合理論分析給出解決實(shí)例問題的方法。這種方法有利于提高學(xué)生的學(xué)習(xí)興趣,增強(qiáng)記憶,加深理解。

3實(shí)踐能力和科研興趣的培養(yǎng)

模式識別是一門理論和實(shí)踐緊密結(jié)合的科學(xué),該學(xué)科的發(fā)展日新月異,在計(jì)算機(jī)和信息處理領(lǐng)域的地位越來越重要。因此,在模式識別課程的教學(xué)過程中要注重學(xué)生實(shí)踐能力和科研興趣的培養(yǎng)。在教學(xué)實(shí)踐中,我們采用了上機(jī)實(shí)驗(yàn)和科學(xué)報告相結(jié)合的教學(xué)方式。

掌握各種模式識別方法的原理和流程是本科模式識別教學(xué)的第一個階段。在此基礎(chǔ)上,我們要求學(xué)生在計(jì)算機(jī)上實(shí)現(xiàn)模式識別方法并用于解決實(shí)際的模式識別問題。在上機(jī)實(shí)現(xiàn)的過程中,學(xué)生不僅需要掌握模式識別問題在計(jì)算機(jī)中的表示方法和識別結(jié)果的展示形式,尤其重要的是學(xué)生需要對模式識別方法的每一個細(xì)節(jié)都要深入理解和掌握才能將算法實(shí)現(xiàn)。在上機(jī)教學(xué)中,我們采用了Matlab編程環(huán)境實(shí)現(xiàn)課程中介紹的模式識別方法。Matlab的編程語言簡單高效,而且提供了功能強(qiáng)大的圖形展示功能[5]。例如在貝葉斯決策和線性分類器的上機(jī)實(shí)驗(yàn)中,學(xué)生可以利用畫圖函數(shù)用不同的顏色和符合標(biāo)記不同類別的樣本,可以輕松地畫出決策面,這種可視化的分類結(jié)果展示形式不僅提高了學(xué)生的學(xué)習(xí)興趣,而且加深了學(xué)生對模式識別方法及其特點(diǎn)的理解。

在學(xué)生成績考核中,除了筆試成績我們還增設(shè)了上機(jī)作業(yè)成績和科學(xué)報告成績兩個部分。上機(jī)作業(yè)的內(nèi)容是要求學(xué)生從若干個上機(jī)題目中選擇有興趣的實(shí)現(xiàn)一個簡單的模式識別系統(tǒng)。例如設(shè)計(jì)實(shí)現(xiàn)貝葉斯分類器、線性分類器、神經(jīng)網(wǎng)絡(luò)分類器、決策樹等??茖W(xué)報告可以有兩種形式,要求學(xué)生或者在模式識別領(lǐng)域的主流英文期刊上選擇感興趣的英文文獻(xiàn),將其翻譯為中文;或者就模式識別領(lǐng)域的一個感興趣的話題談?wù)勛约旱目捶ê椭鲝?。通過上機(jī)作業(yè)和科學(xué)報告的形式,學(xué)生的動手能力得到了良好的鍛煉。不僅提高了學(xué)生的學(xué)習(xí)熱情,而且引導(dǎo)學(xué)生積極思考,不少同學(xué)在科學(xué)報告中提出了自己的學(xué)術(shù)看法和主張,有些內(nèi)容頗具獨(dú)到的見解。

在學(xué)生成績考核中,除了筆試成績我們還增設(shè)了上機(jī)作業(yè)成績和科學(xué)報告成績兩個部分。上機(jī)作業(yè)的內(nèi)容是要求學(xué)生從若干個上機(jī)題目中選擇有興趣的實(shí)現(xiàn)一個簡單的模式識別系統(tǒng)。例如設(shè)計(jì)實(shí)現(xiàn)貝葉斯分類器、線性分類器、神經(jīng)網(wǎng)絡(luò)分類器、決策樹等??茖W(xué)報告可以有兩種形式,要求學(xué)生或者在模式識別領(lǐng)域的主流英文期刊上選擇感興趣的英文文獻(xiàn),將其翻譯為中文;或者就模式識別領(lǐng)域的一個感興趣的話題談?wù)勛约旱目捶ê椭鲝?。通過上機(jī)作業(yè)和科學(xué)報告的形式,學(xué)生的動手能力得到了良好的鍛煉。不僅提高了學(xué)生的學(xué)習(xí)熱情,而且引導(dǎo)學(xué)生積極思考,不少同學(xué)在科學(xué)報告中提出了自己的學(xué)術(shù)看法和主張,有些內(nèi)容頗獨(dú)到的見解。

4結(jié)語

本科模式識別教學(xué)由于學(xué)生的數(shù)學(xué)基礎(chǔ)有限而面臨著兩難的境地。既要把原理和方法講清楚,又不能過多的涉及復(fù)雜的數(shù)學(xué)推導(dǎo),這給教學(xué)帶來很大困難。在教學(xué)實(shí)踐中,我們把教學(xué)內(nèi)容劃分為基礎(chǔ)型、前沿型兩類,并提出了弱化公式推導(dǎo),強(qiáng)調(diào)公式的物理含義,以及結(jié)合實(shí)例增強(qiáng)記憶的教學(xué)方法。為了提高學(xué)生的學(xué)習(xí)興趣,加深理解,我們提出了實(shí)例先導(dǎo)的教學(xué)方法。用實(shí)際例子引導(dǎo)學(xué)生思考,加深學(xué)生對模式識別方法應(yīng)用背景和適用范圍的理解。模式識別是實(shí)踐性很強(qiáng)的科學(xué),并且該學(xué)科的發(fā)展十分迅速。在教學(xué)實(shí)踐中,我們十分重視學(xué)生動手能力和科研興趣的培養(yǎng)。通過上機(jī)作業(yè)和科學(xué)報告的形式引導(dǎo)學(xué)生積極動手,積極思考。

參考文獻(xiàn):

[1] 邊肇祺,張學(xué)工. 模式識別[M]. 2版. 北京:清華大學(xué)出版社. ,2002:9-303.

[2] 顧波. 模式識別本科教學(xué)方法淺談[J]. 中國科教創(chuàng)新導(dǎo)刊.,2010(4):68.

[3] Andrew R. Webb. 統(tǒng)計(jì)模式識別[M]. 2版. 王萍,等,譯. 北京:電子工業(yè)出版社,2004:1-10.

[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分類[M]. 2版. 李宏東,姚天翔,等,譯. 北京:機(jī)械工業(yè)出版社. ,2003.

[5] 楊淑瑩. 模式識別與智能計(jì)算:Matlab技術(shù)實(shí)現(xiàn)[M]. 北京:電子工業(yè)出版社,2008:1-300.

Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming

QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2

(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)

篇8

1 數(shù)據(jù)挖掘的概念、步驟及常用方法

1.1 數(shù)據(jù)挖掘概念、步驟 數(shù)據(jù)挖掘(Data mining,DM)即數(shù)據(jù)庫中的知識發(fā)現(xiàn),是從大型數(shù)據(jù)庫的海量數(shù)據(jù)中提取人們感興趣的知識,這些知識是隱藏的、事先未知的、潛在有用的信息,挖掘的知識表現(xiàn)為概念、規(guī)則、規(guī)律、模式等形式[1]。數(shù)據(jù)挖掘的目的在于使用所發(fā)現(xiàn)的模式幫助解釋當(dāng)前的行為或預(yù)測未來的結(jié)果[2]。挖掘步驟大致有:問題定義、數(shù)據(jù)提取、數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、知識評估、結(jié)果應(yīng)用這六步。

1.2 數(shù)據(jù)挖掘常用方法

1.2.1 描述統(tǒng)計(jì) 數(shù)據(jù)總結(jié)的目的是對數(shù)據(jù)進(jìn)行從低層次抽象、濃縮到高層次,得出它的緊湊描述。最簡單的數(shù)據(jù)總結(jié)方法是描述統(tǒng)計(jì),它包括平均數(shù)、中位數(shù)、分位數(shù)等,它常和統(tǒng)計(jì)圖配合應(yīng)用。

1.2.2 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則從本質(zhì)上講是條件概率,即當(dāng)A發(fā)生時、B同時出現(xiàn)的概率有多大?只要B離50%較遠(yuǎn)就有意義。數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫中存在的一類重要的可被發(fā)現(xiàn)的知識。若兩個或多個變量的取值之間存在某種規(guī)律性,就稱為關(guān)聯(lián)。關(guān)聯(lián)包括簡單關(guān)聯(lián)、時序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)分析的目的是找出數(shù)據(jù)庫中隱藏的關(guān)聯(lián)網(wǎng)。有時我們并不知道數(shù)據(jù)庫中數(shù)據(jù)的關(guān)聯(lián)函數(shù),即使知道也不確定。因此關(guān)聯(lián)分析生成的規(guī)則帶有可信度。

1.2.3 分類和聚類 這是最常用的技術(shù)。分類方法主要有:回歸、決策樹、神經(jīng)網(wǎng)絡(luò)。分類分析在數(shù)據(jù)挖掘中是一項(xiàng)重要任務(wù)。分類器的構(gòu)造方法有統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法等。聚類是根據(jù)事物本身潛在的特性研究對象分類的方法。通過聚類把一個數(shù)據(jù)集合中的個體按照相似性歸成若干類別,使其“物以類聚”,將數(shù)據(jù)庫中的記錄劃分為一系列有意義的子集。聚類要解決的就是實(shí)現(xiàn)滿足這種要求的類的聚合。在進(jìn)行聚類前,這些類別是潛在的,可分割的類的個數(shù)(聚類數(shù))也是未知的。聚類大致分為統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、神經(jīng)網(wǎng)絡(luò)方法和面向數(shù)據(jù)庫的方法等。

1.2.4 偏差檢測 數(shù)據(jù)庫中的數(shù)據(jù)可能有一些異常記錄,檢測這些偏差很有意義。偏差檢測的基本方法是尋找觀測結(jié)果與參照值之間有意義的差別。

2 中醫(yī)病歷中醫(yī)學(xué)數(shù)據(jù)挖掘的特點(diǎn)

目前中醫(yī)病歷中采集的中醫(yī)學(xué)信息具有如下特點(diǎn)。

2.1 癥狀的模糊性 中醫(yī)學(xué)對疾病的診斷是通過望、聞、問、切的四診合參,獲取有用信息,再結(jié)合醫(yī)生的經(jīng)驗(yàn),對疾病做出診斷。癥狀的模糊性不僅表現(xiàn)在獲得信息的形式多樣,而且因中醫(yī)癥狀存在著一癥多名,或多癥一名的現(xiàn)象,因此不同醫(yī)生即使對同樣的癥狀,可能會用不同的文字加以描述,比如對“患者不欲進(jìn)食”的記錄,可能會有納差、食欲不振、納呆等的不同。這種模糊性模式加大了中醫(yī)學(xué)數(shù)據(jù)挖掘的難度。

2.2 癥狀的不完整性 病例和病案的有限性使醫(yī)學(xué)數(shù)據(jù)庫不可能對任何一種疾病信息都能全面地反映出來,表現(xiàn)為醫(yī)學(xué)信息的不完全性。同時,許多醫(yī)學(xué)信息的表達(dá)、記錄本身就具有不確定和模糊性的特點(diǎn)[3],這方面在中醫(yī)癥狀未做出標(biāo)準(zhǔn)量化方法并推行應(yīng)用之前,尤為突出。疾病信息體現(xiàn)的客觀不完整和描述疾病的主觀不確切,形成了中醫(yī)病歷中醫(yī)學(xué)信息的不完整性。

2.3 證候的復(fù)雜性 著名的王永炎院士指出了證候具有動態(tài)時空、內(nèi)實(shí)外虛、多維界面的特點(diǎn),簡明扼要的描述了證候的復(fù)雜性。中醫(yī)證候的復(fù)雜性給數(shù)據(jù)挖掘增加了難度,但這也恰好是數(shù)據(jù)挖掘發(fā)揮效力的用武之地。

2.4 治療信息的個體化特性 中醫(yī)治病之本是辨證論治,體現(xiàn)在“三因治宜”、“同病異治、異病同治”等方面。即使針對同一疾病相同的證,醫(yī)生的處方用藥也可能會有差異。這種個體化的治療,充分體現(xiàn)了中醫(yī)治病的精髓,而其中所蘊(yùn)涵的深奧哲理和規(guī)律,用一般的研究方法難以全面發(fā)掘。數(shù)據(jù)挖掘在這方面很可能會有很高的應(yīng)用價值。

2.5 挖掘過程的復(fù)雜性 中醫(yī)藥領(lǐng)域中的數(shù)據(jù)屬性有離散型的,也有連續(xù)型和混合型的,對這些數(shù)據(jù)的噪聲處理等預(yù)處理相當(dāng)復(fù)雜,挖掘過程還需要人機(jī)交互、多次反復(fù),其中任何一個環(huán)節(jié)都不能缺少專業(yè)人員。只有靠中醫(yī)藥專家的引導(dǎo),針對具體問題,選擇合理的挖掘方法,才能挖掘出真正有價值的知識。

在中醫(yī)學(xué)數(shù)據(jù)挖掘中,應(yīng)針對上述數(shù)據(jù)特點(diǎn)和挖掘目標(biāo),結(jié)合運(yùn)用不同的挖掘方法,對非線性、不完全的信息進(jìn)行智能處理,發(fā)揮各自的技術(shù)及其整合優(yōu)勢。

3 數(shù)據(jù)挖掘在中醫(yī)藥研究中的應(yīng)用

近年來,數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥研究中已得到應(yīng)用。有學(xué)者認(rèn)為中醫(yī)藥數(shù)據(jù)挖掘是中醫(yī)藥現(xiàn)代化研究的重要組成部分[4]。

3.1 中醫(yī)藥信息化研究 姚氏等[5]綜合文獻(xiàn)指出對中醫(yī)藥理論和實(shí)踐進(jìn)行信息化、數(shù)字化、知識化,能夠克服中醫(yī)名詞術(shù)語過于繁雜造成的中醫(yī)發(fā)展障礙,對于中醫(yī)藥信息進(jìn)行文本數(shù)據(jù)挖掘是促進(jìn)中醫(yī)藥信息結(jié)構(gòu)化的途徑之一,該問題的解決,能極大促進(jìn)中醫(yī)藥現(xiàn)代化發(fā)展的進(jìn)程。

3.2 中藥研究 陳凱先等[6]認(rèn)為對大量中藥化學(xué)成分進(jìn)行藥效基團(tuán)的建模研究,并對中藥化學(xué)成分?jǐn)?shù)據(jù)庫進(jìn)行柔性搜索,能夠?yàn)楦浞掷弥兴幓瘜W(xué)成分所含的化學(xué)信息提供技術(shù)支持。馮雪松等[7]對中藥指紋圖譜的特點(diǎn)及數(shù)據(jù)挖掘技術(shù)在其中的應(yīng)用做了綜述,指出中藥指紋圖譜由于反映了藥用植物的“共有特征”,又由于地域、生長環(huán)境、采收等多種因素影響,具有統(tǒng)計(jì)數(shù)學(xué)中多元隨機(jī)分布的“模糊性”,利用模糊數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)技術(shù)等建立一種同時反應(yīng)這兩種特征數(shù)據(jù)庫,存儲中藥指紋圖譜信息,應(yīng)用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)和解析其中潛在的信息,以評價和控制中藥質(zhì)量及研究中藥定量組效關(guān)系。

3.3 方劑研究 喬延江等[4]綜述了KDD在中藥研究開發(fā)中的意義。喬氏等認(rèn)為中藥(復(fù)方)的KDD研究是在中醫(yī)理論指導(dǎo)下,以數(shù)據(jù)挖掘技術(shù)作為知識發(fā)現(xiàn)的主要環(huán)節(jié),對中藥研發(fā)、設(shè)計(jì)、中醫(yī)組方理論及規(guī)律、中藥作用機(jī)制、構(gòu)效關(guān)系、中藥藥效集團(tuán)群的確認(rèn)、化學(xué)成分及藥理指標(biāo)的預(yù)測等進(jìn)行多方位、多學(xué)科、系統(tǒng)的現(xiàn)代化研究,是一個高度復(fù)雜的系統(tǒng)。其目的是建立傳統(tǒng)中醫(yī)理論同現(xiàn)代中藥的科學(xué)化、系統(tǒng)化、可描述化的關(guān)系,是中醫(yī)藥現(xiàn)代化的重要組成部分。楊林等[8]闡述了數(shù)據(jù)庫技術(shù)與Web結(jié)合實(shí)現(xiàn)網(wǎng)上中醫(yī)方劑的信息挖掘。將方劑文獻(xiàn)資料進(jìn)行全方位解析,設(shè)計(jì)內(nèi)容詳細(xì)的數(shù)據(jù)庫與Web技術(shù)結(jié)合,通過Internet開發(fā)了網(wǎng)上中醫(yī)方劑信息分析處理系統(tǒng),選擇支持Web-DB的ORACLE數(shù)據(jù)庫管理系統(tǒng)作為系統(tǒng)開發(fā)和運(yùn)行平臺。經(jīng)過數(shù)據(jù)預(yù)處理、選擇和篩選數(shù)據(jù)、確定分析目標(biāo)、信息挖掘結(jié)果顯示等階段,完成對一批方劑數(shù)據(jù)的信息挖掘。姚美村等[9]應(yīng)用數(shù)據(jù)挖掘技術(shù)對治療消渴病的中藥復(fù)方配伍的內(nèi)涵進(jìn)行探索性研究。以文獻(xiàn)收錄的106個治療消渴病的中藥復(fù)方為對象,經(jīng)解析后建立復(fù)方特征數(shù)據(jù)庫;以數(shù)據(jù)挖掘系統(tǒng)Enterprise Miner為平臺,在單味藥層次上進(jìn)行消渴病復(fù)方組成藥味之間的關(guān)聯(lián)規(guī)則分析研究,結(jié)果顯示單味藥、兩味藥組合、三味藥組合的應(yīng)用規(guī)律與歷代中醫(yī)在消渴病治療用藥方面的論述一致。挖掘結(jié)果的可信度可達(dá)到或接近中醫(yī)專家的分析能力。秦首科等[10]在構(gòu)建方劑、中藥和病癥數(shù)據(jù)倉庫的基礎(chǔ)上,通過對數(shù)據(jù)倉庫內(nèi)部各種關(guān)聯(lián)和映射關(guān)系的定義,利用中藥和病癥數(shù)據(jù)倉庫的聯(lián)機(jī)分析功能,探討了方劑和其針對癥狀之間的聯(lián)系。蔣永光等[11]對從《中醫(yī)大辭典·方劑分冊》中篩選出1355首脾胃方中的414種藥物,經(jīng)用聚類分析、對應(yīng)分析和頻繁集方法,從功效、歸經(jīng)、藥性和藥味等方面進(jìn)行了分類特征分析,并就脾胃方的核心藥物、方劑結(jié)構(gòu)、“藥對藥”組和“方藥證”的對應(yīng)關(guān)聯(lián)方面形成了有關(guān)技術(shù)規(guī)則和處理程序。

3.4 中醫(yī)證候研究 張世筠等[12]應(yīng)用流行病學(xué)和變量聚類分析的數(shù)理統(tǒng)計(jì)方法,對2442例中醫(yī)肝證患者進(jìn)行了初步研究。由調(diào)查組采集核對中醫(yī)四診資料,按肝證辨證記分標(biāo)準(zhǔn)記分,分為11個證型。經(jīng)過聚類分為實(shí)證、風(fēng)證、虛證3類,解決了中醫(yī)各肝證的歸屬問題,本研究還定量地闡明肝的實(shí)證、虛證、風(fēng)證的相互關(guān)系。白云靜等[13]在充分闡釋證候系統(tǒng)的非線性、復(fù)雜性特征的基礎(chǔ)上,探析了人工神經(jīng)網(wǎng)絡(luò)方法用于證候研究的可行性,并介紹了基于人工神經(jīng)網(wǎng)絡(luò)的證候研究方法。徐蕾等[14]采用boot strap方法對406例樣本進(jìn)行擴(kuò)增以滿足數(shù)據(jù)挖掘?qū)颖玖康囊?,采用基于信息熵的決策樹C4.5算法建立中醫(yī)辨證模型。通過決策樹C4.5算法篩選出對辨證分型有意義的26個因素,按其重要程度排序;產(chǎn)生出清楚易懂可用于分類的決策規(guī)則,建立辨證模型,模型分類符合率為:訓(xùn)練集83.6%,驗(yàn)證集80.67%,測試集81.25%;模型區(qū)分各類證型的靈敏度和特異度也較高。認(rèn)為決策樹C4.5算法建立的模型效果較好,可用于慢性胃炎中醫(yī)證型的鑒別診斷。吳斌[15]等探討了腎陽虛證的辨證因子分布規(guī)律。以腎陽虛證量表為基礎(chǔ),從定性、定量角度收集資料。以定性評分計(jì)算各辨證因子的出現(xiàn)頻率,用定量評分進(jìn)行分層聚類分析。發(fā)現(xiàn):畏寒、肢冷、夜尿、腰背發(fā)冷等辨證因子出現(xiàn)頻率高,聚類分析提示腎陽虛主證、舌象、脈象分布較有規(guī)律。認(rèn)為根據(jù)數(shù)理統(tǒng)計(jì)結(jié)果對腎陽虛證的辨證因子進(jìn)行初篩,為腎陽虛證的量化研究奠定了基礎(chǔ)。

4 小結(jié)與展望

利用數(shù)據(jù)挖掘技術(shù)探求中醫(yī)藥診治疾病的規(guī)律,形成用數(shù)字描述和表達(dá)的中醫(yī)藥內(nèi)容,能有力推動中醫(yī)藥研究的規(guī)范化進(jìn)程。但由于中醫(yī)藥信息的復(fù)雜性和特殊性,中醫(yī)藥數(shù)據(jù)挖掘在挖掘?qū)ο蟮膹V泛性、挖掘算法的高效性和魯棒性、提供知識或決策的準(zhǔn)確性方面有更高的要求。目前中醫(yī)藥數(shù)據(jù)庫資源已較豐富。數(shù)據(jù)挖掘技術(shù)將成為中醫(yī)藥現(xiàn)代化的重要組成部分。但從目前應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行的中醫(yī)藥研究來看,中醫(yī)數(shù)據(jù)挖掘尚處于起步階段,多數(shù)是對古文獻(xiàn)數(shù)據(jù)的整理挖掘,缺乏用于探求中醫(yī)診治疾病規(guī)律和復(fù)方用藥規(guī)律的研究。這可能與中醫(yī)數(shù)據(jù)的復(fù)雜性所致的數(shù)據(jù)預(yù)處理繁瑣有關(guān);如能通過建立結(jié)構(gòu)化數(shù)據(jù)庫,采用結(jié)構(gòu)化的臨床信息采集系統(tǒng)收集數(shù)據(jù),將能提高中醫(yī)學(xué)數(shù)據(jù)挖掘的效率及可信度。有助于發(fā)現(xiàn)中醫(yī)的診治規(guī)律,并創(chuàng)新診治模式,提高診療與科研教學(xué)水平。

1 Srikanth R''Agrawal R.Mining Sequential Patterns:Generalizationsand Performance Improvement.In 5th Int’ Extending Database Technology.Avignon France''1996''121-130.

2 翁敬農(nóng)(譯).數(shù)據(jù)挖掘教程.北京:清華大學(xué)出版社''2003''11.

3 Qu JH''Liao QM''Xu WZ''et al.The construction of medical database and datamining.Journal of the Fourth Military Medical University''2001''22(1):88.

4 喬延江''李澎濤''蘇鋼強(qiáng)''等.中藥(復(fù)方)KDD研究開發(fā)的意義.北京中醫(yī)藥大學(xué)學(xué)報''1998''21(3):15-17.

5 姚美村''袁月梅''艾路,等.數(shù)據(jù)挖掘及其在中醫(yī)藥現(xiàn)代化研究中的應(yīng)用.北京中醫(yī)藥大學(xué)學(xué)報''2002''25(3):20-23.

6 陳凱先''蔣華良''嵇汝運(yùn).計(jì)算機(jī)輔助藥物設(shè)計(jì)—原理、方法及應(yīng)用.上海:上??萍汲霭嫔?'2001''1.

7 馮雪松''董鴻曄.中藥指紋圖譜的數(shù)據(jù)挖掘技術(shù).藥學(xué)進(jìn)展''2002''26(4):198-201.

8 楊林''徐慧''任廷革,等.數(shù)據(jù)庫技術(shù)與Web結(jié)合實(shí)現(xiàn)網(wǎng)上中醫(yī)方劑的信息挖掘.中國中醫(yī)藥信息雜志''1999''6(9):71-72.

9 姚美村''艾路''袁月梅''等.消渴病復(fù)方配伍規(guī)律的關(guān)聯(lián)規(guī)則分析.北京中醫(yī)藥大學(xué)學(xué)報''2002''25(6):48-50.

10 秦首科''牛孺子.利用數(shù)據(jù)倉庫分析處理中醫(yī)方劑評析.中醫(yī)藥學(xué)刊''2002''20(3):341-342.

11 蔣永光''李力''李認(rèn)書''等.中醫(yī)脾胃方劑配伍規(guī)律數(shù)據(jù)挖掘試驗(yàn).世界科學(xué)技術(shù)—中醫(yī)藥現(xiàn)代化''2003''5(3):33-37.

12 張世筠''沈明秀''王先春''等.中醫(yī)肝證的變量聚類分析.中國中西醫(yī)結(jié)合雜志''2004''24 (1):35.

13 白云靜''申洪波''孟慶剛''等.中醫(yī)證候研究的人工神經(jīng)網(wǎng)絡(luò)方法探析.中醫(yī)藥學(xué)刊''2004''22(12):2221-2223.

14 徐蕾''賀佳''孟虹''等.基于信息熵的決策樹在慢性胃炎中醫(yī)辨證中的應(yīng)用.第二軍醫(yī)大學(xué)學(xué)報''2004''25(9):1101-1103.

推薦期刊