數學建模中同樣的指標有些對象沒有給指標怎麼辦

題目:

數學建模中同樣的指標有些對象沒有給指標怎麼辦
數學建模處理數據時,所提供數據中(excel)有些指標,有的對象有,有的沒有(格子中就一個「.」),怎麼處理?

解答:

先給你一篇想要哪方面的建模論文我都有
一、問題重述
學科的水平、地位是高等學校的一個重要指標,而學科間水平的評價對於學科的發展有著重要的作用,它可以使得各學科能更加深入的了解本學科(與其他學科相比較)的地位及不足之處,可以更好的促進該學科的發展.因此,如何給出合理的學科評價體系或模型一直是學科發展研究的熱點問題.現有某大學(科研與教學並重型高校)的13個學科在一段時期內的調查數據,包括各種建設成效數據和前期投入的數據.
1、根據已給數據建立學科評價模型,要求必要的數據分析及建模過程.
2、模型分析,給出建立模型的適用性、合理性分析.
3、假設數據來自於某科研型或教學型高校,請給出相應的學科評價模型.
二、問題假設
1、學科評價不受國家政策、地方政府導向等宏觀調控的影響.
2、學科的實力、地位短期內不會因突發狀況而產生驟變.
3、題目所給的13個學科的調查數據準確可靠,能反映不同學科的真實情況.
三、符號說明
:第i項評價指標( );
:重要程度比對值;
:權重向量;
:判斷矩陣的最大特徵根;
:誤差值矩陣;
:評價指標的熵權值;
:誤判係數;
:學科間指標的相差係數;
: 標準化的數據矩陣.
四、問題分析
本題爲學科綜合評價的問題.題中分別給出了評價教學與科研的各學科的指標與數據,爲快速準確的評判各學科間的差別,需建立評價模型來量化分析.
問題一,題目要求建立學科綜合評價模型.爲解決這一綜合評價問題,在評價指標確定的情況下,考慮到每張表的指標均存在分項目,且分項有的重要性明顯不同,有的則沒有明顯的重要性區分,各指標間的相關性也不高,故每張表運用相應的權值計算方法計算分項目的權值,各學科每一指標的權值取分項目的加權代數和.綜合評價時,運用熵權理想解法給出各指標的權值,再計算各學科的總分值,即可依此對各學科進行排序.
問題二,是對問題一中給出的模型進行適用性與合理性的分析.考慮此模型適用性等效於模型穩定性,故運用刀切法對評價指標進行交叉確認評判,將模型的適用性量化成數值以作精確評判.模型的合理性需額外給出幾項指標,通過對比分析,確定模型各指標給出的權值的合理性.
問題三,是建立當此學科數據均來自於某科研型或教學型高校時的綜合評價模型.由於不同類型高校的評價指標權重不同,採用因子分析法得出代表科研的因子和教學的因子,在問題一模型的基礎上,改變因子在不同類型高校模型的得分,得到基於問題一對比模型的新學科排名.
五、模型建立與求解
5.1 評價模型的建立與求解
該題給出了八項指標(如圖1所示),在處理8個不同指標時,由於各個指標的性質不同,故採取不同處理方式.

綜合評價指標體系 圖1
5.1.1 學科建設情況指標A
學科建設情況有一級學科國家重點學科、二級學科國家重點學科、博士學位授權點、碩士學位授權點四個二級指標,不同指標對學科建設情況的影響程度不同,權重也各不相同,而且有不同的實際含義.以此我們可以用綜合模糊評判方法對各學科的學科建設情況給出一個綜合評估方案.
根據問題的實際情況,並通過查詢相關資料,我們知道一級國家重點學科比二級國家重點學科的評定更難,博士學位授權也比碩士學位授權重要,我們對其賦予不同的權值.得出各級指標及其權值,如表1:
表1 各級因素及其權值
主要因素 二級因素 權重 模糊矩陣 三級因素 權重
學科建設情況 A1國家重點學科建設 a1=0.6 RA1 一級國家重點學科(A11) 0.65
二級國家重點學科(A22) 0.35
A2學位授權情況 a2=0.4 RA2 博士學位授權點A21 0.7
碩士學位授權點A22 0.3
因爲影響學科建設情況的有國家重點學科建設(A1)和學位授權情況(A2)兩個二級因素和四個三級因素.我們用每個三級因素數目占總數目的百分比組成每個二級因素的模糊評判矩陣Ra1,RA2.
我們拿學科a1爲例
RA1={}
RA2
同理可出其他各學科的學科建設情況綜合評價指標.D2,D3.D13
得學科建設情況的評價指標向量:
A=(D1D2 …..D13)
=

5.1.2 獲教學獎情況指標 :
教學獎分爲國家級和省級兩個等級,且明顯國家級獎項比省級獎項重要得多,查詢資料知,每年國家頒發的國家級和省級教學獎的數量比大約爲1:8,因此確定國家級獎項和省級獎項權重爲8:1,所以用各級獲獎數與其權重相乘之後的和來作爲獲教學獎評價指標 ,結果如表3:
表3 學科教學獎指標
學科代號 a1 a2 a3 a4 a5 a6 a7
教學獎指標Z2 14 11 1 0 13 3 11
學科代號 a8 a9 a10 a11 a12 a13
教學獎指標Z2 16 1 4 0 24 18
5.1.3 獲科研經費指標
國家級、省級、其它、橫向經費分別爲 、 、 、 ,各項經費之和爲總經費 ,結果如表4.
表4 學科獲科研總經費
學科代號 a1 a2 a3 a4 a5 a6 a7
總經費(萬元) 23916 18943 7201 3088 12657 3379 29506
學科代號 a8 a9 a10 a11 a12 a13
總經費(萬元) 6240 3254 1307 449 971 672
總經費 與國家級經費 的相關係數爲:
求得:
檢驗:

查表可知:顯著性水平爲5%,自由度爲11的t臨界值爲:2.145,上式中的t值大於2.145,因此, r通過顯著性檢驗.分別計算總經費與其他各項經費的相關係數 、 、 .所以總經費和其他各項的相關性顯著.爲簡化數據,用總的科研經費來衡量各學科所獲科研經費的情況,即 .
5.1.4 獲科研成果獎情況指標
科研成果獎分爲國家級、部級和省級三個等級,且明顯國家級獎項比部級獎項、省級獎項重要得多,部級也要比省級重要,類比教學獎情況的處理方法,確定國家級獎項、部級獎項、省級獎項權重爲8:2:1,所以用各級獲獎數與其權重相乘之後的和來作爲獲教學獎評價指標 ,結果如表5:
表5 學科獲科研獎指標
學科代號 a1 a2 a3 a4 a5 a6 a7
科研成果獎指標Z4 57 66 17 23 49 8 76
學科代號 a8 a9 a10 a11 a12 a13
科研成果獎指標Z4 63 55 18 52 46 35
5.1.5 隊伍建設情況指標
題目給出的有關隊伍建設情況的數據種類繁多,經觀察發現,除前兩項「教授人數」和「副教授人數」爲職稱外,其他各項均爲個人榮譽且數量相對都較少.因此把後八項(b1~b8)相加合爲一項.因爲「教授」比「副教授」職稱等級要高,且個人榮譽屬於錦上添花,也存在一人多項榮譽的可能,不能作爲主導指標,比重不能太大.之後類比前文學科建設情況指標的處理方法,給出判斷矩陣 :

求的權重向量:
同樣求出隊伍建設情況指標:
5.1.6 科研成果指標
科研成果包括SCI/SSCI、EI、ISTP、CSSCI、政府報告、專利、專注等七項,其中SCI、 EI 、ISTP是世界著名的三大科技文獻檢索系統,是國際公認的進行科學統計與科學評價的主要檢索工具,其中以SCI最爲重要,SSCI則是SCI的姐妹篇.CSSCI是我國人文社會科學評價領域的標誌性工程,爲人文社會科學事業發展與研究提供第一手資料.而政府報告、專利、專著在學術科研成果評價重也占有重要地位.
分析數據可以看出,對於每個學科,由於學科本身的特點所致,科研成果的側重點不同,比如a1學科的SCI/SSCI、EI、ISTP、專利較多而CSSCI、政府報告、專著則較少,而學科a13的SCI/SSCI、EI、ISTP、專利較少而CSSCI、政府報告、專著則較多.爲簡化數據,對每種科研成果等同看待,但是由數據明顯看出SCI/SSCI與專著數量相差很大,單純累加必然會減少專著數量對科研成果的貢獻率,因此進行規範化處理再相加作爲科研成果指標:

具體結果如表6:
表6 學科科研成果指標
學科代號 a1 a2 a3 a4 a5 a6 a7
科研成果指標Z6 4.048 2.465 0.703 0.719 0.945 0.974 2.069
學科代號 a8 a9 a10 a11 a12 a13
科研成果指標Z6 1.312 2.830 1.725 1.023 1.501 1.220
5.1.7 人才培養情況指標
因爲有關人才培養情況給出了各學科博士、碩士、博士後的人數,且博士後的學識水平明顯高於博士,博士高於碩士.因此類比前文給出的利用判斷矩陣確定權重的方法來得人才培養情況指標 :
判斷矩陣 :

求得權重向量爲:
同樣求的人才培養情況指標:

5.1.8 前期投入資金
前期投入資金是對各科最初實力、地位、受重視程度的體現,也一定程度影響了學科後來的發展情況,因此在對學科進行評價時,也把前期投入資金作爲一項衡量的指標 .
綜合數據處理,得到8項指標情況.如表7
表7 學科各項指標匯總
學科 學科建設 所獲教學獎 所獲科研經費 所獲科研獎 隊伍
建設 科研成果 人才
培養 前期投入資金
a1 2 14 23916 57 81 4.048 261 4689
a2 4.534 11 18943 66 72.75 2.465 310 5123
a3 2.639 1 7201 17 38.25 0.703 53 1876
a4 1.917 0 3088 23 17.25 0.719 127 1234
a5 3.914 13 12657 49 30.5 0.945 62 1345
a6 1.617 3 3379 8 27.25 0.974 114 987
a7 8.181 11 29506 76 104 2.069 287 1070
a8 4.388 16 6240 63 32.75 1.312 222 792
a9 4.812 1 3254 55 35.5 2.830 216 450
a10 2.967 4 1307 18 19 1.725 115 360
a11 3.038 0 449 52 15 1.023 112 362
a12 3.677 24 971 46 20.5 1.511 162 370
a13 1.782 18 672 35 18.5 1.220 183 460
5.1.9 運用基於熵權法的理想解法求出各學科之間的比較,建立數學模型
已求得八項指標中各學科的比較情況,根據題目要求,需要得到的是學科之間的比較,在並沒有給出各指標權重的情況下,指標中數據的差異程度就顯得尤爲重要,所以,採用熵權法來構建每一個指標的權重,而後再利用理想解法求得各個學科的綜合比較情況.以下是具體步驟:
Step1:對原始評價矩陣進行規範化處理.由於不同指標的量綱各不相同,因此首先對原始評價矩陣 (其中 表示有13個學科, 表示有8個指標, 表示第 個學科在第 個指標中的權值)進行規範化處理,而且根據分析,可以看出各個指標都是效益型指標,也就是說各指標中的數據都與學科的水平正相關,所以可以採用下述規範化公式將原始評價矩陣 轉化成 .
規範化公式:
Step2:對規範化矩陣進行歸一化處理.利用公式

Step3:計算各個指標的熵.在有 個評價對象、 個評價指標的問題中,第 個評價指標的熵定義爲:

由於存在對數,所以要求歸一化矩陣中所有項都必須大於0,然而歸一化矩陣中確存在數值爲0的項,因此假設當 時, .
Step4:計算評價指標的熵權.公式爲:

求得熵權結果爲:
指標的熵越大,其熵權越小,該指標越不重要,而且滿足 和 .熵權並非反映指標在實際意義上的重要性,而是在評估中的相對重要性,它反映的是當給定被評價對象集後各種評價指標值確定情況下,各指標在比較上的相對激烈程度.
Step5:構造加權規範化評價矩陣.公式爲:

Step6: 計算正理想解和負理想解的指標加權評價值集合.
Step7:用歐式距離來計算各學科在所有指標中總的接近度係數並排序.
歐式距離公式:
,
,
接近度係數計算公式:
,
最後將該係數作爲學科綜合評價指標 對各學科進行排序,結果如表8爲:
表8 學科綜合評價指標
排名 1 2 3 4 5 6 7 8 9 10 11 12 13
學科代號 a1 a7 a2 a5 a12 a8 a13 a3 a9 a6 a4 a10 a11
評價指標 0.88 0.74 0.67 0.33 0.32 0.3 0.2 0.1 0.04 0.02 0.0142 0.0141 0.01
5.2 評價模型的分析
5.2.1 模型的適用性分析
建立模型的目的是對綜合學科的好壞進行量化打分.考慮到題目給出教學與科研的各項指標數據,適用性在此處不對模型評價指標的範圍不同的情況下進行分析,而是當數據與指標出現錯誤或是缺失時此模型仍然能給出比較正確的分數,並且誤差在一個允許的範圍內,則能說明此模型的適用性好.
適用性的判斷通常使用指標的誤判概率Pw來衡量,這裡運用刀切法來處理.其基本思想是每次剔除評價指標中的一個數據,利用其容量爲m*n-1的評價指標樣本建立判別準則(或判別函數),再用所建立的判別準則對刪除的那個樣品作判別.對評價指標中的每個樣本重複上述步驟,以其誤判的比例作爲誤判概率的估計,若誤判比例在一個可以允許的範圍內,則可以承認其適用性,比例越小,適用性越好.
在求出各學科八個指標的比較情況(如表7)後,對其進行歸一化處理.處理後爲一個其數值構成一個 的矩陣,對其進行刀切法處理.具體的刀切算法如下:(取數據構成矩陣 )
:從總體G1的容量爲 的訓練樣本開始,用經平均化處理的數據替換其中的一個 樣品,對新的容量爲 的矩陣進行判別,取所得的列向量中與該樣本相對應的值.
:將上一步的值與未替換時的判別值做差,差值的絕對值對應放入容量爲 的新矩陣 .
:重複步驟 與 ,直到G1的訓練樣本中的m*n個樣品依次被替換與判別,新矩陣 則爲誤差值矩陣.
考慮到題目中給出的各學科每一指標的數據只有一個,爲防止數據缺失對排序產生影響過大,一般採用填充同級數據的平均值來處理.故此處不做刪除處理,而是採用這一指標的其他數據項的平均值來替換.此處的判別方法即爲模型中給出的熵權理想解法.
某學科一個指標的值出現錯誤,將會影響整體的排名情況,故在此處對列向量作歸一化處理,所對應的值即能反映錯誤對整個排名的影響情況.
所得的誤差矩陣如表9:
表9 指標誤差矩陣
學科 學科建設 所獲教學獎 所獲經費 所獲科研獎 隊伍建設 科研成果 人才培養 前期投入資金
a1 0.0024 0.0281 0.0865 0.005 0.0105 0.0075 0.005 0.0388
a2 0.0326 0.0453 0.1085 0.0342 0.0397 0.0342 0.0343 0.0624
a3 0.0005 0.0209 0.0041 0.0009 0.0006 0.0001 0.0001 0.0059
a4 0 0.0131 0.0114 0.001 0.0009 0.0003 0.0003 0.0002
a5 0.0064 0.0175 0.0198 0.0059 0.0088 0.0086 0.0092 0.0063
a6 0.0003 0.0137 0.0126 0.0008 0.001 0.0006 0.0007 0.0018
a7 0.0104 0.0031 0.1023 0.0103 0.0044 0.0117 0.0114 0.0167
a8 0.0054 0.0324 0.0187 0.0031 0.0071 0.0067 0.0047 0.0122
a9 0.0002 0.0168 0.0138 0.0006 0.0012 0.0016 0.0001 0.0041
a10 0.0005 0.0113 0.0138 0.0016 0.0014 0.0002 0.0009 0.003
a11 0.0003 0.0112 0.011 0.0007 0.001 0.0006 0.0008 0.0025
a12 0.0059 0.0642 0.0425 0.0058 0.0084 0.0062 0.0061 0.0144
a13 0.0047 0.0378 0.0378 0.0049 0.0065 0.0047 0.0039 0.0106
經過對一樣本容量爲500的標準矩陣作隨機判別,計算對比得知誤差係數在0.05爲正常誤差範圍.
運用matlab命令find(S>=0.05)得到超出誤差係數的相關項如表10:
表10 超出誤差係數相關項
0.0642 0.0865 0.1085 0.1023 0.0624
運用誤判比例公式 , 表示樣本矩陣中超出誤差係數的樣本個數, 表示樣本總容量.
易得其貌似誤判率 .就此例情況,上述判別指標還是比較好的,即表明此模型的適用性好.

添加新評論

暱稱
郵箱
網站