——把科學道德列入大學評價體系,是不是會將大學評價變成人人自危的東西🪩📶?
自1987年中國管理科學研究院發布第一個大學排名開始,16年來,每當出現一個大學排名🕵🏻😶🌫️,總是伴隨著對名次不滿的反對聲,那麽———
有沒有基本肯定《中國大學評價》的學術文章
《誤區》作者稱:“據筆者對學術界的了解🏃🏻♂️➡️,至今筆者沒有看到一篇基本肯定武氏評價的學術評論文章。”
筆者不知道顧海兵教授平時是用什麽方法查閱文獻的。《中國大學評價》自1997年開始按年度在《科學學與科學技術管理》雜誌發表,其後有不少同行專家發表過不同的評論,但要說其中沒有一篇是基本肯定的,顯然背離事實。筆者依時間順序列舉幾篇持基本肯定態度的文章❇️:
劉純朝《從〈中國大學評價〉談大學的研究與發展》科學學與科學技術管理1999.8
劉純朝《〈中國大學評價〉的利弊分析及對策探討》科學學與科學技術管理2000.3
蔡言厚蘭雲李衛《完善〈中國大學評價〉的若幹建議》中國高等教育評估2000.3
蔣石梅戰英民劉新福宋敏茹《〈中國大學評價〉對大學發展的導向和促進作用-兼評〈中國大學評價———1998〉》科學學與科學技術管理2000.10
邵傳芳《科研績效指標排名對高校的影響及有待改進之處》科學學與科學技術管理,2001.10
裴雲《大學排行中文理科的權重及其導向性問題》中國高等教育評估2002.3
蔡言厚劉芳周煉《進一步完善〈中國大學評價〉的若幹建議》中國高等教育評估2002.4
蔣石梅曾珍香戰英民劉新福《〈中國大學評價〉六年改進述評》科學學與科學技術管理,2003.4
上述作者分別來自江漢石油學院💥、中南大學𓀚🪴、河北工業大學🤟🏼、上海交通大學👨🏻⚕️、廈門大學等校。劉純朝認為:《評價》“對推進中國大學的研究與發展水平產生了較好的導向作用”、“是一個成功的範例”。蔡言厚🤜🏻、蘭雲👃🏽、李衛說“筆者是持基本肯定態度的,並認為盡管《中國大學評價》還需要不斷完善,但一次比一次進步,經受了實踐的檢驗,得到社會的認可。”邵傳芳說:以“《中國大學評價》為代表的民間大學評價🚢,在連續多年反復商榷、不斷修改和完善指標體系和指標權重的基礎上🕺🏿,其大學排名已經與教育部門掌握的綜合情況較為吻合,逐步得到各大學的重視和認同👩🏻🦳。”裴雲則以《大學排行中文理科的權重及其導向性問題》整篇文章為《評價》的文理科權重作了辯護。蔣石梅、曾珍香、戰英民、劉新福在總結了同行專家的評論意見後寫道“武書連主持的大學評價得到了多數評論者的認可,不少學者提出了建設性意見,其中可操作部分都已被該課題組采用🕞。”
在我國,自1987年中國管理科學研究院發布第一個大學排名開始,16年來,每當出現一個大學排名,總是伴隨著對名次不滿意的大學的強烈的反對聲,而鮮有贊成者😆。在這樣的大環境下,《評價》能得到不少評論者的肯定,筆者深感欣慰。
能不能公開上千名專家書面討論的過程
為了科學地評價中國各大學的科研實力,1997年1月開始,《中國大學評價》課題組進行了建國以來國內高教評估界最大規模的專家咨詢👨🏿⚖️,歷時6個月🧃,共有1927名專家提供了4448份書面意見🟦。專家資格為:中國科學院院士🕧、中國工程院院士、國務院學位委員會學科評議組成員🥱、國務院或國務院學位委員會審批的博士生導師。課題組當年發表的《中國大學研究與發展成果評價(節錄)》(科學學與科學技術管理1997.7)中的各項科研成果指標權重就是根據1083名專家的最後意見確定的。
《誤區》就《評價》的專家意見征詢過程提出質疑🧔🏼♀️:“所選擇的專家是如何抽取的👷🏿♂️?”“如果專家有尖銳對立的看法🦹♀️,則武氏是如何加總的?”並且提出“不能不對這一過程操作中的真實性表示懷疑”。
筆者建議《誤區》作者看看《中國大學研究與發展成果評價(節錄)》。此文有一萬多字專門敘述專家意見征詢過程。《誤區》提出的如何抽取專家🖌、如何處理相互對立的意見等👩🦯➡️,都可以在這篇6年前發表的文章中找到答案,看完之後再對“這一過程操作中的真實性表示懷疑”也不遲。以前筆者答復同行商榷時🐑,間或指出哪些質疑內容與筆者文章的實際內容有出入,但像顧海兵教授這樣對被質疑人的主要文章根本不看的評論者筆者還是第一次遇到。
《中國大學評價》的科學假設是有根據的
1997年😌,筆者以“不同類型大學的科研人員平均具有相同創新能力”的科學假設為基礎,建立了一個新的中國大學科研評價體系。《誤區》認為《評價》的科學假設“是一個虛假的前提”。《誤區》並以“任何一個國家的不同學科不可能在世界上具有同等的地位”等論據試圖證明《評價》的科學假設不能成立。
筆者用1992-1999年中國所有的綜合類、工科類、農林類、醫藥類大學自然科學研究與發展全時人員連續8年的自然科學科研成果,證明《評價》提出的“不同類型大學的科研人員平均具有相同創新能力”和“不同學科的科研人員平均具有相同創新能力”的科學假設是有根據的。之所以選用1992-1999時間段的數據👷♀️,是因為1992年以前教育部發布的數據不完整👩🦼,而2000年中國高校合並重組後,中國各主要大學的學科結構已經改變💂🏿♀️。
表一是1992-1999年我國綜合、工科❌、農林、醫藥類大學自然科學研究與發展全時人員(不含支持人員)人均科研成果得分一覽表🚸。綜合、工科☂️、農林💊🧘、醫藥4類大學分別代表了自然科學的理學、工學👨🏿💻、農學、醫學4大學科。表一的年投入人力和各項科研成果得分是1992-1999連續8年的簡單算術平均數,各項指標的數量源於教育部科技司按年度出版的《高等學校科技統計資料匯編》,指標權重源於《中國大學研究與發展成果評價(節錄)》,其中國內論文均按1分計算。
從表一可見👩🏽🍼,4類大學的人均得分十分接近🤙🏼,實際差別不超過±5%🐝。《誤區》認為《評價》的國家級獎權重偏低(只相當於兩部專著)🐐,筆者也有同一看法🧶。當筆者嘗試提高國家級獎和省部級獎得分即提高優質科研成果的得分而獲得新的人均得分時,在總得分不變的前提下,4類大學人均得分的實際差別縮小到不超過±1%🙆🏿♀️。見表一的參考人均得分。
表一直觀地證明了《評價》的“不同類型大學的科研人員平均具有相同創新能力”和“不同學科的科研人員平均具有相同創新能力”並不是一個虛假的前提🧑🏿🚒,而是客觀存在的真實反映😜。筆者之所以仍以假設對待🧖♀️🪆,是因為上述證明只是中國大學的經驗證明🧘🏼♂️,而非世界範圍內的理論證明🤳🏿。只有在理論上證明了“不同學科的科研人員平均具有相同創新能力”👨,證明了不同質的科學研究可以轉換為同質的科學研究,筆者才會不再作假設對待🐎。
《誤區》稱:“任何一個國家的不同學科不可能在世界上具有同等的地位”👨🏻🍼。這句話本身並沒有錯🧚🏻👩👩👧👦,但是它與“不同學科的科研人員平均具有相同創新能力”之間沒有必然的因果關系🌩,是性質不同的兩件事。例如:我國醫藥類大學的科研水平基本上決定了我國醫學在世界上的地位。假設因為某種原因隨機停辦其中一半的學校𓀏,那麽這些停辦大學的科研課題就會停止,我國醫學的某些領域在世界上的地位就會降低🧚🏻♂️,從而導致我國整個醫學在世界上的地位降低,但是這並不影響未停辦的大學原有的科研得分和人均得分。也就是說🤸🏻♂️,未停辦的醫藥類大學的人均得分並不因為我國醫學在世界上的地位降低而減少🥷🏿。《誤區》將不同學科的科研人員是否具有相同創新能力等同為一個國家的不同學科在世界上是否具有同等地位,是在偷換概念🧎。
《誤區》稱:“任何一個國家都具有自己的優勢學科”。《誤區》的這一觀點是錯誤的。優勢學科是就世界範圍而言的,大多數國家在世界範圍內並沒有優勢學科。以自然科學為例,以美國、英國、日本、德國為代表的少數科技大國在科學領域幾乎具有全面的優勢🚴🏼,在技術領域壟斷著主要核心技術⇢📠,多數國家特別是大部分發展中國家並沒有自己的優勢學科。
《誤區》稱:“學科之間差異正如國民經濟中不同產業之間一樣👨👨👦👦,不可能具有相同的勞動生產率或勞動均產出”。《誤區》應該知道,研究大學評價的教育學和科學計量學是與國民經濟學不同的學科,在不同的領域研究著不同的對象,不能將國民經濟學領域的現象不加分析地推廣到其它科學領域。《誤區》的這一觀點如果不是假設🧑🏿🎨,就應該先證明它👨🏼🦱,而不是先作為結論使用🫔。
《誤區》稱:“如果不同學科之間具有相同創新能力”🎣,“每年的國家科技大獎豈不是每個學科都有份?”前文已述,“不同學科的科研人員平均具有相同創新能力”是指人均能力相同,並不表示每個學科都達到了相同的學術水平🛋。我國普通高校現有自然科學類一級學科60個👨🏻🌾、二級學科244個,國家最高科技獎每年控製在兩個,即使有更多的學科學術水平基本相同,也只能選兩個🤸🏿。國家最高科技獎與人均創新能力是否相同沒有關系⛹🏻♂️。
《誤區》稱:如果“不同學科的科研人員平均具有相同創新能力”🔛,那麽豈不是“在同一學科或相同學科結構條件下🛌🏽🕴,一個學校的規模越大,其所謂的創新能力或分值就越大👖。”《誤區》又錯了。雖然學校規模與得分是正相關,但並不是相同規模獲得相同得分。上海交通大學和武漢理工大學同是工科大學,前者師資人數少於後者,但前者以94.91分列第9名,後者以30.62分列第38名。“不同學科的科研人員平均具有相同創新能力”並不排除同一學科中的不同群體有不同的創新能力,顧海兵教授只要看看評價公式就清楚了。
《中國大學評價》的指標體系是全面的
《誤區》認為《評價》指標片面🔂,“棄除了國內外公認的同行對高校聲譽的評價”🧙🏿♂️、“不僅硬指標不全面,而且軟指標完全沒有”🥵。
《評價》是“以對社會的貢獻作為唯一衡量標準”的大學評價體系。這一體系屬於目標評價的範疇⚱️,其實質是對大學主要功能的評價🧑🚀。現階段的中國大學有且只有人才培養〰️、科學研究兩個功能。《評價》的指標體系已經涵蓋了這兩個功能的所有產出項,指標體系是全面的。
《誤區》認為《評價》“棄除了國內外公認的同行對高校聲譽的評價”🙁,“至少存在40%的誤差”🦃。
“至少存在40%的誤差”在算術的意義上純屬算錯了,因為如果學術聲譽(高教評估界通常稱為學術聲譽或學校聲譽,筆者是第一次看到高校聲譽,本文仍稱學術聲譽)的排名與《評價》的排名一致𓀁👨👧,誤差可以等於零。學術聲譽指標是《美國新聞與世界報導》根據美國國情設計的評價美國大學的指標,即使西方國家也鮮有采用者,更談不上“公認”。例如,英國是世界第二科學大國,英國的大學排名刊登在《泰晤士報高等教育副刊》上,15個指標中沒有學術聲譽。日本是世界第三科學大國🏺,日本的大學排名刊登在《鉆石》周刊上,11個指標中沒有學術聲譽。可見👨👩👧👦🕵🏿♂️,在並不迷信美國報紙的英國人和日本人眼中🤏🏿,學術聲譽指標並不重要🔳,重要的是根據本國國情製定出符合本國實際的大學評價體系。中國有自己的國情,中國大學評價的指標設置也沒有必要以美國一家報紙的標準為標準。大學評價要允許有不同的指標體系,允許不同的思想、不同的評價方法存在。認為沒有學術聲譽指標就“至少存在40%的誤差”在國內外都找不到證據🥳。
《誤區》要《評價》增加的一些軟指標😙,如“學校的財政狀況(學生人均)💇🏼♂️、學生滿意就職率、社會認可度、校友滿意度”等⛰,基本上來自《美國新聞與世界報道》的指標體系。美國的這家報紙對指標的選擇有自己的考慮⤵️。《評價》作為目標評價🧘🏻♀️,沒有必要再增加軟指標。如果什麽指標都用美國報紙的,不如直接請美國報人來給中國大學排名。
《中國大學評價》的指標權重是符合實際的
《誤區》指責《評價》“粗暴地把高校教員的人力總投入分為人才培養投入(57.09%)與科學研究投入(42.91%),並以此作為評價的權重。”《誤區》並稱“以筆者估計,中國高校教師實際用於研究的時間不少於全部勞動時間的75%。由此可以認為,其評價至少偏差30%❣️。”
筆者第一次確定人才培養和科學研究權重的時間是在2000年🤳🏽👷🏿,所用數據截止1998年。有關依據和操作過程簡述如下🌖:
1999年,教育部在《1998年全國教育事業發展統計公報》中發布的全國普通高校專任教師總數為40.72萬人🏐;在《1999年高等學校科技統計資料匯編》和《1998年全國高等學校社科統計資料匯編》公布的全國普通高校研究與發展全時人員共計16.88萬人;在《1998中國教育統計年鑒》公布的中國各大學科研機構人員共4.31萬人。16.88萬研究與發展全時人員減去4.31萬科研機構人員,其差12.57萬人就是各大學上報教育部的專任教師從事科研的工作量或工作時間🗑。40.72萬專任教師總數減去12.57萬人等於28.15萬人,這28.15萬人就是中國大學專任教師從事教學的工作量或工作時間。因此💒,1998年中國普通高校實際從事教學的全時專任教師與當年從事科研的研究與發展全時人員人數之比是28.15∶16.88,百分比為62.51%∶37.49%🏋🏼♀️,指標權重為0.6251∶0.3749。這就是《評價》一級指標權重分配的來源,已發表在《中國大學評價———1998》中,引用的資料已列入各年度《評價》的參考文獻📋。
上述教學與科研人員的比例包括專科學校🍄🟫,如只統計本科大學👩⚕️,教學與科研的指標權重會有一些變化。例如🤞🏻,2001年中國本科大學教學與科研人員之比為0.5709∶0.4291。
可見🛌,《評價》是根據教育部公開發布的專任教師數和研究與發展全時人員數🔱,統計出中國大學的教學與科研權重分配的,該權重實際是中國一千多所大學對本校教師各類工作時間統計的結果。《誤區》指責筆者“粗暴”地確定指標權重🤏🏻、“武氏的評價至少偏差30%”是毫無道理的。
《誤區》又指責筆者“粗暴地把理科師生與文科師生的8比2之數量之比🫴🏻👷🏿♂️,作為自然科學研究與社會科學研究的權重🧑🧑🧒🧒,還美其名曰客觀反映高校實際情況”。
前文所述🧎🏻,《評價》是根據“不同學科的科研人員平均具有相同創新能力”的科學假設確定各學科門類的得分的。依據這一假設,中國大學各學科門類中同等數量的科研人員得分相同,不同數量的科研人員得分不同。2002年中國普通高校理科全時科研人員與文科全時科研人員人數之比約為8∶2,當年理科博導與文科博導人數之比也約為8∶2🧔。在這樣一個比例下⛷,中國大學理科總得分高於文科總得分是正常的。中國大學設置專業、增加編製都需要政府主管部門批準,因此文理科師資人數的比例實際是政府行為🧑🏻🦱。
《誤區》反對《評價》按人均得分相同計算自然科學和社會科學的總得分。在《誤區》看來,既然自然科學和社會科學同等重要🌬,因此不管人數相差多少倍,自然科學的最高得分都應該與社會科學的最高得分相等,否則就是權重失衡。
問題是,大學評價只能客觀地反映中國高校的實際情況🧙♂️🤵🏻,而不能改變和偽飾這種情況。理科與文科的實際比例是8∶2,在《評價》中就只能記載為8∶2,而不能記載為5∶5👨👨👦🧑🦯。不能因為看著不高興、不滿意而去改寫它。只有這樣,提供給社會公眾的信息才是準確的👷🏻♂️。《評價》實事求是地將自然科學與社會科學的科研總得分按人數之比確定為8∶2,《誤區》認為權重失衡👩🏼🎤。假設一個國家自然科學與社會科學人員的比例不是8∶2,而是80∶2,即這個國家已經將文科置於可有可無的境地。按照《誤區》的理論,文科最高分與理科最高分仍然應該相等,絲毫看不出這個國家文科弱🚴🏽👩🏿🎤、理科強。但是在《評價》中,就能清楚地看到這個國家文理科投入的失衡,提醒社會加強文科建設❤️🔥,增加文科投入。中國社會是需要《評價》這樣的真實反映各學科現狀的大學評價📹👲🏽,還是需要《誤區》那樣的為了增加文科得分而掩蓋現實的大學評價呢👢?當然是前者。
廈門大學高教所裴雲先生在《大學排行中文理科的權重及其導向性問題》中對《評價》的文理科權重作了分析。他寫道:“大學排行中關於文科得分低、理工科得分高的狀況是很正常的👵🏿,是符合實際的,大學排行榜對大學進行了正確的評價⚡️。”“大學排行榜正確地揭露出中國大學的這種重理輕文狀況,不僅不會對大學決策者起誤導作用———如果大學排行榜將文理科的比例搞錯了🧑🏿🦲🏃🏻,才會產生深深的🧶、更大的誤導———還會起到一種警示作用,還會從大學排行榜中🏞🧑🏽🦲,使高教界看到,文科的得分如此之低⚂,而想方設法對這種狀況進行改進!事實上,正是通過大學排行在內的許多形式,當前我國大學重理輕文的狀況已經引起了許多學者的註意😙🤥,這就是大學排行的貢獻之一👨🏽✈️。如果要說導向性🦹♂️,大學排行在這裏起了引導高教界對我國文理科現狀進行思考❗️、設計方案🏍🍽、改進的效果!這是一種良性的導向🏋🏻♂️!”
《中國大學評價》是公正的大學評價
《中國大學評價》是客觀公正公開的大學評價👨🚀,她的信度是由可重復檢驗保證的😊。但是《誤區》認為,由於《評價》沒有把科學道德納入評價體系,因而背離了公正。
《誤區》稱🔈:武漢大學“哲學系有關教授在湖北社會科學的優秀成果獎評選過程中有運作不公或運作不公之嫌疑”,因此把武漢大學“列入哲學第1名是值得質疑的”🦉🖱。
筆者認為,《誤區》提出以“或運作不公之嫌疑”而取消武漢大學的哲學第一名是不能接受的🧑🏻🦼➡️。因為這明顯屬於有罪推定🕵🏿。對於《誤區》提出的武漢大學哲學系的事情,湖北省社科優秀成果評獎辦公室已經發表了否定聲明,此事已經了結⛹🏻♀️。一個評價體系如果走向以嫌疑論罪、走向有罪推定是很危險的🧜🏻♂️。
《誤區》又稱👩🦼➡️:由於北京大學社會學教授“王銘銘的低劣學術道德及北京大學的處理之輕”,而“將北京大學列入社會學第1名🧑🏼💻、社會科學第1名是不公正的”。
筆者也認為北京大學對王銘銘教授的處理輕了。但是《評價》是以產出排名的🧠,北京大學的社會學🎧、社會科學在相同專業中產出最高🤦🏼,理應第一名🤏🏼🐭。《評價》不能因王銘銘教授個人的問題株連北大社會學其他教師。認為北大處理輕了,已經不是北大社會學、社會科學兩個專業的問題了🏃♀️,而是北大的整體問題了,總不能因為包括筆者和《誤區》作者在內的一部分人認為處理輕了就降低北京大學的整體名次吧📚。
退一步講,就算把科學道德列入評價體系,也應該對各大學一視同仁。在《評價》中,中國人民大學獲得經濟學第一名,《誤區》對此沒有異議。但是,如果真把科學道德列入評價體系💠,中國人民大學的經濟學第一名也會被質疑的。因為人大教師有多人在經濟學領域一稿多投、重復發表論文,其中也包括顧海兵教授👍🏼。
人非聖賢,孰能無過。把科學道德列入大學評價體系✡️,將大學評價變成人人自危的東西,筆者不能為👨🏻🍳。
版面所限🛏,不能展開,不能盡言,甚為遺憾🙆♀️。
《科技日報》