Aha|顧遠:對於創新教育的評價,要拋棄下意識裡的工業時代思維

如何建構合適的創新教育評價體系?

--

本文授權轉載於Aha社會創新學院,繁中整理授權於翻滾海貍

Photo credit: @mari

(本文根據Aha社會創新學院顧遠在前不久舉辦的第五屆「中國教育三十人」 論壇上的發言整理而成,內容略有增補。)

楊東平老師邀請我來參加這個論壇時,他跟我說的是讓我點評前面的幾位元講者發言的內容,來了以後我才發現已經給我定好了題目,變成演講了,所以我沒有PPT,和大家即興地分享一些關於「創新教育的評價」我的一些思考。

前面楊老師分享時提到了芬蘭的例子,芬蘭的教育世界第一,而芬蘭的學生並不像我們的學生學得這麼辛苦。坐在我旁邊的一位夥伴聽到這兒就問了我一個問題:「你說為什麼芬蘭的教育世界第一,而芬蘭的綜合國力卻並不是世界第一呢?」 我覺得這是一個特別典型的問題,它很好地體現出了圍繞教育和教育評價人們常見的兩種「集體無意識」。

首先,這個問題的背後暗含了一個假設,就是教育的目的是為了提升綜合國力。

Photo credit: @angeloabear

我們不排除從政府的層面或者對某些教育機構而言,這個假設可能確實成立。同時,我們也應該意識到,不同的教育主體和利益相關方對於教育的目的經常是不盡相同的。有人認為教育的目標就是「吃得苦中苦,方為人上人」;有人認為教育是為社會主義培養接班人,為民族復興積蓄力量;有人認為教育應該是培養一個個活潑潑的人……對芬蘭而言,很可能人家更在意教育是否能提升國民的幸福指數,然後順便也提升了在PISA考試中的成績。而後者,僅僅只是實現真正目標過程中的副產品。

於是,這就讓我們意識到了另一個「集體無意識」。芬蘭教育「世界第一」這個不假思索的說法是怎麼來的?

原來,它指的是芬蘭在PISA考試中的成績世界排名第一。我們一方面不斷地引用芬蘭的教育實踐來展示教育創新的多種可能性,來為我們打破應試教育的努力尋找啟發,另一方面卻仍然把它在一個標準化考試中的排名當作它的教育成就的證明。我們是否意識到了這其中的矛盾之處?

對教育的評價是很難的,哪怕是看起來非常簡單的內容。

比如電腦課上學了打字,想測評一下學習效果,聽上去足夠簡單了吧。但是測評的是速度還是準確率就不一樣,更不要說還涉及到輸入文本的難度,在不同干擾環境下的表現等。評價應試教育好歹還可以用考試的分數來衡量,評價非應試的創新教育就更複雜了。

此時,我想分享自己的一個核心觀點:

關於教育的評價我們應該拋棄在下意識裡的工業時代的思維,這種思維讓我們總是想要找尋到一種「標準的、精確的、固定不變的」評價體系;

我們應該意識到教育評價是科學和藝術的平衡、精確和模糊的平衡、主觀和客觀的平衡,並且評價過程本身伴隨著真實的學習歷程,是動態的,而非靜態的。

任何的教育評價都不是孤立存在的,而是服務於特定的教育目標,目標不一樣,評價的內容、方式、主體等都會不一樣。

比如現在學校都會重視讓學生掌握一定的電腦應用能力,但不意味著教學目標就是一樣的。「說明學生熟練地使用數位產品」和「說明學生借助數位產品來進行創造」顯然是兩種不同的目標。

總體而言,教育創新的趨勢在教育目標上表現為越來越以學習者的個人成長為中心,幫助學習者發現和發揮自身的潛力,獲得終身幸福,並成為一個積極的公民。

進而,任何的教育目標總會落實到具體的教學內容上。

我發現做創新教育的人在設計各自的教學內容時一般是四個來源,當然這些來源往往相互交叉。

一個來源是國家的課綱,規定好了各個階段學習者應該掌握的內容。

一個來源是所謂的「威脅論」,典型的如AI威脅論,我們要學習什麼取決於什麼是AI不能做只有人才能做的,否則我們以後的工作就要被AI搶走了;還有國家競爭威脅論,國民要學習什麼取決於在國際競爭中要獲得怎樣的優勢。

一個來源是學術上的實證研究,比如前面一位講者分享的「創新素養」框架,就是依託於一些學者對這個問題的實證研究得出的結論。有必要提醒一句的是,對某一個問題的學術研究往往存在多個競爭性的理論,不可太過迷信某一個理論,而科學進步就是在不同理論間的競爭中發展的。

第四個來源是做創新教育的那個人自己。很多小微創新學校裡,創始人都有自己特定的教育理念,可能出自某種信仰,可能出自某個理論體系或者流派,也可能是很個人化的研究和實踐經驗。

※「小微學校」指的是規模小、創辦時間不長的學校

總體而言,教育創新的趨勢在教學內容上表現為越來越從傳授「事實性知識」轉變為「培養學習者的核心素養」。

不同的教學目標會側重不同的核心素養。現在有很多的機構提出了各種各樣的核心素養框架,彼此之間有相同的地方 — — 比如常見的4C核心素養;但也有很多不同的地方,即便是同一個素養之下包含的內容也未必完全一樣。所以我們不要去指望有一套標準的、適用於一切目標的素養框架會出現,同時,在應用某一個素養框架時也要能明白其來龍去脈才能有效實踐。

測評方式可能是教育評價體系中人們最容易感受到也最受抨擊的地方。

應試教育的測評方式一般就是標準化的考試,而且只能獨立完成,不能和其他人商量,不能借助外面的工具,不能用網路查詢,還只能用筆寫。而我們又期待這些學習者在從學校畢業以後能夠表現出良好地與他人協作的能力,能夠熟練應用數位產品,能夠有很好的網路素養、資訊素養……這豈不是很矛盾嗎?

總體而言,教育創新的趨勢在測評方式表現為越來越多元,越來越與不同的學習方式相互匹配。

比如現在很流行的項目式學習(PBL),常見的測評方式就是專案的最終成果展示和過程中的學生自我評價等。

上午有一位嘉賓在分享時提到美國做教育評價都是「結果導向」的。他還做了個類比,說就好比一隻鳥捉蟲子餵小鳥,你管它是怎麼餵的,最重要的衡量標準就是最後那個小鳥能飛了就對了。我覺得這種說法難以置信,這個類比糟糕透頂。

首先,教育的目標 — — 如我們前面所說,是多元的,不可能像小鳥會飛了那樣就是為了一種結果。

其次,老鳥餵小鳥這是個由基因決定的生物性行為,小鳥長大了餵它的下一代還是一樣動作;而教育可不是這種機械重複性的行為,教育是要幫助人發現內在動力和潛質去自我成長的,所以不可能不關注過程,只關注結果。

事實上,今天越來越多的教育測評除了測最終的學習成果,也會測評和記錄學習的過程,並據此來幫助學習者調整自己的學習行為和下一步的學習目標。

這個過程很類似GPS在導航時起到的作用,幫助你到達設定的目的地,在過程中隨著真實發生的情況即時地給予你回饋並調整路線。

而從更為深遠的角度來說,在我們所面臨的VUCA時代,連目的地的設定,也就是學習的目標,也是一邊探索一邊發現、不斷進化逐漸形成的,沒有一個現成的、所有人都一致的、清晰明確可以事先就能界定的目標。

※VUCA:由多變(Volatile)、不確定(Uncertain)、複雜(Complex) 與混沌不明(Ambiguous)所組成的詞彙,指的是科技創新引發產業與生活型態的變動世代。

另外,測評方式也內在的包括測評的主體。

傳統的應試教育,就是老師出題考學生。在創新教育領域,我們會看到除了有老師參與的評價,也會有學生的自評、學生之間的相互評價、社區或者其他專業人士的評價等。

說到這兒,我想起來就在前不久(10月8日),臺灣正式實施《學校形態實驗教育評鑑規範》。其中第二條內容提到了政府對實驗教育進行評鑑的原則是「協調溝通」,而不是我們在大陸常見到的「指導和規範」。同時,第三條第二款進一步指出評鑑之前要和被評鑑的機構協商評鑑的內容和形式,而不是要求後者去被動接受前者所規定的。這就更在實施細節上體現出政府主管部門對民間的創新教育的尊重和信任。同時,這也表明政府和民間創新機構都意識到──教育,特別是創新教育,是不能用一套標準化的體系去評價的,從內容到形式只能逐步在實踐中摸索。

最後,就要說到教育評價到結果用來做什麼,也就是教育評價的目的是什麼。

傳統應試教育是用一套評價標準來評價所有學生,本質上是把學生當作「產品」來篩選,所以評價的結果就是「成功」和「失敗」,其實就是「合格」和「不合格」。

Photo credit: @anniespratt

總體上,教育創新的趨勢在教育評價的結果應用上體現為越來越把學生當作「用戶」,評價的目的不是為了獎懲,而是為了幫助學習者更好地學習,不斷地改進自己的學習成果,提升自己的成長體驗。

我們都聽說過 「適性化學習(adaptive learning)」,現在還出現了「適性化考試(adaptive testing)」,根據上一道題的結果推送下一題,以便更有效地評估學習效果,也便於學生和老師根據每一步的測評來決定下一步的教學。

教育評價體系的問題目前已經成為制約教育領域創新發展的最主要的原因之一。很多關心教育創新或者正在實踐教育創新的人會積極地從網路上或者書本上搜集各種素養框架、評估表、評價工具等,一些教育機構也會展示一套看起來非常細緻嚴謹的評估框架來證明自己的教育實踐的有效性,卻往往忽略了:

一、創新教育並不存在唯一「正確的」評價體系,而只有「合適的」評價體系;

二、「合適的」評價體系由「教學目標」、「教學內容」、「評價方式」,以及對「評價方式」的應用這四點組成,並且這四點有著高度的內在一致性,相互匹配並相互支持。

各方對教育評價體系的探究正越來越深入,很多很精細的框架已經出現並正在實踐中被應用。比如Summit的學習測評系統,基於史丹福評估學習與平等中心(SCALE)的跨學科技能評估準則。這套測評系統精細到學生七大認知領域的36個具體的認知技能,每個認知技能還被細分為8個不同等級。借助這套測評系統,人們希望能夠更加精確、具體地展現出每個學生的認知能力發展程度,並幫助他們提出更加清晰的學習目標,來達到綜合指導和規劃學習的目的。

再次提醒一句,這些都只是測評系統「之一」,而非 「唯一」;並且它要真正發揮作用,一定是建立在上面我們說過的四點內容相互匹配相互支援的評價體系之中的。

在測評體系不斷走向精細化的同時,我們也不要忽略或者排斥相對主觀的、定性的、模糊的測評方式。

杜拉克在回顧自己成長歷程的時候提到過自己在小學階段遇到了人生的第一位導師艾爾莎小姐。這位年輕的女士發現了小德魯克在寫作方面很有天分,於是鼓勵小德魯克每週都寫一篇自己想寫的文章,然後給予即時的點評回饋,幫助他不斷提高寫作水準。最終德魯克的寫作天分得到了極大的發揮,他不僅是個思想家,還是個文體大家。另外,德魯克自己成年以後經常使用「回饋分析法」來助力個人成長。他每年都會給自己制定個人成長計畫,定期用實際的成果與當初的計畫做比較,借此分析出自己的長處、自己的學習方式的特點,並制定下一階段新的成長目標。

教育的「出口」對教育和教育評價的影響是顯而易見的。

人們常說教育的目標就是3C:College(大學)、Career(工作)、Citizen(公民)。長期以來,體現標準化考試的成績的一紙文憑成了教育的「出口」判斷教育成果的工具。本質而言,文憑是為了解決資訊不對稱的情況下快速篩選人才的問題。那麼如果在資訊相對充分透明的情況下,是不是可以嘗試更多其他的對教育成果的認可方式。比如小微創新學校在彼此熟識的情況下,可否相互認可彼此的學分和各自多樣的評價方式;比如企業和學校之間建立委託培養關係,用畢業生在實際工作中的表現作為教育成果的體現;再比如國外有一些以同儕學習(peer-to-peer learning)為主要學習方式的學校會向本地的高校提出要求,在錄取自己的學生時增加 「同儕證言(quote)」 作為學習成果評價的比重。

最後我想指出的是,關於創新教育的評價我們可以從其他一些地方獲得啟發。

比如企業是如何「選用育留」人才的,如何編制「素質詞典」、如何制定「人才發展規劃」的;比如幼教、特殊教育領域是如何做教育成果評價的,因為這些教育領域相對離應試教育比較遠。時間關係,我就不展開細說了。

今天這場即興發言基本上把我對創新教育的評價的主要觀點都說了,內容有點多。

如果大家只能記住三個詞,或者三句話,我希望是下面這三個:

1.目標:不存在放之四海皆準的評價標準,任何教育評價框架的起點都是教學目標。

2.平衡:教育評價是科學和藝術的平衡、主觀和客觀的平衡、精確和模糊的平衡。

3.動態:教育評價的方式回應著教學目標和教學內容,目的是為了說明學習者的成長,所以做教育創新的人應該有能力即時地動態調整自己的教育評價方式。

Aha社會創新學院

Aha,創新催生公民 教育通向自由

我們的公號文章皆為原創,探討 「社會創新、教育創業、社會投資」等主題。我們希望透過這些文章,呈現Aha在這些領域內思想的深度、視野的廣度,和對行業發展的前瞻。希望讀者們可以從中獲得實踐上的啟發,並享受閱讀和分享時帶來的快樂。

微博:新浪@Aha社會創新學院
微信:AhaSchool
聯繫郵箱:info@ahaschool.cn

歡迎幫我按 5 次免費的綠色拍手,讓我有一點點稿費可以繼續寫東西和轉載好文跟大家分享

--

--

栗子南瓜
魚水教育催化劑 To Be Educational Catalyst

致力於成為學習生態系統催化者,正在研究、設計和實踐教育創新、集體智慧、複雜/ 學習生態系統。http://fb.me/ToBeEDUcatalyst