「人工智能比人快」
大語言模型ChatGPT進入香港的大學後,自稱「小語言模型」的王浩一度感受到存在主義危機。他是香港浸會大學文學院語文中心的講師,精專語言教學。
ChatGPT在2022年末的面世,令全球學界出現一系列「膝跳反應」。一些人相信生成式AI將重塑教育界,過度擔憂會箝制技術的創新發展和應用。但也有不少學者表達了憂慮,包括生成式AI對學術誠信的侵蝕、導致認知能力和批判性思維下降、提供錯誤資訊、加劇偏見和歧視等等。
香港大專院校、英國牛津和劍橋大學、以及美國公立中小學系統都在2023年初提出封鎖ChatGPT的政策。香港大學是香港第一個做出封鎖動作的大學,該校教與學創新中心的陳嘉玉教授回憶,校方當時並非想永久封禁使用ChatGPT,而是認為需要時間籌備硬件、平台和應用新技術的知識等。
2023年6月,港大教務委員會通過就教與學使用生成式AI的全面政策。港大與微軟談好合作,創立校內系統接入ChatGPT,一系列針對使用生成式AI的政策陸續出爐。港大在新政裏指,掌握和應用生成式AI是學生須具備的重要能力。
在9月開學季到來之前,陳嘉玉和同事奔走於各個學院宣傳。她記得醫學院很踴躍,社會科學專業的老師會打電話來和她商量,要怎麼調整教學評估的過程。
2023年夏,香港各大院校幾乎都採取類似策略,與微軟合作推出自己的校內系統,一般會限制指令數量。陳嘉玉認為,由校方推出校內系統,是為了保證學生使用新技術的平等性。
一個大背景是,谷歌、微軟和OpenAI均限制香港用戶使用其生成式 AI工具。以OpenAI為例,它將香港、中國大陸、北韓、敘利亞和伊朗列為限制訪問的國家和地區。因此,不少香港人使用Quora推出的平台Poe(Platform for Open Exploration),它不用翻牆,整合了包括ChatGPT、Midjourney、Claude等熱門聊天機器人。據網絡流量分析網站Similarweb數據,2024年2月,香港是全球最多人使用Poe的地區,佔總流量逾25%。
如果說ChatGPT剛問世時,教育工作者對此還充滿猶疑,那麼一年半後,他們中的不少人都意識到,使用這項新技術意味著冒險,但視而不見或許會有更大的危機。
無論如何,學生們已躍躍欲試。2024年1月,英國獨立智庫HEPI發布首份英國學生使用生成式AI的研究結果。從1200名本科生樣本可以看到,超過53%的學生使用生成式AI幫助他們應對評估,還有63%的學生用來解釋概念、54%的學生用來提出研究想法、53%的學生用來總結文章。
文章抄襲檢測工具服務公司Turnitin最新數據亦顯示,過去一年, 他們審查逾2億篇主要來自高中生和大學生的論文,其中11%、即2200萬篇論文中,有20%的內容包含AI撰寫的語言,另有3%的論文內容中滲入高達八成AI寫作。
南加州大學新聞及傳播學院助理教授 Mike Ananny 認為,我們需要將生成式AI視為一種快速新興的語言術,「人們可以用它來學習、理解自己的世界以及與他人溝通。」
掌握AI基礎知識和倫理的重要性被不斷強調。在美國伊利諾大學厄巴納-香檳分校教授英語和資訊科學的Ted Underwood,將學生學習AI倫理基礎知識形容為學習民主原則——就算不追求研究政治學的人,也需要理解民主。
陳嘉玉認為,對生成式AI的教育要從五個方面入手,包括AI概念、應用、情感識別、安全與保障和負責任使用。她剛被任命為聯合國教科文組織高等教育未來準備能力(future readiness)和人工智能素養首席專家,在港大教育中心工作超過15年,是教育學院的教授。
在港大推出基本政策和平台後,陳嘉玉也在思考ChatGPT要如何具體應用在不同學科中。一些已經存在的原則,可能會在使用新技術的興奮中被忽略。例如社會工作專業,若同學將個案的資料放到ChatGPT中分析,會違反紀律;有些具有個人隱私資料的文件,若要上傳到ChatGPT,也應該先遮蓋相關內容。
師生會否積極使用生成式AI,很大程度取決於機構有沒有提供支援和指定政策。英國教育部2024年1月發布報告《生成式人工智能在教育中的應用》,受訪教師指出他們獲得生成式AI資訊的主要來源是社交媒體,而非從工作場所培訓。上述HEPI報告亦顯示,有63%的受訪者認為其機構對人工智能使用指定了「明確」的政策,但僅有22%的學生認為他們在獲得人工智能的支援上感到滿意。
陳嘉玉認為,AI素養如同韌性、批判性思考等,應成為教育中重要的軟技能(soft skill)。港大也推出一門針對AI素養(AI literacy)的線上課程,截止2024年3月,全校近4萬名學生中,約1500人完成了該課程。
「目前ChatGPT就像一位頗有能力和潛力的同事,但還沒能融入團隊和工作流程。」在教學中積極使用ChatGPT的王浩說,生成式AI與大學教育的結合,還在一個「很初級的階段」。
「是需要時間的,只不過這個人工智能是比人快的。」陳嘉玉說,「永遠都會有一班實踐的人(community of practice),有一班擁護者(champion),也有一班人會慢一點。要分批慢慢做。」
如何在教學中有效使用ChatGPT?成為這項技術在教育場景落地的第一關。
受訪的幾位老師在課上總會再三強調,不能將ChatGPT當作資料搜尋器。在李祖喬看來,提示素養(prompt literacy)——即與機器溝通的語言能力,是很重要的教育。他是香港恆生大學社會科學系的講師,專注於社會和文化研究等領域。
在課堂練習中,李祖喬嘗試推動同學用ChatGPT尋找一些資料,即場分享給大家。這是要同學鍛鍊運用AI的讀寫力。有的同學不太擅長提問,在與ChatGPT對話中,可以練習收窄提問範圍、更替詞語和提問的方式等。「以怎樣的方式問,才可以問到有意思的答案, 同時又不能假設這是最後答案。」李祖喬說。他也曾嘗試自己準備好一些問題,讓同學們放進各自的任務中去問ChatGPT,再一起看不同組別的效果。
正在香港攻讀人文學科碩士學位的易瀟就在不斷嘗試中,摸索到如何更高效地向ChatGPT發指令。他此前在英國留學,擁有媒體研究的碩士學位。
使用ChatGPT潤色論文前,易瀟很擔心機器潤色得僵硬、機械,「我們這種學科要照顧語言的可讀性,很多東西會在語言變硬的過程中流失。」他說。
ChatGPT抹去了他的疑慮。易瀟發現,論文的語言的確被修改得更好了,機器人彷彿能讀懂作者的意識,強化作者的情感。不過,由於修改指令籠統,使得學術語言被改得過於活潑,也有些脫離原意。他試著縮窄指令,把需求表述得更清楚和細緻。例如說明他是非英文母語者,想要修改語法錯誤,調節語言的連貫性,也請ChatGPT幫忙做文字分段,以提升語言的節奏感。修改指令後,ChatGPT給出了更好的版本。
易瀟認為,國際學術圈的語言中,英語是霸權,AI可以幫助修短板、彌合差距。但「喜悅之外也有恐懼」,他說,「 我會擔心人類的語言或者寫作能力本身 ,是不是也被威脅了?」
學術寫作變得更平等了嗎?
語言教學工作者王浩認為,人類多年累積的文明、創造的價值,以文字的方式保留下來,被餵養給機器,「現在或許沒有100%,但做到了10%,已經很厲害了。」王浩說,「主要就是generate human like text(生成類似人類輸出的文本)的那個功能,寫出來的東西非常好。」
王浩也曾被外國學者邀請參與ChatGPT相關的研究測試。參與者要判斷一段學術摘要是由人還是AI書寫,「我真的分不出來。」王浩感嘆,「機器和人寫的肯定有區別。但我感覺在某些層面上,可能比人還厲害。」
王浩的語言課以寫作項目進行。針對香港政府的政策或公共議題定下主題,學生研究議題後要提出自己的觀點,針砭時弊,最後寫就一篇文章刊登在《南華早報》。
在這個項目上,王浩嘗試進行人機結合的實驗。他一般使用Poe的ChatGPT-4,並專門定製(customize)聊天機器人,設置兩個人物進行對話,一個角色為某個固定專業的學生,另一個角色則是老師。向對話框投入一則新聞和相關背景後,王浩發出要寫一篇文章的指示,繼而要求列出觀點、大綱,兩個角色便輪流做出回應。在整個過程中,王浩也會將事先準備好的內容餵給機器人,以此調整內容方向。
在進行一番對話後,機器人生成一篇文章。王浩刪去其中缺少證據支持的內容,又做了些微修改後,文章定稿。「最後的版本是互動形成的」,王浩展示了一篇文章的形成過程,只花了30分鐘。
有時ChatGPT也能提出王浩沒想到點子。例如在一則關於長者搭乘公共交通優惠計劃的文章中,王浩先把一些新聞素材餵給機器人,並在提示語中給出自己的觀點,ChatGPT不僅將提示語中的觀點轉化為流暢的文字,還提出王浩原本沒想到的觀點。
機器人成為思考夥伴,帶來一種新的互動寫作體驗和思維方式。「這裏面涉及到,人機合作時,人和機器各自扮演什麼角色的問題。」王浩說,「人可以做high level的事,機器來執行。」
王浩認為,雖然人類在吸收數據的量和效率上比不過大語言模型,但人擁有的優勢是,對語境更有判斷力。「大語言模型是在那裏回答你給的問題,不了解關鍵問題就沒法回答。」
他續指,王浩認為,生成式AI真正能改變格局的能力,不是作為搜索引擎回答問題或產生一個主意,「它可以像一個人去提出問題,然後跟我展開一個討論。它是一個推理引擎(reasoning engine),你要提供東西讓它來處理,而不是坐在那裏等它給你東西。」
在王浩看來,生成式AI可以卸去一些認知負荷(cognitive load),即那些有能力做、但不太有意思的事。他更享受的是通過一些社會現實或問題,生發出有助於幫助解決問題的想法,「對我來說要坐在那裏敲出來一段話,不是那麼令人興奮。」
李祖喬也認為,ChatGPT最有用之處,是幫助進行廣義上的日常生活創作。例如在腦中決定做一件事的時候,先構想一個主題,詢問ChatGPT後獲得一些步驟的框架,以此加快確定自己的觀點。
生成式AI在寫作中的運用,也促使王浩思考寫作教學的模式要如何調整。如果有的學生擁有獨到觀點,但對語言的駕馭能力有限,寫不出漂亮句子,掙扎於表達的過程,那麼AI是不是能讓這樣的學生更有機會表達他們的想法?王浩認為,就這個意義層面來說,ChatGPT是equalizer(使人平等的工具)。
但科技的應用總是存在一體兩面。易瀟認為儘管ChatGPT可以幫助對抗學術語言的霸權,但也可能複製不平等,「哪些人可access(使用),或者真的懂得如何使用,裏面有很多gap(差距)。」
易瀟曾向一同做小組作業的同學推薦使用ChatGPT來潤色語言,但他發現對方的文字反而出現了添油加醋的效果。他猜測同學不太會寫指令。「如何可以發揮到這個工具最大的潛力,這裏面有很多divide(區隔),還不用說有些人連這個工具都不知道。」
在香港之外,一些人正在嘗試通過生成式AI降低學習成本、促進社會流動。根據The Atlantic報導,最熱情的人工智慧使用者往往是公立大學或社區學院,他們為龐大、多樣化的學生群體提供服務。比如,亞利桑那州立大學在一門寫作入門課上試行,由人工智能機器人對學生課業提供反饋。這門課程用低價格向遠程學生授課,機器人也可以按照學生自己的上課時間表,提供類似同伴反饋的服務。
需要重新回答:你希望學生學什麼、如何評估他們的能力
在2023年2月,王浩第一次進行人機合作寫作的嘗試時,告知報章編輯會使用ChatGPT,並將對話過程截屏發給對方。這個作法獲得正面反饋。這篇文章刊登的版面上,也標註了有ChatGPT參與。王浩認為這是一次里程碑式的作法,證明業界可以接受ChatGPT參與寫作。
在王浩看來,儘管目前大學在禁止用ChatGPT寫論文或寫文章上已形成基本共識,人機合作的寫作實驗依然顯示了未來的趨勢,對教授語言課的老師更是一種訊號:若在報章上的文章都允許有生成式AI參與,那麼大學內的論文為什麼不允許呢?
王浩相信,目前做machine learning研究的還是小群體,而大部分教育工作者都在做human learning。要迎來人機合作的未來,「很需要讓machine learning 和 human learning兩個範疇的專家更多交流。」
此外,在這背後有一個更重要的討論是,寫作技能代表著什麼?是一種評估手段,還是交流方式?王浩認為,目前在大學裏寫文章,不是為了溝通想法,是為了展示學習能力或在課堂中的表現。「要想清楚你到底希望學生學什麼,應該表現出什麼能力,可以拿到學位。」王浩說,「生成式AI就像一個放大器。教學中的很多做法,生成式AI可以幫你做simulation(模擬),前提是你的教學方法經得起推敲。」
機器可以協助學生表達、減少文字耗時的苦勞,但在這種情況下,技術會不會讓應在教育中奠基的「基本功」變弱呢?
李祖喬理解這種擔憂,但他認為教育應既可以「從基本功步向成熟的思維」,也可以令學生通過貼身興趣而帶動,使人成為某類自己想成為的專家。
「所謂『表達』 固然重要, 但訓練人表達,是否總是要問教科書的定義,然後用論文格式?太重視這點,會扼殺年輕人的創造力。」李祖喬說,文字弱但因為看Youtube、使用AI而成為一些領域的專家,已經是這個時代很多年輕人的路徑。他看到,要打磨影片,所需要的剪輯、研究的技藝也比一些文章更複雜,「大學教育應該對不同的表達技藝更開放。」
「身為人文社科的老師,我還是非常相信文字寫作的價值,因為它最能表達人運用理性去回應自身處境的辨證思維和矛盾心理,也覺得寫字是無法代替的。」李祖喬說,「我們也要有一定的開放程度,使學生可以接上全球化下不同種類的技術和產業。」對他而言,學生要培養的是研究精神,「即每事問到底,未到底時要存疑,同時不用急於表達的狀態。」
而大學這個空間最大的特色,是「帶著研究精神去學習」。「大學有時不一定需要創新的,可以是守住傳統的, 兩者都重要的。」李祖喬說,「我最相信的是『研究精神』,即不是做學術研究員,而是做每件事——寫business proposal(商業提案),去旅行,玩不同技藝——都想研究如何做得更好。」
王浩則熱切關注大學什麼時候修改評估方法。目前,一些微小的改變正在實踐。
李祖喬就曾嘗試調整檢測方式。2023年3月,在一次文化研究導論通識課的期中測驗中,他與學生提前溝通好,可以用電腦並使用ChatGPT作即場考試的工具。這門課的學生大多來自商科。李祖喬參考了美國賓州大學管理學副教授 Ethan Mollick 在教學中融入ChatGPT的經驗。
「我的想法是,我們正面臨一個全新的教育情境,既要用新科技, 又要確保同學的成績公平。」李祖喬強調,簡單使用ChatGPT答案會得到低分,以此確保公平。
另外,測驗內容也有所轉變,不再考教科書定義。他給出一條新聞短片,讓學生們應用課堂所學的文化研究概念來解釋短片。學生也可以使用ChatGPT修改英文答案的文法。李祖喬指出,這個測驗的重點是分析閱讀影片的能力,以及應用概念解釋片段。
這次測驗中,李祖喬觀察到同學們很努力應用ChatGPT和Google完成測試,同學們後來反饋這是不錯的考核經驗。「當然,這很視乎究竟是什麼課堂。剛好文化研究是考觀察力、自由思考和創作的學問,我才有空間和同學做實驗。」李祖喬說。
香港恆生大學公共政策研究中心副主任鄧鍵一也因應調整了對學生的考核標準。他教授研究方法(research method)課程,以前執著於學生交上來的研究假設是否寫得清楚,但那些條條框框稱得上八股。在ChatGPT可以幫忙整理好格式的情況下,鄧鍵一更看重「想問的問題從哪裏來」、是什麼令學生產生好奇心。這個學習過程中,學生可以將更多精力投注到自己與世界的關係中。
不過,這個思考過程也可能通過ChatGPT偷懶。鄧鍵一現在收到研究計畫或文獻綜述,有時能察覺那並非來自本科生的手筆。以前有的學生會想了解他人怎麼看「毒L」(指欠缺異性緣的男性),或是有的人為什麼喜歡放閃,「你會知道那件事來自於生活。」鄧鍵一舉例,現在可能會收到有人想了解什麼因素導致心理健康好壞的題目,「可能是因為社會上的心理健康問題很嚴重,但當你收到六七個人都做同一個題目,你就知道這個題目可能是ChatGPT給的。」
老師在考核中也會更注重多方面因素,「可能intro寫得一般、有語法錯誤,但會看authenticity(真實性)多一點。」鄧鍵一說。
新時代與舊問題
當許多人都想踏進這股新潮水時,有的人則警惕地站在岸邊。鄧鍵一發現,身邊的同事有些兩極,有的老師更注重背誦定義,便回到更傳統的、centralized(集中式的)的考試方法。