中國海洋大學(xué)在國際語言學(xué)研究領(lǐng)域取得新進(jìn)展
http://m.bossanovawear.com  2025年6月30日  來源:華禹教育網(wǎng)

  近日,中國海洋大學(xué)二語習(xí)得跨學(xué)科研究團(tuán)隊(duì)成員劉穎穎副教授在國際語言學(xué)頂刊Computer Assisted Language Learning(《計(jì)算機(jī)輔助語言學(xué)習(xí)》)發(fā)表論文“Enhancing GPT-based automated essay scoring: the impact of fine-tuning and linguistic complexity measures”(強(qiáng)化基于GPT的寫作自動評分:微調(diào)與語言復(fù)雜度指標(biāo)的影響)。

  該研究探索了大語言模型在寫作自動評分領(lǐng)域中的應(yīng)用,探討了其可靠性、準(zhǔn)確性及公平性等問題。研究采用預(yù)訓(xùn)練人工智能大語言模型,對母語為漢語、法語、德語、西班牙語的二語學(xué)習(xí)者的英文寫作進(jìn)行自動評分,對比了微調(diào)大語言模型、語言復(fù)雜度指標(biāo),以及兩者相結(jié)合等三種方式在自動評分上的表現(xiàn),揭示了微調(diào)技術(shù)與語言復(fù)雜度指標(biāo)在寫作自動評分中的作用。

  研究發(fā)現(xiàn),微調(diào)大語言模型與人類評分者具有較高的一致性,能夠較準(zhǔn)確地評估中、高水平作文,但在低水平作文評分時(shí)準(zhǔn)確性偏低,反映出訓(xùn)練集內(nèi)低水平樣本不足所導(dǎo)致的類別不均衡問題。此外,大語言模型的評分結(jié)果普遍高于人工評分,且針對不同一語背景寫作者的作文,評分準(zhǔn)確度存在組間差異。分析顯示,“微調(diào)大語言模型+語言復(fù)雜度參數(shù)”的復(fù)合模型在三種方式中表現(xiàn)最優(yōu),但相較于僅使用微調(diào)大語言模型,優(yōu)勢并不明顯。本研究展現(xiàn)了生成式人工智能在二語寫作測試中的應(yīng)用前景,并為該領(lǐng)域的后續(xù)研究提供了有益參考。


      由左至右依次為劉穎穎副教授、綦惠磊同學(xué)、陸小飛教授

  論文第一作者為中國海洋大學(xué)外國語學(xué)院劉穎穎副教授,共同第一作者為中國海洋大學(xué)外國語學(xué)院2024屆本科生綦惠磊,通訊作者為美國賓夕法尼亞州立大學(xué)陸小飛教授。Computer Assisted Language Learning為SSCI、A&HCI雙索引期刊。根據(jù)科睿唯安(Clarivate)期刊引證報(bào)告,該刊近三年(2022年至2024年)在語言學(xué)SSCI期刊中排名穩(wěn)居前三位,被中科院2025年期刊分區(qū)表列為1區(qū)Top期刊,在國際學(xué)術(shù)界享有較高聲譽(yù)。
 關(guān)于中國海洋大學(xué)更多的相關(guān)文章請點(diǎn)擊查看 

特別說明:由于各方面情況的不斷調(diào)整與變化,華禹教育網(wǎng)(m.bossanovawear.com)所提供的信息為非商業(yè)性的教育和科研之目的,并不意味著贊同其觀點(diǎn)或證實(shí)其內(nèi)容的真實(shí)性,僅供參考,相關(guān)信息敬請以權(quán)威部門公布的正式信息為準(zhǔn)。