產品分類
吃瓜動態(tài)
  • 450公裏/小時(shí),全球最快!新高鐵(tiě)來(lái)湖北了!
  • 鋼鐵行業怎麽從周期陣痛邁向耐性成長?
  • 美國“杜魯門”號(hào)航母一戰(zhàn)機墜海 — 新京(jīng)報
  • 謝娜回四川老家陪爸爸媽媽,裝(zhuāng)扮土氣又(yòu)胖又老,小肚子傑出素顏很瘦弱
  • 伊朗被突襲影響幾許?一圖整理全球產油國TOP20
聯(lián)係方(fāng)式

郵箱:admin@aa.com

電話:020-123456789

傳真:020-123456789

時尚

深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评 — 新京报

2025-06-17 16:36:01      點擊:615

深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评 — 新京报

6月8日下午,2025年高考(kǎo)英語科目考試完畢。在本年(nián)高考英語北京卷的作文標題中,李華(huá)又一次成為“主角”。

 

與此一起,這場"言語才能大考"也成為AI大模型的試金石——從精準審題(tí)到地道表達,從邏輯連接到文明適(shì)配(pèi),大言語模(mó)型能否作為“李華”完(wán)結高考英語作文題意圖共同要(yào)求?在各個大模型均已具有“深度考慮”方(fāng)式的當下,“AI考生(shēng)”能拿到多少分?對此,新京報貝(bèi)殼財經對國(guó)內外幹流大言語模型進行了測評。

 

本次測評(píng)挑(tiāo)選2025年高考英語北(běi)京卷作文標題,測評目標為DeepSeek R1、ChatGPT o3、通義千問Qwen3、騰訊混(hún)元T1、訊飛星火X1、百度(dù)文心X1六款(kuǎn)深度推(tuī)理模型產品,並約請北京市十一學校一分校(xiào)英語教師韓憲昌(chāng)、深圳中學英語教師趙文嘉參照從前高考評分標準對(duì)上述大模型生成(chéng)的英語作文打分並作點評。

 

本著客觀公正和“盲評”準(zhǔn)則,韓憲昌教師和趙文嘉教師給出了專業評分。本次參賽的六名大模型(xíng)“AI考生”得(dé)分揭曉後由高到低(dī)的排名分別為:訊飛星火 X1、DeepSeek R1、百度文心X1、通義千問Qwen3、ChatGPT o3、騰(téng)訊混元T1。

 

詳細(xì)來(lái)看(kàn),2025高考英語北京(jīng)卷作文題意圖要求為:

 

假定(dìng)你是紅星中學高三學生李華。聯合國正麵向全球青少(shǎo)年打開主張搜集活動。你的外國老友Jim計劃參與,為此發來郵(yóu)件,就主張內容問詢你的主張。請你(nǐ)用英文給他回複,內容包含(hán):

1. 提出的(de)主張;

2. 主張的理由。

提示詞:主張 proposal。

留意:

1.詞數100左右;

2.最初和完畢已給出,不計入總詞數。

Dear Jim,

______________________________________________________________________。

Yours,

Li Hua    

 

以下是將上(shàng)述(shù)作文標題要求作為提示詞輸(shū)入大模型(xíng)後,六款大模型產(chǎn)品在翻開深度考(kǎo)慮方(fāng)式,並封閉了聯網查找方式後生成的成果,以及韓憲昌(chāng)教師和趙文嘉教(jiāo)師給(gěi)出的評分和評語:

 

DeepSeek。 R1。

 


Dear Jim,

I'm thrilled to hear you're joining the UN initiative! For your proposal, I suggest focusing on promoting plastic-free campuses worldwide.。

My advice is to encourage students to reduce single-use plastics by bringing reusable bottles and bags, recycling plastic waste, and organizing school-wide awareness campaigns.。

I recommend this for two reasons. First, plastic pollution is a global crisis harming wildlife and ecosystems. Schools, as micro-communities, can drive real change by adopting eco-friendly habits early. Second, young people’s collective action can inspire broader societal shifts. Starting locally creates ripples of impact—proving our generation’s power to protect the planet.。

This proposal not only tackles an urgent issue but also unites students across borders. I believe it’s practical, impactful, and truly aligns with the UN’s goals.。

Go for it—I’m rooting for you!。

Yours,

Li Hua。

 

韓憲昌教師評分:內容7分,言語8分,結構4分 → 總分19分。

評語(yǔ):內容詳實,主張“無塑學校”詳細,理由全麵(環境危機與青(qīng)年舉動),高度相關主題。言語精準(zhǔn),句式豐(fēng)厚(複合句),無過錯。結構謹慎,邏輯(jí)流通,完(wán)畢有力。可是,顯著超字數約束,扣除1分。

 

趙文嘉教師評分:19分。

評語:該模型內容上關鍵都有提及,進行(háng)了細節彌補;言語上嫻熟運用現在分詞做後置定語,介詞短語做狀語等;結構謹慎且邏輯流通。可是UN initiatives翻譯不行詳細到位,以及字數較多實踐考試不(bú)一定(dìng)能夠寫(xiě)完。

 

ChatGPT。 o3。

 


Dear Jim,

I recommend you propose a project named “Zero-Plastic Lunchbox.” The idea is to encourage secondary schools to replace single-use lunch packaging with reusable stainless-steel containers. Participating students record their plastic reduction on a shared app and post creative waste-cutting tips each week.。

This works for two reasons. First, plastic waste is a major threat to marine life, yet teenagers can curb it through a simple lunch-time habit. Second, the app’s quantifiable data will impress the UN panel by demonstrating clear environmental benefits and worldwide scalability.。

Yours,

Li Hua。

 

韓憲昌教師評分:內容6分,言語5分,結構3分 → 總分14分。

評語:內容掩蓋關(guān)鍵,但“零塑飯盒”理由粗淺(未深(shēn)挖全球影(yǐng)響)。言語(yǔ)有過錯(如“This works”口語化),句式單調。結構根本明晰,但(dàn)開展缺少。

 

趙文嘉教師評分(fèn):15分。

評(píng)語:最初缺少布景,參與UN主張搜集活動,完畢得比較僵硬,結構上缺少(shǎo)完(wán)畢如祝願希望。部(bù)分選詞用法不精(jīng)確及表達(dá)不行完好。理由不行深化。

 

通義。千問Qwen3。

 


Dear Jim,

I'm glad to hear about your interest in the UN proposal campaign. I suggest focusing on "Promoting Digital Literacy for Rural Youth". Many young people in remote areas lack access to quality tech education, limiting their future opportunities.。

Your proposal could call for global partnerships to provide affordable devices, online courses, and teacher training in underserved regions. This aligns with the UN’s Sustainable Development Goals and empowers youth to bridge the digital divide. As students, you can share personal stories to highlight how tech skills transform lives.。

I’m sure this idea will resonate with the UN and showcase youth-driven solutions!。

Yours,

Li Hua。

 

韓憲昌教師評分:內容6分,言語7分,結構4分 → 總分17分。

評語:內容(róng)根本完好(hǎo),主張(zhāng)“鄉村(cūn)數(shù)字素質”合理,但理由稍(shāo)簡略(luè)(未充沛打(dǎ)開影響)。言語精確,句式(shì)較簡略,表達得當。結構明晰,聯(lián)接天然。

 

趙文嘉(jiā)教(jiāo)師評分:17分。

評語(yǔ):因未運用連(lián)接詞,結構和邏(luó)輯比較稍顯差勁。

 

騰訊。混元(yuán)。T1。

 


Dear Jim,

Glad to hear you’re working on the UN youth proposal. Here’s my idea: Focus on "Youth-Led Green Campus Initiatives".。

Teens are key to shaping a sustainable future, and schools are where we spend most of our time. Proposing eco-actions—like recycling competitions, energy-saving challenges, or plant-a-tree days—can turn small habits into big change. These activities are easy to organize, fun, and teach us responsibility. Plus, they show the UN how youth drive real-world solutions.。

Hope this helps. Can’t wait to hear your final plan—go for it, Jim!

Yours,

Li Hua。

 

韓憲(xiàn)昌(chāng)教師評分:內容5分,言語5分,結構2分 → 總分12分。

評語:內容根本相關,但主張“綠色學校(xiào)”理由泛泛(缺少詳細支撐)。言語口語化(如“Glad to hear”),句式簡(jiǎn)略,得(dé)當性弱(ruò)。結構鬆懈,完畢隨意。

 

趙文嘉教師評分:14分。

評語(yǔ):結構不行明(míng)晰,缺少連接詞,理由不豐厚,不行深化。

 

訊飛星火。 X1。

 


Dear Jim,

 

I’m glad to help with your proposal! I suggest proposing a "Global Youth Climate Action Network". This initiative would connect teenagers worldwide to share eco-friendly projects, like school recycling programs or community tree-planting, and collaborate on solutions to climate issues.。

 

The reason is twofold: First, it empowers young people to take practical steps against environmental problems while spreading awareness. Second, uniting diverse voices under one platform highlights youth’s role in shaping a sustainable future, which aligns perfectly with the UN’s goals.。

 

Let me know if you need further details!。

 

Yours,

Li Hua。

 

韓憲昌教師評分:內容8分,言語8分,結構4分 → 總分20分。

評語:內容完(wán)好,主張“全球氣候舉動網絡”明晰,理由充沛且緊(jǐn)扣主題。言語根本(běn)精確,句式多樣(如“twofold”結構)。結構明晰,階段聯接天然(rán)。

 

趙文嘉教師評分:19分。

評語:審(shěn)題上標(biāo)題了解精確,內容上中心關鍵都提(tí)到了且做了較為深化的解說。言語上用了較多方式多變的句法(fǎ)結構。結構上第一段與第二段篇幅適當,一般來講(jiǎng)假如采納總分總的結構,能夠經過篇幅和內容來傑出中心中心階(jiē)段。

 

百度。文心。X1。

 

 

Dear Jim,

I’m glad to know you’re participating in the UN’s proposal collection. My suggestion is to focus on ""Promoting Traditional Craftsmanship Through Digital Innovation"".。

Firstly, many ancient handicrafts are fading due to globalization. By integrating digital tools like 3D modeling or VR, teenagers can help artisans preserve techniques and reach wider audiences. Secondly, this proposal aligns with sustainability—reviving local crafts reduces industrial waste and supports eco-friendly production. Lastly, it fosters cultural exchange, as young people worldwide could share stories behind these crafts, enhancing mutual understanding.。

I believe this idea balances creativity, cultural preservation, and tech engagement, which the UN values. Let me know if you need more details!。

Yours,

Li Hua。

 

韓憲昌(chāng)教師評分:內容7分,言語8分,結構4分 → 總分19分。

評語:內容(róng)立異,主張“數字工藝維護”詳實,理由充沛(文明(míng)可持續性)。言語優異,句(jù)式多樣(如“Firstly...Lastly”),無過錯。結構合理,過(guò)渡流通。

 

趙文嘉(jiā)教師評分:18分。

評語:結構明晰幹練,理由充沛詳細,選(xuǎn)詞和句法精確多樣。

  

整(zhěng)理兩位教師給出的平均分,六(liù)款大模(mó)型的排名(míng)如下:。

 

 

關於上述AI大模型相互之間的比照,韓憲昌教師表明,它們(men)都能在內容方麵切中關鍵,完結寫作使命。可(kě)是(shì),內容細節多少、細節(jiē)邏輯聯係強弱、觀念表達精準性與(yǔ)簡潔性等方麵(miàn),不同比較大。

 

趙文嘉教師則表明,有的模型(xíng)的作文無論是語法,句法仍是選詞都十分精準到位,且邏輯明晰,理由充沛深化,有的模型的(de)作文比較(jiào)之下則邏輯(jí)性短缺(quē),打開得不行詳細深化。

 

韓(hán)教(jiāo)師告知新京報(bào)貝殼財經記者,這些AI生成的作文立意都比較立異,由於AI大(dà)模型在短時間內相關信息查找和(hé)整合(hé)才(cái)能強於考生。而實在考(kǎo)生在有限時間(jiān)內(nèi),很難有特別立異的視點,一般會求穩而選用保存的視點,且是(shì)平常訓練(liàn)過的(de)相關的論題內容(róng)遷移到考場上。

 

而在趙教師看來,上(shàng)述AI大模型生成作文的特點(diǎn)是選詞都十分高檔(dàng)和相對精確,能夠(gòu)合理運用不同的詞匯來表達(dá)。部分語(yǔ)法如非謂語動(dòng)詞,定語從句的使用十分嫻熟。內容(róng)比較深化詳細。而和實在考生的差異首要在於選詞以及內容表達的深化程度上。可是比較實在考生中寫作十分優異的同學,AI生成的作文句式仍是不行(háng)豐厚,用的比較固定,如分詞做後置定語,狀語,以及定語從句。除此之外實在考生還(hái)會用到各種類型的倒裝,動名詞的(de)複合結構和獨立主格等。

 

“從詳細(xì)內容來講,AI大模型內(nèi)嵌的評分標準和寫作方向不同很大,有的作文內容過於簡略,有(yǒu)的過於冗長(zhǎng)和雜亂,這應該跟(gēn)大模型內部的數據庫有很大(dà)聯係。”韓教師說。

 

值得留意的是(shì),上述“AI考生”均為具有(yǒu)深度考慮功用的推理大模型。跟著本年春節期間DeepSeek R1的走紅,各家(jiā)幹流大模型公司對推理(lǐ)大(dà)模型的注重程度日積月累。5月28日,DeepSeek更(gèng)新(xīn)了DeepSeek-R1-0528版(bǎn)別;5月21日,騰訊旗下的深度考(kǎo)慮模型混元T1和快考慮模型(xíng)混元Turbo S雙雙迭代;4月29日,阿裏巴巴開源新一代通義千(qiān)問模型Qwen3,其可一起支撐推理和非推理使命;4月25日,百度發布了深度考慮(lǜ)模型X1 Turbo;4月20日,科大訊飛對深度推理大模型訊飛星火X1進行了全新晉級。

 

能夠發現,在(zài)本年4至5月,國內幹流大模型均(jun1)進行了推理層麵的更新,這也帶來(lái)了其在英語寫(xiě)作等方麵(miàn)的才能前進,等(děng)待國產大模型的下一次進化。

 

文/羅亦丹。

修改 楊娟娟 校正 王心。

楊單純曬美國留學生活照(zhào) 稱被(bèi)堵(dǔ)在教室門口收簡(jiǎn)曆
埃爾多安:土耳(ěr)其將向印尼出口48架(jià)第五代戰機“可(kě)汗”

石榴视频APP下载_石榴视频在线观看_石榴视频色版_石榴视频污下载