產品分類
吃瓜動態
  • 以色列轟炸伊朗核設施!核汙染防治概念迸發
  • 極氪突發人事調整,“老將”林傑全麵擔任銷售與商場
  • 楊丞琳(lín)疑似再次回應Makiyo風雲,引證媽媽的19個字超級暖心
  • 歐盟發布停止進口俄動力方案 2027年為最終期限 — 新京報(bào)
  • 自(zì)稱麵臨較大身心壓力 聞名量化創始人清盤 公(gōng)司(sī)最新回應
聯係方式

郵箱:admin@aa.com

電話:020-123456789

傳真:020-123456789

深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评 — 新京报

2025-06-15 17:19:50      點擊:065

深度推理模型写高考英语作文谁更强?记者实测,名校英语教师点评 — 新京报

6月8日下午,2025年高考(kǎo)英語科目(mù)考試完畢。在本年高考英語北京卷的作文標題中,李華又(yòu)一次成為“主角”。

 

與此一起,這場"言語才能大考(kǎo)"也成(chéng)為AI大模型的試金石(shí)——從精(jīng)準(zhǔn)審題到地道表達,從邏輯連接到文明(míng)適配,大言語(yǔ)模型能否作為(wéi)“李華”完結高考英語作文題意圖共同要求?在各個大(dà)模型均已具有“深度(dù)考慮”方式的當下,“AI考生”能拿到多少分?對此,新京報貝(bèi)殼財經對國內外幹流大言語模型進行了測評。

 

本次測評挑選2025年高考英語北京卷作文標題,測評(píng)目標為DeepSeek R1、ChatGPT o3、通義千問Qwen3、騰訊混元T1、訊(xùn)飛星火X1、百度文(wén)心X1六款深度推(tuī)理模型(xíng)產品,並約請北京市十一學校一分(fèn)校英語教師韓憲昌、深圳(zhèn)中學英語教師趙文嘉參照從前高考評分標準對上述大(dà)模型(xíng)生成的(de)英(yīng)語作文打分並作點評。

 

本著客觀公正和“盲評”準則,韓憲昌教師和趙文嘉教師給出了(le)專業評分。本次(cì)參賽的六名大模(mó)型“AI考生”得分揭曉後由高到低的(de)排名分別為:訊飛星火 X1、DeepSeek R1、百度文心X1、通義千問Qwen3、ChatGPT o3、騰訊混元T1。

 

詳細來看,2025高考英語北京卷作文題意圖要求為:

 

假定你是紅星中學高三學生李(lǐ)華。聯合國正麵向全球(qiú)青少年打開主張搜集活動。你的外國老友Jim計劃參與,為此發來郵件,就主張內容問(wèn)詢你的(de)主張。請你用英文給他回(huí)複(fù),內容包含:

1. 提出的(de)主張;

2. 主張的理由。

提(tí)示詞:主張 proposal。

留意:

1.詞數100左右;

2.最初和完畢已給出,不計入總詞數。

Dear Jim,

______________________________________________________________________。

Yours,

Li Hua    

 

以下是將上述作文標題要(yào)求作為提示詞輸入大模型後,六款大(dà)模型產品在翻開深度(dù)考慮方式,並(bìng)封閉了聯網查找方式後生成的成果,以及韓憲(xiàn)昌(chāng)教(jiāo)師和趙文嘉教師給出的評分和評語:

 

DeepSeek。 R1。

 


Dear Jim,

I'm thrilled to hear you're joining the UN initiative! For your proposal, I suggest focusing on promoting plastic-free campuses worldwide.。

My advice is to encourage students to reduce single-use plastics by bringing reusable bottles and bags, recycling plastic waste, and organizing school-wide awareness campaigns.。

I recommend this for two reasons. First, plastic pollution is a global crisis harming wildlife and ecosystems. Schools, as micro-communities, can drive real change by adopting eco-friendly habits early. Second, young people’s collective action can inspire broader societal shifts. Starting locally creates ripples of impact—proving our generation’s power to protect the planet.。

This proposal not only tackles an urgent issue but also unites students across borders. I believe it’s practical, impactful, and truly aligns with the UN’s goals.。

Go for it—I’m rooting for you!。

Yours,

Li Hua。

 

韓憲(xiàn)昌教師評分:內容7分,言(yán)語8分,結構4分 → 總分19分。

評語(yǔ):內(nèi)容詳實,主張“無塑學校”詳細,理由(yóu)全(quán)麵(環境危機與青年舉動),高度(dù)相關主題(tí)。言語(yǔ)精準,句式(shì)豐厚(複合句),無過錯。結構謹慎,邏輯(jí)流通,完畢有力。可(kě)是,顯著超字數約束,扣除1分。

 

趙文嘉(jiā)教師評分:19分(fèn)。

評語:該模型內容上關鍵都有提及,進(jìn)行(háng)了(le)細節彌補;言(yán)語上嫻熟運用現在分詞做後置定語,介詞短語做狀語等;結構謹慎且邏輯流通。可是UN initiatives翻譯不行詳細到(dào)位,以及字數較多實踐考試不一定能夠寫完。

 

ChatGPT。 o3。

 


Dear Jim,

I recommend you propose a project named “Zero-Plastic Lunchbox.” The idea is to encourage secondary schools to replace single-use lunch packaging with reusable stainless-steel containers. Participating students record their plastic reduction on a shared app and post creative waste-cutting tips each week.。

This works for two reasons. First, plastic waste is a major threat to marine life, yet teenagers can curb it through a simple lunch-time habit. Second, the app’s quantifiable data will impress the UN panel by demonstrating clear environmental benefits and worldwide scalability.。

Yours,

Li Hua。

 

韓憲(xiàn)昌教師評分:內容6分,言語5分,結構3分 → 總分14分。

評語:內容掩蓋關鍵,但“零塑飯盒”理由粗淺(未深挖全球影響)。言語有過錯(如“This works”口語化),句式單調。結構(gòu)根本明晰,但開展缺少。

 

趙文嘉教師(shī)評分(fèn):15分。

評語:最初缺(quē)少布景,參與UN主張搜(sōu)集活動(dòng),完畢得比較僵硬,結構上缺少完畢如祝願希望。部分選詞用法不精確及表達不行完好。理由不行深化。

 

通義。千問Qwen3。

 


Dear Jim,

I'm glad to hear about your interest in the UN proposal campaign. I suggest focusing on "Promoting Digital Literacy for Rural Youth". Many young people in remote areas lack access to quality tech education, limiting their future opportunities.。

Your proposal could call for global partnerships to provide affordable devices, online courses, and teacher training in underserved regions. This aligns with the UN’s Sustainable Development Goals and empowers youth to bridge the digital divide. As students, you can share personal stories to highlight how tech skills transform lives.。

I’m sure this idea will resonate with the UN and showcase youth-driven solutions!。

Yours,

Li Hua。

 

韓憲昌教師評分:內容6分,言語7分,結構4分 → 總分17分。

評語:內容根(gēn)本完好(hǎo),主張“鄉村數字素質”合理,但理由稍(shāo)簡(jiǎn)略(未充沛打開影響)。言(yán)語精確,句式較簡略,表達得當。結構明晰,聯接天然。

 

趙文嘉教師(shī)評分:17分。

評語:因未運用連接詞,結構和邏輯(jí)比較稍顯差(chà)勁。

 

騰訊。混元。T1。

 


Dear Jim,

Glad to hear you’re working on the UN youth proposal. Here’s my idea: Focus on "Youth-Led Green Campus Initiatives".。

Teens are key to shaping a sustainable future, and schools are where we spend most of our time. Proposing eco-actions—like recycling competitions, energy-saving challenges, or plant-a-tree days—can turn small habits into big change. These activities are easy to organize, fun, and teach us responsibility. Plus, they show the UN how youth drive real-world solutions.。

Hope this helps. Can’t wait to hear your final plan—go for it, Jim!

Yours,

Li Hua。

 

韓(hán)憲昌教師評分:內(nèi)容5分,言語5分,結(jié)構2分 → 總分12分(fèn)。

評語:內容根本相關(guān),但主張“綠色學校”理由泛泛(缺少詳細支撐)。言(yán)語口語化(如“Glad to hear”),句式(shì)簡略,得當性弱。結構鬆懈(xiè),完畢隨意。

 

趙文嘉教師評分:14分。

評語:結構(gòu)不(bú)行(háng)明晰,缺少連接詞,理由不豐厚,不(bú)行深化。

 

訊飛星火。 X1。

 


Dear Jim,

 

I’m glad to help with your proposal! I suggest proposing a "Global Youth Climate Action Network". This initiative would connect teenagers worldwide to share eco-friendly projects, like school recycling programs or community tree-planting, and collaborate on solutions to climate issues.。

 

The reason is twofold: First, it empowers young people to take practical steps against environmental problems while spreading awareness. Second, uniting diverse voices under one platform highlights youth’s role in shaping a sustainable future, which aligns perfectly with the UN’s goals.。

 

Let me know if you need further details!。

 

Yours,

Li Hua。

 

韓(hán)憲昌教師評分:內(nèi)容8分,言(yán)語8分,結構4分 → 總分20分。

評語:內容完好,主張“全球氣候舉(jǔ)動網(wǎng)絡”明(míng)晰(xī),理由充沛且緊扣主題。言語根本精確,句式多樣(如“twofold”結構)。結構明晰,階段(duàn)聯接天(tiān)然。

 

趙文嘉教師評分:19分。

評(píng)語:審(shěn)題上標題了解精(jīng)確,內容上中心關鍵都(dōu)提(tí)到了且做了較(jiào)為深化的解說。言語上用了較(jiào)多方式(shì)多變(biàn)的句法結構。結(jié)構上第一段與第二段篇幅適當,一般來講假如采納總分總的結構,能(néng)夠經(jīng)過篇幅和內(nèi)容(róng)來傑出中心中心階段。

 

百度。文心。X1。

 

 

Dear Jim,

I’m glad to know you’re participating in the UN’s proposal collection. My suggestion is to focus on ""Promoting Traditional Craftsmanship Through Digital Innovation"".。

Firstly, many ancient handicrafts are fading due to globalization. By integrating digital tools like 3D modeling or VR, teenagers can help artisans preserve techniques and reach wider audiences. Secondly, this proposal aligns with sustainability—reviving local crafts reduces industrial waste and supports eco-friendly production. Lastly, it fosters cultural exchange, as young people worldwide could share stories behind these crafts, enhancing mutual understanding.。

I believe this idea balances creativity, cultural preservation, and tech engagement, which the UN values. Let me know if you need more details!。

Yours,

Li Hua。

 

韓憲昌教師評分:內容7分,言語8分,結構(gòu)4分 → 總分19分(fèn)。

評語:內容立異,主張“數字工藝(yì)維護”詳實,理由充沛(文(wén)明可持續性)。言語(yǔ)優異,句式多(duō)樣(如“Firstly...Lastly”),無過錯。結構合理,過渡流通。

 

趙文嘉教師評分:18分。

評(píng)語:結構明(míng)晰(xī)幹練,理由充沛(pèi)詳細,選詞(cí)和句法精確多樣。

  

整理兩位教師(shī)給出(chū)的平(píng)均分,六款大模型(xíng)的排名如下:。

 

 

關(guān)於上述AI大模型相互(hù)之間的比照,韓憲(xiàn)昌教師(shī)表明,它們都能在(zài)內容方麵切中關鍵,完結寫(xiě)作使命。可是,內容細節多少、細節邏輯(jí)聯係強(qiáng)弱、觀念(niàn)表達精準性與簡潔性等方麵,不同比(bǐ)較大。

 

趙文嘉教師則表明,有的(de)模型的(de)作文無論是語法,句法仍是選詞都十分精準到位,且邏輯明晰,理由充沛深化,有的模型的(de)作文比較之(zhī)下則邏輯性短缺,打開得不行詳細深化。

 

韓教師告知新京報貝殼財(cái)經記者,這些AI生成的作文立意都比較立異,由於AI大模型在短時間內相關信(xìn)息查找和整合才能強於考生。而實在考(kǎo)生在有限時間內,很(hěn)難有特別立異的視點,一般會求穩而選用保存的(de)視點,且是平常訓練過的相關的論題內容遷移到(dào)考場上。

 

而在趙教師看(kàn)來,上述(shù)AI大模型生成(chéng)作文的特點(diǎn)是(shì)選(xuǎn)詞都十分高檔和相對精確,能(néng)夠合理運用(yòng)不同的詞匯來(lái)表達。部分語法如非謂語動詞,定語從句的使用十分嫻熟。內容比較深化詳細。而和實在考生的差異首(shǒu)要在於選(xuǎn)詞以(yǐ)及內容表達的深化程度上。可是比較實在考生中(zhōng)寫作十分優異的同(tóng)學,AI生成的作(zuò)文句式仍是不行豐厚,用的比(bǐ)較固定,如分詞做後(hòu)置定語,狀語(yǔ),以及定語從句。除(chú)此之外實在考生還會用到各種類型的倒裝,動名詞的複合(hé)結構和獨立主格等。

 

“從詳細內容來講,AI大模型內嵌的(de)評分標準和寫作方向不同很大,有的作文內容過於簡略,有的過於冗長(zhǎng)和雜亂,這應該跟大(dà)模型內部的數據庫有很大聯係。”韓教師(shī)說。

 

值得留意的是,上述“AI考生”均為具有深度(dù)考慮功用(yòng)的推理大模型。跟著本年春節期間DeepSeek R1的走紅,各家幹流大模型公(gōng)司對推理大模型的注(zhù)重程度日積月累。5月28日,DeepSeek更新了DeepSeek-R1-0528版別;5月21日,騰訊旗下的深度考慮模型混元T1和快考慮(lǜ)模型混元Turbo S雙雙迭代;4月29日,阿裏巴巴開(kāi)源新一代通義千問模型(xíng)Qwen3,其可一起支撐推理和非推(tuī)理使命;4月25日,百度發布了深度考慮(lǜ)模型X1 Turbo;4月20日,科大訊飛對深度推理大模型訊飛星火X1進行了全新晉級。

 

能夠發現(xiàn),在本年4至5月,國內幹流大模型均進行(háng)了推理層麵的更新,這也帶來了其在(zài)英語寫作等方麵的才能前進,等待國(guó)產大(dà)模型的下一次進化。

 

文/羅亦(yì)丹。

修改 楊娟娟 校正 王心。

我國將加大力度推(tuī)動深圳(zhèn)歸納(nà)變革試點工(gōng)作
大學上新29種新專業!來知道蓄勢起飛(fēi)的“未來科技顯眼包”

石榴视频APP下载_石榴视频在线观看_石榴视频色版_石榴视频污下载