热门文档
- 2025-04-11 16:29:44 Android移动应用基础教程第三版课后习题答案
- 2025-04-07 14:39:05 绩效域的内容
- 2024-12-16 09:02:46 《深度学习500问》第一章+数学基础
- 2024-12-15 02:29:02 计算机网络(第八版)(谢希仁)答案
- 2025-04-11 15:32:03 江西省六校2025届高三下学期3月第二次联考试题 政治
- 2024-12-28 10:28:42 第02章 人体比例和尺寸
- 2024-12-15 02:33:39 六级阅读译文2022.12-2023.12
- 2025-04-11 15:32:03 江西省六校2025届高三下学期3月第二次联考试题 生物
- 2025-01-12 23:31:50 Python背记手册
- 2024-12-28 10:28:42 第05章 产品操纵装置
- 2025-03-18 17:38:21 大学生《形势与政策》课程论文(1800字) (3)
- 2025-01-12 23:38:28 算法设计与分析习题解答(第4版)

1、本文档共计 0 页,下载后文档不带水印,支持完整阅读内容或进行编辑。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
2、当您付费下载文档后,您只拥有了使用权限,并不意味着购买了版权,文档只能用于自身使用,不得用于其他商业用途(如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利)。
3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。
4、如文档内容存在违规,或者侵犯商业秘密、侵犯著作权等,请点击“违规举报”。
石家庄市2025届普通高中毕业年级教学质量检测(二)语文(本试卷满分150分,考试时问150分钟)注意事项:1.答卷前,考生务必将自己的姓名、准考证号填写在答题卡上。2.回答选择题时,选出每小题答案后,用铅笔把答题卡上对应题目的答案标号涂黑。如需改动,用橡皮擦干净后,再选涂其他答案标号。回答非选择题时,将答案写在答题卡上,写在本试卷上无效。3.考试结束后,将本试卷和答题卡一并交回。ー、阅读(72分)(一)阅读1(本题共5小题,19分)阅读下面的文字,完成1~5题。材料一:从语言角度来看,大模型最根本的功能就是皖计概率和输出概率。费岛琢磨,是“僧推月下门”还是“惜被月下门”,韩愈说“敲”更好,这是文科思维。大模型是理科思维,会说“推”的概率15%,“敲”的概率20%,“叩、拍、碰、弱”等都各有概率。我们也要习惯大模型的统计概单视角。计算概单过程很长,有了概率,最终选一个词输出就好了。有时选概率最大那个词,有时会加一些随机性,这是由一个叫“温度”的参数拉制的。低温输出序列稳定,高温输出序列吴活。大模型作诗写文,输入同样内客,输出选择会有一定随机性。大模型输出最看重的是语言形式“像模像样”,乍一看还以为它真知道,其实很多输出的信息都是“胡编”的,矩库算出来诃元是什么就输出什名。形式上一步步挺像回事,仔细一看推理辽辑是蒙的。这就是著名的“幻觉”问题。一个媛解“幻觉”的办法,是用“联网搜索”得到更多信息帮助。有时大模型会自行判断,需要联网找索获得更多信息。大棋型需要联网搜索时,会通过内置的工具调用,根据用户输入包括网页内客、新闻摘要、数据等。大模型不是简单地将其与用户榆入的词元拼接,而是动态地将搜索结果整合到知识体系中,结合词元生成晨终的输出。模型有内部逻辑和注意力机制,对用户输入和搜索结果进行综合分析,生成更准确全面的回答。为了提高数率和减少计算开销,还需要对搜索结果进行筛选和压缩,如只提取与用户问题最相关的部分,或者对搜索结果进行总结和提炼。“深度思考"在算法意义上,是目前大模型开发的最前沿技术。DeepSeek向全球公布了“强化学习”训练深度思考的完整机制,让业界惊叹。这是继“涌现”之后最重要的大模型研发成果。机器“自言自语”思考越来越厉害,居然可以直接“强化学习”,不要人类中间提示,只靠最终一般认为,雾要人为准备很多思维链素材,进行有监督微调,像老师收学生一步步解题那样,很麻烦地教会大模型深度思考、深入推理。国为太麻烦,教得不太成功。而De©pSck让基高三语文第1页(共8页)础能力不错的V3,面对海量有答案的问题,自己"强化学习"棋索,不要人工监督干预。V3自己不断思考,生成思维缝。有些思维链是无效的,但有些与最终答常是相关的,V3就据此修改自己的系数,学习遂渐有进步。随着训练进行,V3生成的思雄链越来越长,逻辑水平越来越高,后训练咸功收敏,V3进化为逻排能力明显强得多的R1-Zro。之后,DeepSeek再用许多训练手段,如给思维链输出打分,来消除语言混乱,提高思维旋输出的可读性。这料就开发出了大家热悉的R1,逻辑能力非常强大,输出对用户也友好。材料二:他们认为只会刷题的年生往往死记硬背,无法推理解决复杂的问题。而天才是会自己独立思考的,光靠填鸭式的刷题无法培养天才,于是他们尝试一开始就不让它“刷题”(谁大量语料),而是直接让它去考试或者去挑战一些难题,让它自己对考试的错题进行分析、回溯、反思,不结果你猜怎么着?这种看似“野蛮”的训练方式,竞然培养出了推理能力翅强的天才学生。DeepSeek-R1-Zero在各种推理能力测试中表现惊艳,基至还展现出一些意想不到的“超能力”。“自我脸算”技能:模型自已做完题后,还会“回头检查”,看看答案对不对,如采发现错了,还会自己改正。这简直就像考诚时,微完题还会认真验算一样,太自党了。“反思总结”技能:犍型还能“反思”自己的思考过程,分析哪里做得好,哪里做得不好,简直就是“学而时习之”的AI版。“超长解题思路”:模型能够生成非常详细的解题步殿,一步一步地展示它是怎么思考的。这就像考试时,不仅能写出答案,还能把详细的解题过程都写出来。DeepSeek--R1-Zero的这些推理能力,都是纯粹通过强化学习"自已长出来”的,没有借助任何“刷题”数据的帮助。(《摘编自吴知远《DeepSeek-R1训练过程的通俗讲解》)1.下列对材料中相关概念的理解和分析,不正确的一项是3分】A.“温度”是调控模型输出的参数,低温可使生成结果更稳定可靠,高温可增加输出序列的灵活性。B.“幻觉”指大模型依据统计概率生成貌似合理实则失真的答案,这些信息容易误导使用C.DeepSeek“思维链”通过分步训练使模型获得逻辑推理能力,因此需要人工预先制作解题的标准范例。D.“刷题”是与“强化学习”相对立的概念,前者只是灌输大量语料,后者则会在反思推理中提升能力。2.根据材料二内容,下列说法正确的一项是(3分)A.DeepSeek团队让模型通过桃战难题学会了逻辑推理,它就不会出现敏错题的情况。B.R1-Zero像人考试主动校验答案一样进行“自我验算”,表明其已具备人类思维。CR1-Zro能够生成详细的解题步豫,思维链越长逻辑水平就越高,结论就越准确。D.R1-Z©ro的逻辑能力完全依赖强化学习自发形成,没有借助任何刷题数据的帮助。高三语文第2页(共8页)



请如实的对该文档进行评分-
-
-
-
-
0 分