2022年普通高等学校招生全国统一考试(北京卷)语文本试卷共10页,150分。考试时长150分钟。考生务必将答案答在答题卡上,在试卷上作答无效。考试结束后,将本试卷和答题卡一并交回。一、本大题共5小题,共18分。阅读下面材料,完成1-5题。材料一屠呦呦从葛洪的《肘后备急方》中获得了新思路,提取出青蒿素,荣获了诺贝尔生理学或医学奖。这让世界看到了中国古籍的惊人价值。对于古籍的界定有多种说法,其中较为通行的是:1911年以前、以中国古代传统文化为主要内容、采用中国传统的著作方式、具有中国传统装帧形式的书籍。古籍的类型除了大量的汉文古籍,还有丰富的民族文字古籍。近年来,随着传统文化热的兴起,认识和了解古籍成为一种需求。古籍的价值是多重的。古籍的载体材料主要包括纸张、织物和墨。这三种材料由于产生或制作的年代不同,具有鲜明的时代特征,比如元代以前印书主要用麻纸、皮纸,明代以后大量用竹纸,通过载体材料体现出的文物价值显而易见。浩瀚的古代文献记载着中华民族五千年绵延不断的文明,为了解先人的政治、文化、制度、风俗等提供了重要的资料。这就是古籍的文献价值。古籍在加工制作过程中,使用的材料以及制版、印刷中所体现出来的工艺都具有珍贵的艺术价值。人们看到一部古籍,往往还未翻阅,就已为其精美的外观和典雅的色调所征服。对文献研究者来说,文献价值是古籍的“皮”,其他价值则是古籍的“毛”,皮之不存,毛将焉附。据《中国古籍总目》著录,存世古籍总量大约有20万种。其中一些珍贵的古籍具有很高的文物价值、文献价值和艺术价值。这些珍贵古籍不仅包括全本,还包括具有重要历史文献价值的残本、散页等。元代及元代以前版印、抄写的古籍已万不存一,流传至今者是我国现存古籍中最珍贵的文化遗产。这些古籍非常稀有,很多作为文物被珍藏在图书馆,读者很难一睹其庐山真面目。(取材于李致忠、梁爱民等的相关文章)材料二古籍的传承性保护是一种新兴的古籍保护理念。以往,古籍保护提倡原生性保护与再生性保护。原生性保护指保护古籍文物本身,可谓之“存形”;再生性保护指对古籍的影印、缩微复制和整理出版等,可谓之“移形”。不过,这两种方式主要解决古籍“藏”与“用”的问题,而古籍的“藏”与“用”长期局限在特定的机构与学者群体中,未能引起普通大众的广泛注意。传承性保护则是利用各种更易于接受的方式将古籍推向大众,让古籍“活”起来,实现古籍从“藏”到“用”最后至“活”的飞跃。人工智能技术的发展为这一飞跃提供了条件。人工智能处理古籍的过程大体包含四步:首先,将古籍扫描并处理成图像文件。其次,通过光学字符识别技术,将图像文件中的文字识别为计算机可处理的电子文本。再次,通过自然语言处理技术,对所获取的文本进行基础性加工,包括自动断句、标点以及词语切分等。最后,识别并抽取文本中的专名(如人名、地名、书名)等概念与知识,为后续深入的古籍知识挖掘提供基础性支撑。目前,研究者引入序列标注模型,在计算机自动断句、标点、专名识别等领域都取得了很好的效果。所谓序列标注,即输入字符串,预测每个字符在该位置的专名属性以及是否在该位置断句。例如,输入“论语云管氏而知礼孰不知礼”,模型应预测为“(B-BOOK)(E-BOOK)S(B-PER)(E-PER)OOSOOOO”,其中,“B-BOOK”表示书名开头的字,这里指“论”;“E-BOOK”表示书名结尾的字,这里指“语”;“S”表示其后应断句的字,这里对应“云”和第一个“礼”;“B-PER”表示人名开头的字,这里指“管”;“E-PER”表示人名结尾的字,这里指“氏”;“O”表示不做任何操作。每一个字都对应一个或一组符号。研究者通过多种机器学习模型,训练计算机自动标注文本序列的能力,进而使其完成自动断句、标点、专名识别等任务。模型预测的综合准确率均达到90%以上。由此,海量的典籍就可以转化为数字化、结构化的文本,从而降低普通人阅读古籍的难度,实现互联网环境下古籍的传承性保护。让古籍“活”起来的尝试还有很多。《典籍里的中国》等节目不断涌现,各地古籍存藏单位联合举办“中华传统晒书大会”,延续古人“曝书护书”的习俗,不仅晒古...