国际汉语教学研究

2025, No.47(03) 47-56+63

[打印本页] [关闭]
本期目录(Current Issue) | 过刊浏览(Archive) | 高级检索(Advanced Search)

基于《国际中文教育中文阅读分级标准》的文本语言特征量化与等级识别技术研究
Quantitative Analysis of Text Features and Level Classification Techniques Based on the Chinese Graded Readers Standards for International Chinese Language Education

李吉梅,邱经纬,陆晨昕

摘要(Abstract):

本文以《国际中文教育中文阅读分级标准》为指导,聚焦文本分级语言特征的量化与识别,构建了涵盖汉字、词汇、句子、语篇四个层面的可计算指标体系,并探讨了基于自然语言处理(NLP)和大语言模型(LLMs)技术的语言特征识别方法。为突破传统规则方法的局限,本文构建了“规则驱动+检索增强生成(RAG)”的混合架构,融合了LLMs的语义推理能力,以提升句子层面语法条目的识别能力和语法点的歧义消解能力,并通过动态加载领域词典、短词合并算法及正则优化等策略,提升面向阅读分级的词汇层面的分词准确性。本文提出的面向国际中文分级阅读的语言特征量化指标体系与文本语言特征识别技术方案,可提高中文可读性评估、文本等级识别等任务的准确率,对个性化、智能化国际中文分级阅读技术平台的研发具有借鉴意义。

关键词(KeyWords): 中文阅读分级;阅读分级标准;自然语言处理;大语言模型

Abstract:

Keywords:

基金项目(Foundation): 国家社科基金重点项目“汉语作为第二语言学习者阅读素养评价标准的构建与测评研究”(20AYY016)

作者(Author): 李吉梅,邱经纬,陆晨昕

参考文献(References):

扩展功能
本文信息
服务与反馈
本文关键词相关文章
本文作者相关文章
中国知网
分享