成果速递 | 我院江新教授团队通过机器学习揭示中文阅读的眼动特征对阅读水平的预测作用-北京语言大学心理学院

当前位置：首页 > 新闻公告 > 学院新闻 > 正文

成果速递 | 我院江新教授团队通过机器学习揭示中文阅读的眼动特征对阅读水平的预测作用

【来源： | 发布日期：2024-09-23 | 阅读次数：】

近日，北京语言大学心理学院江新教授团队在《Reading and Writing》(SSCI, Q2, IF=2.0)发表了题为“Predicting Chinese reading proficiency based on eye movement features and machine learning”的研究论文，揭示了中文语篇阅读中不同层面的眼动特征对阅读水平的预测作用。

研究概述

有效评估阅读能力对于语言研究与语言教育至关重要。传统的阅读测试通常要求读者在阅读文本后回答问题，测试结果容易受到考试焦虑、疲劳和问题难度等因素的影响。随着眼动追踪技术在阅读研究中的日益普及，一些研究者通过眼动追踪技术和机器学习算法来预测和评估阅读能力，或识别阅读困难和障碍。然而，已有研究主要集中在印欧语的读者，较少考察中文读者。由于中文和印欧语在文字系统、词汇、句法和语篇连贯性方面的差异，以及阅读处理机制的不同，基于印欧语的研究结果不一定适用于中文。

以往的印欧语研究发现全局眼动特征（global eye movement feature）对阅读水平有预测作用，但对于词汇、句子层面等局部眼动特征（local eye movement feature）的研究较少。为了进一步考察眼动特征对中文阅读水平的预测作用，本研究收集了中国大学生阅读说明文的眼动数据，使用机器学习算法（支持向量机），综合语篇、句子、词汇三个层面的眼动特征，构建了预测中文阅读理解水平的模型。

研究结果显示，综合利用篇章、句子和词汇三个层面的眼动特征的模型，实现了较高的预测准确率（81.69%，84.71%）（图1），而且词汇、句子和篇章层面的眼动特征对中文阅读水平也都能发挥着独特的预测作用。研究结果表明，使用支持向量机并综合利用篇章、句子和词汇三个层面眼动特征来构建中文阅读水平的预测模型是可行的、有效的。

图1模型预测准确率随着特征数增多的变化图

本研究不但增进了我们对于不同层面的眼动特征与中文读者阅读能力之间的关系的了解，而且为机器学习与眼动追踪技术在中文阅读能力评估中的研究与应用提供了参考。

北京语言大学博士毕业生、清华大学教育研究院博士后史未卿博士为该论文的第一作者，北京语言大学心理学院江新教授为该论文的通讯作者。研究得到了国家社会科学基金重大项目“汉语文本可读性测评和分级的跨学科研究”（17ZDA305）以及北京语言大学一流学科团队支持计划（2023YGF07）的资助。

论文信息

Shi, W., & Jiang, X. (2024). Predicting Chinese reading proficiency based on eye movement features and machine learning. Reading and Writing, 1-25.

https://doi.org/10.1007/s11145-024-10563-2

撰稿：史未卿

审核：江新