Using Large Language Models to Assess Young Students’ Writing Revisions

Tianwen Li; Zhexiong Liu; Lindsay Matsumura; Elaine Wang; Diane Litman; Richard Correnti

2024 NAACL NAACL 2024

Using Large Language Models to Assess Young Students’ Writing Revisions

Abstract

AbstractAlthough effective revision is the crucial component of writing instruction, few automated writing evaluation (AWE) systems specifically focus on the quality of the revisions students undertake. In this study we investigate the use of a large language model (GPT-4) with Chain-of-Thought (CoT) prompting for assessing the quality of young students’ essay revisions aligned with the automated feedback messages they received. Results indicate that GPT-4 has significant potential for evaluating revision quality, particularly when detailed rubrics are included that describe common revision patterns shown by young writers. However, the addition of CoT prompting did not significantly improve performance. Further examination of GPT-4’s scoring performance across various levels of student writing proficiency revealed variable agreement with human ratings. The implications for improving AWE systems focusing on young students are discussed.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Natural Language Processing

🧭 Keyword Pioneer — writing revision

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Tianwen Li , Zhexiong Liu , Lindsay Matsumura , Elaine Wang , Diane Litman , Richard Correnti

Topics

Artificial Intelligence > Learning Paradigms > Few-Shot Learning Natural Language Processing > Generation > Text Generation Natural Language Processing > Applications > Text Classification

Keywords

chain-of-thought prompting automated writing evaluation large language model writing revision

Download PDF

Related papers

Working Alliance Transformer for Psychotherapy Dialogue Classification 2024

Named Entity Recognition Under Domain Shift via Metric Learning for Life Sciences 2024

Assessing Logical Puzzle Solving in Large Language Models: Insights from a Minesweeper Case Study 2024

TelME: Teacher-leading Multimodal Fusion Network for Emotion Recognition in Conversation 2024

Extractive Summarization with Text Generator 2024