LTRC_IIITH’s 2023 Submission for Prompting Large Language Models as Explainable Metrics Task

Pavan Baswani; Ananya Mukherjee; Manish Shrivastava

2023 IJCNLP IJCNLP 2023

LTRC_IIITH’s 2023 Submission for Prompting Large Language Models as Explainable Metrics Task

Abstract

AbstractIn this report, we share our contribution to the Eval4NLP Shared Task titled “Prompting Large Language Models as Explainable Metrics.” We build our prompts with a primary focus on effective prompting strategies, score-aggregation, and explainability for LLM-based metrics. We participated in the track for smaller models by submitting the scores along with their explanations. According to the Kendall correlation scores on the leaderboard, our MT evaluation submission ranks second-best, while our summarization evaluation submission ranks fourth, with only a 0.06 difference from the leading submission.

🌉 Interdisciplinary Bridge — Artificial Intelligence and Natural Language Processing

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Robotics, Security & Privacy, Speech & Audio

Authors

Pavan Baswani , Ananya Mukherjee , Manish Shrivastava

Topics

Natural Language Processing > Applications > Machine Translation Natural Language Processing > Resources & Methods > Large Language Models Artificial Intelligence > Core AI > Large Language Models Natural Language Processing > Applications > Summarization

Keywords

in-context learning prompting strategy machine translation evaluation explainable metrics score aggregation explainable metric large language model

Download PDF

Related papers

On the Use of Language Models for Function Identification of Citations in Scholarly Papers 2023

Team NLLG submission for Eval4NLP 2023 Shared Task: Retrieval-Augmented In-Context Learning for NLG Evaluation 2023

Automatic Translation of Span-Prediction Datasets 2023

PACT: Pretraining with Adversarial Contrastive Learning for Text Classification 2023

VACASPATI: A Diverse Corpus of Bangla Literature 2023