Research Explorer

BabyHGRN: Exploring RNNs for Sample-Efficient Language Modeling

Patrick Haller, Jonas Golde, Alan Akbik

2024 CONLL

BabyLlama-2: Ensemble-Distilled Models Consistently Outperform Teachers With Limited Data

Jean-Loup Tastet, Inar Timiryasov

2024 CONLL

BabyLM Challenge: Experimenting with Self-Distillation and Reverse-Distillation for Language Model Pre-Training on Constrained Datasets

Aakarsh Nair, Alina Hancharova, Mayank Kumar et al.

2024 CONLL

BabyLM Challenge: Exploring the effect of variation sets on language model training efficiency

Akari Haga, Akiyo Fukatsu, Miyu Oba et al.

2024 CONLL

BERTtime Stories: Investigating the Role of Synthetic Story Data in Language Pre-training

Nikitas Theodoropoulos, Giorgos Filandrianos, Vassilis Lyberatos et al.

2024 CONLL

Causal ATE Mitigates Unintended Bias in Controlled Text Generation

Rahul Madhavan, Kahini Wadhawan

2024 CONLL

Choosy Babies Need One Coach: Inducing Mode-Seeking Behavior in BabyLlama with Reverse KL Divergence

Shaozhen Shi, Yevgen Matusevych, Malvina Nissim

2024 CONLL

ConcreteGPT: A Baby GPT-2 Based on Lexical Concreteness and Curriculum Learning

Luca Capone, Alessandro Bondielli, Alessandro Lenci

2024 CONLL

Continuous Attentive Multimodal Prompt Tuning for Few-Shot Multimodal Sarcasm Detection

Soumyadeep Jana, Animesh Dey, Ranbir Singh Sanasam

2024 CONLL

Critical Questions Generation: Motivation and Challenges

Blanca Calvo Figueras, Rodrigo Agerri

2024 CONLL

CrowdCounter: A benchmark type-specific multi-target counterspeech dataset

Punyajoy Saha, Abhilash Datta, Abhik Jana et al.

2024 CONLL

Developmentally Plausible Multimodal Language Models Are Highly Modular

Alina Klerings, Christian Bartelt, Aaron Mueller

2024 CONLL

Different Ways to Forget: Linguistic Gates in Recurrent Neural Networks

Cristiano Chesi, Veronica Bressan, Matilde Barbini et al.

2024 CONLL

Dreaming Out Loud: A Self-Synthesis Approach For Training Vision-Language Models With Developmentally Plausible Data

Badr AlKhamissi, Yingtian Tang, Abdülkadir Gökce et al.

2024 CONLL

EditEval: An Instruction-Based Benchmark for Text Improvements

Jane Dwivedi-Yu, Timo Schick, Zhengbao Jiang et al.

2024 CONLL

ELC-ParserBERT: Low-Resource Language Modeling Utilizing a Parser Network With ELC-BERT

Rufus Behr

2024 CONLL

Explaining the Hardest Errors of Contextual Embedding Based Classifiers

Claudio Moisés Valiense De Andrade, Washington Cunha, Guilherme Fonseca et al.

2024 CONLL

Exploring Curriculum Learning for Vision-Language Tasks: A Study on Small-Scale Multimodal Training

Rohan Saha, Abrar Fahim, Alona Fyshe et al.

2024 CONLL

Extending the BabyLM Initiative : Promoting Diversity in Datasets and Metrics through High-Quality Linguistic Corpora

Laurent Prévot, Sheng-Fu Wang, Jou-An Chi et al.

2024 CONLL

Findings of the Second BabyLM Challenge: Sample-Efficient Pretraining on Developmentally Plausible Corpora

Michael Y. Hu, Aaron Mueller, Candace Ross et al.

2024 CONLL

From Babble to Words: Pre-Training Language Models on Continuous Streams of Phonemes

Zébulon Goriely, Richard Diehl Martinez, Andrew Caines et al.

2024 CONLL

Further Compressing Distilled Language Models via Frequency-aware Partial Sparse Coding of Embeddings

Kohki Tamura, Naoki Yoshinaga, Masato Neishi

2024 CONLL

Generalizations across filler-gap dependencies in neural language models

Katherine Howitt, Sathvik Nair, Allison Dods et al.

2024 CONLL

Global Learning with Triplet Relations in Abstractive Summarization

Fengyu Lu, Jiaxin Duan, Junfei Liu

2024 CONLL

Global-Pruner: A Stable and Efficient Pruner for Retraining-Free Pruning of Encoder-Based Language Models

Guangzhen Yao, Yuehan Wang, Hui Xu et al.

2024 CONLL

Papers