‘BonTen’ – Corpus Concordance System for ‘NINJAL Web Japanese Corpus’

Masayuki Asahara; Kazuya Kawahara; Yuya Takei; Hideto Masuoka; Yasuko Ohba; Yuki Torii; Toru Morii; Yuki Tanaka; Kikuo Maekawa; Sachi Kato; Hikari Konishi

2016 COLING COLING 2016

‘BonTen’ – Corpus Concordance System for ‘NINJAL Web Japanese Corpus’

Abstract

AbstractThe National Institute for Japanese Language and Linguistics, Japan (NINJAL) has undertaken a corpus compilation project to construct a web corpus for linguistic research comprising ten billion words. The project is divided into four parts: page collection, linguistic analysis, development of the corpus concordance system, and preservation. This article presents the corpus concordance system named ‘BonTen’ which enables the ten-billion-scaled corpus to be queried by string, a sequence of morphological information or a subtree of the syntactic dependency structure.

🧭 Keyword Pioneer — web corpus

🐣 Hot Topic Early Bird — dependency parsing

🐝 Cross-Pollinator — Artificial Intelligence, Computer Science, Computer Vision, Data Science & Analytics, Deep Learning, Healthcare & Medicine, Interdisciplinary, Knowledge & Reasoning, Machine Learning, Mathematics & Optimization, Natural Language Processing, Reinforcement Learning, Security & Privacy, Speech & Audio

Authors

Masayuki Asahara , Kazuya Kawahara , Yuya Takei , Hideto Masuoka , Yasuko Ohba , Yuki Torii , Toru Morii , Yuki Tanaka , Kikuo Maekawa , Sachi Kato , Hikari Konishi

Topics

Natural Language Processing > Resources & Methods > Text Representation

Keywords

dependency parsing web corpus corpus linguistics japanese language concordance system

Download PDF

Retrieving Occurrences of Grammatical Constructions 2016

Chinese Preposition Selection for Grammatical Error Diagnosis 2016

CharNER: Character-Level Named Entity Recognition 2016

Are Cohesive Features Relevant for Text Readability Evaluation? 2016

‘BonTen’ – Corpus Concordance System for ‘NINJAL Web Japanese Corpus’

Abstract

Authors

Topics

Keywords

Related papers