A processor for KyotoCorpus, KWDLC, and AnnotatedFKCCorpus

ku-nlp, updated 🕥 2022-12-28 06:58:02

kyoto-reader: A processor for KWDLC, KyotoCorpus, and AnnotatedFKCCorpus

License Python 3.7,3.8,3.9,3.10 Python Versions

以下のコーパスから形態素・係り受け関係・述語項構造・共参照関係・固有表現情報を抽出し、Pythonから扱うためのインターフェースを提供します。

  • 京都大学ウェブ文書リードコーパス (KWDLC)
  • 京都大学テキストコーパス (KyotoCorpus)
  • 不満調査データセットタグ付きコーパス (AnnotatedFKCCorpus)

Requirements

Installation

zsh $ pip install kyoto-reader

Documents

https://kyoto-reader.readthedocs.io/en/latest/

Authors/Contact

京都大学 黒橋・褚・村脇研究室 (contact at nlp.ist.i.kyoto-u.ac.jp) - Nobuhiro Ueda

Issues

support discourse relation

opened on 2020-02-17 08:20:03 by nobu-g

一部の KWDLC の文書には談話関係が自動付与されている。 このデータも扱えるようにする。

Releases

Release v2.5.0 2022-04-11 08:32:09

Release v2.4.1 2022-04-09 08:50:59

Release v2.4.0 2022-04-04 13:44:51

Release v2.3.0 2022-03-29 07:16:38

Release v2.2.0 2021-11-11 06:55:56

Release v2.1.1 2021-03-21 16:13:17

Kurohashi-Chu-Murawaki lab, Kyoto University

We are working on making NLP better

GitHub Repository

japanese pyknp predicate-argument-structure coreference corpus-processing