東京都立大学

自然言語処理研究室

東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。

小町は2023年4月に一橋大学に新設されるソーシャル・データサイエンス学部・研究科に転出予定で、都立大では新規の学生の募集を停止しています。一橋大学に2023年4月入学で大学院(修士課程)の指導を希望する人は小町までお問い合わせください(※博士課程は2025年4月入学の学生から受け入れ予定です)。

キーワード: 自然言語処理 (機械翻訳、言語学習支援、基盤技術)、機械学習(深層学習、単語分散表現)

今後の予定

  • 言語処理学会年次大会に現地参加予定です。


ニュース

  • 2022/01/26 以下の公聴会を開催しました。

    1. Yuting Zhao. Multimodal Neural Machine Translation based on Image-Text Semantic Correspondence.

    2. 安道健一郎. Automatic Discharge Summary Generation using Neural Network Models.

    3. Zhousi Chen. Neural Combinatory Constituency Parsing.

  • 2023/01/23 以下の論文の採択が決定しました。

    1. Hiroto Tamura, Tosho Hirasawa, Hwichan Kim and Mamoru Komachi. Does Masked Language Model Pre-training with Artificial Data Improve Low-resource Neural Machine Translation? Findings of the 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023). (short)

    2. Zizheng Zhang, Masato Mita and Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Findings of the 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023). (long)

  • 2023/01/11 以下の論文の採択が決定しました。

    1. 相田太一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). 異なる時期での意味の違いを捉える単語分散表現の結合学習. 自然言語処理, Vol.30, No.2. 2023年6月. (採択決定)

    2. 小山碧海, 喜友名朝視顕, 小林賢治, 新井美桜, 三田雅人, 岡照晃, 小町守. 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築. 自然言語処理, Vol.30, No.2. 2023年6月.(採択決定)

  • 2022/11/20 以下の論文が採択されました。

    1. Zhousi Chen and Mamoru Komachi. Discontinuous Combinatory Constituency Parsing. Transactions of the Association for Computational Linguistics. 2022.

  • 2022/11/12 The 2022 Conference on Empirical Methods in Natural Language Processing にて、以下の発表をしました

    1. Seiichi Inoue, Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST) and Daichi Mochihashi (ISM). Infinite SCAN: An Infinite Model of Diachronic Semantic Change. EMNLP 2022. (long, oral)

    2. Yuting Zhao and Ioan Calapodescu (NAVER Labs). Multimodal Robustness for Neural Machine Translation. EMNLP 2022. (long, poster)

  • 2022/11/10 以下の論文が採択されました。

    1. Hongfei Wang, Michiki Kurosawa, Satoru Katsumata, Masato Mita (CyberAgent) and Mamoru Komachi. Chinese Grammatical Error Correction Using Pre-trained Models and Pseudo Data. ACM Transactions on Asian and Low-Resource Language Information Processing. (accepted)

    2. Kenichiro Ando, Takashi Okumura (Kitami Institute of Technology), Mamoru Komachi, Hiromasa Horiguchi (National Hospital Organization), Yuji Matsumoto (RIKEN). Exploring Optimal Granularity for Extractive Summarization of Unstructured Health Records: Analysis of the Largest Multi-Institutional Archive of Health Records in Japan. PLOS Digital Health, 1(9): e0000099. September, 2022.

    3. Kenichiro Ando, Takashi Okumura (Kitami Institute of Technology), Mamoru Komachi, Hiromasa Horiguchi (National Hospital Organization), Yuji Matsumoto (RIKEN). Is Artificial Intelligence Capable of Generating Discharge Summaries from Inpatient Records? PLOS Digital Health. (accepted)

  • 2022/10/22 The 36th Pacific Asia Conference on Language, Information and Computation にて、以下の発表をしました。

    1. Seiichiro Kondo, Naoya Ueda, Teruaki Oka, Masakazu Sugiyama (AI Shift), Asahi Hentona (AI Shift) and Mamoru Komachi. Japanese Named Entity Recognition from Automatic Speech Recognition Using Pre-trained Models. PACLIC 36 (2022).

  • 2022/10/17 The 29th International Conference on Computational Linguistics および関連ワークショップで、以下の発表をしました(1番の研究自体は RA 先での研究成果です)

    1. Mana Ashida and Saku Sugawara (NII). Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios. COLING 2022. (long paper)

    2. Seiichiro Kondo and Mamoru Komachi. TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022. WAT 2022.

  • 2022/08/31 NLP若手の会 (YANS) 第17回シンポジウムにて下記の発表を行い、2件の発表が受賞しました!

    1. 佐藤郁子平澤寅庄金輝燦岡照晃小町守. 原文に対して補完的な画像はMMTモデルの翻訳精度を向上させるのか. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月29日.(奨励賞受賞)

    2. 木山朔金輝燦平澤寅庄岡照晃小町守. Causal言語モデルによる機械翻訳. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.(奨励賞受賞)

    3. 榎本大晟平澤寅庄金輝燦岡照晃小町守. 事前学習を用いる機械翻訳での単語分割同時最適化の検討. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.

    4. 中島京太郎金輝燦平澤寅庄岡照晃小町守. 訓練データからの文選択手法の機械翻訳における特徴分析 . NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.

  • 2022/05/10 NAACL のワークショップに下記の論文が採択されました!

    1. Xiaomeng Pan, Hongfei Wang, Teruaki Oka and Mamoru Komachi. Zuo Zhuan Ancient Chinese Dataset for Word Sense Disambiguation. NAACL Student Research Workshop (SRW) 2022. (to appear)

    2. Mana Ashida and Mamoru Komachi. Towards Automatic Generation of Messages Countering Online Hate Speech and Microaggressions. The 6th Workshop on Online Abuse and Harms (WOAH) 2022. (to appear)

  • 2022/04/05 13th Edition of Language Resources and Evaluation Conference (LREC 2022) に下記の論文が採択されました!

    1. Hwichan Kim, Sangwhan Moon (Tokyo Institute of Technology), Naoaki Okazaki (Tokyo Institute of Technology) and Mamoru Komachi. Learning How to Translate North Korean through South Korean. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    2. Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita and Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    3. Yujin Takahashi, Masahiro Kaneko, Masato Mita and Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.

    4. Keigo Takahashi and Danushka Bollegala (University of Liverpool). Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models. 13th Edition of Language Resources and Evaluation Conference (LREC 2022). May, 2022.