ホーム

東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。

キーワード: 自然言語処理 (機械翻訳、言語学習支援、意味解析、文書要約、対話)、機械学習(深層学習、半教師あり学習)

東京都立大学自然言語処理研究室へようこそ


今後の予定

  • 今年度は以下の公聴会を行います。どなたでも参加できます。Zoom のリンクは後日掲載します。
    • 12/23(水)16:00-18:00 金子正弘: Grammatical and Semantic Biases in Representation Learning from Raw Datasets(公聴会は日本語)
    • 01/18(月)12:30-14:30 Aizhan Imankulova: A Study on Exploiting Additional Resources for Low-resource Neural Machine Translation(公聴会は日本語)
    • 01/22(金)15:30-17:30 Longtu Zhang: Neural Machine Translation Using Sub-Character Level Information(公聴会は英語)
  • 2020/12/08-11 自然言語処理のメジャー国際会議 COLING にて以下の発表をします。
    • Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Generating Diverse Corrections with Local Beam Search for Grammatical Error Correction. In The 28th International Conference on Computatinal Linguistics (COLING). December, 2020. (accepted as a short paper)
    • Ryoma Yoshimura, Masahiro Kaneko, Tomoyuki Kajiwara (Osaka University) and Mamoru Komachi. SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction. In The 28th International Conference on Computatinal Linguistics (COLING). December, 2020. (accepted as a short paper)
    • Masahiro Kaneko and Danushka Bollegala. Autoencoding Improves Pre-trained Word Embeddings. In The 28th International Conference on Computatinal Linguistics (COLING). December, 2020. (accepted as a short paper; see arXiv version)
    • Ikumi Yamashita, Satoru Katsumata, Masahiro Kaneko, Aizhan Imankulova and Mamoru Komachi. Cross-lingual Transfer Learning for Grammatical Error Correction. In The 28th International Conference on Computatinal Linguistics (COLING). December, 2020. (accepted as a long paper)
  • 2020/12/04-07 自然言語処理の国際会議 AACL-IJCNLP 2020 と関連ワークショップにて以下の発表をします。
    • Hongfei Wang, Michiki Kurosawa, Satoru Katsumata and Mamoru Komachi. Chinese Grammatical Correction Using BERT-based Pre-trained Model. In The 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP). December, 2020. (accepted as a short paper; see arXiv version)
    • Satoru Katsumata and Mamoru Komachi Stronger Baselines for Grammatical Error Correction Using a Pretrained Encoder-Decoder Model. In The 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP). December, 2020. (accepted as a short paper; see arXiv version)
    • Siti Oryza Khairunnisa, Aizhan Imankulova and Mamoru Komachi. Towards a Standardized Dataset on Indonesian Named Entity Recognition. In AACL-IJCNLP 2020 Student Research Workshop (AACL-IJCNLP SRW 2020). December, 2020. (accepted as a research paper)
    • Mana Ashida, Seunghun Lee (International Christian University) and Kunzang Mamgyal (NBDD Colledge). Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia). In AACL-IJCNLP 2020 Student Research Workshop (AACL-IJCNLP SRW 2020). December, 2020. (accepted as a research paper)
    • Hiroki Homma and Mamoru Komachi. Non-Autoregressive Grammatical Error Correction Towards a Writing Support System. In The 6th Workshop on Natural Language Processing Techniques for Educational Application (NLP-TEA). December, 2020. (accepted as a long paper)
    • Zizheng Zhang, Tosho Hirasawa, Wei Houjing, Masahiro Kaneko and Mamoru Komachi. Translation of New Named Entities from English to Chinese. In The 7th Workshop on Asian Translation (WAT). December, 2020. (accepted as a short paper)
  • 2020/12/03 以下の論文を音声言語および自然言語処理シンポジウムにて発表します。
    • 安道健一郎(東京都立大/理研)・奥村貴史(北見工大/理研)・小町守(東京都立大)・堀口裕正 (国立病院機構)・松本裕治(理研). 診療録解析のための文のセグメント分割と意味ラベル付与. 情報処理学会第246回自然言語処理研究会.
ニュース

  • 2020/11/20 以下の論文を Conference on Machine Translation (WMT) にて発表しました。
    • Aizhan Imankulova, Masahiro Kaneko, Tosho Hirasawa and Mamoru Komachi. Towards Multimodal Simultaneous Neural Machine Translation. In 2020 Fifth Conference on Machine Translation (WMT). November, 2020.
    • Akifumi Nakamachi (Osaka University), Hiroki Shimanaka, Tomoyuki Kajiwara (Osaka University) and Mamoru Komachi. TMUOU submission for WMT20 Quality Estimation Shared Task. In 2020 Fifth Conference on Machine Translation (WMT 2020). November, 2020.
  • 2020/11/16 以下の論文が ACM TALLIP に採択されました。
    • Longtu Zhang and Mamoru Komachi. Using Sub-Character Level Information for Neural Machine Translation of Logographic Languages. ACM Transaction on Asian and Low-Resource Language Information Processing. (accepted)
  • 2020/11/05 以下の研究をオンライン発表しました。
    • Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Osaka University), Chenhui Chu (Osaka University). Double Attention-based Multimodal Neural Machine Translation with Semantic Image Regions. In The 22nd Annual Conference of the European Association for Machine Translation (EAMT 2020), pp.105-114. Lisbon, Portugal. November, 2020.
  • 2020/09/30 情報処理学会自然言語処理研究会にて以下の発表をしました。
    • 本間広樹, 小町守. 非自己回帰モデルを用いた高速な日本語文法誤り訂正. 情報処理学会第245回自然言語処理研究会. September 30, 2020.
    • 安道健一郎, 関根聡(理化学研究所), 小町守. Wikipedia における読者属性を考慮した引用要否の分析. 情報処理学会第245回自然言語処理研究会. September 30, 2020.
  • 2020/09/23 NLP(自然言語処理)若手の会(YANS)第15回シンポジウムにて以下の発表をしました。
    • 吉村綾馬, 杉山雅和(AI Shift), 友松祐太(AI Shift), 小町守音声認識誤り検出における文単位のラベルからの単語単位の誤り予測NLP 若手の会第15回シンポジウム.  September 23, 2020.
    • 小山碧海, 甫立健悟, 金子正弘, 小町守文法誤り訂正における複数の擬似誤り生成モデルの比較NLP 若手の会第15回シンポジウム. September 23, 2020.
    • 今藤誠一郎, 甫立健悟, 平澤寅庄, 金子正弘, 小町守機械翻訳における非自己回帰モデルの複数言語の出力分析NLP 若手の会第15回シンポジウム. September 23, 2020.
    • 喜友名朝視顕吉村綾馬金子正弘小町守項目別マルチタスク学習による系列変換タスクの品質推定. NLP 若手の会第15回シンポジウム. September 23, 2020.
  • 2020/08/31 以下の研究が言語処理学会論文誌に採録決定しました。
    • 梶原智之(阪大), 西原大貴(阪大), 小平知範, 小町守. 日本語の語彙平易化のための言語資源の整備. 言語処理学会論文誌, 27巻4号. December, 2020.(採録決定)
  • 2020/08/13 以下の研究が人工知能学会論文誌に採録されました。
    • 新井美桜, 金子正弘, 小町守. 日本語学習者向けの文法誤り検出機能付き作文用例検索システム. 人工知能学会論文誌, 35巻5号. September, 2020. (paper)
  • 2020/07/15 Workshop on Advances in Language and Vision Research で開催されていた Video-guided Machine Translation Challenge (ビデオつき機械翻訳)にて、都立大と東工大のチームが1位になりました!
  • 2020/07/10 自然言語処理のトップカンファレンス、The 58th Annual Meeting of Association for Computational Linguistics (ACL 2020) および関連ワークショップにて、以下の発表を行いました。
    • Hwichan Kim, Tosho Hirasawa and Mamoru Komachi. Zero-shot North Korean to English Neural Machine Translation by Character Tokenization and Phoneme Decomposition. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2020 SRW), pp.72-78. July, 2020. (paper)
    • Yujin Takahashi, Satoru Katsumata and Mamoru Komachi. Grammatical Error Correction Using Pseudo Learner Corpus Considering Learner's Error Tendency. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2020 SRW), pp.27-32. July, 2020. (paper)
    • Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki and Kentaro Inui. Can Encoder-decoder Models Benefit from Pre-trained LanguageRepresentation in Grammatical Error Correction? In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL 2020), pp.4258-4254. July, 2020. (paper)
    • Masahiro Kaneko, Aizhan Imankulova, Tosho Hirasawa and Mamoru Komachi. English-to-Japanese Diverse Translation Using Opposite Direction Models. In Proceedings of The 4th Workshop on Neural Generation and Translation (WNGT 2020), pp.134-138. July, 2020. (paper)
    • Tosho Hirasawa, Zhishen Yang, Mamoru Komachi and Naoaki Okazaki. Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020. In Workshop on Advances in Language and Vision Research. July, 2020. (paper)
サブページ (1): 過去のニュース