東京都立大学
自然言語処理研究室
東京都立大学システムデザイン学部情報科学科 (東京都立大学大学院システムデザイン研究科情報科学域)人工知能・自然言語処理分野、自然言語処理研究室(小町研)のウェブサイトです。小町研では、多言語コミュニケーションを支援するために、コンピュータを用いて人間のことばを理解・解析する手法の研究をしています。西東京に自然言語処理の研究開発拠点を作ることを目指しています。
小町は2023年4月に一橋大学に新設されるソーシャル・データサイエンス学部・研究科に転出しました。都立大では新規の学生の募集を停止しています。一橋大学で大学院(修士課程)の指導を希望する人は小町までお問い合わせください。※博士課程は2025年4月入学の学生から受け入れ予定です。一橋大学の研究室サイトは暫定的にこちら。
キーワード: 自然言語処理 (機械翻訳、言語学習支援、基盤技術)、機械学習(深層学習、単語分散表現)
ニュース
2023/08/31 NLP 若手の会シンポジウム (YANS 2023) で以下の表彰がありました。
スポンサー賞(LLM-X 賞): 中島京太郎 (都立大). 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移.
ハッカソン賞(リーダーボードハッカソン 優秀賞): 山本悠士 (東京理科大),和田有輝也 (LINE),郷原聖士 (NAIST),木山朔 (都立大)
2023/08/14 NLP 若手の会シンポジウム (YANS 2023) で以下の発表を予定しています。
中島京太郎 (都立大), 金輝燦 (都立大), 平澤寅庄 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移.
上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). 文法性評価ベンチマークBLiMPにおけるバイアス除去.
金輝燦 (都立大), 小町守 (一橋大), 鈴木潤 (東北大). 言語識別器を用いた敵対的学習による多言語モデルの言語横断性の改善.
佐藤郁子 (都立大), 平澤寅庄 (都立大), 金輝燦 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 視覚情報による曖昧性解消に着目した英日マルチモーダル機械翻訳のデータセット構築.
2023/06/21 一般社団法人アジア太平洋機械翻訳協会 AAMT 長尾賞 学生奨励賞 の表彰式予定です。
Yuting Zhao. Multimodal Neural Machine Translation based on Image-Text Semantic Correspondence.
2023/06 下記の国際会議論文が採択されました。
Xiaomeng Pan, Zhousi Chen and Mamoru Komahi. Query Generation Using GPT-3 for CLIP-Based Word Sense Disambiguation for Image Retrieval. The 12th Joint Conference on Lexical and Computational Semantics (*SEM 2023). (short)
Hwichan Kim and Mamoru Komachi. Enhancing Few-shot Cross-lingual Transfer with Target Language Peculiar Examples. Findings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023). (long)
Taichi Aida and Danushka Bollegala (Liverpool University). Unsupervised Semantic Variation Prediction using the Distribution of Sibling Embeddings. Findings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023). (long)
2023/05 下記の論文誌が出版予定です。
Siti Oryza Khairunnisa, Zhousi Chen, Mamoru Komachi. Dataset Enhancement and Multilingual Transfer for Named Entity Recognition in the Indonesian Language. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP). April, 2023.
Keigo Takahashi, Teruaki Oka, Mamoru Komachi. Effectiveness of pre-trained language models for the Japanese Winograd Schema Challenge. Journal of Advanced Computatinal Intelligence and Intelligent Informatics, Vol. 27, No.3. (accepted)
相田太一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). 異なる時期での意味の違いを捉える単語分散表現の結合学習. 自然言語処理, Vol.30, No.2. 2023年6月. (採択決定)
小山碧海, 喜友名朝視顕, 小林賢治, 新井美桜, 三田雅人, 岡照晃, 小町守. 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築. 自然言語処理, Vol.30, No.2. 2023年6月.(採択決定)
小林千真, 相田太一, 岡照晃, 小町守. BERTを用いた日本語の意味変化の分析. 自然言語処理, Vol.30, No.2. 2023年6月. (採択決定)