研究発表
2024年度
学術論文誌(査読あり)
凌 志棟, 相田 太一, 岡 照晃 (SB Intuitions), 小町 守. 日本語意味変化検出のための評価データセットの構築と分析. 自然言語処理. Vol.31, No.4, December, 2024. (accepted)
Hongfei Wang, Zhousi Chen, Zizheng Zhang, Zhidong Ling, Xiaomeng Pan, Wenjie Duan, Masato Mita (CyberAgent) and Mamoru Komachi. Revisiting the Evaluation for Chinese Grammatical Error Correction. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.28, No.6. November, 2024. (accepted)
Siti Oryza Khairunnisa, Zhousi Chen, Mamoru Komachi. Improving Domain-Specific NER in the Indonesian Language through Domain Transfer and Data Augmentation. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.28, No.6. November, 2024. (accepted)
Masamune Kobayashi, Masato Mita, Mamoru Komachi. Revisiting Meta-evaluation for Grammatical Error Correction. Transactions of the Association for Computational Linguistics (TACL), Vol.12, pp.837-855. July 1, 2024. (PDF)
Zizheng Zhang, Masato Mita, Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Journal of Natural Language Processing, Vol.31, No.2, pp.328-348. June, 2024. (PDF)
国際会議(査読あり、予稿あり)
Ayako Sato, Tosho Hirasawa, Hwichan Kim, Zhousi Chen, Teruaki Oka, Masato Mita, Mamoru Komachi. DejaVu: Disambiguation evaluation dataset for English-JApanese machine translation on VisUal information. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (oral, accepted)
Kyotaro Nakajima, Hwichan Kim, Tosho Hirasawa, Taisei Enomoto, Zhousi Chen, Mamoru Komachi. A Survey for LLM Tuning Methods: Classifying Approaches Based on Model Internal Accessibility. Proceedings of the 38th Pacific Asia Conference on Language, Information and Computation (PACLIC 38). December, 2024. (poster, accepted)
Hwichan Kim, Jun Suzuki (Tohoku University), Tosho Hirasawa, Mamoru Komachi. Pruning Multilingual Large Language Models for Multilingual Inference. Findings of the 2024 Confernece on Empirical Methods in Natural Language Processing (EMNLP 2024). November, 2024. (accepted)
Taichi Aida and Danushka Bollegala (University of Liverpool). A Semantic Distance Metric Learning Approach for Lexical Semantic Change Detection. Findings of the Association for Computational Linguistics: ACL 2024, pp.7570-7580. August, 2024. (PDF)
Masamune Kobayashi, Masato Mita, Mamoru Komachi. Large Language Models Are State-of-the-Art Evaluator for Grammatical Error Correction. Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024), pp.68-77. June, 2024. (PDF)
Naoya Ueda, Masato Mita, Teruaki Oka, Mamoru Komachi. Token-length Bias in Minimal-pair Paradigm Datasets. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.16224–16236. May, 2024. (PDF)
Yoshinari Nagai, Teruaki Oka, Mamoru Komachi. A Document-Level Text Simplification Dataset for Japanese. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.459–476. May, 2024. (PDF)
Hwichan Kim, Shota Sasaki (CyberAgent), Sho Hoshino (CyberAgent), and Ukyo Honda (CyberAgent). A Single Linear Layer Yields Task-Adapted Low-Rank Matrices. Proceedings of the 2024 Joint International Conference on Computational Linguistics, Language Resources and Evaluation (LREC-COLING 2024), pp.1602–1608. May, 2024. (PDF)
国際会議(査読なし、予稿あり)
Ayako Sato, Kyotaro Nakajima, Hwichan Kim, Zhousi Chen and Mamoru Komachi. TMU-HIT's Submission for the WMT24 Quality Estimation Shared Task: Is GPT-4 a Good Evaluator for Machine Translation? Ninth Conference on Machine Translation (WMT24). November, 2024. (poster, accepted)
Taisei Enomoto, Hwichan Kim, Tosho Hirasawa, Yoshinari Nagai, Ayako Sato, Kyotaro Nakajima and Mamoru Komachi. TMU-HIT at MLSP 2024: How Well Can GPT-4 Tackle Multilingual Lexical Simplification? Proceedings of the 19th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2024), pp.590-598. June, 2024. (poster, PDF)
シンポジウム(査読なし、予稿なし)
臼井 久生 (東京農工大), 木山 朔 (都立大), 古宮 嘉那子 (東京農工大). 大規模視覚言語モデルの謎解き能力調査. YANS2024. 2024年9月5日.
榎本 大晟 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 小町 守 (一橋大). Multilingual LLM への指示文は本当に英語であるべきなのか?. YANS2024. 2024年9月5日.
坂部 立 (一橋大), 金 輝燦 (都立大), 小町 守 (一橋大). 人間とLLMが考える"面白い”は一致するのか? YANS2024. 2024年9月6日.
木山 朔 (都立大), 相田 太一 (都立大), 小町 守 (一橋大), 小木曽 智信 (国語研), 高村 大也 (産総研), 持橋 大地 (統数研). 日本語の単語を対象とした複数時期の意味変化パターン分析. YANS2024. 2024年9月6日.
佐藤 郁子 (都立大), 金 輝燦 (都立大), 陳 宙斯 (一橋大), 三田 雅人 (サイバーエージェント/都立大), 小町 守 (一橋大). テキスト評価におけるLLMアライメント手法の影響分析. YANS2024. 2024年9月6日.
中島 京太郎 (都立大), 金 輝燦 (都立大), 平澤 寅庄 (都立大), 榎本 大晟 (都立大), 小町 守 (一橋大). 言語モデルの透明性ごとに適応な可能なチューニング手法の調査. YANS2024. 2024年9月6日.
書籍
小町守. 自然言語処理の教科書. 技術評論社. 2024年5月24日.
雑誌記事・辞典項目等
須藤 克仁, 小町 守, 梶原 智之, 三田 雅人. NLP2024 テーマセッション「人間と計算機のことばの評価」. 自然言語処理, 31 巻 2 号, pp.755-762. 2024年6月.
飯田 大貴, 岩倉 友哉, 笠井 淳吾, 小島 熙之, 小町 守, 古宮 嘉那子, 田村 晃裕, 二宮 崇, 平岡 達也, 水木 栄. 生成 AI 時代の自然言語処理における産学官の役割と課題 NLP2024ワークショップ. 自然言語処理, 31 巻 2 号, 798-804. 2024年6月.
2023年度
学術論文誌(査読あり)
Keigo Takahashi, Teruaki Oka, Mamoru Komachi and Yasufumi Takama (TMU). A Comparative Study of Relation Classification Approaches for Japanese Discourse Relation Analysis. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol.28, No.2, pp.239-254. March 20, 2024. (PDF)
Hwichan Kim, Tosho Hirasawa, Sangwhan Moon (Tokyo Institute of Technology), Naoaki Okazaki (Tokyo Institute of Technology), Mamoru Komachi. North Korean Neural Machine Translation through South Korean Resources. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Vol.22, No.9, 22 pages. September, 2023. (PDF)
Siti Oryza Khairunnisa, Zhousi Chen, Mamoru Komachi. Dataset Enhancement and Multilingual Transfer for Named Entity Recognition in the Indonesian Language. ACM Transactions on Asian and Low-Resource Language Information Processing (TALLIP), Vol.22, No.6, 21 pages. June, 2023. (PDF)
Keigo Takahashi, Teruaki Oka, Mamoru Komachi. Effectiveness of pre-trained language models for the Japanese Winograd Schema Challenge. Journal of Advanced Computational Intelligence and Intelligent Informatics, Vol. 27, No.3, pp.511-521. (PDF)
相田太一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). 異なる時期での意味の違いを捉える単語分散表現の結合学習. 自然言語処理, Vol.30, No.2, pp.275-303. 2023年6月. (PDF)
小山碧海, 喜友名朝視顕, 小林賢治, 新井美桜, 三田雅人, 岡照晃, 小町守. 日本語文法誤り訂正のための誤用タグ付き評価コーパスの構築. 自然言語処理, Vol.30, No.2, pp.330-371. 2023年6月. (PDF)
小林千真, 相田太一, 岡照晃, 小町守. BERTを用いた日本語の意味変化の分析. 自然言語処理, Vol.30, No.2, pp.713-747. 2023年6月. (PDF)
国際会議(査読あり、予稿あり)
Kenichiro Ando (RIKEN), Mamoru Komachi, Satoshi Sekine (RIKEN). WikiSQE: A Large-Scale Dataset for Sentence Quality Estimation in Wikipedia. 38th AAAI Conference on Artificial Intelligence, 38(16), pp.17656-17663. February 2024. (PDF)
Taichi Aida and Danushka Bollegala (Liverpool University). Swap and Predict -- Predicting the Semantic Changes in Words across Corpora by Context Swapping. Findings of The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023), pp.7753–7772. Singapore. December, 2023. (PDF)
Xiaohang Tang (Liverpool University), Yi Zhou (Liverpool University), Taichi Aida, Procheta Sen (Liverpool University), and Danushka Bollegala (Liverpool University). Can Word Sense Distribution Detect Semantic Changes of Words? Findings of The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023), pp.3575–3590. Singapore. December, 2023. (PDF)
Zizheng Zhang, Masato Mita, Mamoru Komachi. ClozEx: A Task toward Generation of English Cloze Explanation. Findings of The 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023), pp.5228–5242. Singapore. December, 2023. (poster, PDF)
Tosho Hirasawa, Emanuele Bugliarello (University of Copenhagen), Desmond Elliott (University of Copenhagen) and Mamoru Komachi. Visual Prediction Improves Zero-Shot Cross-Modal Machine Translation. The Eight Conference on Machine Translation (WMT 2023), pp.522–535. Singapore. December, 2023. (oral, PDF)
Taisei Enomoto, Tosho Hirasawa, Hwichan Kim, Teruaki Oka and Mamoru Komachi. Simultaneous Domain Adaptation of Tokenization and Machine Translation. The 37th Pacific Asia Conference on Language, Information and Computation (PACLIC 37). Hong Kong. December, 2023. (poster, PDF)
Zhidong Ling, Taichi Aida, Teruaki Oka and Mamoru Komachi. Construction of Evaluation Dataset for Japanese Lexical Semantic Change Detection. The 37th Pacific Asia Conference on Language, Information and Computation (PACLIC 37). Hong Kong. December, 2023. (oral, PDF)
Xiaomeng Pan, Zhousi Chen and Mamoru Komachi. Query Generation Using GPT-3 for CLIP-Based Word Sense Disambiguation for Image Retrieval. The 12th Joint Conference on Lexical and Computational Semantics (*SEM 2023), pp.417–422. (PDF)
Hwichan Kim and Mamoru Komachi. Enhancing Few-shot Cross-lingual Transfer with Target Language Peculiar Examples. Findings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), pp.747–767. (PDF)
Taichi Aida and Danushka Bollegala (Liverpool University). Unsupervised Semantic Variation Prediction using the Distribution of Sibling Embeddings. Findings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023), pp. 6868–6882. (PDF)
Hiroto Tamura, Tosho Hirasawa, Hwichan Kim and Mamoru Komachi. Does Masked Language Model Pre-training with Artificial Data Improve Low-resource Neural Machine Translation? Findings of the 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023), pp.2216-2225. (PDF)
Zizheng Zhang, Masato Mita (Cyberagent/TMU) and Mamoru Komachi. Cloze Quality Estimation for Language Assessment. Findings of the 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023), pp.540-550. (PDF)
国際会議(査読あり、予稿なし)
Zhousi Chen and Mamoru Komachi. Discontinuous Combinatory Constituency Parsing. 17th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2023). May, 2023. (poster)
国際会議(査読なし、予稿あり)
Naoya Ueda and Mamoru Komachi. TMU Feedback Comment Generation System Using Pretrained Sequence-to-Sequence Language Models. Proceedings of the 16th International Natural Language Generation Conference: Generation Challenges, pp. 68-73. September, 2023. (poster, PDF)
研究会・全国大会(査読なし、予稿あり)
相田太一 (国語研/都立大), 近藤明日子 (東大), 小木曽智信 (国語研). 「昭和・平成書き言葉コーパス」の語彙統計情報の公開. 言語処理学会第29回年次大会. 2024年3月12日.
Zizheng Zhang (都立大), Masato Mita (サイバーエージェント), Mamoru Komachi (一橋大). A Task of Cloze Explanation Generation for ESL Learning. 言語処理学会第29回年次大会. 2024年3月12日.
凌志棟, 相田太一, 岡照晃 (都立大), 小町守 (一橋大). 日本語意味変化検出の評価セットの拡張と検出手法の評価. 言語処理学会第29回年次大会. 2024年3月12日.
小林正宗 (都立大), 三田雅人 (サイバーエージェント), 小町守 (一橋大). 文法誤り訂正の包括的メタ評価: 既存自動評価の限界と大規模言語モデルの可能性. 言語処理学会第29回年次大会. 2024年3月12日.
Zhishen Yang (東工大), Tosho Hirasawa (都立大), Edison Marrese-Taylor (産総研/東大), Naoaki Okazaki (東工大). Large Language Models as Manga Translators: A Case Study. 言語処理学会第29回年次大会. 2024年3月13日.
佐藤郁子, 平澤寅庄, 金輝燦, 岡照晃 (都立大), 小町守 (一橋大). 語義曖昧性解消に着目した英日マルチモーダル機械翻訳の評価セット構築と分析. 言語処理学会第29回年次大会. 2024年3月13日.
木山朔, 相田太一 (都立大), 小町守 (一橋大), 小木曽智信 (国語研), 高村大也 (産総研), 松井秀俊 (滋賀大), 持橋大地 (統数研). 意味変化分析に向けた単語埋め込みの時系列パターン分析. 言語処理学会第29回年次大会. 2024年3月13日.
上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). Minimal-pair Paradigmデータセットにおけるトークン長バイアスの分析と改善. 言語処理学会第29回年次大会. 2024年3月14日.
大平颯人 (東北大), 金輝燦 (都立大), 小町守 (一橋大). 多言語ゼロショット学習における推論言語に関する分析. 言語処理学会第29回年次大会. 2024年3月14日.
段文傑 (都立大), 王鴻飛 (都立大), 岡照晃 (都立大), 小町守 (一橋大), 古宮嘉那子 (農工大). ニューラル機械翻訳を使った中国語古文の翻訳 -- 訓練・評価時の時間的差異の検証. 情報処理学会人文科学とコンピュータシンポジウム 2023. 2023年12月10日.
小林正宗 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). 文法誤り訂正におけるメタ評価の再考. 情報処理学会第258回自然言語処理研究会. 2023年12月3日.(優秀研究賞受賞)
中島京太郎 (都立大), 金輝燦 (都立大), 平澤寅庄 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移. 情報処理学会第257回自然言語処理研究会. 2023年9月1日.
シンポジウム(査読なし、予稿なし)
中島京太郎 (都立大), 金輝燦 (都立大), 平澤寅庄 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 語彙内トークンを媒介とした大規模言語モデルへのソフトプロンプトの転移. NLP若手の会 (YANS) 第18回シンポジウム. 2022年8月30-31日.(スポンサー賞=LLM-X賞受賞)
上田直生也 (都立大), 三田雅人 (サイバーエージェント/都立大), 小町守 (一橋大). 文法性評価ベンチマークBLiMPにおけるバイアス除去. NLP若手の会 (YANS) 第18回シンポジウム. 2022年8月30-31日.
金輝燦 (都立大), 小町守 (一橋大), 鈴木潤 (東北大). 言語識別器を用いた敵対的学習による多言語モデルの言語横断性の改善. NLP若手の会 (YANS) 第18回シンポジウム. 2022年8月30-31日.
佐藤郁子 (都立大), 平澤寅庄 (都立大), 金輝燦 (都立大), 岡照晃 (一橋大), 小町守 (一橋大). 視覚情報による曖昧性解消に着目した英日マルチモーダル機械翻訳のデータセット構築. NLP若手の会 (YANS) 第18回シンポジウム. 2022年8月30-31日.
雑誌記事・辞典項目等
小町守. 自然言語処理の教育応用の最新動向. 英語教育2023年7月号. 2023年6月. 大修館書店.
須藤克仁 (NAIST), 小町守, 梶原智之(愛媛大学) , 三田雅人(サイバーエージェント/TMU) . NLP2023 テーマセッション「ことばの評価と品質推定」. 自然言語処理, Vol.30, No.2, pp.844-850. 2023年6月. (PDF)
2022年度
学術論文誌(査読あり)
Zhousi Chen and Mamoru Komachi. Discontinuous Combinatory Constituency Parsing. Transactions of the Association for Computational Linguistics. Volume 11, pp.267-283. March, 2023. (PDF)
Kenichiro Ando, Takashi Okumura (Kitami Institute of Technology), Mamoru Komachi, Hiromasa Horiguchi (National Hospital Organization), Yuji Matsumoto (RIKEN). Is Artificial Intelligence Capable of Generating Hospital Discharge Summaries from Inpatient Records? PLOS Digital Health, 1(12): e0000158. December, 2022. (PDF)
Hongfei Wang, Michiki Kurosawa, Satoru Katsumata, Masato Mita (CyberAgent) and Mamoru Komachi. Chinese Grammatical Error Correction Using Pre-trained Models and Pseudo Data. ACM Transactions on Asian and Low-Resource Language Information Processing. October, 2022. (PDF)
Kenichiro Ando, Takashi Okumura (Kitami Institute of Technology), Mamoru Komachi, Hiromasa Horiguchi (National Hospital Organization), Yuji Matsumoto (RIKEN). Exploring Optimal Granularity for Extractive Summarization of Unstructured Health Records: Analysis of the Largest Multi-Institutional Archive of Health Records in Japan. PLOS Digital Health, 1(9): e0000099. September, 2022. (PDF)
Tosho Hirasawa, Masahiro Kaneko, Aizhan Imankulova, Mamoru Komachi. Pre-trained Word Embedding and Language Model Improve Multimodal Machine Translation: A Case Study in Multi30K. IEEE Access, 10.1109/ACCESS.2022.3185243. June, 2022. (PDF)
山下郁海, 金子正弘(東工大), 三田雅人(理研), 勝又智, Imankulova Aizhan, 小町守. 言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正. 自然言語処理, 29巻2号, pp.314-343. 2022. (PDF)
Zhishen Yang (Tokyo Institute of Technology), Tosho Hirasawa, Mamoru Komachi, Naoaki Okazaki (Tokyo Institute of Technology). Why videos do not guide translations in video-guided machine translation? An empirical evaluation of video-guided machine translation dataset. Journal of Information Processing, Vol.30, pp.388-396. 2022年5月. (PDF)
国際会議(査読あり、予稿あり)
Seiichi Inoue, Mamoru Komachi, Toshinobu Ogiso (NINJAL), Hiroya Takamura (AIST) and Daichi Mochihashi (ISM). Infinite SCAN: An Infinite Model of Diachronic Semantic Change. Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), pp.1605-1616. (oral, PDF)
Yuting Zhao and Ioan Calapodescu (NAVER Labs). Multimodal Robustness for Neural Machine Translation. Proceedings of the 2022 Conference on Empirical Methods in Natural Language Processing (EMNLP 2022), pp.8505-8516. (poster, PDF)
Kenichiro Ando, Mamoru Komachi, Takashi Okumura (Kitami Institute of Technology), Hiromasa Horiguchi (National Hospital Organization), Yuji Matsumoto (RIKEN). Is In-hospital Meta-information Useful for Abstractive Discharge Summary Generation? The 27th International Conference on Technologies and Applications of Artificial Intelligence (TAAI 2022). 4 pages. (best paper award)
Seiichiro Kondo, Naoya Ueda, Teruaki Oka, Masakazu Sugiyama (AI Shift), Asahi Hentona (AI Shift) and Mamoru Komachi. Japanese Named Entity Recognition from Automatic Speech Recognition Using Pre-trained Models. Proceedings of the 36th Pacific Asia Conference on Language, Information and Computation (PACLIC 36), pp.102-108. October, 2022. (oral, PDF)
Mana Ashida and Saku Sugawara (NII). Possible Stories: Evaluating Situated Commonsense Reasoning under Multiple Possible Scenarios. Proceedings of the 29th International Conference on Computational Linguistics (COLING 2022), pp.3606-3630. October, 2022. (PDF)
Xiaomeng Pan, Hongfei Wang, Teruaki Oka and Mamoru Komachi. Zuo Zhuan Ancient Chinese Dataset for Word Sense Disambiguation. Proceedings of the 2022 Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technologies: Student Research Workshop, pp.129-135. July, 2022. (PDF)
Mana Ashida and Mamoru Komachi. Towards Automatic Generation of Messages Countering Online Hate Speech and Microaggressions. Proceedings of the 6th Workshop on Online Abuse and Harms (WOAH) 2022, pp.11-23. July, 2022. (PDF, dataset)
Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita, Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. Proceedings of the 13th Edition of Language Resources and Evaluation Conference (LREC 2022), pp.5565-5572. June, 2022. (PDF)
Yujin Takahashi, Masahiro Kaneko, Masato Mita, Mamoru Komachi. ProQE: Proficiency-wise Quality Estimation Dataset for Grammatical Error Correction. Proceedings of the 13th Edition of Language Resources and Evaluation Conference (LREC 2022), pp.5994–6000. June, 2022. (PDF, dataset)
Hwichan Kim, Sangwhan Moon (Tokyo Institute of Technology), Naoaki Okazaki (Tokyo Institute of Technology) and Mamoru Komachi. Learning How to Translate North Korean through South Korean. Proceedings of the 13th Edition of Language Resources and Evaluation Conference (LREC 2022), pp.6711–6718. June, 2022. (PDF)
Keigo Takahashi and Danushka Bollegala (University of Liverpool). Unsupervised Attention-based Sentence-Level Meta-Embeddings from Contextualised Language Models. Proceedings of the 13th Edition of Language Resources and Evaluation Conference (LREC 2022), pp.7155–7163. June, 2022. (PDF)
国際会議(査読あり、予稿なし)
Siti Oryza Khairunnisa, Zhousi Chen, Mamoru Komachi. A Study on Cross-Lingual Transfer for Named Entity Recognition in the Indonesian Language. Sixth International Workshop on Symbolic-Neural Learning (SNL2022). (poster)
Zhousi Chen, Mamoru Komachi. Discontinuous Constituency Parsing and Beyond. Sixth International Workshop on Symbolic-Neural Learning (SNL2022). (poster)
国際会議(査読なし、予稿あり)
Naoya Ueda and Mamoru Komachi. TMU Feedback Comment Generation System Using Pretrained Sequence-to-Sequence Language Models. GenChal 2022: Feedback Comment Generation for Writing Learning.
Seiichiro Kondo and Mamoru Komachi. TMU NMT System with Automatic Post-Editing by Multi-Source Levenshtein Transformer for the Restricted Translation Task of WAT 2022. Workshop on Asian Translation 2022.
研究会(査読なし、予稿あり)
喜友名朝視顕, 岡照晃, 小町守. スキップレイヤー法を用いた BERT の分析. 情報処理学会研究報告自然言語処理, 2022-NL-253巻, 9号, pp.1-6. 2022年9月22日.
小山碧海, 喜友名朝視顕, 三田雅人(サイバーエージェント), 岡照晃, 小町守. 日本語文法誤り訂正コーパスへの誤用タグ付け. 情報処理学会研究報告自然言語処理, 2022-NL-253巻, 17号, pp.1-9. 2022年9月22日.
全国大会(査読なし、予稿あり)
佐藤郁子, 平澤寅庄, 金輝燦, 岡照晃, 小町守. マルチモーダル機械翻訳における画像・入力文間類似度と翻訳品質の相関の分析. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
平澤寅庄, 小町守. 視覚翻訳言語モデルを用いた英日マルチモーダル機械翻訳. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
上田直生也, 岡照晃 , 杉山雅和 (AI Shift), 邊土名朝飛 (AI Shift), 小町守. 日本語T5を用いたEntity辞書のメンション候補自動獲得手法の提案と評価. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
陳宙斯, 小町守. DAG Conversion for Penn Treebank. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
安道健一郎, 関根聡 (理研), 小町守. Wikipediaにおける文の品質推定のための大規模データセット. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
長井慶成, 岡照晃, 小町守. 文書単位の日本語テキスト平易化コーパスの構築に向けて. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
榎本大晟, 平澤寅庄, 金輝燦, 岡照晃, 小町守. ニューラル機械翻訳における単語分割器のドメイン適応. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
木山朔, 金輝燦, 平澤寅庄, 岡照晃, 小町守. Decoderのみを用いた機械翻訳モデルの分析. 言語処理学会第29回年次大会. 2023年3月6日. (PDF)
シンポジウム(査読なし、予稿なし)
喜友名朝視顕, 小町守. In-Context Learningにおける事例の順番に関する分析. 電子情報通信学会言語理解とコミュニケーション研究会. 2023年3月18日.
佐藤郁子,平澤寅庄,金輝燦,岡照晃,小町守. 原文に対して補完的な画像はMMTモデルの翻訳精度を向上させるのか. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月29日.(奨励賞受賞)
木山朔,金輝燦,平澤寅庄,岡照晃,小町守. Causal言語モデルによる機械翻訳. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.(奨励賞受賞)
榎本大晟,平澤寅庄,金輝燦,岡照晃,小町守. 事前学習を用いる機械翻訳での単語分割同時最適化の検討. NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.
中島京太郎,金輝燦,平澤寅庄,岡照晃,小町守. 訓練データからの文選択手法の機械翻訳における特徴分析 . NLP若手の会 (YANS) 第17回シンポジウム. 2022年8月30日.
雑誌記事・辞典項目等
持橋大地(統数研), 小木曽智信(国語研), 高村大也(産総研), 小町守. 「言語統計力学」=言語学・自然言語処理・物理学. 自然言語処理, 29巻, 3号, pp.1030-1036. 2022年.
2021年度
学術論文誌(査読あり)
喜友名朝視顕, 平澤寅庄, 小町守, 小木曽智信(国語研). 事前学習モデルを用いた近代文語文のニューラル機械翻訳. 情報処理学会論文誌, 63巻2号, pp.269-282. February, 2022.
本間広樹, 小町守. 高速な文法誤り訂正機能を持つ日本語ライティング支援システムの構築. 人工知能学会論文誌, 37巻1号, pp.B-L22_1-14. January, 2022. (PDF)
Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, and Chenhui Chu (Kyoto University). Region-Attentive Multimodal Neural Machine Translation. Neurocomputing, Volume 476, pp.1-13. January, 2022. (PDF)
Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, and Chenhui Chu (Kyoto University). Word-Region Alignment-Guided Multimodal Neural Machine Translation. IEEE/ACM Transactions on Audio, Speech and Language Processing, Volume 30, pp.244-259. December, 2021. (PDF)
吉村綾馬, 金子正弘, 梶原智之(愛媛大), 小町守. 文法誤り訂正の参照文を用いない自動評価への最適化. 自然言語処理, 28巻, 2号, pp.404-427. June 15, 2021. (PDF)
甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における訂正度を考慮した多様な訂正文の生成. 自然言語処理, 28巻, 2号, pp.428-449. June 15, 2021. (PDF)
Longtu Zhang and Mamoru Komachi. Using Sub-Character Level Information for Neural Machine Translation of Logographic Languages. ACM Transaction on Asian and Low-Resource Language Information Processing. Vol.20, No.2, Article No.31, pp.1-15. April 15, 2021. (PDF)
国際会議(査読あり、予稿あり)
Kazuma Kobayashi, Taichi Aida and Mamoru Komachi. Analyzing Semantic Changes in Japanese Words Using BERT. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC 2021), pp. 273-283. November 7, 2021. (PDF)
Taichi Aida, Mamoru Komachi, Toshinobu Ogiso (National Institute for Japanese Language and Linguistics), Hiroya Takamura (National Institute of Advanced Science and Technology), Daichi Mochihashi (The Institute of Statistical Mathematics). A Comprehensive Analysis of PMI-based Models for Measuring Semantic Differences. In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC 2021), pp. 21-31. November 7, 2021. (PDF)
Hwichan Kim and Mamoru Komachi. Can Monolingual Pre-trained Encoder-Decoder Improve NMT for Distant Language Pairs? In Proceedings of the 35th Pacific Asia Conference on Language, Information and Computation (PACLIC 2021), pp. 235-243. November 7, 2021. (PDF)
Seiichi Inoue, Taichi Aida, Mamoru Komachi and Manabu Asai (Soka University). Modeling Text using the Continuous Space Topic Model with Pre-Trained Word Embeddings. Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing: Student Research Workshop, pp.138-147. August, 2021. (PDF)
Zhousi Chen, Longtu Zhang, Aizhan Imankulova and Mamoru Komachi. Neural Combinatory Constituency Parsing. Findings of the Association for Computational Linguistics: ACL-IJCNLP 2021, pp.2199-2213. August, 2021. (paper)
Zhisheng Yang (Tokyo Institute of Technology), Tosho Hirasawa, Naoaki Okazaki (Tokyo Institute of Technology), Mamoru Komachi. Do Videos Guide Translations? Evaluation of a Video-Guided Machine Translation dataset. In Proceedings of the Workshop on Visually Grounded Interaction and Language. June 10, 2021. (PDF)
Seiichiro Kondo, Kengo Hotate, Tosho Hirasawa, Masahiro Kaneko and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, pp. 143-149. June 8, 2021. (PDF)
Aomi Koyama, Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. In Proceedings of the 2021 Conference of the North American Chapter of the Association for Computational Linguistics: Student Research Workshop, pp. 126-135. June 8, 2021. (PDF)
Rob van der Goot (IT University of Copenhagen), Marija Stepanovic (IT University of Copenhagen), Alan Ramponi (IT University of Copenhagen), Ibrahim Sharaf, Ahmet Üstün (University of Groningen), Aizhan Imankulova, Siti Oryza Khairunnisa, Mamoru Komachi and Barbara Plank (IT University of Copenhagen). From Masked-Language Modeling to Translation: Non-English Auxiliary Tasks Improve Zero-shot Spoken Language Understanding. In Proceedings of the 2021 Annual Conference of the North American Chapter of the Association for Computational Linguistics: Human Language Technology (NAACL-HLT 2021), pp. 2479-2497. June 8, 2021. (PDF)
Masahiro Kaneko and Danushka Bollegala (University of Liverpool). Debiasing Pre-trained Contextualised Embeddings. The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL), pp. 1256-1266. April, 2021. (PDF)
Masahiro Kaneko and Danushka Bollegala (University of Liverpool). Dictionary-based Debiasing of Pre-trained Word Embeddings. The 16th Conference of the European Chapter of the Association for Computational Linguistics (EACL), pp. 212-223. April, 2021. (PDF)
国際会議(査読あり、予稿なし)
Zhousi Chen, Longtu Zhang, Aizhan Imankulova and Mamoru Komachi. Neural Combinatory Constituency Parsing. In The 17th International Conference on Parsing Technologies (IWPT 2021). August 6, 2021.
Rob van der Goot (IT University of Copenhagen), Marija Stepanovic (IT University of Copenhagen), Alan Ramponi (IT University of Copenhagen), Ibrahim Sharaf, Ahmet Üstün (University of Groningen), Aizhan Imankulova, Siti Oryza Khairunnisa, Mamoru Komachi and Barbara Plank (IT University of Copenhagen). Multilingual Slot and Intent Detection (xSID) with Cross-lingual Auxiliary Tasks. In the 3rd Workshop on Computational Research in Typology and Multilingual NLP (SIGTYP 2021). June 10, 2021.
国際会議(査読なし、予稿あり)
Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Ehime University) and Chenhui Chu (Kyoto University). TMEKU System for the WAT2021 Multimodal Translation Task. In Proceedings of The 8th Workshop on Asian Translation, pp.174-180. August, 2021.
Hwichan Kim, Mamoru Komachi. TMU NMT System with Japanese BART for the Patent task of WAT 2021. In Proceedings of The 8th Workshop on Asian Translation, pp.133-137. August, 2021.
Seiichiro Kondo, Aomi Koyama, Tomoshige Kiyuna, Tosho Hirasawa and Mamoru Komachi. Machine Translation with Pre-specified Target-side Words Using a Semi-autoregressive Model. In Proceedings of The 8th Workshop on Asian Translation, pp.68-73. August, 2021.
その他査読なし論文
Daisuke Suzuki, Yujin Takahashi, Ikumi Yamashita, Taichi Aida, Tosho Hirasawa, Michitaka Nakatsuji, Masato Mita, Mamoru Komachi. Construction of a Quality Estimation Dataset for Automatic Evaluation of Japanese Grammatical Error Correction. In arXiv e-prints, 2201.08038 (8 pages). January, 2022. (paper)
Yujin Takahashi, Masahiro Kaneko, Masato Mita, Mamoru Komachi. Proficiency Matters Quality Estimation in Grammatical Error Correction. In arXiv e-prints, 2201.06199 (6 pages). January, 2022. (paper)
Zhousi Chen, Longtu Zhang, Aizhan Imankulova and Mamoru Komachi. Neural Combinatory Constituency Parsing. In arXiv e-prints, 2106.06689 (15 pages). June, 2021. (paper)
Rob van der Goot (IT University of Copenhagen), Marija Stepanovic (IT University of Copenhagen), Alan Ramponi (IT University of Copenhagen), Ibrahim Sharaf, Ahmet Üstün (University of Groningen), Aizhan Imankulova, Siti Oryza Khairunnisa, Mamoru Komachi and Barbara Plank (IT University of Copenhagen). From Masked-Language Modeling to Translation: Non-English Auxiliary Tasks Improve Zero-shot Spoken Language Understanding. In arXiv e-prints, 2105.07316. May, 2021. (paper)
Aomi Koyama, Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Comparison of Grammatical Error Correction Using Back-Translation Models. In arXiv e-prints, 2104.07848 (10 pages). April, 2021. (paper)
Seiichiro Kondo, Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Sentence Concatenation Approach to Data Augmentation for Neural Machine Translation. In arXiv e-prints, 2106.06689 (7 pages). April, 2021. (paper)
全国大会(査読なし、予稿あり)
小林正宗(芝浦工大) 高橋悠進, 三田雅人(理研/都立大), 小町守. ニューラル文法誤り訂正システムにおけるリランキングの改善に向けたオラクル分析. 言語処理学会第28回年次大会. 2022年3月15日.
凌志棟, 相田太一, 金輝燦, 岡照晃, 小林千真, 小町守. 日本語BERTを用いた単語の用例の分野別分析ツールの開発. 言語処理学会第28回年次大会. 2022年3月16日.
山下郁海, 岡照晃, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 日本語T5モデルを用いた障害レポートからの重要箇所抽出. 言語処理学会第28回年次大会. 2022年3月16日.
小林千真, 山下郁海, 岡照晃, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 対照学習による文ベクトルを使用した障害レポートのクラスタリング. 言語処理学会第28回年次大会. 2022年3月16日.
田村弘人, 平澤寅庄, 金輝燦, 岡照晃, 小町守. 人工データでの事前学習によるニューラル機械翻訳の性能向上. 言語処理学会第28回年次大会. 2022年3月17日.
近藤明日子(国語研), 相田太一, 小木曽智信(国語研). 近現代雑誌通時コーパスの語彙統計情報の公開. 言語処理学会第28回年次大会. 2022年3月17日.
木山朔, 上坂奏人, 佐藤郁子, 佐藤京也, 米田悠人, 小山碧海, 三田雅人(理研/都立大), 岡照晃, 小町守. 日本語文法誤り訂正の流暢性評価に向けたデータ作成. 言語処理学会第28回年次大会. 2022年3月17日.
今藤誠一郎, 上田直生也, 岡照晃, 杉山雅和 (AI Shift), 邊土名朝飛 (AI Shift), 小町守. 事前学習モデルを用いた音声認識結果からの固有表現抽出. 言語処理学会第28回年次大会. 2022年3月17日.
井上誠一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). ガウス確率場による単語の意味変化と語義数の同時推定. 言語処理学会第28回年次大会. 2022年3月17日.
井上誠一, 小町守, 小木曽智信(国語研), 高村大也(産総研), 持橋大地(統数研). Infinite SCAN: 単語の意味変化と語義数の同時推定. 電子情報通信学会情報論的学習理論と機械学習研究会 (IBISML). 2022年3月9日.
平尾礼央, 小町守, 岡照晃. 美容品レビューのクリック予測に向けたマルチモーダルデータの利用. 情報処理学会第251回自然言語処理研究会. Vol.2021-NL-251, No.3, pp. 1-7. 2021.
杉山雅和 (AI Shift), 吉村綾馬, 友松祐太 (AI Shift), 小町守. 日本語音声認識誤り訂正のための擬似誤りデータ作成と評価. 人工知能学会全国大会, 2Yin5-04. June 9, 2021.
シンポジウム(査読なし、予稿なし)
蘆田真奈,金子正弘,平澤寅庄,小町守. QAタスクにおけるGPTの性差別的バイアスの評価及びプロンプトを用いたバイアス除去手法の検討. YANS 2021.
小山碧海,金子正弘,小町守. 学習者データに対する擬似誤り生成を用いた文法誤り訂正モデルの分析. YANS 2021.
上田直生也,山下郁海,高橋悠進,平澤寅庄,小町守. 疑似データによるデータ拡張を行った文法誤り検出モデルの未知の誤りパターンに対する性能評価. YANS 2021.
鈴木大祐,高橋悠進,山下郁海,相田太一,平澤寅庄,小町守. 日本語文法誤り訂正の参照文を用いない自動評価における人手評価への最適化. YANS 2021.
中辻充恭,山下郁海,高橋悠進,平澤寅庄,小町守. Prompting を用いた GPT による文法誤り訂正の検討とその分析. YANS 2021.
商用誌記事・辞典項目等
須藤克仁(NAIST), 小町守, 梶原智之. NLP2021 ワークショップ: 文章の評価と品質推定〜人間・機械の「作文」の巧拙をどう見極めるか?〜. 自然言語処理, Vol.28, No.3, pp.895-900. September 15, 2021.
2020年度
学術論文誌(査読あり)
梶原智之(阪大), 西原大貴(阪大), 小平知範, 小町守. 日本語の語彙平易化のための言語資源の整備. 自然言語処理, 27巻, 4号, pp.801-824. December, 2020. (paper)
新井美桜, 金子正弘, 小町守. 日本語学習者向けの文法誤り検出機能付き作文用例検索システム. 人工知能学会論文誌, 35巻, 5号, pp.1-9. September, 2020. (paper)
国際会議(査読あり)
Kengo Hotate, Masahiro Kaneko and Mamoru Komachi. Generating Diverse Corrections with Local Beam Search for Grammatical Error Correction. In Proceedings of the 28th International Conference on Computational Linguistics (COLING), pp. 2132-2137. December 9, 2020. (paper)
Ryoma Yoshimura, Masahiro Kaneko, Tomoyuki Kajiwara (Osaka University) and Mamoru Komachi. SOME: Reference-less Sub-Metrics Optimized for Manual Evaluations of Grammatical Error Correction. In Proceedings of the 28th International Conference on Computational Linguistics (COLING), pp. 6516-6522. December 12, 2020. (paper)
Masahiro Kaneko and Danushka Bollegala (University of Liverpool). Autoencoding Improves Pre-trained Word Embeddings. In Proceedings of the 28th International Conference on Computational Linguistics (COLING), pp. 1699-1713. December 8, 2020. (paper)
Ikumi Yamashita, Satoru Katsumata, Masahiro Kaneko, Aizhan Imankulova and Mamoru Komachi. Cross-lingual Transfer Learning for Grammatical Error Correction. In Proceedings of the 28th International Conference on Computational Linguistics (COLING), pp.4704-4715. December 11, 2020. (paper)
Hongfei Wang, Michiki Kurosawa, Satoru Katsumata and Mamoru Komachi. Chinese Grammatical Correction Using BERT-based Pre-trained Model. In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP), pp.163-168. December 5, 2020. (paper)
Satoru Katsumata and Mamoru Komachi. Stronger Baselines for Grammatical Error Correction Using a Pretrained Encoder-Decoder Model. In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing (AACL-IJCNLP), pp. 827-832. December 6, 2020. (paper)
Siti Oryza Khairunnisa, Aizhan Imankulova and Mamoru Komachi. Towards a Standardized Dataset on Indonesian Named Entity Recognition. In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing: Student Research Workshop (AACL-IJCNLP SRW 2020), pp.64-71. December 7, 2020. (paper)
Mana Ashida, Seunghun Lee (International Christian University) and Kunzang Mamgyal (NBDD Colledge). Building a Part-of-Speech Tagged Corpus for Drenjongke (Bhutia). In Proceedings of the 1st Conference of the Asia-Pacific Chapter of the Association for Computational Linguistics and the 10th International Joint Conference on Natural Language Processing: Student Research Workshop (AACL-IJCNLP SRW 2020), pp.57-63. December 7, 2020. (paper)
Hiroki Homma and Mamoru Komachi. Non-Autoregressive Grammatical Error Correction Towards a Writing Support System. In Proceedings of the 6th Workshop on Natural Language Processing Techniques for Educational Application (NLP-TEA), pp.1-10. December 4, 2020. (paper)
Zizheng Zhang, Tosho Hirasawa, Wei Houjing, Masahiro Kaneko and Mamoru Komachi. Translation of New Named Entities from English to Chinese. In Proceedings of the 7th Workshop on Asian Translation (WAT), pp.58-63. December 4, 2020. (paper)
Aizhan Imankulova, Masahiro Kaneko, Tosho Hirasawa and Mamoru Komachi. Towards Multimodal Simultaneous Neural Machine Translation. In Proceedings of the Fifth Conference on Machine Translation (WMT), pp.594-603. November, 2020. (paper)
Masato Mita (RIKEN AIP/Tohoku University), Shun Kiyono (RIKEN AIP/Tohoku University), Masahiro Kaneko, Jun Suzuki (Tohoku University/RIKEN AIP) and Kentaro Inui (Tohoku University/RIKEN AIP). A Self-Refinement Strategy for Noise Reduction in Grammatical Error Correction. Findings of the Association for Computational Linguistics: The 2020 Conference on Empirical Methods in Natural Language Processing, pp.267-280. Novermber, 2020.
Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Osaka University), Chenhui Chu (Osaka University). Double Attention-based Multimodal Neural Machine Translation with Semantic Image Regions. In The 22nd Annual Conference of the European Association for Machine Translation (EAMT 2020), pp.105-114. Lisbon, Portugal. November, 2020. (paper)
Masashi Takaku (Ibaraki University), Tosho Hirasawa, Mamoru Komachi, Kanako Komiya (Ibaraki University). Neural Machine Translation from Historical Japanese to Contemporary Japanese Using Diachronically Domain-Adapted Word Embeddings. In The 34th Pacific Asia Conference on Language, Information and Computation (PACLIC). October, 2020. (accepted)
Hwichan Kim, Tosho Hirasawa and Mamoru Komachi. Zero-shot North Korean to English Neural Machine Translation by Character Tokenization and Phoneme Decomposition. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2020 SRW), pp.72-78. Seattle, WA, USA. July, 2020. (paper)
Yujin Takahashi, Satoru Katsumata and Mamoru Komachi. Grammatical Error Correction Using Pseudo Learner Corpus Considering Learner's Error Tendency. In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics: Student Research Workshop (ACL 2020 SRW), pp.27-32. Seattle, WA, USA. July, 2020. (paper)
Masahiro Kaneko, Masato Mita, Shun Kiyono, Jun Suzuki and Kentaro Inui. Can Encoder-decoder Models Benefit from Pre-trained Language Representation in Grammatical Error Correction? In Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics (ACL 2020), pp.4258-4254. Seattle, WA, USA. July, 2020. (paper)
Reo Hirao, Mio Arai, Hiroki Shimanaka, Satoru Katsumata and Mamoru Komachi. Automated Essay Scoring System for Nonnative Japanese Learners. In 12th International Conference on Language Resources and Evaluation (LREC 2020), pp.1250-1257. Marseille, France. 2020. (paper)
Aomi Koyama, Tomoshige Kiyuna, Kenji Kobayashi, Mio Arai and Mamoru Komachi. Construction of an Evaluation Corpus for Grammatical Error Correction for Learners of Japanese as a Second Language. In 12th International Conference on Language Resources and Evaluation (LREC 2020), pp.204-211. Marseille, France. 2020. (paper)
国際会議(査読あり、予稿なし)
Rob van der Goot (IT University of Copenhagen), Marija Stepanovic (IT University of Copenhagen), Alan Ramponi (IT University of Copenhagen), Ibrahim Sharaf, Ahmet Üstün (University of Groningen), Aizhan Imankulova, Siti Oryza Khairunnisa, Mamoru Komachi and Barbara Plank (IT University of Copenhagen). Cross-lingual multi-task transfer for zero-shot task-oriented dialog. Workshop on RESOURCEs and representations For Under-resourced Languages and domain. November, 2020.
国際会議(査読なし、予稿あり)
Hiroto Tamura, Tosho Hirasawa, Masahiro Kaneko and Mamoru Komachi. TMU Japanese-English Multimodal Machine Translation System for WAT 2020. In Proceedings of the 7th Workshop on Asian Translation (WAT), pp. 80-91. December, 2020. (paper)
Hwichan Kim, Tosho Hirasawa and Mamoru Komachi. Korean to Japanese Neural Machine Translation System Using Hanja Information. In Proceedings of the 7th Workshop on Asian Translation (WAT), pp. 127-134. December, 2020. (paper)
Hongfei Wang and Mamoru Komachi. TMU System Using BERT-based Pre-trained Model to the NLP-TEA CGED Shared Task 2020. In Proceedings of the 6th Workshop on Natural Language Processing (NLP-TEA), pp.87-90. December 4, 2020. (paper)
Akifumi Nakamachi (Osaka University), Hiroki Shimanaka, Tomoyuki Kajiwara (Osaka University) and Mamoru Komachi. TMUOU submission for WMT20 Quality Estimation Shared Task. In Proceedings of the Fifth Conference on Machine Translation (WMT 2020), pp.1035-1039. November, 2020. (paper)
Masahiro Kaneko, Aizhan Imankulova, Tosho Hirasawa and Mamoru Komachi. English-to-Japanese Diverse Translation Using Opposite Direction Models. In Proceedings of the 4th Workshop on Neural Generation and Translation (WNGT 2020). Seattle, WA, USA. July, 2020. (paper)
特許
Mamoru Komachi, Shin Kanouchi, Tomoya Ogata, Tomoya Takatani (Toyota Motor Corporation). OUTPUT SENTENCE GENERATION APPARATUS, OUTPUT SENTENCE GENERATION METHOD, AND OUTPUT SENTENCE GENERATION PROGRAM. US-10643032-B2. May 5, 2020.
小町守, 叶内晨, 尾形朋哉, 高谷智哉(トヨタ自動車株式会社). 出力文生成装置、出力文生成方法および出力文生成プログラム. 特許第6815899号. December 25, 2020.
その他査読なし論文
Hongfei Wang, Michiki Kurosawa, Satoru Katsumata, Mamoru Komachi. Chinese Grammatical Correction Using BERT-based Pre-trained Model. In arXiv e-prints, 2011.02093 (6 pages). November, 2020. (paper)
Masahiro Kaneko and Danushka Bollegala. Autoencoding Improves Pre-trained Word Embeddings. In arXiv e-prints, 2010.13094. October, 2020. (paper)
Masato Mita, Shun Kiyono, Masahiro Kaneko, Jun Suzuki and Kentaro Inui. A Self-Refinement Strategy for Noise Reduction in Grammatical Error Correction. In arXiv e-prints, 2010.03155. (paper)
Shinnosuke Takamichi (The University of Tokyo), Mamoru Komachi, Naoko Tanji (The University of Tokyo, Hiroshi Saruwatari (The University of Tokyo). JSSS: free Japanese speech corpus for summarization and simplificaiton. In arXiv e-prints, 2010.01793 (4 pages). October, 2020. (paper)
Tosho Hirasawa, Zhishen Yang (Tokyo Institute of Technolgy), Mamoru Komachi and Naoaki Okazaki (Tokyo Institute of Technology). Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020. In arXiv e-prints, 2006.12799 (4 pages). June, 2020. (paper)
Satoru Katsumata and Mamoru Komachi. Stronger Baselines for Grammatical Error Correction Using Pretrained Encoder-Decoder Model. In arXiv e-prints, 2005.11849 (6 pages). May, 2020. (paper)
Aizhan Imankulova, Masahiro Kaneko, Tosho Hirasawa and Mamoru Komachi. Towards Multimodal Simultaneous Neural Machine Translation. In arXiv e-prints, 2004.03180 (12 pages). April, 2020. (paper)
研究会(査読なし、予稿あり)
安道健一郎, 奥村貴史(北見工大/理研), 小町守, 堀口裕正(国立病院機構), 松本裕治(理研). 診療録解析のための文のセグメント分割と意味ラベル付与. 情報処理学会第246回自然言語処理研究会. December 2, 2020.
本間広樹, 小町守. 非自己回帰モデルを用いた高速な日本語文法誤り訂正. 情報処理学会第245回自然言語処理研究会. September 30, 2020.
安道健一郎, 関根聡(理研), 小町守. Wikipedia における読者属性を考慮した引用要否の分析. 情報処理学会第245回自然言語処理研究会. September 30, 2020.
全国大会(査読なし、予稿あり)
Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Ehime University), Chenhui Chu (Kyoto University). Neural Machine Translation with Semantically Relevant Image Regions. 言語処理学会第27回年次大会. 2021年3月18日.
本間 広樹, 小町 守, 真鍋 章(富士電機), 谷本 恒野(富士電機). BERTモデルを用いた障害レポートに対する重要箇所抽出. 言語処理学会第27回年次大会. 2021年3月16日.
山下 郁海, 小町 守, 真鍋 章(富士電機), 谷本 恒野.(富士電機) 隠れ層補間によるデータ拡張を用いた障害レポート分類. 言語処理学会第27回年次大会. 2021年3月18日.
蘆田 真奈, 平澤 寅庄, 金子 正弘, 小町 守. 日本語 BERT による否定表現認識についての分析. 言語処理学会第27回年次大会. 2021年3月17日.
相田 太一, 小町 守, 小木曽 智信(国語研), 高村 大也(産総研), 持橋 大地(統数研). 通時的な単語の意味変化を捉える単語分散表現の結合学習. 言語処理学会第27回年次大会. 2021年3月17日.
喜友名 朝視顕, 平澤 寅庄, 小町 守, 小木曽 智信(国語研). 事前学習モデルを用いた近代文語文の現代語機械翻訳. 言語処理学会第27回年次大会. 2021年3月16日.
喜友名 朝視顕, 吉村 綾馬, 金子 正弘, 小町 守. マルチタスク学習を用いた系列変換タスクの品質推定. 言語処理学会第27回年次大会. 2021年3月18日.
小山 碧海, 甫立 健悟, 金子 正弘, 小町 守. 文法誤り訂正における複数の逆翻訳モデルを利用した訂正傾向の比較. 言語処理学会第27回年次大会. 2021年3月17日.
今藤 誠一郎, 甫立 健悟, 平澤 寅庄, 金子 正弘, 小町 守. 2 文の連結を用いた機械翻訳におけるデータ拡張. 言語処理学会第27回年次大会. 2021年3月16日.
井上 誠一(創価大), 相田 太一, 浅井 学(創価大), 小町 守. 学習済み単語分散表現を用いた連続空間トピックモデル. 言語処理学会第27回年次大会. 2021年3月17日.
小林 千真(法政大), 相田 太一, 小町 守. BERT を使用した日本語の単語の通時的な意味変化の分析. 言語処理学会第27回年次大会. 2021年3月17日. 2021年3月17日.
シンポジウム等(査読なし、予稿なし)
高橋悠進, 金子正弘, 小町守. 文法誤り訂正における品質推定モデルに対する習熟度の影響の分析. 言語処理学会第27回年次大会ワークショップ文章の評価と品質推定. March 19, 2021.
吉村綾馬, 杉山雅和(AI Shift), 友松祐太(AI Shift), 小町守. 音声認識誤り検出における文単位のラベルからの単語単位の誤り予測. NLP 若手の会第15回シンポジウム. September 23, 2020.
小山碧海, 甫立健悟, 金子正弘, 小町守. 文法誤り訂正における複数の擬似誤り生成モデルの比較. NLP 若手の会第15回シンポジウム. September 23, 2020.
今藤誠一郎, 甫立健悟, 平澤寅庄, 金子正弘, 小町守. 機械翻訳における非自己回帰モデルの複数言語の出力分析. NLP 若手の会第15回シンポジウム. September 23, 2020.
喜友名朝視顕, 吉村綾馬, 金子正弘, 小町守. 項目別マルチタスク学習による系列変換タスクの品質推定. NLP 若手の会第15回シンポジウム. September 23, 2020.
相田太一, 小町守, 小木曽智信(国語研), 高村大也(産総研/東工大), 坂田綾香(統数研), 小山慎介(統数研), 持橋大地(統数研). 単語分散表現の結合学習による単語の意味の通時的変化の分析. 「通時コーパス」シンポジウム, 2020年9月13日.(口頭)
相田太一, 小町守, 小木曽智信(国語研), 持橋大地(統数研). 単語分散表現を用いた近現代日本語の意味変化の抽出. 昭和・平成書き言葉コーパスによる近現代日本語の実証的研究. 2020年8月8日.(口頭)
2019年度
学術論文誌(査読あり)
白井良介, 松村雪桜, 小木曽智信(国語研), 小町守. 近代の歴史的資料を対象とした機械学習による文境界推定. 情報処理学会論文誌. 61巻2号, pp.152-161. February, 2020. (paper)
Aizhan Imankulova, Takayuki Sato and Mamoru Komachi. Filtered Pseudo-Parallel Corpus Improves Low-Resource Neural Machine Translation. ACM Transactions on Asian and Low-Resource Language Information Processing. Vol. 19, No. 2, Article 24, 16 pages. October, 2019. (paper)
Masahiro Kaneko and Mamoru Komachi. Multi-Head Multi-Layer Attention to Deep Language Representations for Grammatical Error Detection. Computacion y Sistemas. Vol. 23, No. 3, pp. 883-891. September, 2019. (paper)
嶋中宏希, 梶原智之, 小町守. 事前学習された文の分散表現を用いた機械翻訳の自動評価. 自然言語処理. 26巻3号, pp.613-634. September, 2019. (paper)
国際会議(査読あり)
Hayahide Yamagishi and Mamoru Komachi. Improving Context-aware Neural Machine Translation with Target-side Context. 16th International Conference on the Pacific Association for Computational Linguistics (PACLING 2019). October 11-13, 2019. (oral; Best Student Paper)
Keigo Takahashi, Hikaru Omori and Mamoru Komachi. Japanese Predicate Argument Structure Analysis with Pointer Networks. 16th International Conference on the Pacific Association for Computational Linguistics (PACLING 2019). October 11-13, 2019. (oral)
Michiki Kurosawa and Mamoru Komachi. Dynamic Fusion: Attentional Language Model for Neural Machine Translation. 16th International Conference on the Pacific Association for Computational Linguistics (PACLING 2019). October 11-13, 2019. (oral)
Longtu Zhang and Mamoru Komachi. Chinese--Japanese Unsupervised Neural Machine Translation Using Sub-character Level Information. The 33rd Pacific Asia Conference on Language, Information and Computation (PACLIC 33). September, 2019. (oral, paper)
Tosho Hirasawa and Mamoru Komachi. Debiasing Word Embeddings Improves Multimodal Machine Translation. In Proceedings of the 17th Machine Translation Summit (MT Summit 2019), pp. 32-42. Dublin, Ireland. August, 2019. (oral, paper)
Aizhan Imankulova, Raj Dabre, Atsushi Fujita, and Kenji Imamura. Exploiting Out-of-Domain Parallel Data through Multilingual Transfer Learning for Low-Resource Neural Machine Translation. In Proceedings of the 17th Machine Translation Summit (MT Summit 2019), pp. 128-139. Dublin, Ireland. August, 2019. (oral, paper)
Mio Arai, Masahiro Kaneko and Mamoru Komachi. Grammatical-Error-Aware Incorrect Example Retrieval System for Learners of Japanese as a Second Language. In 14th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 14), pp. 296-305. August 2, 2019. (poster, full paper)
Kengo Hotate, Masahiro Kaneko, Satoru Katsumata and Mamoru Komachi. Controlling Grammatical Error Correction Using Word Edit Rate. In The 2019 ACL Student Research Workshop (SRW), pp. 149-154. July, 2019. (poster, paper)
Mio Arai, Tomonori Kodaira and Mamoru Komachi. Sakura: Large-scale Incorrect Example Retrieval System for Learners of Japanese as a Second Language. In The 57th Annual Meeting of the Association for Computational Linguistics (ACL 2019): System Demonstrations, pp. 1-6. July, 2019. (poster, paper)
Masahiro Kaneko and Danushka Bollegala. Gender-preserving Debiasing for Pre-trained Word Embeddings. In Proceedings of the 57th Annual Meeting of the Association for Computational Linguistics (ACL 2019), pp. 1641-1650. July, 2019. (oral, full paper)
Hikaru Omori and Mamoru Komachi. Multi-Task Learning for Japanese Predicate Argument Structure Analysis. In 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2019), pp. 3404-3414. June 5, 2019. (poster; full paper)
Masato Mita, Tomoya Mizumoto, Masahiro Kaneko, Ryo Nagata and Kentaro Inui. Cross-Corpora Evaluation and Analysis of Grammatical Error Correction Models — Is Single-Corpus Evaluation Enough? In 2019 Annual Conference of the North American Chapter of the Association for Computational Linguistics (NAACL-HLT 2019), pp. 1309-1314. June 3, 2019. (poster; short paper)
Tosho Hirasawa, Hayahide Yamagishi, Yukio Matsumura, Mamoru Komachi. Multimodal Machine Translation with Embedding Prediction. In NAACL Student Research Workshop (SRW) 2019, pp. 86-91. June 4, 2019. (oral, paper)
Masahiro Kaneko and Mamoru Komachi. Multi-Head Multi-Layer Attention to Deep Language Representations for Grammatical Error Detection. In 20th International Conference on Computational Linguistics and Intelligent Text Processing (CICLing). April, 2019. (poster; see arXiv)
国際会議(査読あり、予稿なし)
Zhousi Chen, Longtu Zhang, Mamoru Komachi. Neural Combinatory Constituency Parsing. In the Third International Workshop on Symbolic-Neural Learning (SNL-2019). July 12, 2019. (poster)
国際会議(査読なし、予稿あり)
Aizhan Imankulova, Masahiro Kaneko, Mamoru Komachi. Japanese-Russian TMU Neural Machine Translation System using Multilingual Model for WAT 2019. In Proceedings of the 6th Workshop on Asian Translation (WAT): News Commentary Task, pp.165-170. December 4, 2019.
Ryoma Yoshimura, Hiroki Shimanaka, Yukio Matsumura, Hayahide Yamagishi, Mamoru Komachi. Filtering Pseudo-References by Paraphrasing for Automatic Evaluation of Machine Translation. In Fourth Conference on Machine Translation (WMT19) Shared Task: Metrics, pp. 521-525. August 1-2, 2019. (paper)
Satoru Katsumata and Mamoru Komachi. (Almost) Unsupervised Grammatical Error Correction using Synthetic Comparable Corpus. In 14th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 14): Shared Task, pp. 134-138. August 2, 2019. (paper)
Masahiro Kaneko, Kengo Hotate, Satoru Katsumata and Mamoru Komachi. TMU Transformer System Using BERT for Re-ranking at BEA 2019 Grammatical Error Correction on Restricted Track. In 14th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 14): Shared Task, pp. 207-212. August 2, 2019. (paper)
その他査読なし論文
Michiki Kurosawa and Mamoru Komachi. Dynamic Fusion: Attentional Language Model for Neural Machine Translation. In arXiv e-prints, 1909.04879 (13 pages). September 2019. (paper)
Hayahide Yamagishi and Mamoru Komachi. Improving Context-aware Neural Machine Translation with Target-side Context. In arXiv e-prints, 1909.00531 (12 pages). September 2019. (paper)
Hiroki Shimanaka, Tomoyuki Kajiwara and Mamoru Komachi. Machine Translation Evaluation with BERT Regressor. In arXiv e-prints, 1907.12679 (6 pages). July 2019. (paper)
Satoru Katsumata and Mamoru Komachi. Towards Unsupervised Grammatical Error Correction using Statistical Machine Translation with Synthetic Comparable Corpus. In arXiv e-prints, 1907.09724 (7 pages). July 2019. (paper)
Tosho Hirasawa and Mamoru Komachi. Debiasing Word Embeddings Improves Multimodal Machine Translation. In arXiv e-prints, 1905.10464 (10 pages). May 2019. (paper)
Masahiro Kaneko and Mamoru Komachi. Multi-Head Multi-Layer Attention to Deep Language Representations for Grammatical Error Detection. In arXiv e-prints, 1904.07334 (12 pages). April 2019. (paper)
Hikaru Omori and Mamoru Komachi. Multi-task Learning for Japanese Predicate Argument Structure Analysis. In arXiv e-prints, 1904.02244 (10 pages). April 2019. (paper)
Tosho Hirasawa, Hayahide Yamagishi, Yukio Matsumura and Mamoru Komachi. Multimodal Machine Translation with Embedding Prediction. In arXiv e-prints, 1904.00639 (6 pages). April 2019. (paper)
研究会(査読なし、予稿あり)
Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Osaka University), Chenhui Chu (Osaka University). Double Attention-based Multimodal Neural Machine Translation with Semantic Image Region. 情報処理学会第241回自然言語処理研究会. August 30, 2019.
安道 健一郎(首都大学東京/理化学研究所 革新知能統合研究センター), 奥村 貴史(北見工業大学/理化学研究所 革新知能統合研究センター), 小町 守(首都大学東京), 松本 裕治(奈良先端科学技術大学院大学/理化学研究所 革新知能統合研究センター). 確信度に基づく退院時サマリの分析. 情報処理学会第240回自然言語処理研究会. June 13, 2019.
黒澤 道希, 小町 守. ニューラル機械翻訳に対する注意言語モデル. 情報処理学会第240回自然言語処理研究会. June 14, 2019.
全国大会(査読なし、予稿あり)
小山碧海, 喜友名朝視顕, 小林賢治, 新井美桜, 小町守. 日本語学習者の文法誤り訂正のための評価コーパス構築. 言語処理学会第26回年次大会 (NLP2020), 2020年3月17日.(ポスター)
金輝燦(朝鮮大), 平澤寅庄, 小町守. 韓国語対訳データを利用した文字分割と音素分解による朝鮮語ニューラル機械翻訳. 言語処理学会第26回年次大会 (NLP2020), 2020年3月17日.(ポスター)
相田太一(長岡技科大), 小町守, 小木曽智信(国語研), 高村大也(産総研/東工大), 坂田綾香(統数研), 小山慎介(統数研), 持橋大地(統数研). 単語分散表現の結合学習による単語の意味の通時的変化の分析. 言語処理学会第26回年次大会 (NLP2020), 2020年3月17日.(口頭)
勝又智, 小町守, 真鍋章(富士電機), 谷本恒野(富士電機). 障害レポートの分類問題に対するデータ選択を用いたBERTモデルの精度向上. 言語処理学会第26回年次大会 (NLP2020), 2020年3月18日.(ポスター)
高久雅史(茨城大), 平澤寅庄, 小町守, 古宮嘉那子(茨城大). 通時的な領域適応を行った単語分散表現を利用した古文から現代文へのニューラル機械翻訳. 言語処理学会第26回年次大会 (NLP2020), 2020年3月18日. (ポスター)
王鴻飛, 黒澤道希, 勝又智, 小町守. 事前学習モデルを用いた中国語文法誤り訂正. 言語処理学会第26回年次大会 (NLP2020), 2020年3月18日. (ポスター)
嶋中宏希, 梶原智之(阪大), 小町守. 事前学習された多言語の文符号化器を用いた機械翻訳の品質推定. 言語処理学会第26回年次大会 (NLP2020), 2020年3月18日. (ポスター)
三田雅人(理研/東北大), 清野舜(理研/東北大), 金子正弘(首都大/理研), 鈴木潤(東北大/理研), 乾健太郎(東北大/理研). 文法誤り訂正のための自己改良戦略に基づくノイズ除去. 言語処理学会第26回年次大会 (NLP2020), 2020年3月18日.(口頭)
平尾礼央, 新井美桜, 嶋中宏希, 勝又智, 小町守. 複数項目の採点を行う日本語学習者の作文自動評価システム. 言語処理学会第26回年次大会 (NLP2020), 2020年3月19日. (ポスター)
高橋悠進, 勝又智, 小町守. 学習者の誤り傾向を考慮した擬似データを用いた文法誤り訂正. 言語処理学会第26回年次大会 (NLP2020), 2020年3月19日. (ポスター)
山下郁海, 勝又智, 金子正弘, Aizhan Imankulova, 小町守. 言語間での転移学習を用いたロシア語文法誤り訂正. 言語処理学会第26回年次大会 (NLP2020), 2020年3月19日. (ポスター)
白井 稔久, 萩行 正嗣(株式会社ウェザーニュース), 小町 守. 擬似誤りコーパスを用いた天気予報原稿のニューラル誤り検出. 2019年度人工知能学会全国大会. June 6, 2019. (ポスター)
Yuting Zhao, Longtu Zhang, Mamoru Komachi. Application of Unsupervised NMT Technique to Japanese--Chinese Machine Translation. The 33rd Annual Conference of the Japanese Society for Artificial Intelligence. June 6, 2019. (oral)
本間 広樹, 山岸 駿秀, 松村 雪桜, 小町 守. ニューラル機械翻訳におけるコーパスフィルタリングに関する固有表現に注目した分析. 2019年度人工知能学会全国大会. June 7, 2019. (ポスター)
高橋 啓吾, 大森 光, 小町 守. Pointer Networksを用いた文内述語項構造解析. 2019年度人工知能学会全国大会. June 7, 2019. (ポスター)
シンポジウム等(査読なし、予稿なし)
Yuting Zhao, Mamoru Komachi, Tomoyuki Kajiwara (Osaka University), Chenhui Chu (Osaka University). Double Attention-based Multimodal Neural Machine Translation with Semantic Image Regions. NLP 若手の会第14回シンポジウム. August 26, 2019.
平澤寅庄, 小町守, 中山英樹(東大), 田村晃裕(愛媛大), 二宮崇(愛媛大). Semantic Attention を用いたマルチモーダル機械翻訳の検討. NLP 若手の会第14回シンポジウム. August 26, 2019.
中澤真人, 嶋中宏希, 黒澤道希, 小町守. 中日機械翻訳における事前学習された言語モデリングの利用に関する考察. NLP 若手の会第14回シンポジウム. August 27, 2019.
高橋悠進, 勝又智, 小町守. 語形変化を考慮したロシア語の文法誤り訂正の検討. NLP 若手の会第14回シンポジウム. August 27, 2019.
山下郁海, 勝又智, 金子正弘, Imankulova Aizhan, 小町守. 英語からロシア語への転移学習を用いた文法誤り訂正. NLP 若手の会第14回シンポジウム. August 27, 2019.
甫立健悟, 金子正弘, 小町守. Autoencoder を用いた頑健な文の分散表現生成の検討. NLP 若手の会第14回シンポジウム. August 27, 2019.
白石奈緒美, 勝又智, 小町守. Persona Graph を用いた地方議会会議録のキーワード抽出の検討. NLP 若手の会第14回シンポジウム. August 27, 2019.
金子正弘(首都大/理研AIP), 三田雅人(理研AIP/東北大), 鈴木潤(東北大/理研AIP), 乾健太郎(東北大/理研AIP). コロケーション・イディオム誤りを考慮した文法誤り訂正のための擬似データ生成. NLP 若手の会第14回シンポジウム. August 27, 2019.
Imankulova Aizhan, 金子正弘, 平澤寅庄, 小町守. 画像を使用したマルチモーダルニューラル同時翻訳. NLP 若手の会第14回シンポジウム. August 27, 2019.
平尾礼央, 新井美桜, 嶋中宏希, 勝又智, 小町守. ニューラルネットワークを利用した日本語学習者の複数項目作文能力推定. NLP 若手の会第14回シンポジウム. August 27, 2019.
商用誌記事・辞典項目等
小町守, 梶原智之. 言語学習支援のためのニューラル言い換え生成. 人工知能学会誌, Vol.34, No.4, pp.451-459. July, 2019.
2018年度
学術論文誌(査読あり)
金子正弘, 堺澤勇也, 小町守. 正誤情報と文法誤りパターンを考慮した単語分散表現を用いた文法誤り検出. 自然言語処理, Vol.25, No.4, pp.421-440. September, 2018.
国際会議(査読あり)
Yoshiaki Kitagawa and Mamoru Komachi. Long Short-Term Memory for Japanese Word Segmentation. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation. Hong Kong. December 1-3, 2018. (oral; see arXiv)
Ryosuke Miyazaki and Mamoru Komachi. Japanese Sentiment Classification using a Tree-Structured Long Short-Term Memory with Attention. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation. Hong Kong. December 1-3, 2018. (poster; see arXiv)
Tomonori Kodaira and Mamoru Komachi. The Rule of Three: Abstractive Text Summarization in Three Bullet Points. In Proceedings of the 32nd Pacific Asia Conference on Language, Information and Computation. Hong Kong. December 1-3, 2018. (poster; see arXiv)
Longtu Zhang and Mamoru Komachi. Neural Machine Translation of Logographic Language Using Sub-character Level Information. In Proceedings of the Third Conference on Machine Translation, pp.17-25. Brussels, Belgium. October 31, 2018. (poster, paper)
Satoru Katsumata, Yukio Matsumura, Hayahide Yamagishi and Mamoru Komachi. Graph-based Filtering of Out-of-Vocabulary Words for Encoder-Decoder Model. In Proceedings of ACL 2018 Student Research Workshop, pp.112-119. Melbourne, Australia. July 17, 2018. (poster, paper)
Michiki Kurosawa, Yukio Matsumura, Hayahide Yamagishi and Mamoru Komachi. Japanese Predicate Conjugation for Neural Machine Translation. In Proceedings of NAACL 2018 Student Research Workshop, pp.100-105. New Orleans, Louisiana, USA. June 2, 2018. (poster, paper)
Hiroki Shimanaka, Tomoyuki Kajiwara and Mamoru Komachi. Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations. In Proceedings of NAACL 2018 Student Research Workshop, pp.106-111. New Orleans, Louisiana, USA. June 2, 2018. (poster, paper)
Yuya Sakaizawa and Mamoru Komachi. Construction of a Japanese Word Similarity Dataset. In Proceedings of the 11th edition of the Language Resources and Evaluation Conference (LREC 2018), pp.948-951. Miyazaki, Japan. May 9, 2018. (poster, paper)
Sirihattasak Sugan, Mamoru Komachi and Hiroshi Ishikawa. Annotation and Classification of Toxicity for Thai Twitter. In Proceedings of the 2nd Workshop on Text Analytics for Cybersecurity and Online Safety (TA-COS 2018), pp.1-7. Miyazaki, Japan. May 12, 2018. (oral, paper)
国際会議(査読なし、予稿あり)
Yukio Matsumura, Satoru Katsumata, Mamoru Komachi. TMU Japanese--English Neural Machine Translation System using Generative Adversarial Network for WAT 2018. In Proceedings of the Third Workshop on Asian Translation (WAT 2018). Hong Kong. December 3, 2018. (poster)
Longtu Zhang, Yuting Zhao, Mamoru Komachi. TMU Japanese-Chinese Unsupervised NMT System for WAT 2018 Translation Task. Proceedings of the Third Workshop on Asian Translation (WAT 2018). Hong Kong. December 3, 2018. (poster)
Hiroki Shimanaka, Tomoyuki Kajiwara and Mamoru Komachi. RUSE: Regressor Using Sentence Embeddings for Automatic Machine Translation Evaluation. In Proceedings of the Third Conference on Machine Translation, pp.764-771. Brussels, Belgium. November 1, 2018. (poster, paper)
Masahiro Kaneko, Tomoyuki Kajiwara and Mamoru Komachi. TMU System for SLAM-2018. In Proceedings of The 13th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2018): Shared Task on Second Language Acquisition Modeling, pp.365-369. New Orleans, Louisiana, USA. June 5, 2018. (poster, paper)
Tomoyuki Kajiwara and Mamoru Komachi. Complex Word Identification Based on Frequency in a Learner Corpus. In Proceedings of The 13th Workshop on Innovative Use of NLP for Building Educational Applications (BEA 2018): Shared Task on Complex Word Identification, pp.195-199. New Orleans, Louisiana, USA. June 5, 2018. (poster, paper)
その他査読なし論文
Longtu Zhang and Mamoru Komachi. Chinese-Japanese Unsupervised Neural Machine Translation Using Sub-character Level Information. In arXiv e-prints, 1903.00149 (5 pages). March 2019. (paper)
Tomoya Ogata, Mamoru Komachi and Tomoya Takatani (Toyota). Divide and Generate: Neural Generation of Complex Sentences. In arXiv e-prints, 1901.10196 (6 pages). January 2019. (paper)
Tomonori Kodaira and Mamoru Komachi. The Rule of Three: Abstractive Text Summarization in Three Bullet Points. In arXiv e-prints, 1809.10867 (9 pages). September 2018. (paper)
Longtu Zhang and Mamoru Komachi. Neural Machine Translation of Logographic Language Using Sub-character Level Information. In arXiv e-prints, 1809.02694 (9 pages). September 2018. (paper)
Satoru Katsumata, Yukio Matsumura, Hayahide Yamagishi and Mamoru Komachi. Graph-based Filtering of Out-of-Vocabulary Words for Encoder-Decoder Model. In arXiv e-prints, 1805.11189 (8 pages). May 2018. (paper)
Michiki Kurosawa, Yukio Matsumura, Hayahide Yamagishi and Mamoru Komachi. Japanese Predicate Conjugation for Neural Machine Translation. In arXiv e-prints, 1805.10047 (6 pages). May 2018. (paper)
Hiroki Shimanaka, Tomoyuki Kajiwara and Mamoru Komachi. Metric for Automatic Machine Translation Evaluation based on Universal Sentence Representations. In arXiv e-prints, 1805.07469 (6 pages). May 2018. (paper)
研究会(査読なし、予稿あり)
竹中誠, 柳瀬利彦(日立製作所 中央研究所), 小泉敦子(日立製作所 中央研究所), 江原遥(産総研). 敵対的生成を利用した校正可否の識別. 情報処理学会第235回自然言語処理研究会, Vol.2018-NL-235, No.5, pp.1-5. May 13, 2018.
全国大会(査読なし、予稿あり)
山岸駿秀, 小町守. 目的言語側の文間文脈を考慮した文脈つきニューラル機械翻訳. 言語処理学会第25回年次大会, pp.394-397. March 14, 2019.(ポスター)
金子正弘, 小町守. 深層言語表現モデルに対するマルチヘッド・多層アテンションによる英語文法誤り検出. 言語処理学会第25回年次大会. March 14, 2019.(ポスター)
嶋中宏希, 梶原智之(大阪大学/首都大), 小町守. BERTを用いた機械翻訳の自動評価. 言語処理学会第25回年次大会. March 14, 2019.(ポスター)
甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における単語編集率を用いた訂正度の制御. 言語処理学会第25回年次大会, pp.635-638. March 14, 2019.(ポスター)
勝又智, 小町守, 真鍋章(富士電機), 大頭威(富士電機), 嶋﨑優子(富士電機). node2vecを用いた障害レポートにおける故障原因推定. 言語処理学会第25回年次大会, pp.1045-1048. March 15, 2019.(ポスター)
長我部恭行, 甲斐優人, 石井奏人, 荻野 天翔, 黒澤道希, 小町守. 機械翻訳に対する文間文脈を考慮した評価と分析. 言語処理学会第25回年次大会, pp.1073-1076. March 15, 2019.(ポスター)
吉村綾馬, 松村雪桜, 山岸駿秀, 小町守. 機械翻訳の自動評価のための擬似参照訳作成. 言語処理学会第25回年次大会, pp.1093-1096. March 15, 2019.(ポスター)
新井美桜, 金子正弘, 小町守. 日本語学習者向けの文法誤り検出機能付き誤用例文検索システム. 言語処理学会第25回年次大会. March 15, 2019.(ポスター)
平澤寅庄, 山岸駿秀, 松村雪桜, 小町守. 事前学習した単語分散表現を利用したマルチモーダル機械翻訳. 言語処理学会第25回年次大会. March 15, 2019.(ポスター)
大森光, 小町守. マルチタスク学習を用いたニューラル文内述語項構造解析. 言語処理学会第25回年次大会. March 15, 2019.(ポスター=言語処理学会第25回年次大会若手奨励賞受賞)
勝又智, 小町守. 教師なし文法誤り訂正. 言語処理学会第25回年次大会, pp.1391-1394. March 15, 2019.(ポスター)
三田雅人 (理研AIP/東北大), 水本智也 (理研AIP), 金子正弘 (首都大/理研AIP), 永田亮 (甲南大/理研AIP), 乾健太郎 (東北大/理研AIP). 文法誤り訂正のコーパス横断評価 : 単一コーパス評価で十分か? 言語処理学会第25回年次大会. March 15, 2019.(ポスター)
シンポジウム等(査読なし、予稿なし)
吉村綾馬, 松村雪桜, 山岸駿秀, 小町守. 機械翻訳の自動評価のためのN-bestを用いたマルチリファレンス作成手法の提案. NLP 若手の会第13回シンポジウム. August 27, 2018.
嶋中宏希, 梶原智之(阪大), 小町守. RUSE: 文の分散表現を用いた回帰モデルによる機械翻訳の自動評価. NLP 若手の会第13回シンポジウム. August 28, 2018.
金子正弘, Imankulova Aizhan, 小町守. 転移学習を用いてコンテキストを考慮した系列変換タスクにおけるリランキング. NLP 若手の会第13回シンポジウム. August 28, 2018.
黒澤道希, 小町守. ニューラル機械翻訳に対する言語モデルの導入に関する検討. NLP 若手の会第13回シンポジウム. August 28, 2018.
甫立健悟, 松村雪桜, 勝又智, 金子正弘, 小町守. 敵対的生成ネットワークを用いた文法誤り訂正. NLP 若手の会第13回シンポジウム. August 28, 2018.
平澤寅庄, 松村雪桜, 山岸駿秀, 小町守. 画像から抽出した複数種の特徴量を組み込んだニューラル機械翻訳の検討. NLP 若手の会第13回シンポジウム. August 29, 2018.
松村雪桜, 小町守. 敵対的生成ネットワークを用いた機械翻訳の評価における分野依存性の分析. NLP 若手の会第13回シンポジウム. August 29, 2018.
竹中誠, 小町守. 単語分散表現の統計力学的解釈に向けて. 第3回統計・機械学習若手シンポジウム. August 11, 2018.
招待講演等
小町守. 深層言語表現モデルと自然言語処理の未来. 全脳アーキテクチャ若手の会 第39回勉強会. March 10, 2019.
小町守. 言語はなぜ人工知能の問題になるのか. 首都大学東京システムデザイン学部 SD フォーラム. October 3, 2018.
小町守. ここまできた機械翻訳!ことばの壁を乗り越える. 羽村市生涯学習センターゆとろぎ先端テクノロジー講座. September 15, 2018.
小町守. 言語処理における GAN の展開. 人工知能学会第75回人工知能セミナー. August 27, 2018.
2017年度
学術論文誌(査読あり)
梶原智之, 小町守. 平易なコーパスを用いないテキスト平易化. 自然言語処理, Vol.25, No.2, pp.223-249. March, 2018.(2018年度最優秀論文賞受賞)
Tomoyuki Kajiwara, Danushka Bollegala (University of Liverpool), Yuichi Yoshida (NII), Ken-ichi Kawarabayashi (NII). An Iterative Approach for the Global Estimation of Sentence Similarity. PLoS ONE 12(9): e0180885. https://doi.org/10.1371/journal.pone.0180885. September 12, 2017.
国際会議(査読あり)
Kento Shioda, Mamoru Komachi, Rue Ikeya (Research Organization of Information and Systems) and Daichi Mochihashi (Institute of Statistical Mathematics). Suggesting Sentences for ESL using Kernel Embeddings. In Proceedings of the 4th Workshop on NLP Techniques for Educational Applications (NLPTEA 2017), pp.64-68. Taipei, Taiwan. December 1, 2017. (poster, paper)
Masahiro Kaneko, Yuya Sakaizawa, Mamoru Komachi. Grammatical Error Detection Using Error- and Grammaticality-Specific Word Embeddings. In Proceedings of the 8th International Joint Conference on Natural Language Processing (IJCNLP 2017), pp.40-48. Taipei, Taiwan. November 28, 2017. (oral, paper)
Tomoyuki Kajiwara, Mamoru Komachi, Daichi Mochihashi (Institute of Statistical Mathematics). MIPA: Mutual Information Based Paraphrase Acquisition via Bilingual Pivoting. In Proceedings of the 8th International Joint Conference on Natural Language Processing (IJCNLP 2017), pp.80-89. Taipei, Taiwan. November 28, 2017. (oral, paper)
Hayahide Yamagishi, Shin Kanouchi, Takayuki Sato, Mamoru Komachi. Improving Japanese-to-English Neural Machine Translation by Voice Prediction. In Proceedings of the 8th International Joint Conference on Natural Language Processing (IJCNLP 2017), pp.277-282. Taipei, Taiwan. November 28, 2017. (poster, paper)
Tomoyuki Kajiwara and Atsushi Fujita (National Institute of Information and Communications Technology). Semantic Features based on Word Alignments for Estimating Quality of Text Simplification. In Proceedings of the 8th International Joint Conference on Natural Language Processing (IJCNLP 2017). Taipei, Taiwan. November 28, 2017. (poster, short paper)
Yuuki Sekizawa, Tomoyuki Kajiwara and Mamoru Komachi. Improving Japanese-English Neural Machine Translation by Paraphrasing the Target Language. In Proceedings of the 4th Workshop on Asian Translation, pp.64-69. Taipei, Taiwan. November 27, 2017. (oral, paper)
Aizhan Imankulova, Takayuki Sato and Mamoru Komachi. Improving Low-Resource Neural Machine Translation with Filtered Pseudo-Parallel Corpus. In Proceedings of the 4th Workshop on Asian Translation, pp.70-78. Taipei, Taiwan. November 27, 2017. (oral, paper)
Yui Suzuki, Tomoyuki Kajiwara and Mamoru Komachi. Building a Non-Trivial Paraphrase Corpus using Multiple Machine Translation Systems. In Proceedings of ACL 2017 Student Research Workshop, pp.36-42. Vancouver, Canada. July 31, 2017. (paper, data)
国際会議(査読あり、予稿なし)
Yui Suzuki and Mamoru Komachi. An Annotation Framework for Language Learning Using Natural Language Processing Tools: Its Design and An Experimental Study. The Computer Assisted Language Instruction Consortium (CALICO) Conference 2017. Flagstaff, Arizona, USA. May 18, 2017. (poster)
国際会議(査読なし、予稿あり)
Yukio Matsumura and Mamoru Komachi. Tokyo Metropolitan University Neural Machine Translation System for WAT 2017. In Proceedings of the 4th Workshop on Asian Translation: Shared Task, pp.160-166. Taipei, Taiwan. November 27, 2017. (poster, paper, demo)
その他査読なし論文
Yoshiaki Kitagawa and Mamoru Komachi. Long Short-Term Memory for Japanese Word Segmentation. In arXiv e-prints, 1709.08011 (10 pages). September 2017. (paper)
Yukio Matsumura, Takayuki Sato and Mamoru Komachi. English-Japanese Neural Machine Translation with Encoder-Decoder-Reconstructor. In arXiv e-prints, 1706.08198 (8 pages). June 2017. (paper)
Ryosuke Miyazaki and Mamoru Komachi. Japanese Sentiment Classification using a Tree-Structured Long Short-Term Memory with Attention. In arXiv e-prints, 1704.00924 (6 pages). April 2017. (paper, demo)
Junki Matsuo, Mamoru Komachi and Katsuhito Sudoh (NTT Laboratories). Word-Alignment-Based Segment-Level Machine Translation Evaluation using Word Embeddings. In arXiv e-prints, 1704.00380 (5 pages). April 2017. (paper)
研究会(査読なし)
塩田健人, 小町守, 池谷瑠絵(情報・システム研究機構), 持橋大地(統計数理研究所). カーネル埋め込みを用いた英語学習者向けの用例検索. 情報処理学会 自然言語処理研究会, Vol.2017-NL-233, No.16, pp.1-5. October 25, 2017.(口頭)
塩田健人, 小町守, 瀬戸口光宏(弁護士ドットコム), 市橋立(弁護士ドットコム). 法律相談 SNS におけるユーザー投稿文書を用いた著者役割推定. 情報処理学会 自然言語処理研究会, Vol.2017-NL-232, No.1, pp.1-7. July 19, 2017.(口頭)
大崎彩葉, 北川善彬, 小町守. 日本語 Twitter 文書を対象とした系列ラベリングによる表記正規化. 情報処理学会 自然言語処理研究会, Vol.2017-NL-231, No.12, pp.1-6. May 15, 2017.(口頭)
梶原智之, 小町守. Bilingual Pivoting による言い換え獲得の相互情報量に基づく一般化. 情報処理学会 自然言語処理研究会, Vol.2017-NL-231, No.21, pp.1-8. May 16, 2017.(口頭=情報処理学会第231回自然言語処理研究会・第116回音声情報処理研究会学生奨励賞受賞, データ)
全国大会(査読なし)
新井美桜, 小平知範, 小町守. Lang-8を用いた日本語学習者向けの誤用検索システムの構築. 言語処理学会第24回年次大会 pp.204-207. March 13, 2018.(ポスター)
大森光, 小町守. 複数の項候補を考慮したニューラル文内述語項構造解析. 言語処理学会第24回年次大会, pp.252-255. March 13, 2018.(ポスター)
松村雪桜, 小町守. 敵対的生成ネットワークを用いた機械翻訳評価手法. 言語処理学会第24回年次大会, pp.568-571. March 14, 2018.(ポスター=言語処理学会第24回年次大会若手奨励賞受賞)
金子正弘, 小町守. パイプライン処理によるニューラル英語文法誤り検出と訂正. 言語処理学会第24回年次大会, pp.576-579. March 14, 2018.(ポスター)
嶋中宏希, 梶原智之, 小町守. 汎用的な文の分散表現を用いた文単位の機械翻訳自動評価. 言語処理学会第24回年次大会, pp.580-583. March 14, 2018.(ポスター)
中澤真人, 池田可奈子, 山田美知花, 吉村綾馬, 鈴木由衣, 小町守. リビュー文書を対象とした句単位の日本語評価極性タグ付きコーパス. 言語処理学会第24回年次大会, pp.781-784. March 14, 2018.(ポスター)
黒澤道希, 松村雪桜, 山岸駿秀, 小町守. 述語の活用情報を用いたニューラル日英翻訳. 言語処理学会第24回年次大会, pp.813-816. March 14, 2018.(ポスター)
Aizhan Imankulova, Koji Murakami (Rakuten). Preliminary Experiments toward NMT on E-commerce Product Titles. 言語処理学会第24回年次大会, pp.893-896. March 14, 2018.(ポスター)
白井良介, 松村雪桜, 小木曽智信 (国語研), 小町守. 近代の歴史的資料を対象とした機械学習による文境界推定. 言語処理学会第24回年次大会, pp.1023-1026. March 15, 2018.(ポスター)
勝又智, 松村雪桜, 山岸駿秀, 小町守. ニューラル機械翻訳における共起情報を考慮した語彙選択. 言語処理学会第24回年次大会, pp.1058-1061. March 15, 2018.(ポスター)
小平知範, 小町守. TL;DR 3行要約に着目したニューラル文書要約. 情報処理学会 情報基礎とアクセス技術研究会, Vol.2017-IFAT-128, No.33, pp.1-6. September 20, 2017.(WebDB Forum 2017 株式会社 FRONTEO 賞受賞)
シンポジウム等(査読なし、予稿なし)
白井稔久, 尾形朋哉, 小町守. エンコーダ・デコーダモデルを用いた画像の日本語キャプション生成のエラー分析. NLP 若手の会(YANS)第12回シンポジウム. September 3, 2017.(ポスター)
嶋中宏希, 山岸駿秀, 松村雪桜, 小町守. クロスリンガルな単語分散表現を用いた機械翻訳自動評価手法の検討. NLP 若手の会(YANS)第12回シンポジウム. September 3, 2017.(ポスター)
勝又智, 松村雪桜, 山岸駿秀, 小町守. ニューラル日英翻訳におけるRNNモデルとCNNモデルの出力分析. NLP 若手の会(YANS)第12回シンポジウム. September 4, 2017.(ポスター)
黒澤道希, 山岸駿秀, 松村雪桜, 小町守. 活用情報を用いた日英ニューラル機械翻訳. NLP 若手の会(YANS)第12回シンポジウム. September 4, 2017.(ポスター=奨励賞受賞)
小町守. 自然言語処理における知識とは何か -- 深層学習による機械翻訳. 科学基礎論学会2017年度ワークショップ, 自然言語の哲学: 深層学習による機械翻訳と形式意味論. June 18, 2017.(口頭)
著書・分担執筆
Ryu Iida, Mamoru Komachi, Naoya Inoue, Kentaro Inui and Yuji Matsumoto. NAIST Text Corpus: Annotating Predicate-Argument and Coreference Relations in Japanese. In Nancy Ide and James Pustejovsky Eds, Handbook of Linguistic Annotation, pp.1177-1196, June 2017. Springer Science.
商用誌記事・辞典項目等
小町守. 自然言語処理の教育応用. 人工知能学会編, 人工知能学大事典, pp.688-689. 2017年7月. 共立出版.
小町守(著), 国立国会図書館調査及び立法考査局(編). 自然言語処理. 人工知能・ロボットと労働・雇用をめぐる視点: 科学技術に関する調査プロジェクト報告書, 調査資料 2017-5, pp.10-12. March 30, 2018. 国立国会図書館.
招待講演等
小町守. 深層ニューラルネットワークを用いた日本語処理. 人工知能学会第71回人工知能セミナー「Deep Learning 技術の仕組みと自然言語処理への応用」. June 30, 2016.
2016年度
国際会議(査読あり)
Tomoyuki Kajiwara and Mamoru Komachi. Building a Monolingual Parallel Corpus for Text Simplification Using Sentence Similarity Based on Alignment between Word Embeddings. In Proceedings of the 26th International Conference on Computational Linguistics (COLING 2016), pp.1247-1258. Osaka, Japan, December 14, 2016. (poster, paper, data)
Yasunobu Asakura, Masatsugu Hangyo (Weathernews) and Mamoru Komachi. Disaster Analysis using User-Generated Weather Report. In Proceedings of The 2nd Workshop on Noisy User-generated Text, pp.83-91. Osaka, Japan, December 2016. (oral, paper)
Takayuki Sato, Jun Harashima (Cookpad) and Mamoru Komachi. Japanese-English Machine Translation of Recipe Texts. In Proceedings of The 3rd Workshop on Asian Translation (WAT): Research papers, pp.58-67. Osaka, Japan, December 2016. (oral, paper, code, demo)
Shin Kanouchi, Katsuhito Sudoh (NTT) and Mamoru Komachi. Neural Reordering Model Considering Phrase Translation and Word Alignment for Phrase-based Translation. In Proceedings of The 3rd Workshop on Asian Translation (WAT): Research papers, pp.94-103. Osaka, Japan, December 2016. (poster, paper, code)
Tomonori Kodaira, Tomoyuki Kajiwara and Mamoru Komachi. Controlled and Balanced Dataset for Japanese Lexical Simplification. In Proceedings of the ACL 2016 Student Research Workshop, pp.1-7. Berlin, Germany, August 2016. (poster, paper, data)
Ryuichi Tachibana and Mamoru Komachi. Extraction of English Spelling Errors using a Word Typing Game. In Proceedings of The 10th Edition of the Language Resources and Evaluation Conference (LREC), pp.385-390. Portorož, Slovenia, May 2016. (poster, paper, data)
国際会議(査読なし、予稿あり)
Hayahide Yamagishi, Shin Kanouchi, Takayuki Sato and Mamoru Komachi. Controlling the Voice of a Sentence in Japanese-to-English Neural Machine Translation. In Proceedings of The 3rd Workshop on Asian Translation (WAT): System description papers, pp.203-210. Osaka, Japan, December 2016. (poster, paper)
国際会議(査読あり、予稿なし)
Zhang, Longtu. Short-long / Long-short Preferences in English/Japanese Processing Revisited. Young Researchers Symposium on Natural Language Processing. Osaka, Japan, December 2016. (poster)
その他査読なし論文
Yuya Sakaizawa and Mamoru Komachi. Construction of a Japanese Word Similarity Dataset. In arXiv e-prints, 1703.05916 (5 pages). March 2017. (paper, data)
Ai Hirata and Mamoru Komachi. Sparse Named Entity Classification using Factorization Machines. In arXiv e-prints, 1703.04879 (5 pages). March 2017. (paper)
研究会(査読なし)
叶内晨, 小町守. ゲーミフィケーションを利用した効率的な対話ログ収集の試み. 電子情報通信学会 言語理解とコミュニケーション研究会, 信学技報 NLC2016-30, pp.1-6. December 2016.(ポスター)
梶原智之, 小町守. 平易なコーパスを用いないテキスト平易化のための単言語パラレルコーパスの構築. 情報処理学会 自然言語処理研究会, Vol.2016-NL-229, No.13, pp.1-8. December 2016.(口頭=情報処理学会第229回自然言語処理研究会優秀研究賞受賞, paper)
松尾潤樹, 小町守, 須藤克仁(NTT). 単語分散表現を用いた単語アライメントによる日英機械翻訳の自動評価尺度. 情報処理学会 自然言語処理研究会, Vol.2016-NL-229, No.20, pp.1-7. December 2016.(口頭)
佐藤貴之, 原島純(クックパッド), 小町守. レシピに対する日英機械翻訳の誤り分析. 情報処理学会研究報告, Vol.2016-NL-228, No.3, pp.1-9. September 2016.(口頭, ソース, デモ)
宮崎亮輔, 小町守. 極性辞書を利用した句構造による注意型ニューラル評価極性分類. 情報処理学会研究報告, Vol.2016-NL-227, No.3, pp.1-10. July 2016.(口頭, デモ)
梶原智之, 小町守. 単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築. 情報処理学会研究報告, Vol.2016-NL-227, No.12, pp.1-8. July 2016.(口頭, データ)
全国大会(査読なし)
小平知範, 宮崎亮輔, 小町守. 障害情報レポートに対する同時関連文章圧縮. 言語処理学会第23回年次大会, pp.186-189. March 14, 2017.(ポスター, 予稿)
Imankulova Aizhan, 佐藤貴之, 小町守. 逆翻訳による高品質な大規模擬似対訳コーパスの作成. 言語処理学会第23回年次大会. March 14, 2017.(ポスター, 予稿, データ)
梶原智之, 小町守. Simple PPDB: Japanese. 言語処理学会第23回年次大会, pp.210-213. March 15, 2017.(ポスター, 予稿, データ)
鈴木由衣, 梶原智之, 小町守. 複数の機械翻訳を用いた言い換え認識の評価用コーパス構築に向けて. 言語処理学会第23回年次大会, pp.529-532. March 15, 2017.(ポスター, 予稿)
尾形朋哉, 叶内晨, 高谷智哉, 小町守. キーワードに基づくニューラル文生成のためのリランキング. 言語処理学会第23回年次大会, pp.609-612. March 15, 2017.(ポスター, 予稿)
金子正弘, 堺澤勇也, 小町守. 英語学習者の文法誤りパターンと正誤情報を考慮した単語分散表現学習. 言語処理学会第23回年次大会, pp.729-732. March 15, 2017.(若手奨励賞受賞)(ポスター, 予稿, コード)
叶内晨, 尾形朋哉, 金子正弘, 河村綾菜, 北川善彬, 黒田紘司, 齋藤宏行, 山本豊, 小町守. ゲーミフィケーションを利用した対話ログ収集における応答文の改善と対話ログの解析. 言語処理学会第23回年次大会, pp.955-958. March 16, 2017.(ポスター, 予稿)
関沢祐樹, 梶原智之, 小町守. 目的言語の低頻度語の高頻度語への言い換えによるニューラル機械翻訳の改善. 言語処理学会第23回年次大会, pp.982-985. March 16, 2017.(ポスター, 予稿)
松村雪桜, 佐藤貴之, 小町守. 逆翻訳によるニューラル機械翻訳の最適化. 言語処理学会第23回年次大会, pp.986-989. March 16, 2017.(若手奨励賞ノミネート)(ポスター, 予稿)
山岸駿秀, 叶内晨, 佐藤貴之, 小町守. ニューラル日英翻訳における出力文の態制御. 言語処理学会第23回年次大会, pp.1065-1068. March 16, 2017.(ポスター, 予稿)
シンポジウム等(査読なし、予稿なし)
鈴木由衣, 小町守. 学習者の振り返りから学習意欲を推定するタスクの提案. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
松村雪桜, 佐藤貴之, 叶内晨, 小町守. 文節へのアテンションを用いたニューラル日英翻訳. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
佐藤貴之, 原島純(クックパッド), 小町守. レシピ文における日英機械翻訳の誤り分析. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
大森光, 鈴木由衣, 宮崎亮輔, 小町守. レビュー記事と新聞記事における文単位の日本語評価極性分類の誤り分析. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
尾形朋哉, 叶内晨, 小町守. Pointer Networks による単語選択を利用したニューラル対話生成. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
梶原智之, 小町守. 文難易度と単語分散表現のアライメントに基づく文間類似度を用いたテキスト平易化のための単言語パラレルコーパスの構築. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
山岸駿秀, 佐藤貴之, 叶内晨, 小町守. ニューラル日英翻訳における態の制御. NLP若手の会(YANS)第11回シンポジウム. August 2016.(ポスター)
2015年度
学術論文誌(査読あり)
大山浩美(NAIST), 小町守, 松本裕治(NAIST). 日本語学習者の作文における誤用タイプの階層的アノテーションに基づく機械学習による自動分類. 自然言語処理, Vol.23, No.2, pp.195-225. March 2016.(論文)
叶内晨, 北川善彬, 荒牧英治(NAIST), 岡崎直観(東北大), 小町守. Web情報からの罹患検出を対象とした事実性解析・主体解析の誤り分析. 自然言語処理, Vol.22, No.5, pp.363-395. December 2015.(論文)
国際会議(査読あり)
Peinan Zhang and Mamoru Komachi. Japanese Sentiment Classification with Stacked Denoising Auto-Encoder using Distributed Word Representation. In Proceedings of The 29th Pacific Asia Conference on Language, Information and Computation (PACLIC 29), pp.150-159. Shanghai, China, October 2015. (oral, paper, demo)
Shin Kanouchi, Mamoru Komachi, Naoaki Okazaki (Tohoku University), Eiji ARAMAKI (Kyoto University) and Hiroshi Ishikawa. Who caught a cold? - Identifying the subject of a symptom. In Proceedings of the ACL-IJCNLP 2015 (long papers), pp.1660-1670. Beijing, China, July 29, 2015. (oral, paper)
Yoshiaki Kitagawa, Mamoru Komachi, Eiji ARAMAKI (Kyoto University), Naoaki Okazaki (Tohoku University), Hiroshi Ishikawa. Disease Event Detection based on Deep Modality Analysis. In Proceedings of the ACL-IJCNLP 2015 Student Research Workshop, pp.28-34. Beijing, China, July 2015. (oral/poster, paper)
Tomoyuki Kajiwara (Nagaoka University of Technology) and Kazuhide Yamamoto (Nagaoka University of Technology). Evaluation Dataset and System for Japanese Lexical Simplification. In Proceedings of the ACL-IJCNLP 2015 Student Research Workshop, pp.35-40. Beijing, China, July 2015. (oral/poster, paper)
国際会議(査読なし、予稿あり)
Junki Matsuo, Kenichi Ohwada and Mamoru Komachi. Source Phrase Segmentation and Translation for Japanese-English Translation Using Dependency Structure. In Proceedings of the 2nd Workshop on Asian Translation (WAT2015), pp.99-104. Kyoto, Japan, October 2015. (poster, paper)
Yinchen Zhao, Mamoru Komachi and Hiroshi Ishikawa. Improving Chinese Grammatical Error Correction with Corpus Augmentation and Hierarchical Phrase-based Statistical Machine Translation. In Proceedings of the 2nd Workshop on Natural Language Processing Techniques for Educational Applications (NLP-TEA-2): Shared Task on Chinese Grammatical Error Diagnosis (CGED), pp.111-116. Beijing, China, July 2015. (poster, paper)
研究会(査読なし、予稿あり)
趙寅琛, 小町守, 石川博. 統計的機械翻訳を用いた中国語文法誤り訂正. 情報処理学会研究報告, Vol.2016-NL-225, No.6, pp.1-6. January 2016.(口頭)
塩田健人, 梶原智之, 小町守. 使用者数による語彙制限を用いた日本語学習者のための文章読解支援. 情報処理学会研究報告, Vol.2015-NL-224, No.6, pp.1-6. December 2015.(ポスター)
塘優旗, 小町守. 部分的アノテーションを利用した CRF による日本語学習者文の単語分割. 情報処理学会研究報告, Vol.2015-NL-223, No.2, pp.1-9. September 2015. (口頭)
張培楠, 小町守. 単語分散表現を用いた多層 Denoising Auto-Encoder による評価極性分類. 情報処理学会研究報告, Vol.2015-NL-222, No.6, pp.1-8. July 2015. (口頭, デモ)
立花竜一, 小町守. 英単語タイピングゲームによるスペリング誤りの抽出と分析. 情報処理学会研究報告, Vol.2015-NL-222, No.10, pp.1-7. July 2015. (口頭, データ)
岩倉友哉(富士通研究所), 平田亜衣, 立花竜一, 山崎舞子(東工大), 市原正陽(茨城大学), 古宮嘉那子(茨城大学). 複数ジャンルを対象とした基本固有表現タグ付きコーパスの作成. 情報処理学会研究報告, Vol.2015-NL-221, No.13, pp.1-5. May 2015.
全国大会(査読なし、予稿あり)
大崎彩葉, 唐口翔平, 大迫拓矢, 佐々木俊哉, 北川善彬, 堺澤勇也, 小町守. Twitter 日本語形態素解析のためのコーパス構築. 言語処理学会第22回年次大会, pp.16-19. March 2016.(ポスター, データ)
大和田賢一, 小町守. 統計的機械翻訳におけるグラフ伝搬を用いた未知語対訳辞書構築の改善. 言語処理学会第22回年次大会, pp.227-230. March 2016.(ポスター)
小平知範, 梶原智之, 小町守. 均衡コーパスを用いた日本語語彙平易化データセットの構築. 言語処理学会第22回年次大会, pp.258-261. March 2016.(ポスター, データ)
堺澤勇也, 小町守. 日本語動詞・形容詞類似度データセットの構築. 言語処理学会第22回年次大会, pp.262-265. March 2016.(ポスター, データ)
朝倉康伸, 小町守, 萩行正嗣. マイクロブログにおける浸水害情報の解析. 言語処理学会第22回年次大会, pp.577-580. March 2016.(ポスター)
叶内晨, 小町守. フレーズベース機械翻訳における単語間の情報を考慮した深層学習による語彙化並べ替えモデル. 言語処理学会第22回年次大会, pp.693-696. March 2016.(口頭, コード)
関沢祐樹, 梶原智之, 小町守. 語構成情報と言い換えパターンを用いた二字漢字の句への言い換え. 言語処理学会第22回年次大会, pp.725-728. March 2016.(口頭)
野口真人, 梶原智之, 小町守. 語構造情報を用いた日本語複合動詞の言い換え. 言語処理学会第22回年次大会, pp.729-732. March 2016.(口頭)
平田亜衣, 小町守. Factorization Machines を用いた未知の固有表現分類. 言語処理学会第22回年次大会, pp.805-808. March 2016.(口頭=言語処理学会第22回年次大会若手奨励賞受賞)
北川善彬, 小町守. 深層ニューラルネットワークを利用した日本語単語分割. 言語処理学会第22回年次大会, pp.933-936. March 2016.(口頭)
シンポジウム等(査読なし、予稿なし)
梶原智之, 小町守. テキスト平易化コーパスの構築指針. NLP若手の会第10回シンポジウム. September 2015. (ポスター)
関沢祐樹, 梶原智之, 小町守. 辞書定義文と分散表現を用いた漢語の和語への言い換え. NLP若手の会第10回シンポジウム. September 2015. (ポスター)
小平知範, 梶原智之, 小町守. 語彙平易化システムの評価のためのデータセットの改良. NLP若手の会第10回シンポジウム. September 2015. (ポスター)
塩田健人, 梶原智之, 小町守. 日本語学習者の文章読解支援のための語彙制限. NLP若手の会第10回シンポジウム. September 2015. (ポスター)
野口真人, 梶原智之, 小町守. 語構造情報を用いた複合動詞の言い換え. NLP若手の会第10回シンポジウム. September 2015. (ポスター)
池田可奈子, 三澤賢祐(不満買取センター). Twitterを利用した日本語感情表現辞書の自動構築. NLP若手の会第10回シンポジウム. September 2015. (ポスター・予稿なし)
著書・分担執筆
Budi Irmawati, Mamoru Komachi and Yuji Matsumoto. Towards Construction of an Error-corrected Corpus of Indonesian Second Language Learners. In Francisco Alonso Almedia, Ivalla Ortega Barrera, Elena Quintana Toledo and Margarita E. Sanchez Cuervo Eds, Input a Word, Analyze the World: Selected Approaches to Corpus Linguistics, pp.425-444, March 2016. Cambridge Scholars Publishing.
奥野陽, グラム・ニュービッグ, 萩原正人(著), 小町守(監修), イノウ(編集). 自然言語処理の基本と技術. 翔泳社. March 2016.
商用誌記事・辞典項目等
小町守. 機械翻訳から見る日本語. 日本語学, 第35第1号, pp.52-63, December 2015.
招待講演等
小町守. 自然言語処理の新展開. Recruit Technologies Open Lab #01. April 21, 2015.
2014年度
国際会議(査読あり)
Budi Irmawati (NAIST), Mamoru Komachi, Yuji Matsumoto (NAIST). Towards Construction of an Error-Corrected Corpus of Indonesian Second Language Learners. 6th International Conference on Corpus Linguistics. May 2014.
国際会議(査読なし、予稿あり)
Yinchen Zhao, Mamoru Komachi and Hiroshi Ishikawa. Extracting a Chinese Learner Corpus from the Web: Grammatical Error Correction for Learning Chinese as a Foreign Language with Statistical Machine Translation. In Proceedings of the 22nd Conference on Computers in Education, pp.56-61. Nara, Japan, November 2014. (poster, paper)
Kenichi Ohwada, Ryosuke Miyazaki and Mamoru Komachi. Predicate-Argument Structure-based Preordering for Japanese-English Statistical Machine Translation. In Proceedings of the 1st Workshop on Asian Translation, pp.44-49. Tokyo, Japan, October 2014. (poster, paper)
全国大会(査読なし、予稿あり)
叶内晨, 小町守, 岡崎直観(東北大), 荒牧英治(京大), 石川博. 風邪に罹ったのは誰か?−疾患・症状を保有する主体の推定. 言語処理学会第21回年次大会, pp.206-209. March 2015. (口頭)
北川善彬, 小町守, 荒牧英治(京大), 岡崎直観(東北大), 石川博. インフルエンザ流行検出のための事実性解析. 言語処理学会第21回年次大会, pp.218-221. March 2015. (口頭)
宮崎亮輔, 小町守, 疋田敏朗(トヨタIT開発センター), 柏倉俊樹(トヨタIT開発センター). Wikipedia を用いた遠距離教師あり学習による専門用語抽出. 言語処理学会第21回年次大会, pp.87-90. March 2015. (口頭, コード)
堺澤勇也, 小町守. パラグラフベクトルを用いた教師なし語義曖昧性解消の考察. 言語処理学会第21回年次大会, pp.115-118. March 2015. (口頭)
平田亜衣, 小町守. 様々なジャンルのテキストに対する固有表現認識の分析. 言語処理学会第21回年次大会ワークショップ「自然言語処理におけるエラー分析」. March 2015.(口頭)
シンポジウム等(査読なし、予稿なし)
大和田賢一, 宮崎亮輔, 小町守. 述語項構造解析に基づく事前並べ替え手法による科学論文を対象とした日英統計的機械翻訳. NLP若手の会第9回シンポジウム. September 2014. (ポスター)
趙寅琛, 小町守. 統計的機械翻訳による中国語学習者作文の誤り訂正システム. NLP若手の会第9回シンポジウム. September 2014. (ポスター)
宮崎亮輔, 小町守, 立花竜一. 遠距離教師あり学習を用いた複合名詞のアノテーションによる未知語の半自動獲得. NLP若手の会第9回シンポジウム. September 2014. (ポスター)
商用誌記事・辞典項目等
小町守. 英語教育と自然言語処理のクロスロード [6]「言語の壁を乗り越える」. 英語教育, 第63巻, 第6号, pp.52-53, August 2014.
小町守. 英語教育と自然言語処理のクロスロード [5]「英語習熟度推定の自然言語処理的アプローチ」. 英語教育, 第63巻, 第5号, pp.52-53, July 2014.
小町守. 英語教育と自然言語処理のクロスロード [4]「コンピュータに誤りは直せるか? 動詞誤り訂正の新潮流」. 英語教育, 第63巻, 第4号, pp.52-53, June 2014.
小町守. 英語教育と自然言語処理のクロスロード [3]「コンピュータに誤りは直せるか? 前置詞誤り訂正の最先端」. 英語教育, 第63巻, 第3号, pp.52-53, May 2014.
小町守. 英語教育と自然言語処理のクロスロード [2]「ビッグデータ時代の英語学習者コーパス」. 英語教育, 第63巻, 第2号, pp.52-53, April 2014.
2013年度
学術論文誌(査読あり)
林部祐太 (NAIST), 小町守, 松本裕治 (NAIST). 述語と項の位置関係ごとの候補比較による日本語述語項構造解析. 自然言語処理, Vol.21, No.1, pp.3-26, March 2014. (論文)
小木曽智信(国語研), 小町守, 松本裕治(NAIST). 歴史的日本語資料を対象とした形態素解析. 自然言語処理, Vol.20, No.5, pp.727-748, December 2013.(論文)
水本智也 (NAIST), 小町守, 永田昌明 (NTT), 松本裕治 (NAIST). 日本語学習者の作文自動誤り訂正のための語学学習 SNS の添削ログからの知識獲得. 人工知能学会論文誌, Vol.28, No.5, pp.420-432, July 2013.(論文)
小嵜耕平 (NAIST), 新保仁 (NAIST), 小町守, 松本裕治 (NAIST). 相互 k-近傍グラフを用いた半教師あり分類. 人工知能学会論文誌, Vol.28, No.4, pp.400-409, June 2013.(論文)
岡照晃 (NAIST), 小木曽智信 (国語研), 小町守, 松本裕治 (NAIST). 統計的機械学習を用いた歴史的資料への濁点付与の自動化. 情報処理学会論文誌, Vol.54, No.4, pp.1641-1654, April 2013.(論文)
国際会議(査読あり)
Hiromi Oyama (NAIST), Mamoru Komachi and Yuji Matsumoto (NAIST). Towards Automatic Error Type Classification of Japanese Language Learners’ Writings. In Proceedings of the 27th Pacific Asia Conference on Language, Information, and Computation (PACLIC 27), pp.163-172. November 2013. (oral, paper)
Keisuke Sakaguchi (NAIST), Yuki Arase (Microsoft Research, Asia) and Mamoru Komachi. Discriminative Approach to Fill-in-the-Blank Quiz Generation for Language Learners. In Proceedings of the 51st Annual Meeting of Association for Computational Linguistics: Short papers, pp.238-242. August 2013. (poster, paper)
Yu Sawai (NAIST), Mamoru Komachi and Yuji Matsumoto (NAIST). A Learner Corpus-based Approach to Verb Suggestion for ESL. In Proceedings of the 51st Annual Meeting of Association for Computational Linguistics: Short papers, pp.708-713. August 2013. (oral, paper)
国際会議(査読なし、予稿あり)
Ippei Yoshimoto (NAIST), Tomoya Kose (NAIST), Kensuke Mitsuzawa (NAIST), Keisuke Sakaguchi (NAIST), Tomoya Mizumoto (NAIST), Yuta Hayashibe (NAIST), Mamoru Komachi, Yuji Matsumoto (NAIST). NAIST at 2013 CoNLL Shared Task Grammatical Error Correction. In Proceedings of the Seventeenth Conference on Computational Natural Language Processing, pp.26-33. August 2013. (oral, paper)
Tomoya Mizumoto (NAIST), Yuta Hayashibe (NAIST), Keisuke Sakaguchi (NAIST), Mamoru Komachi, Yuji Matsumoto (NAIST). NAIST at the NLI 2013 Shared Task. In Proceedings of the 8th Workshop on Innovative Use of NLP for Building Educational Applications, pp.134-139. June 2013. (poster, paper)
全国大会(査読なし、予稿あり)
吉本一平(NAIST), 小町守, 松本裕治(NAIST). 定冠詞の前方照応用法を考慮した冠詞誤り訂正. 言語処理学会年次大会, March 2014.
岡照晃 (NAIST), 小町守, 小木曽智信 (国語研), 松本裕治 (NAIST). 表記のバリエーションを考慮した近代日本語の形態素解析. 人工知能学会全国大会, 2B1-2. June 2013. (ポスター)
商用誌記事・辞典項目等
小町守. 英語教育と自然言語処理のクロスロード [1]「はじめよう自然言語処理」. 英語教育, 第63巻, 第1号, pp.52-53, March 2014.