小町守

191-0065 東京都日野市旭が丘6-6
東京都立大学システムデザイン学部
特任教授

komachi--at--tmu.ac.jp

トップページに行く

2023/07/27 このページは現在更新していません。現在都立大では新規の学生を受け付けていません。一橋大学の研究室サイトをご覧ください。

研究テーマ

  • 第二言語学習・教育支援への自然言語処理の応用
  • 大規模ウェブデータを用いた自然言語処理
  • 誤りを含んだテキストの頑健な処理基盤
  • 統計的自然言語処理(機械翻訳・日本語入力)
  • 深層学習を用いた自然言語処理(表現学習・深層ニューラルネットワーク)

外国人が日本語を学ぶとき、あるいは日本人が外国語 (特に英語)を学ぶときの学習支援、あるいは教育支援に 自然言語処理の手法を応用する研究をしています。 特に語学学習者が作文するときの誤り検出・訂正に焦点を当てています。

また、自然言語処理におけるグラフ理論を用いた半教師あり学習や、 意味解析と情報抽出分野の研究を行っています。 最小限の人手作業で大規模コーパスから有用な知識を抽出する手法の 開発に取り組んでいます。ウェブデータを対象にした研究をしています。

統計的自然言語処理にも関心があり、頑健な形態素解析を実現する手法 の研究、統計的機械翻訳に統語知識と意味知識を統合する手法の研究、 日本語入力・誤り訂正に統計的手法や機械学習を適用する研究などを行っています。

学歴

学部時代は文科系でしたが、大学院進学を機に自然言語処理に専攻を 変え、以後ずっと自然言語処理、特に機械学習・統計的手法を用いた 自然言語処理を専門としています。

2010年3月博士(工学)
奈良先端科学技術大学院大学情報科学研究科
博士論文テーマ: Graph-Theoretic Approaches to Minimally Supervised Natural Language Learning
(グラフ理論的観点からの自然言語処理における弱教師あり学習)
奈良先端科学技術大学院大学最優秀学生賞(博士)
指導教員: 松本裕治
2007年3月修士(工学)
奈良先端科学技術大学院大学情報科学研究科
修士論文テーマ: Argument Structure Analysis of Event Nouns Based on Noun-verb Co-occurences and Noun Phrase Patterns
(名詞と動詞の共起および名詞句の語彙統語パターンを用いた事態性名詞 の項構造解析)
奈良先端科学技術大学院大学最優秀学生賞(修士)
指導教員: 松本裕治
2005年3月学士(教養)
東京大学教養学部
学士論文テーマ: 植民地期の台湾における言語政策
指導教員: 岡本拓司
2002年2月-11月
The University of Sydney, Faculty of Arts
AIKOM (Study Abroad in Komaba) 交換留学生
哲学・言語学・歴史学の授業を履修 (言語学の授業2つで上位3-5%の学生にしか与えられない High Distinction を獲得(

研究歴

NTT 研究所との共同研究(実習生の期間を含めると4年間)、ヤフー 研究所との共同研究、海外 Microsoft Research と Apple Inc. でのインターンシップなど、 大学における研究教育に止まらず、 実用化を視野に入れたさまざまなアプリケーションで必要とされる研究に 取り組んでいます。

2022年4月-2023年3月
教授
東京都立大学システムデザイン学部 (東京都立大学大学院システムデザイン研究科兼担)
独立した自然言語処理の研究室を主宰して研究を行なっています。
2013年4月-2022年3月
准教授
東京都立大学(旧首都大学東京)システムデザイン学部 (東京都立大学(旧首都大学東京)大学院システムデザイン研究科兼担)
独立した自然言語処理の研究室を主宰して研究を行なっています。
2010年4月-2013年3月
助教
奈良先端科学技術大学院大学情報科学研究科
大学教員としてウェブなど大規模で多様なデータを対象にした自然言語処理の研究をしています。

2012年以前の研究歴は省略します

論文誌(査読あり)

国際会議採択論文を発展させた論文を中心に、国内外の論文誌に採録されています。 (うち1編言語処理学会20周年記念論文賞、1編2018年度最優秀論文賞、1編人工知能学会論文賞受賞)

  1. Hongfei Wang, Michiki Kurosawa, Satoru Katsumata, Masato Mita (CyberAgent) and Mamoru Komachi. Chinese Grammatical Error Correction Using Pre-trained Models and Pseudo Data. ACM Transactions on Asian and Low-Resource Language Information Processing. (accepted)
  2. Kenichiro Ando, Takashi Okumura (Kitami Institute of Technology), Mamoru Komachi, Hiromasa Horiguchi (National Hospital Organization), Yuji Matsumoto (RIKEN). Exploring Optimal Granularity for Extractive Summarization of Unstructured Health Records: Analysis of the Largest Multi-Institutional Archive of Health Records in Japan. PLOS Digital Health, 1(9): e0000099. September, 2022.
  3. Tosho Hirasawa, Masahiro Kaneko, Aizhan Imankulova, Mamoru Komachi. Pre-trained Word Embedding and Language Model Improve Multimodal Machine Translation: A Case Study in Multi30K. IEEE Access, 10.1109/ACCESS.2022.3185243. June, 2022.
  4. 山下郁海, 金子正弘(東工大), 三田雅人(理研), 勝又智, Imankulova Aizhan, 小町守. 言語間での転移学習のための事前学習モデルと多言語の学習者データを用いた文法誤り訂正. 自然言語処理, 29巻2号, pp.314-343. 2022.
  5. Zhishen Yang (Tokyo Institute of Technology), Tosho Hirasawa, Mamoru Komachi, Naoaki Okazaki (Tokyo Institute of Technology). Why videos do not guide translations in video-guided machine translation? An empirical evaluation of video-guided machine translation dataset. Journal of Information Processing, Vol.30, pp.388-396. 2022年5月.
  6. 喜友名朝視顕, 平澤寅庄, 小町守, 小木曽智信(国語研). 事前学習モデルを用いた近代文語文のニューラル機械翻訳. 情報処理学会論文誌, 63巻2号, pp.269-282. February, 2022.
  7. 本間広樹, 小町守. 高速な文法誤り訂正機能を持つ日本語ライティング支援システムの構築. 人工知能学会論文誌, 37巻1号, pp.B-L22_1-14. January, 2022.
  8. Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, and Chenhui Chu (Kyoto University). Region-Attentive Multimodal Neural Machine Translation. Neurocomputing, Volume 476, pp.1-13. January, 2022.
  9. Yuting Zhao, Tomoyuki Kajiwara (Ehime University), Mamoru Komachi, and Chenhui Chu (Kyoto University). Word-Region Alignment-Guided Multimodal Neural Machine Translation. IEEE/ACM Transactions on Audio, Speech and Language Processing, Volume 30, pp.244-259. December, 2021.
  10. 吉村綾馬, 金子正弘, 梶原智之(愛媛大), 小町守. 文法誤り訂正の参照文を用いない自動評価への最適化. 自然言語処理, 28巻, 2号, pp.404-427. June 15, 2021.
  11. 甫立健悟, 金子正弘, 勝又智, 小町守. 文法誤り訂正における訂正度を考慮した多様な訂正文の生成. 自然言語処理, 28巻, 2号, pp.428-449. June 15, 2021.
  12. Longtu Zhang and Mamoru Komachi. Using Sub-Character Level Information for Neural Machine Translation of Logographic Languages. ACM Transactions on Asian and Low-Resource Language Information Processing. Vol.20, No.2, Article No.31, pp.1-15. April 15, 2021.
  13. 梶原智之(阪大), 西原大貴(阪大), 小平知範, 小町守. 日本語の語彙平易化のための言語資源の整備. 言語処理学会論文誌. 27巻, 4号, pp.801-824. December, 2020.
  14. 新井美桜, 金子正弘, 小町守. 日本語学習者向けの文法誤り検出機能付き作文用例検索システム. 人工知能学会論文誌. 35巻, 5号, pp.1-9. September, 2020.
  15. 白井良介, 松村雪桜, 小木曽智信(国語研), 小町守. 近代の歴史的資料を対象とした機械学習による文境界推定. 情報処理学会論文誌. 61巻2号, pp.152-161. February, 2020.
  16. Aizhan Imankulova, Takayuki Sato and Mamoru Komachi. Filtered Pseudo-Parallel Corpus Improves Low-Resource Neural Machine Translation. ACM Transactions on Asian and Low-Resource Language Information Processing. Vol. 19, No. 2, Article 24, 16 pages. October, 2019.
  17. Masahiro Kaneko and Mamoru Komachi. Multi-Head Multi-Layer Attention to Deep Language Representations for Grammatical Error Detection. Computacion y Sistemas. Vol. 23, No. 3, pp. 883-891. September, 2019.
  18. 嶋中宏希, 梶原智之, 小町守. 事前学習された文の分散表現を用いた機械翻訳の自動評価. 自然言語処理. 26巻3号, pp.613-634. September, 2019.
  19. 金子正弘, 堺澤勇也, 小町守. 正誤情報と文法誤りパターンを考慮した単語分散表現を用いた文法誤り検出. 自然言語処理, Vol.25, No.4, pp.421-440. September, 2018.
  20. 梶原智之, 小町守. 平易なコーパスを用いないテキスト平易化. 自然言語処理, Vol.25, No.2, pp.223-249. March, 2018. (言語処理学会2018年度最優秀論文賞)
  21. 大山浩美, 小町守, 松本裕治. 日本語学習者の作文における誤用タイプの階層的アノテーションに基づく機械学習による自動分類. 自然言語処理, Vol.23, No.2, pp.195-225. March, 2016.
  22. 叶内晨, 北川善彬, 荒牧英治, 岡崎直観, 小町守. Web情報からの罹患検出を対象とした事実性解析・主体解析の誤り分析. 自然言語処理, Vol.22, No.5, pp.363-395. December, 2015.
  23. 林部祐太, 小町守, 松本裕治. 述語と項の位置関係ごとの候補比較による日本語述語項構造解析. 自然言語処理, Vol.21, No.1, pp.3-25. March, 2014.
  24. 小木曽智信, 小町守, 松本裕治. 歴史的日本語資料を対象とした形態素解析. 自然言語処理, Vol.20, No.5, pp.727-748. December, 2013.
  25. 水本智也, 小町守, 永田昌明, 松本裕治. 日本語学習者の作文自動誤り訂正のための語学学習SNSの添削ログからの知識獲得. 人工知能学会論文誌, Vol.28, No.4, pp.420-432. July, 2013.
  26. 小嵜耕平, 新保仁, 小町守, 松本裕治. 相互 k-近傍グラフを用いた半教師あり分類. 人工知能学会論文誌, Vol.28, No.4, pp.400-408. June, 2013.
  27. 岡照晃, 小木曽智信 (国語研), 小町守, 松本裕治. 統計的機械学習を用いた歴史的資料への濁点付与の自動化. 情報処理学会論文誌, Vol.54, No.4, pp.1641-1654. April, 2013.
  28. 内海慶 (ヤフー), 小町守. ウェブ検索クエリログとクリックスルーログを用いた同義語獲得. 情報処理学会論文誌: データベース (TOD56), Vol.6, No.1, pp.16-28. January, 2013.
  29. 飯田龍 (東工大), 小町守, 井之上直也, 乾健太郎, 松本裕治. 述語項構造と照応関係のアノテーション: NAIST テキストコーパス構築の経験から. 自然言語処理, Vol.17, No.2, pp.25-50. April, 2010.
    (言語処理学会20周年記念論文賞)
  30. 小町守, 飯田龍 (東工大), 乾健太郎, 松本裕治. 名詞句の語彙統語パターンを用いた事態性名詞の項構造解析. 自然言語処理, Vol.17, No.1, pp.141-159. January, 2010.
  31. 小町守, 工藤拓 (Google), 新保仁, 松本裕治. Espresso 型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析. 人工知能学会論文誌, Vol.25, No.2, pp.233-242. January, 2010.
    (人工知能学会2010年度論文賞)
  32. 小町守, 牧本慎平 (ヤフー), 内海慶 (ヤフー), 颯々野学 (ヤフー). ラプラシアンラベル伝播による検索クリックスルーログからの意味カテゴリ獲得. 人工知能学会論文誌, Vol.25, No.1, pp.196-205. January, 2010.
  33. 小町守, 鈴木久美 (Microsoft Research). 検索ログからの半教師あり意味知識獲得の改善. 人工知能学会論文誌, Vol.23, No.3, pp.217-225. March, 2008.
  34. 小町守. 台湾植民地期の言語政策: 安藤正次と二語併用の台湾 科学技術史, No.8, pp.31-55. 2005.

国際会議

最近は論文誌ではなく国際会議(特にメジャーカンファレンス)にターゲットを絞っていますが、機械翻訳を中心に、評価型の会議・ワークショップにも参加しています。 2017年からは arXiv に投稿するようになりました。 2010年4月から教員になり、指導する学生との共著の論文が増えてきました。

数が多くて書き切れないので、Google Scholar の小町のページをご覧ください。デフォルトでは引用順(インパクトが高い順)に並んでいますが、発表の新しい順に並べることもできます。

研究会・全国大会・シンポジウム等 (査読なし)

言語処理学会年次大会(年1回、3月)と情報処理学会自然言語処理研究会(年5回、5・7・9・11・1月)、そして NLP 若手の会シンポジウム(年1回、9月)で主に発表しています。

数が多くて書き切れないので、研究室のページのほうをご覧ください。首都大に来る前の業績は別のページにまとめてあります。

解説・書評・項目執筆など

  • [項目執筆] 小町守. 自然言語処理の教育応用. pp.688-689. 人工知能学会編, 人工知能学大事典. 2017年7月. 共立出版.
  • [項目執筆] 小町守. 自然言語処理. pp.688-689. 国立国会図書館調査及び立法考査局編, 人工知能・ロボットと労働・雇用をめぐる視点: 科学技術に関する調査プロジェクト報告書, 調査資料 2017-5, pp.10-12. 2018年3月. 国立国会図書館.
  • [項目執筆] Ryu Iida, Mamoru Komachi, Naoya Inoue, Kentaro Inui and Yuji Matsumoto. NAIST Text Corpus: Annotating Predicate-Argument and Coreference Relations in Japanese. In Nancy Ide and James Pustejovsky Eds, Handbook of Linguistic Annotation, pp.1177-1196, June 2017. Springer Science.
  • [監修] 萩原正人, グラム・ニュービッグ, 奥野陽(著), イノウ(編), 小町守(監修). 自然言語処理の基本と技術. 翔泳社. March 2016.
  • [解説] 小町守. 機械翻訳から見る日本語. 日本語学, 第35巻, 第1号, pp.52-63, December 2015.
  • [解説] 小町守. 英語教育と自然言語処理のクロスロード [6]「言語の壁を乗り越える」. 英語教育, 第63巻, 第6号, pp.52-53, August 2014.
  • [解説] 小町守.英語教育と自然言語処理のクロスロード [5]「英語習熟度推定の自然言語処理的アプローチ」. 英語教育, 第63巻, 第5号, pp.52-53, July 2014.
  • [解説] 小町守. 英語教育と自然言語処理のクロスロード [4]「コンピュータに誤りは直せるか? 動詞誤り訂正の新潮流」. 英語教育, 第63巻, 第4号, pp.52-53, June 2014.
  • [解説] 小町守. 英語教育と自然言語処理のクロスロード [3]「コンピュータに誤りは直せるか? 前置詞誤り訂正の最先端」. 英語教育, 第63巻, 第3号, pp.52-53, May 2014.
  • [解説] 小町守. 英語教育と自然言語処理のクロスロード [2]「ビッグデータ時代の英語学習者コーパス」. 英語教育, 第63巻, 第2号, pp.52-53, April 2014.
  • [解説] 小町守. 英語教育と自然言語処理のクロスロード [1]「はじめよう自然言語処理」. 英語教育, 第63巻, 第1号, pp.52-53, March 2014.
  • [書評] 小町守. 「自然言語処理の基礎」. 人工知能学会誌, Vol.26, No.2, pp.214-215, March 2011.
  • [項目執筆] 小町守. 「確率的言語モデルに基づくかな漢字変換」. 言語処理学事典. 共立出版. p33, December 2009.
  • [マニュアル] 菊池英明, 塚原渉, 小町守, 山田篤, 高梨克也. 『日本語話し言葉コーパス』XML 文書について. 2004.

研究費獲得

教員になってから研究の代表者となって研究するようになりました。(組織内の競争的な研究費や、企業との競争的ではない共同研究は以下には記載しません)

研究代表者

  • 2022年度 科研費基盤B 「深層学習による言語生成の評価データセットの構築と品質推定」. 1340万円 [540/360/440]. (2022.04-2025.03)
  • 2020年度 科研費国際共同研究強化 (A) 「言語学習者の誤用に注目した単語と文の分散表現の獲得と分析」 970万円 [970]. (2020.02-2023.03)
  • 2019年度 科研費基盤C 「単語分散表現の学習における構成性とその解釈」. 330万円 [230/50/50]. (2019.04-2022.03)
  • 平成28年度 Microsoft Research CORE プロジェクト 「Neural Network for Robust Japanese Word Segmentation」. 250万円 [250]. (2016.04-2017.03)
  • 平成28年度 科研費若手B 「頑健な単語表現の学習と深層ニューラルネットワークを用いた誤り訂正」. 310万円 [150/80/80]. (2016.04-2019.03)
  • 平成24年度 Microsoft Research CORE プロジェクト 「Learning L1-aware Error Models from the Web」. 200万円 [200]. (2012.04-2013.03)
  • 平成23年度 科研費若手B 「自然言語処理における全体最適化のための大規模・超並列処理」 270万円 [150/120]. (2011.04-2013.03)
  • 平成23年度 財団法人テレコム先端技術研究支援センター SCAT研究費助成「大規模情報抽出のための頑健な述語項構造解析の研究」 250万円 [100/100/50]. (2011.04-2014.03)
  • 日本学術振興会特別研究員 (DC2; 採用率21%) 「大規模なコーパスを用いた機械学習に基づく名詞句の項構造解析」 100万円 [50/50]. (2008.04-2010.03)

研究分担者

  • 平成25〜28年度 科研費基盤B 「日本語ライティング評価の支援ツール開発: 「人間」と「機械」による評価の統合的活用」. 代表: 田中真理(名古屋外国語大学) (2014.04-2017.03)
  • 平成25年度 科研費基盤A 「運動学習・支援のための多次元情報記録・提示とモデルベース強化学習」. 代表: 柴田智広(九州工業大学) (2014.04-2015.03)
  • 平成24年度 科研費基盤A 「外国語ニュース・講演の音声同時通訳方式に関する研究」. 代表: 中村哲 (奈良先端大). (2012.04-2013.03)
  • 平成23年度 情報通信研究機構 (NICT) 委託研究 「知識・言語グリッドに基づくアジア医療交流支援システムの研究開発」 代表: 中村哲 (奈良先端大). (2011.12-2013.03)
  • 平成23〜25年度 科研費基盤A 「大域情報を利用した同時処理による自然言語解析手法の研究」. 代表: 松本裕治 (奈良先端大). (2011.04-2014.03)
  • 平成22年度 人間文化研究機構 国立国語研究所 共同研究プロジェクト 「統計と機械学習による日本語史研究」. 代表: 小木曽智信 (国語研究所). (2010.11-2013.09)
  • 平成22年度 科研費特定 「代表性を有する大規模書き言葉コーパスの構築:21世紀の日本語研究の基盤整備」 計画研究「書き言葉コーパスの自動アノテーションの研究」. 代表: 松本裕治 (奈良先端大). (2010-2011)
  • 2005年度 情報処理推進機構 (IPA) 未踏ソフトウェア創造事業 (未踏ユース) 「ユーザ参加型のパッケージ管理・斡旋システム」. 代表: 吉澤智也 (東京大学). (2005.07-2006.03) (採択率50%、年間300万円の開発費の支給を受け、ユーザのログを活用した Mac OS X のソフトウェア管理システムの開発を行いました。)

受賞

主著

  1. 人工知能学会2010年度論文賞: 小町守, 工藤拓, 新保仁, 松本裕治. 「Espresso 型ブートストラッピング法における意味ドリフトのグラフ理論に基づく分析」2011年6月.
    (年間1-3件の論文に与えられます。2010年度は3件に与えられました)
  2. 情報処理学会平成22年度山下記念研究賞: 小町守. 「ウェブ検索ログを用いたラベル伝播による意味カテゴリ獲得」2011年3月.
    (年間100件中2件の発表に与えられました)
  3. 言語処理学会第14回年次大会最優秀発表賞: 小町守, 工藤拓, 新保仁, 松本裕治. 「カーネル法を用いた意味的類似度の定義とブートストラップの一般化」2009年3月.
    (200件中1件に与えられました)

共著

  1. Workshop on Advances in Language and Vision Research, WMT Challenge 2020 Winner (1st place): Tosho Hirasawa, Zhishen Yang (Tokyo Institute of Technology), Mamoru Komachi, Naoaki Okazaki (Tokyo Institute of Technology) Keyframe Segmentation and Positional Encoding for Video-guided Machine Translation Challenge 2020
  2. 言語処理学会2018年度最優秀論文賞: 梶原智之, 小町守. 「平易なコーパスを用いないテキスト平易化」 2019年3月15日.
    (21件中1件に与えられました)
  3. NLP若手の会第12回シンポジウム奨励賞: 黒澤道希, 山岸駿秀, 松村雪桜, 小町守. 「活用情報を用いた日英ニューラル機械翻訳」 2017年9月5日.
    (国際会議等で未発表の研究のうち、将来性が見込まれる研究に与えられました)
  4. 情報処理学会第229回自然言語処理研究会優秀研究賞: 梶原智之, 小町守. 「平易なコーパスを用いないテキスト平易化のための単言語パラレルコーパスの構築」2016年12月22日.
    (10件中1件に与えられました)
  5. 言語処理学会20周年記念論文賞: 飯田龍, 小町守, 井之上直也, 乾健太郎, 松本裕治. 「述語項構造と照応関係のアノテーション: NAIST テキストコーパス構築の経験から」2014年7月.
    (20年間の論文誌の中で特に優れた論文2編に与えられました)
  6. 言語処理学会第13回年次大会優秀発表賞: 飯田龍, 小町守, 乾健太郎, 松本裕治. 「日本語書き言葉を対象とした述語項構造と共参照関係のアノテーション: NAISTテキストコーパス開発の経験から」2008年3月
    (200件中4件に与えられました)

指導学生

  1. 言語処理学会第26回年次大会若手奨励賞: 嶋中宏希. 2020年3月16日.
    事前学習された多言語の文符号化器を用いた機械翻訳の品質推定.
  2. 16th International Conference of the Pacific Association for Computational Linguistics (PACLING) Best Student Paper: Hayahide Yamagishi. 12 October, 2019.
    Improving Context-aware Neural Machine Translation with Target-side Context
  3. 言語処理学会第25回年次大会若手奨励賞: 大森光. 2019年3月15日.
    マルチタスク学習を用いたニューラル文内述語項構造解析.
  4. 言語処理学会第24回年次大会若手奨励賞: 松村雪桜. 敵対性生成ネットワークを用いた機械翻訳評価手法. 2018年3月15日.
    (300件中9件に与えられました)
  5. WebDB Forum 2017 株式会社 FRONTEO 賞: 小平知範. TL;DR 3行要約に着目したニューラル文書要約. 2017年9月20日.
    (該当する企業が特に奨励したい研究に与えられました)
  6. 情報処理学会第231回自然言語処理研究会・第116回音声言語情報処理研究会学生奨励賞: 梶原智之. Bilingual Pivoting による言い換え獲得の相互情報量に基づく一般化. 2017年5月16日.
    (10件中2件に与えられました)
  7. 言語処理学会第23回年次大会若手奨励賞: 金子正弘. 英語学習者の文法誤りパターンと正誤情報を考慮した単語分散表現学習. 2017年3月16日.
    (300件中4件に与えられました)
  8. 言語処理学会第22回年次大会若手奨励賞: 平田亜衣. Factorization Machines を用いた未知の固有表現分類. 2016年3月.
    (300件中5件に与えられました)
  9. 情報処理学会第201回自然言語処理研究会・第86回音声言語情報処理研究会学生奨励賞: 岡照明. 機械学習による近代文語文への濁点の自動付与. 2011年5月.
    (10件中2件に与えられました)
  10. 情報処理学会第201回自然言語処理研究会・第86回音声言語情報処理研究会学生奨励賞: 林部祐太. 文脈情報と格構造の類似度を用いた日本語文間述語項構造解析. 2011年5月.
    (10件中2件に与えられしました)
  11. 情報処理学会平成23年度山下記念研究賞: 小嵜耕平. ハブを作らないグラフ構築法を用いた半教師あり語義曖昧性解消. 2010年11月.
    (年間1件の発表に与えられました)
  12. 情報処理学会第196回自然言語処理研究会・第81回音声言語情報処理研究会学生奨励賞: 小嵜耕平. 半教師あり語義曖昧性解消のためのグラフスパース化. 2010年5月.
    (13件中3件に与えられました)

特許

企業の研究所との共同研究で特許を取得しました。

  • Mamoru Komachi, Shin Kanouchi, Tomoya Ogata, Tomoya Takatani. Output Sentence Generation Apparatus, Output Sentence Generation Method, And Output Sentence Generation Program, US Patent # 15/887333 (2018.09.06)
  • 小町守, 颯々野学. 適正単語取得装置、機械学習装置及び方法, 特許第5042268号 (登録日 2012.07.20)

教育

統計的自然言語処理の手法を中心に、講義と演習を担当しています。

担当講義

  • 東京都立大学システムデザイン研究科「自然言語処理特論」. 2014, 2016, 2018, 2020-
    (学部4年生・修士1年生を対象に自然言語処理の講義を行いました)
  • 東京都立大学システムデザイン学部「機械学習」. 2020-
  • 東京都立大学システムデザイン学部「データ構造とアルゴリズムI」. 2018-
    (学部1年生を対象にアルゴリズムの講義を行っています)
  • 津田塾大学学芸学部「自然言語処理」. 2019- (学部3年生を対象に自然言語処理の講義と演習を行なっています)
  • 首都大学東京システムデザイン学部「パターン認識と機械学習」. 2016-2019
    (学部3年生を対象に90分 x 8 回の機械学習の講義を行ないました)
  • 首都大学東京システムデザイン学部「情報理論」. 2013-2019
    (学部3年生を対象に情報理論の講義を行ないました)
  • 首都大学東京全学共通科目「基礎ゼミナール」. 2018-2019
    (学部1年生を対象に少人数でアカデミックスキルのトレーニングをします)
  • 首都大学東京システムデザイン学部「オートマトンと言語理論」. 2014-2017
    (学部2年生を対象にオートマトンと言語理論の講義を行ないました)
  • 首都大学東京国際交流科目「Introduction to Computational Linguistics」. 2014, 2015
    (交換留学生を対象に自然言語処理の講義を行いました。英語による授業です)
  • 首都大学東京オープンユニバーシティ「自然言語処理の基本と技術」. 2016
    (一般向けの講座で同名の書籍を用いて 90分 x 4回セミナーを行いました)

オムニバス講義

  • 東京都立大学システムデザイン学部「人工知能・自然言語処理概論」. 2018-
    (3-4コマ分、自然言語処理に関する導入講義をしています)
  • 首都大学東京システムデザイン学部「情報通信特別講義」 「IT業界における企業と大学と学生の関係」. 2014-2017
    (インターンシップや共同研究の事例を通じてIT業界のトピックを解説しました)

演習・実験

  • 首都大学東京システムデザイン研究科「研究プロジェクト演習」. 2013, 2015, 2017(隔年開講)
    (2013年は機械学習による論文の著者推定タスク、2015年は深層学習を用いた画像認識タスクに取り組みました)
  • 首都大学東京システムデザイン学部「情報工学演習」. 2013-2018
    (学部2年生を対象に90分x8回アルゴリズムの演習を行ないました)
  • 首都大学東京教育改革推進事業「アルゴリズムとデータ構造デザインワークショップ」. 2015
    (学部1〜3年生を対象に、夏休みの3日間10-17時でアルゴリズムとデータ構造の演習をしました)

奈良先端大時代の教育歴は省略しました

論文審査委員

主査

  • 2022年度
    • 博士: 安道 健一郎, 陳 宙斯, 趙 宇婷
    • 修士: 小山 碧海(博士後期課程進学), 今藤 誠一郎, 喜友名 朝視顕, 田村 弘人, 井上 誠一, 小林 千真
    • 学士: 中辻 充恭, 佐藤 郁子(博士前期課程進学), 木山 朔(博士前期課程進学), 榎本 大晟(博士前期課程進学), 中島 京太郎(博士前期課程進学)
  • 2021年度
    • 修士: Oryza Siti Khairunnisa(博士後期課程進学), 李 凡, 金 輝燦(博士後期課程進学), 相田 太一 (博士後期課程進学), 蘆田 真奈, 高橋 悠進, 平尾 礼央, 山下 郁海
    • 学士: 上田 直生也(博士前期課程進学), 鈴木 大祐, 凌 志棟(博士前期課程進学)
  • 2020年度
    • 博士: 金子 正弘, Longtu Zhang, Aizhan Imankulova
    • 修士: 平澤 寅庄(博士後期課程進学), 王 鴻飛(博士後期課程進学), 甫立 健悟, 本間 広樹, 吉村 綾馬
    • 学士: 小山 碧海(博士前期課程進学), 今藤 誠一郎(博士前期課程進学), 喜友名 朝視顕(博士前期課程進学), 田村 弘人(博士前期課程進学)
  • 2019年度
    • 修士: 新井 美桜, 白井 稔久, 黒澤 道希, 嶋中 宏希, 勝又 智, 趙 宇婷(博士後期課程進学)
    • 学士: 高橋 悠進(博士前期課程進学), 中澤 真人(博士前期課程進学), 平尾 礼央(博士前期課程進学), 山下 郁海(博士前期課程進学)
  • 2018年度
    • 修士: 池田 可奈子, 尾形 朋哉, 大崎 彩葉, 山岸 駿秀, 大森 光, 松村 雪桜, スィリハッタサック スカーン, 竹中 誠(博士後期課程進学), 白井 良介
    • 学士: 甫立 健悟(博士前期課程進学), 本間 広樹(博士前期課程進学), 吉村 綾馬(博士前期課程進学)
  • 2017年度
    • 博士: 梶原 智之(大阪大学特任助教)
    • 修士: 関沢 祐樹, 塩田 健人, 小平 知範, 金子 正弘(博士後期課程進学)
    • 学士: 長内 洋太(博士前期課程進学), 白井 稔久(博士前期課程進学), 黒澤 道希(博士前期課程進学), 嶋中 宏希(博士前期課程進学), 勝又 智(博士前期課程進学)
  • 2016年度
    • 修士: 朝倉 康伸, 叶内 晨, 北川 善彬, 堺澤 勇也, 佐藤 貴之, 松尾 潤樹, 宮崎 亮輔
    • 学士: 大崎 彩葉(博士前期課程進学), 大森 光(博士前期課程進学), 尾形 朋哉(博士前期課程進学), 松村 雪桜(博士前期課程進学), 山岸 駿秀(博士前期課程進学)
  • 2015年度
    • 修士: 立花 竜一, 張 培楠, 平田 亜衣, 塘 優旗, 趙 寅琛, 大和田 賢一
    • 学士: 野口 真人, 小平 知範(博士前期課程進学), 関沢 祐樹(博士前期課程進学), 塩田 健人(博士前期課程進学)
  • 2014年度
    • 学士: 叶内 晨(博士前期課程進学), 宮崎 亮輔(博士前期課程進学), 堺澤 勇也(博士前期課程進学), 北川 善彬(博士前期課程進学)
  • 2013年度
    • 学士: 江尻 大志, 佐々木 聖司, 張 培楠(博士前期課程進学), 平田 亜衣(博士前期課程進学)

副査

修士の副査については数が多いので、省略します。

  • 2022年度
    • 博士: Tzong-Xiang Huang(都立大=課程博士)
  • 2021年度
    • 博士: 松藤彰宏(都立大=課程博士), LI YOUDI(都立大=課程博士)
  • 2020年度
  • 2019年度
    • 博士: Wei-Fen Hsieh(首都大=課程博士), 星野 翔(総研大=課程博士)
  • 2018年度
    • 博士: 五味 怜央奈(首都大=課程博士), 柴田 祐樹(首都大=課程博士)
  • 2017年度
  • 2016年度
    • 博士: 遠藤 正樹(首都大=社会人博士)
  • 2015年度
    • 博士: 大山 浩美(NAIST=課程博士)
  • 2013年度
    • 博士: 小木曽 智信(NAIST=社会人博士), 林部 祐太(NAIST=課程博士)
  • 2012年度
    • 博士: 林 克彦(NAIST=課程博士), 平野 徹(NAIST=社会人博士)

学会活動

プログラム委員として国際会議の査読に関わったり、国内の論文誌の査読をする一方、各種シンポジウムやワークショップの企画運営をしています。現在も継続中のものは先頭にアステリスクをつけています。

海外

自然言語処理、アプリケーション、機械学習といった国際会議・ワークショップの論文査読や運営の仕事をしています。

プログラム委員長 program chair

  • PACLIC: Pacific Asia Conference on Language, Information and Computation (2019)
  • NLP-TEA: Workshop on Natural Language Processing Techniques for Educational Applications (2018)

分野長 area chair

  • EMNLP: Conference on Empirical Methods in Natural Language Processing and Natural Language Learning (2017: Text Mining and NLP Applications)
    (機械学習を用いた自然言語処理・統計的自然言語処理のトップ国際会議です)
  • IJCNLP: International Joint Conference on Natural Language Processing (2017: NLP Applications)
  • ACL: Annual Meeting of the Association for Computational Linguistics (2014: NLP Applications, 2021: NLP Applications)
    (自然言語処理のトップ国際会議です)

編集委員 action editor

  • TACL: Transactions of the Association for Computational Linguistics (2018-2020)
    (自然言語処理のトップ論文誌の一つです)

プログラム委員 program committee

  • ACL: Annual Meeting of the Association for Computational Linguistics (2015 (main, demo), 2016 (main, demo), 2017 (main, demo), 2018 (demo), 2020 (main))
    (自然言語処理のトップ国際会議です)
  • EMNLP: Conference on Empirical Methods in Natural Language Processing and Natural Language Learning (2012, 2014, 2015, 2016, 2018 (demo), 2019 (demo), 2020 (main, demo))
    (機械学習を用いた自然言語処理・統計的自然言語処理のトップ国際会議です)
  • NAACL: North American Chapter of the Association for Computational Linguistics (2009, 2016, 2018, 2019)
    (自然言語処理で最難関とされるトップ会議会議の一つです)
  • COLING: International Conference on Computational Linguistics (2014, 2016, 2018, 2020 (main, demo))
    (自然言語処理でもっとも古い国際会議の一つです)
  • CoNLL: Conference on Computational Natural Language Learning (2011, 2012, 2013)
    (自然言語理解や統計的自然言語処理では難関とされるメジャー会議の一つです)
  • EACL: Conference of the European Chapter of the Association for Computational Linguistics (2012)
    (ヨーロッパ最大の自然言語処理に関する国際会議です)
  • AACL: Conference of the Asian Chapter of the Association for Computational Linguistics (2020)
    (アジア圏の最大の自然言語処理に関する国際会議です)
  • HLT: Human Language Technologies Conference (2009, 2018)
  • IJCNLP: International Joint Conference on Natural Language Processing (2011, 2013, 2015, 2020)
    (アジア圏の最大の自然言語処理に関する国際会議です)
  • PACLIC: Pacific Asia Conference on Language, Information and Computation (2018)
  • LREC: Language Resources and Evaluation Conference (2018, 2020)
    (言語資源に関する世界最大の国際会議です)
  • BEA: Workshop on Innovative Use of NLP for Building Educational Applications, (2013, 2014, 2015, 2016, 2017, 2018, 2019, 2020)
    (自然言語処理の言語教育・言語学習への応用に関する専門的な国際ワークショップです)
  • NLP-TEA: Workshop on Natural Language Processing Techniques for Educational Applications (2014, 2015, 2016, 2017)
  • WTIM: Workshop on Advances in Text Input Methods (2011)
    (テキスト入力メソッドに関する世界初の国際ワークショップです)
  • AAAI: Conference on Artificial Intelligence (2011, 2018)
    (人工知能で最難関とされるトップ国際会議の一つです)
  • IJCAI: International Joint Conference on Artificial Intelligence (2015, 2019)
    (人工知能で最難関とされるトップ国際会議の一つです)
  • CIKM: Conference on Information and Knowledge Management (2020)
    (データマイニングのメジャーカンファレンスの一つです)

査読者 reviewer

  • TACL: Transactions of the Association for Computational Linguistics (2014, 2015, 2016, 2017, 2018, 2020)
    (自然言語処理のトップ論文誌の一つです)
  • NIPS: Conference on Neural Information Processing Systems (2012, 2013, 2014, 2015)
    (機械学習のトップ国際会議です)
  • TALLIP: ACM Transactions on Asian and Low-Resource Language Information Processing (2012, 2018, 2020)
    (アジア言語処理の論文誌です)
  • T-ASL: IEEE Transactions on Audio, Speech and Language Processing (2018, 2019, 2020)

ワークショップ長 workshop chair

  • *NAACL: North American Chapter of the Association for Computational Linguistics (2021)

国内

代議員

学会員の代表として活動しています。

  • 言語処理学会代議員 (2015-2019)

編集委員

学会論文誌のメタ査読委員(査読者を依頼して、最終判定を決める人)や学会賞の選定、学会誌(一般向けの雑誌)の編集などを行なっていました。

  • 人工知能学会編集委員 (2012-2016)
  • 電子情報通信学会編集委員 (2014-2016)
  • 言語処理学会編集委員 (2013-2015)

査読者

不定期に自然言語処理・ウェブマイニング関係の論文誌の査読を引き受けています。最近は国際会議に軸足を移しているので、国内の学会の論文誌の査読はほとんど引き受けていません。

  • 電子情報通信学会常任査読委員 (2013-)
  • 言語処理学会論文誌査読者 (2011-2013, 2016, 2018)
  • 情報処理学会論文誌査読者 (2010-2012, 2016, 2018)
  • 情報処理学会論文誌: データベース (TOD) 査読者 (2011-2012)
  • 人工知能学会論文誌査読者 (2010, 2012)
  • 電子情報通信学会論文 (D分冊) 査読者 (2009-2012)

研究会・全国大会委員

学会研究会・全国大会の企画運営に携わっています。

  • 言語処理学会第27回年次大会 (NLP2021) ワークショップ 「文章の評価と品質推定~人間・機械の「作文」の巧拙をどう見極めるか?~」オーガナイザ (2021)
  • 言語処理学会言語処理技術セミナー実行委員 (2018, 2019)
  • 言語処理学会第24回年次大会 (NLP2018) ワークショップ 「言語処理研究者・技術者の育成と未来への連携」オーガナイザ (2018)
  • 情報処理学会自然言語処理研究会(NL研)幹事 (2014-2017)
  • 言語処理学会年次大会 (NLP) プログラム委員 (2013-2015)
  • NLP (自然言語処理) 若手の会シンポジウムプログラム委員 (2008, 2010-2014)
    (2011年は NAIST のローカルオーガナイザーとしてシンポジウムを開催しました。 2012-2014年は共同委員長として、若手コミュニティの活性化に取り組みました。)
  • 第15回情報論的学習理論ワークショップ (IBIS 2012) プログラム委員
  • 誤り検出・訂正ワークショップ (EDCW 2012) 共同オーガナイザ
  • 言語処理学会第18回年次大会 (NLP2012) テーマセッション 「文書の作成/校正支援」オーガナイザー (2012)
  • 言語処理学会第17回年次大会 (NLP2011) ワークショップ 「自然言語処理における企業と大学と学生の関係」プログラム委員 (2011)

社会活動

2004年6月-2014年
Fink プロジェクト開発者
(Mac OS X のソフトウェア管理システム Fink の公式開発者で、Mac OS X で簡単に Unix のツールが使えるようにサポート していました。また、Apple WWDC Student Scholarship という奨学制度を 2006年と2009年に利用させてもらいました)
2003年7月-2007年10月
Gentoo プロジェクト開発者
(Gentoo Linux の公式開発者でした。 メインで担当していたのは CJK、日中韓など英語以外の言語のソフトウェアで、 ソフトウェアの設定ファイルを書いたり、他の人に書いてもらったパッチを 取り込んだり、ソフトウェアの導入ポリシーについて本家で議論・交渉したり していました)

雑誌記事

オープンソース開発活動で商業誌に定期的に寄稿していました。

  • 小町守. Mac OS X で始める UNIX ライフ: パッケージングシステム総解説. Professional Mac OS X (ソフトバンクムック), 2005年.
  • 小町守. Mac OS XでPortageを使おう!Gentoo for Mac OS X、インストールから使用法まで. Software Design (技術評論社) 2005年3月号.
  • 小町守. Gentoo Linuxパッケージ操作研究【後編】. Software Design (技術評論社) 2005年1月号.
  • 小町守. Gentoo Linuxパッケージ操作研究【前編】. Software Design (技術評論社) 2004年12月号.
  • 小町守. Gentoo Linuxパッケージ作成ガイド【後編】. Software Design (技術評論社) 2004年 2月号.
  • 小町守. Gentoo Linuxパッケージ作成ガイド【前編】. Software Design (技術評論社) 2004年 1月号.

招待講演・セミナー等

Gentoo Linux の本家公式開発者として招待講演をしていました。最近は産学連携や自然言語処理に 関する招待講演やパネル討論に招かれています。

  • 小町守. 言語はなぜ人工知能の問題になるのか. 首都大学東京 SD フォーラム. 東京. October 2018.
  • 小町守. ここまできた機械翻訳!ことばの壁を乗り越える. 羽村市生涯学習センターゆとろぎ先端テクノロジー講座(招待講演). 東京. September 2018.
  • 小町守. 言語処理における GAN の展開. 第76回人工知能セミナー, 人工知能学会(招待講演). 東京. August 2018.
  • 小町守. 計算言語学への招待 〜コトバを科学する〜. 夢ナビライブ 2017(招待講演). 東京. August 2017.
  • 小町守. 深層ニューラルネットワークを用いた日本語処理. 第71回人工知能セミナー, 人工知能学会(招待講演). 東京. June 2016.
  • 小町守. 論文を書かない自然言語処理. 言語処理学会第22回年次大会ワークショップ 論文に書けない(書かない)自然言語処理. 仙台. March 2016.
  • 小町守. ウェブマイニングを用いた言語学習支援. 国立情報学研究所. 東京. Septebmer 2015.
  • 小町守. 自然言語処理の新展開. Recruit Technologies Open Lab(招待講演). 東京. April 2015.
  • 小町守. スーパーローカル自然言語処理研究室をつくる. データ構造と情報検索と言語処理勉強会(招待講演). 東京. October 2014.
  • 小町守. インターンシップから始まる世界 -- イノベーションと人材開発の今を考える. CAUA設立15周年記念シンポジウム (パネリスト). 2014年6月
  • 小町守. 頑健な自然言語処理に向けた誤り検出・訂正. ALAGIN 自然言語処理分科会セミナー (講師). 東京. March 2014.
  • Mamoru Komachi. Graph-Theoretic Approaches to Minimally-Supervised Natural Language Learning. Web & AI Seminar, National Institute of Informatics (invited talk). September 2013.
  • 小町守. ウェブマイニングを用いた英語学習支援. 人工知能学会インタラクティブ情報アクセスと可視化マイニング研究会 (招待講演). 東京. July 2013.
  • Mamoru Komachi. Learning Learner-aware Error Models from the Web. Microsoft Research Japan CORE Project Workshop. Beijing, China. May 2013.
  • 小町守. 頑健な自然言語処理に向けた誤り検出・訂正. ALAGIN 自然言語処理分科会セミナー (講師). 東京. March 2013.
  • Paul Butcher, Achraf Chalabi, Kalika Bali, Ram Prakash, Mamoru Komachi. Future of Text Input Methods: Research directions and community building. Second Workshop on Advances in Text Input Methods (WTIM 2) (panelist). Munbai, India. December 2012.
  • 小町守. 英語学習者コーパスを用いた英作文の誤り訂正. 第16回名古屋地区NLPセミナー (招待講演). 名古屋. September 2012.
  • Jun Takamatsu, Takafumi Taketomi, Mamoru Komachi, Tetsuya Sakai. Study and Research Abroad. Microsoft Research Forum 2011 (panelist). 2011年11月.
  • Danushka Bollegala, 荒瀬由紀, 石野亜耶, 岡崎直観, 岡野原大介, 笹野遼平, 柴田知秀, 小町守. 自然言語処理の最前線. 奈良先端未来開拓コロキウム (パネリスト). 2011年9月.
  • 小町守. 自然言語処理とリサーチエンジニア. 株式会社ロックオン (招待講演). 2011年5月.
  • 小町守, 坂地泰紀, 萩原正人, 長谷川大, グラム・ニュービッグ, 吉田光男. 自然言語処理における企業と大学と学生の関係. 言語処理学会第17回年次大会ワークショップ (パネリスト). 2011年3月.
  • 小町守. 自然言語処理を応用した日本語学習支援 京都中ロータリークラブ例会 (招待講演). 2011年1月.
  • 喜連川優, 國領二郎, 松井くにお, 小町守. Open Data が切り開く新時代の研究・開発〜新たな産学連携の形を求めて〜. 第3回楽天研究開発シンポジウム (パネリスト). 2010年12月.
  • 小町守. 大規模コーパスを用いた計算言語類型論. 2010年度第2回社会的知能発生学研究会 (招待講演). 2010年12月
  • 小町守. ハッカーを育てる -- 人材育成のための大学の情報システム. CAUAシンポジウム2010in大阪 (パネリスト). 2010年12月
  • Mamoru Komachi. Graph-Theoretic Approaches to Minimally Supervised Natural Language Learning. Tsujii Laboratory, The University of Tokyo (invited talk). June 2010.
  • 小町守. 統計的機械翻訳勉強会 (講師). 2010年3月.
  • 小町守. スマートフォンにおける日本語入力の課題. Google TechTalk. 2010年3月.
  • 公野昇, 鬼塚真, 伊藤豪浩, 岡瑞起, 荒瀬由紀, 小町守. インターンシップと産学連携の可能性. WebDB Forum 2009 特別セッション (パネリスト). 2009年11月.
  • Mamoru Komachi. Graph-based Analysis of Semantic Drift in Espresso-style Bootstrapping Algorithms. Language Weaver (invited talk). August 2009.
  • 小町守. Gentoo Linux インストール大会. オープンソースカンファレンス2005 (講師). 2005.
  • 小町守. GentooJP 部会報告. ソフトウェア技術者協会(SEA) & フリーソフトウェアイニシアティブ(FSIJ) 合同セミナー 2004 (招待講演). 2004.
  • 小町守. OS Update. Internet Week 2003 (ライトニングトーク招待講演). 2003.

その他の情報

  • 語学:
    • 英語 TOEIC 960 点、TOEFL CBT 266点 (2005/09)、TOEFL iBT 98点 (2009/03)
      • シドニー大学に1年間留学、Microsoft Research に3ヶ月、Apple Inc. に3ヶ月留学していました。
    • 中国語
      • 中学3年生から高校3年生まで、 第二外国語として選択していました。
    • ドイツ語・フランス語
      • 大学で第二外国語として英語の代わりに履修していました。
  • プログラミング言語: Python, C++, C#, Perl, Bash
  • 開発プラットホーム: Linux (Ubuntu), Mac OS X, Windows