研究の進め方

研究の進め方

研究のサイクルについて説明します。

研究は基本的に

    1. 国内研究会・全国大会発表 (査読なし)

    2. 国際会議発表 (査読あり)

    3. 論文誌発表 (査読あり)

が1セットです。修士論文に相当する研究で1セット回すのが標準的です。自然言語処理分野で1に当たるのは

    • 言語処理学会年次大会 (毎年3月開催、原稿1-2月〆切)

    • 情報処理学会自然言語処理研究会 (毎年5月・7月・9月・11月・1月開催、原稿それぞれの開催日の1ヶ月前〆切)

が代表的なところです。国内の研究会や全国大会は、学外の人からのコメントがもらえる貴重な機会なので、興味を持ってもらえるように準備しましょう。また、ここでちゃんと日本語の原稿を用意しておくと、英語論文を書くときのベースができているので、かなり書きやすくなります (英語で文章を書くことが苦痛ではない人でないかぎり、ほとんどの場合は日本語を最初に書いて英訳するほうが最初のうちは楽です)。

どの国際会議に投稿するかは研究内容やタイミングにもよりますが、だいたい自然言語処理の国際会議は1-3月が投稿シーズンで、4-6月が落ち穂拾い的な国際会議の投稿シーズンなので、春から夏にかけてサーベイ・夏から秋にかけて実装と評価・秋から冬にかけて論文執筆・冬から春にかけて投稿、というようなスケジュールで回ることが多いです。

国際会議に投稿した論文は2-3人の査読者によって、論文の明瞭性、実験の再現性など何項目にも渡って通信簿のように5段階評価され、コメントとともに返却されます。採択である場合は発表までに最終稿を投稿します。不採択である場合はコメントに従って書き直し、他の国際会議に投稿します。論文が採択されるまで、このプロセスを何回も繰り返します。

めでたく国際会議に採択された場合、査読でもらったコメントと会議でもらったコメントをもとに、学会の論文誌に投稿します。自分の場合、以下のようなところに投稿することが多いです。

    • 情報処理学会論文誌

    • 人工知能学会論文誌

    • 自然言語処理 (言語処理学会の論文誌)

投稿してからだいたい2ヶ月〜1年程度で査読結果が返却されるので、「照会」あるいは「条件付き採録」であった場合、コメントに従って論文を修正して再度提出します。「採録」であった場合はよいのですが、「不採録」であった場合、コメントに従って大幅に書き換えて再投稿するか、あるいは他の学会の論文誌に投稿します。基本的に一発で「採録」になることはほとんどないので、最低1往復はする、というところが国際会議との違いです。

論文の書き方

スケジュール

全ての研究がこのようにスムーズに行く訳ではないですが、大体の感じを示します。典型例として、内部進学で修士まで行く場合(高専からの編入含)と、外部進学で博士まで行く場合を挙げます。

B4で進学する場合

B4 4〜7月

研究室配属され、研究生活のスタートです。夏までは自然言語処理やプログラミング、機械学習の基礎を学びます。平日はほぼ毎日夕方の時間(16〜19時)に基礎勉強会が入ります。基礎勉強会は全て課題が出るので、毎日3〜6時間程度課題をやります。4月から毎月2倍ずつ忙しくなると考えてもらえればよいです。

5月の下旬から、研究室内の研究タスクの一部に参加してもらいます。研究テーマを人数分用意しますので、研究テーマのマッチングを行った上で、1人に1人大学院生のメンターをつけて、夏休みにやる内容の準備をします。毎週 B4 全員での進捗報告を行います。タスクによってはタスクに関する基礎勉強が必要で、いくつか追加で出席する勉強会が増えることがあります。

B4 8〜9月

8月末〜9月中旬に開催されるYANS(自然言語処理の若手の会のシンポジウム)に向けて、実験・ポスター作成を行います。YANS まではお盆の週を除き毎週進捗報告があり、基礎勉強会がないぶんフルスロットルでがっつり研究します。

YANS が終わったあとの数週間は小休止です。しばらく研究をお休みしてリフレッシュしたい人は、この期間に休んでください。9月に合宿をしたりすることがあります。

B4 10〜11月

特別研究の研究テーマを決め、実験を行います。9月まで行っていた内容でもかまいませんし、新しい内容でもかまいません。特に研究室でこの研究をやってほしい、ということはありませんので、好きな研究をしてください。(最初にアサインする研究テーマは、どれもやってみたらそれなりにおもしろい研究テーマのつもりですが、研究は常に成功するものではないので、いろいろやってみたけど期待通りの結果にならないので止むを得ず変更する、という可能性も考えられます)

B4 12〜1月

情報処理学会自然言語処理研究会(NL研)または言語処理学会年次大会に投稿する原稿を書きます。2014年度、2015年度ともに、B4全員が卒業前に発表しました。2016年度は5人中3人が卒業前、1人が卒業後に発表しました。NL 研および年次大会は発表とともに原稿が公開されますが、いずれにおいても発表をしない人は、研究室サイトで卒論を公開してもらいます。

また、研究内容を学内の特別研究発表会に向けてスライドとポスターにまとめます。首都大の情報通信システムコースの特別研究発表会の予稿は2カラムで4ページです。

B4 2〜3月

実験結果が良好な場合、国際会議に投稿します。2014年度以降毎年、国際会議に投稿する学生がいます(毎年2名程度)。投稿先はだいたい ACL(自然言語処理のトップカンファレンス)のショートペーパー(4ページ)か ACL Student Research Workshop(同5ページ)です。まずショートペーパーに投稿し、不採択でも(コメントを受けて1ページ程度追記し)ACL SRW に投稿する、という形をお勧めしています。フルペーパーに投稿して採択された学部生もいるので、挑戦したい人は挑戦しましょう。

また、言語処理学会年次大会に投稿した人は、学会で発表します。発表形式は口頭あるいはポスターですが、最近はポスターを選択する学生が多いです。年次大会に連動して YANS の懇親会が開かれますので、夏の YANS の参加で知り合った学外の人たちと懇親を深めましょう。

M1 の夏にインターンシップに行きたい人は、このあたりの期間に調整を行います。研究所でのインターンシップであれば、研究室における活動実績(基礎勉強会の達成率と理解度、YANS と言語処理学会年次大会で発表した研究の取り組み方とクオリティ)に基づき研究室から推薦します(毎年2-3名)。

M1 4〜7月

新たに研究テーマをサーベイします。サーベイの分量は、自然言語処理や機械学習のトップカンファレンスの論文を中心に、3か月で100本(1週間で10本弱=1日2本程度)を目安としています。サーベイとは、タイトルとアブストラクトをざっと読み、おもしろそうだと思ったら中も読む、という程度の「斜め読み」のことを言います。7月末〜8月頭にサーベイした論文のリスト(著者名、タイトル、発表場所、発表年が最低限必要な情報)を提出してもらいます。

授業に参加する他、研究室内の基礎勉強会の TA を分担してもらいます。基礎勉強会に参加していたときは「写経」のようなつもりになっていたことでも、教える側になってようやく「こういうことだったのか」と理解できることが多いので、TA をすることで研究室の基礎勉強会の完成です。

また、人によっては B4 の特別研究のメンターになってもらったり、共同研究に参加してもらったりします。こちらも研究能力が向上しますので、自分の研究との両立は大変でしょうが、当たった人は頑張ってください。

M1 8〜11月

インターンシップに行く人が多いですが、行かない人は夏休み期間も週1回の進捗報告でフォローアップし、修士論文のコアとなる部分の実装・実験を行ないます。インターンシップに行く人も、10月までには修士論文で取り組むタスクを決定し、実験をスタートしましょう。

M1 12〜3月

実験結果が良好であれば、言語処理学会年次大会に投稿し、国際会議の原稿を執筆します。ACL/NAACL/EMNLP といったトップ国際会議はショートペーパーでかまわないので、積極的に投稿してください(ただし、博士後期課程に進学希望でない修士の学生には Student Research Workshop への投稿は認めていません)。

この時期の研究は就職活動と並行するので、スケジューリングが若干悩ましいかもしれません。

M2 4〜7月

実験結果が良好でなければ、3月の言語処理学会は見送り、5月、7月、9月の NL 研や夏の WebDB Forum 等で発表しましょう。3月の言語処理学会で発表しない人は、春休み期間も週1回の進捗報告でフォローアップします。トップカンファレンス以外の国際会議(COLING/IJCNLP 含む)や国際ワークショップはフルペーパーでの投稿を原則とするので、言語処理学会の原稿と比べて長く書ける NL 研や WebDB Forum を活用してください。

TA の2周目に加えて、B4 のメンターや共同研究の主力メンバーとしての参加をお願いします。

M2 8〜11月

国際会議で発表した人は、論文誌に投稿して査読者とやりとりを1-2往復します。国際会議論文は短距離走だとすると、論文誌は長距離走で、アイデア一発ではなくしっかり実験的な裏付けを求められるので、心が折れそうになるときもありますが、最後までがんばりましょう(ちなみにうちの大学院だと、論文誌の採録実績があれば日本学生支援機構の奨学金の返還免除にほぼ通ります)。

8-9月には修士論文の中間発表会(ポスター)があります。それまでに学会発表を経験しているので戸惑うことはないでしょうが、いくつか研究テーマを手がけてきた人は、修士論文をどのテーマで書くのかの見極めをしてください。

M2 12〜3月

まだどの国際会議にも投稿していない場合、投稿のラストチャンスです。研究室では原則として査読付き国際会議への投稿を修士の学位申請書の提出要件としています(採択は要件としていません)。学位申請書の提出は1月頭で、12月までに投稿できない場合は卒業時期を遅らせることになりますので、ご注意ください。

すでに国際会議で発表済みの人は、年内に論文誌に投稿してください。投稿後に査読が返って来る時間(1ヶ月半〜)を考えると、年明けの投稿だとやりとりが就職後にかかってしまうためです。

修士論文を執筆し、発表会を終えたら一区切りです。どうもお疲れさまでした。

対外発表にかかる研究で作成したプログラムやデータは (README など必要なマニュアルや仕様書をつけて) 保存することが義務付けられています。研究室では GitHub での公開を奨励しているので、公開可能なデータやプログラムは公開しましょう。

M1で入学する場合

M1 4〜7月

新しい研究室での研究生活のスタートです。夏までは自然言語処理やプログラミングの基礎を学びます。言語処理を学んだことのある人は、復習だと思って聞いてください。内部進学の学生と異なり、TAはありませんが、授業と基礎勉強会の両方に出席するのでかなり忙しいです。大学院の専門科目は隔年開講なので、M1とM2では開講される科目が全て異なります。もし取りたい科目があれば2年生で取ってもいいかもしれません。

6月ごろからサーベイを開始します。少しずつ自然言語処理の知識がついてきて、どんな研究がおもしろいか、ということが分かってきますので、どのような研究をしたいのか、考えてみてください。

M1 8〜9月

一つ研究テーマを決め、実装と評価を開始します。夏の YANS(若手の会シンポジウム)は聴講参加してもらっています(発表できる内容がある人は、発表を奨励しますが、発表なしでも研究室から旅費を出しています)。外部の人と交流することで色々な刺激をもらえますので、積極的に参加しましょう。

博士後期課程に進学希望の人がインターンシップに行くのはあまりお勧めしません。行きたい場合、M2 になってから、あるいは D に進学してから行った方がいいです。まずは、M1の3月の言語処理学会年次大会で発表する(そしてそれを国際会議に投稿する)ことを目指して研究を進めた方がよい(そこで研究に向いていないと思ったら、就職に方向転換できる)です。

M1 10〜3月

ひたすら実験・評価・執筆し、3月開催の言語処理学会年次大会あるいは5月/7月開催の NL 研に投稿します。研究会・年次大会の発表(スライドあるいはポスター)を準備しながら、結果が良好であれば国際会議に投稿します。

修士論文の研究テーマを変えたい人は、対外発表を1回するところまでを一区切りとして、対外発表をしたら変更してかまいません。対外発表する前に変更すると、修士の修了が困難になる可能性があるためです(本学域では、修士論文の学位申請の前までに対外発表を1回することが、申請の要件となっています)。

M2 4〜8月

結果が良好であれば国際会議に投稿します。博士後期課程に進学する人は、日本学術振興会特別研究員(いわゆる学振)に申請しましょう(学内締め切りは5月なので、4月頭には1stドラフトを書く)。首都大では、学振に不採用でも、毎年学振に申請することを条件に、(学振に採択されるまで)月15万円を支給する奨学金があります。

M2 9〜12月

9月上旬に修士論文の中間発表会があります。それ以降は、コメントを踏まえてさらに実験を行います(あるいは、4月に研究テーマを変更した人は、結果が良好でなければ3月までの研究テーマに戻ることも検討します)。11月末に修士論文の目次〆切(タイトル提出)、12月下旬に修士論文の1stドラフトの〆切があります。

M2 1〜3月

修士論文を提出し、発表を行います。また、言語処理学会年次大会・国際会議でも発表しましょう。博士後期課程に進学する場合、論文誌へも投稿しましょう。

博士後期課程

博士に進学する人は博士後期課程の3年間でこのサイクルを1.5-3回転します(同時に複数のサイクルが走ることもあります)。3年間で1.5サイクル(5年間で修士と合わせて2サイクル)回せれば博士号が取得でき、恐らく普通に企業に就職できます。3年間で2〜2.5サイクル(5年間で3サイクル)回せれば大学で助教の仕事・企業の研究所で研究員の仕事が見つかるでしょう。3年間で3サイクル以上回せる人は、研究者としてもエンジニアとしても超人です。

本研究室は大学院から進学する学生は原則として博士後期課程に進学希望の人しか受験を認めていませんが、博士前期課程を修了したあと社会人博士として進学する(進学したい)人も歓迎しています。その場合、長期履修制度を活用することができますが、仕事をしながら3年間で博士号を取得することは困難だと思われるので、気長に研究をしましょう。