松本研究室の手引き

この文書は

NAIST の松本研究室(自然言語処理学講座)の修士1年生に、松本研で1年過ごすってどんな感じか伝える目的で書かれています。また、今後松本研に来ようと思っている学部生の参考になればとも思っています。

松本研の1年

NAIST に入学してから1年でどんなことがあるのか時系列で紹介します。

4月

4月頭に入学式があります。研究室配属希望が4月中旬にあるので、4月の第1週から第2週にかけては、引っ越しや授業に加えて研究室説明会にも忙しいと思います。松本研ではこの時期 M1 の人も入れた勉強会はありませんが、最初から松本研に来る気まんまんの人は話してみると M2 以上向けの勉強会に参加させてもらえるかもしれません。NAIST では授業の資料は端末から印刷したりしないといけないので、本配属が決まるまでは仮に配属された研究室でプリンタを使わせてもらったりします。

4月の第3週にめでたく配属先が決まると、その日に新入生ガイダンスと歓迎会があります。その週の研究会で夏休み前の勉強会の日程が決まるので、忙しい1年の始まりです。

例年ゴールデンウィークの前に松本先生宅でバーベキューをします。M1 の人は原則全員参加で、午後1時に集合して徒歩で松本先生のお宅にお邪魔して、午後7時くらいまで飲んだり食べたり遊んだりとわいわい親睦を深めます。

5月

連休の間には勉強会はなくなるので一息つけますが、計算理論 I という授業を履修している人は、連休の間の平日か連休明けに中間試験があるので、オートマトンとか正規表現とかを必死に勉強するはめになります。(情報系の学部の卒業者はそれほど苦労しないみたいですが、文科系出身者や情報系以外の出身者はがんばらないとついていけないようです)

5月も中旬になると M1 向けの勉強会、つまり

が本格的に始まるので、信じられないくらい忙しい時期の幕開けです。FSNLP 勉強会は、英語で自然言語処理に関する論文が読めるようになることを目的として輪読するので、自然言語処理の内容を理解することと、この分野の英文を読めるようになることの2つが大きな目標です。D-Math 勉強会は自然言語処理をするに当たって最低限必要な数学の基礎知識をつけることを目的とした勉強会で、こちらは NAIST の授業でも相当するものがありますが、授業では演習量が十分とは言い難いので、しっかり問題を解いて理解することが目標です。

5月の終わりから6月の初めにかけてが NAIST のI期の授業の境目なので、このあたり試験と課題の提出に忙しくなります。試験勉強に明け暮れて毎日午前2時とか3時とかまで研究室にいて、部屋に帰って寝ると試験の時間に起きられないからと研究室周辺で一夜を明かすようになるのもこのあたりです。単位を取るだけならそこまでがんばることもないと思いますが、いい成績が取りたかったらある程度は勉強しておいたほうがよいです。代々受け継がれている過去問セットも研究室の先輩や他の研究室の M1 が(その研究室の先輩からもらっていたりして)持っていることがあるので、手に入ったらながめるくらいはしておくとよいです。試験でいい点を取ることが勉強の目的ではありませんが、試験の問題も解けないくらいの理解度なら学んだとは言えないでしょうから、少なくとも試験問題が解ける程度には勉強しましょう ;-)

6月

II期の授業が始まります。特に情報系の学部出身者は一般科目と呼ばれる選択必修科目の単位を「アルゴリズム概論」「計算機構造概論」「システムプログラム概論」や「基礎数学」といった単位で履修することができないので、I期とII期とでひたすら「学際領域特論」という名前の授業を履修して6単位揃えておかないと、夏休み明け研究に入ったら授業を取るのがぐっと難しくなるので、夏前までに履修しておきましょう。

6月に入ると授業科目も新しくなり、だいぶ NAIST の生活に慣れてきます。同時に松本研では M1 の人たちに「研究会発表」が回ってくることになり、このときまでにだいたい所属するメイン勉強会と、修士の研究としてなにに取り組みたいか考えて発表することになっているので、みんな思い悩むようです。勉強会によっては研究会の発表練習をさせてくれるところもあるようですが、研究会発表自体も質疑応答込みで30分-1時間程度なので、徹夜でプレゼンテーションを作って発表、となることが多いみたいです。研究会発表もかなり大変ですが、FSNLP の担当と重なる(第2章から第4章あたり担当の人が危険)と泣けてくるほど忙しいです。注意しましょう。

7月

7月になるとだいたいメイン勉強会が決まってくるので、メイン勉強会で論文紹介もしくは研究進捗報告の担当のローテーションに組み込まれます。少なくとも一つ以上の勉強会をメイン勉強会としないといけないので、論文紹介ネタを探すのに研究室でうなることになります。紹介するからにはおもしろい論文を紹介したいわけですが、何本か読まないとそもそもおもしろいかどうか分からないのと、一つの論文を説明できるくらいに理解しようと思うと、そこから関連研究として参照されている論文も数本は読まないといけないので、初めての論文紹介は準備に20-40時間はかかると思っても過大評価していないでしょう。英語を読むのが苦手な人は全訳を作ってから理解するという手もあるようです。

いい論文のネタが思い浮かばない人は、スタッフの人やドクターの人に相談すると適切な論文や本を教えてくれます。ただしその場合でも準備には時間がかかるので、自分の担当する週の2週間以上前に相談しておくことをお薦めします。2つ以上の勉強会のローテーションにあえて自分から組み込まれる人もいますが、けっこうつらいのでお薦めはしません。ちなみに自分の経験(機械翻訳・意味談話解析・CJE でローテーションに入っていた)から言うと、3つ以上でもできるという自信があっても、せめて2つまでに止めておいた方がいいと忠告しておきます。

7月の中旬-下旬くらいには学内で TOEIC の試験(TOEIC-IP)があります。正式な TOEIC ではないので、公式なスコアとして使えないこともありますが、特に就職活動をする可能性がある人は自分の英語力を知るためにも受けておいた方がよいです。ちなみに松本研の人の TOEIC スコアはホワイトボードに一覧になって書いてあります。

8月

7月の終わりから8月の頭にかけてがII期の授業の期末なので、また試験と課題に追われる日々になります。特に学際領域特論の授業はだいたい課題提出が単位取得要件になっているので、情報系出身の人はたいへんみたいです。

8月に授業が終わった数日後から、松本研の夏の読書会が始まります。これは毎年1週間かけて言語学系の本と数学系の本を交代で読む勉強会で、ドクター・スタッフの人と修士の人が組になって準備します。真ん中くらいから後ろの章の担当だと土日を挟むので試験が終わったあとからでも準備できますが、前のほうの章を担当する人は、試験がある最中から準備しないといけないので注意しましょう。(その代わり第1章や第2章はイントロダクションになっていて内容的には簡単であることが多いです。後ろの章は発展的な内容の議論になっていて、理解するだけで泣きそうになります)

夏の読書会は前半が水木金、後半が月火のように分割されて、火曜日勉強会のあとにカレーを作ってみんなで食べるのが恒例になっていますが、いつもこの読書会に挟まれた土日のどちらかに SVM 合宿と呼ばれる機械学習系の勉強会が1日かけてあります。休み明け読書会担当になっている人は厳しいかもしれませんが、この勉強会は松本研 OB の人で研究者・技術者として一線で活躍している人たちが一堂に会する勉強会なので、ぜひ参加しましょう。

8月の残りは夏のプロジェクトの期間です。プロジェクト実習という授業を履修している人は、学内のものであれば1週間程度、実習先の研究室に出向いて実習することになります。学外のものであれば、インターン先に出向いて3日-1ヶ月程度実習します。インターンでは宿泊費や交通費は支給されるのが普通ですが、NTT のように日当(1日3000円)を出してくれるところもありますし、企業の研究所の雰囲気を知ったり、就職するつもりの人は企業の仕事を体験できたり仲間ができたりするので、特にこれがしたいということが決まっていない人は、ぜひ夏のインターンで学外のものに参加することを強くお薦めします。ちなみに自然言語処理関係のインターンは NTT や Google、東芝などがあります。

プロジェクト実習をやらない人は松本研でなにか夏の課題を設定してそれをやることになります。夏は冷房が利きすぎているので夏風邪を引かないよう注意しましょう。あと夏休み学外のインターンにも行かないで実家にも帰らないでいると精神的に病むので、学外のインターンに行かない人はお盆だけでも絶対実家に帰りましょう。

9月

9月は秋の合宿があります。夏のプロジェクトの成果報告会です。奈良近辺のホテルに1泊2日で出かけていって、1日目の午後から2日目の午前にかけて研究進捗報告をします。夜はテニスや温泉など思い思いに過ごします。ここで10月11月の研究の方向の洗い出しをするので、みんなから意見をもらえるようツッコミ甲斐があるような内容にしていくと喜ばれます。

9月末は M2 の人のゼミナール II 発表(修士論文中間発表)があります。ゼミナール II はかなりの数出席しないといけないのですが、9月の最終週は1週間毎日朝から夕方までゼミナール II があるので、出席回数を稼ぎたい人はここで一気に出ておくことをお薦めします。

10月

10月からIII期が始まります。研究室によっては(つまり松本研のように山ほど勉強会がないところは)II期までで単位を取り終わっている人が多いので、がくっと授業の出席人数が減ります。

10月末から12月頭にかけて、ゼミナール II という授業で他の研究室の人(主に M1)向けに修士論文として取り組みたいテーマについての発表を行うので、勉強ムードで来ていた人は心機一転して研究に頭を切り換える必要があります。研究室によっては論文紹介だけのところもあるようですが、松本研の M1 の人はほとんど研究発表を行います(論文紹介は夏休み前から勉強会で行っているので)。

ゼミナール II 発表の前の週くらいに研究会発表の時間を使って予行練習をします。研究に関するツッコミは研究会発表の時間に来るので、ある意味冷や汗をかくのは研究会発表の時間です。ゼミナール II の時間は研究の専門外の人にも伝わるように発表内容を噛み砕いて説明することが求められるので、内容的な問題点は研究会発表で洗い出してゼミナール II までに洗練する、という感じです。

11月

11月中旬くらいには自然言語処理を研究している大学院の合同研究会があります。NAIST と JAIST と東工大を順々に回っているので、他の大学の研究室の雰囲気を知ることができるいい機会です(交通費なども出ます)。ゼミナール II や研究会発表で忙しくなければ、特にドクターに進学する予定、もしくは進学する可能性がある人は行ってみることをお薦めします。

ゼミナール II が一段落すると、III期の授業を履修している人は課題や試験の提出があります。III期の授業は応用的な内容も多く、課題もなかなか時間がかかるものも多い(プログラムを書いたり)ので、授業をまだ残しているとかなりつらいものがあります。個人的にはこの時期が1年のうちで一番苦しかったです。

12月

IV期の授業が始まります。IV期の授業は取りたい人が取るような感じです。出席だけで成績がつくような感じなので、楽といえば楽です。言語処理学会の年次大会に投稿しようと思っている人は、そろそろ研究内容をまとめないといけないので、年末年始にかけて準備する感じです。

また2回目の TOEIC も12月に行われます。就職活動に TOEIC を使う人は、遅くとも1月くらいが申し込み〆切の TOEIC に申し込んで受ける必要がありますが、最後の模試くらいだと思って受けるといい準備になると思います。

1月

年明けごろに研究会発表がまた回ってきます。言語処理学会に行く人は言語処理学会の内容をまとめて発表練習を行うと同時に論文も書きます。4ページ程度なのであまり書くスペースがなく、削りに削ってまとめる感じになります。週末も研究室に泊まり込みで論文を書くようになるのですが、修論を書いている人もいるので生気が抜けた人の顔を見られるようになります。

2月

就職活動する人は学内での就職説明会が始まります。研究所でなく一般の企業を受ける人は SPI や GAB といった就職の筆記試験対策をしておきましょう。

3月

言語処理学会に論文を出した人は言語処理学会に行きます。就職希望の人は就職活動が忙しくなります。説明会と1次試験は大阪というところが多いですが、2次試験以降は東京だったりするので東京と奈良を往復する生活が始まります。

ドクター進学希望の人は、最初の学内選考が4月の頭にあるので、この段階で出せる人は博士課程の研究計画書を書いて用意することになります。(まだ研究計画が用意できない人は9月や翌年2月に受験することになります)

4月

M2 になりました。2年生として新入生を迎えましょう ;-)

内部進学でドクターを受験する人は4月の上旬に試験があります。年次大会で発表した人はそれに肉付けしてドクターでやりたいことをまとめましょう。ただ4月受験する人は短期修了する人がメインのようで、短期修了しない場合は9月入試を受ける方がよいのかもしれません。

5月

就職活動している人はそろそろ正念場です。6月まで入るとかなり苦しくなります。M2 の研究会発表は4月中か5月上旬か、いずれにせよ早めに終えておきましょう。

ドクター希望の人は日本学術振興会の特別研究員(通称学振)に応募してみましょう。倍率かなり厳しいので採用されるかは運のようなものがありますが、自分の研究を客観的に見て、研究室以外の人にもアピールするようにまとめるというのはかなりいい経験になります。自分も選には漏れましたがたいへん勉強になりました。

6月

就職活動も学振も一段落して、そろそろ修士論文をどのテーマで行くか考えるころです。タグ付けして解析を行うようなタスクの場合、夏前にデータを作成し始めないと修士論文には間に合わないかもしれないので、なるべくこの時期までに自分でタグ付けしてみて問題点を洗い出しておきましょう。

7月

以外と夏休みの読書会の予習が負担になりがちなので、少しずつやっておくと楽だと思います。なにか他にやることを見つけて出ないという強者もいますが、基本的に全員参加なので、M1 の人と分担して担当部分を理解しましょう。就職する人はたぶんまともに英語の長文をよ読む機会はこれが最後なのではないでしょうか……

8月

2回目の読書会が終わると、長い夏休みの始まりです。夏休みと言っても勉強会がなくなるだけで研究を進めておかないと秋以降つらいです。アドバイザーやドクターの人と話して方向性を見極めながら研究するといいでしょう。また、正月は修士論文で忙しくて帰省している場合でない可能性があるので、お盆に帰省しておくとよいです。ずっと奈良にいると精神的に病みます。

9月

M2 は松本研の合宿での発表は免除になりますが、その代わり9月末のゼミナール発表の練習が合宿前にあります。この段階ですでに修士論文はこれで書くというゴーサインが出ないといけないので、9月になってもまだ先が見えていない場合は少し焦るくらいでいいのかもしれません。ドクター入試受ける人は、入試の研究計画書とちょうど時期が被っているので、まとめて用意ができて楽です。ドクターで研究が花開いた人は、M1からM2の夏くらいまでは他の人の研究を手伝っていて、秋口から自分で取り組みたいテーマを見つけてそのままドクターではそれを3年やる、という感じの人がけっこういるので、ドクターに行くつもりの人は拙速にならずじっくり腰を据えて取り組めるテーマを見つけましょう。

10月

これといって特にイベントはありませんが、単位の確認だけはしっかりしておきましょう。特に忘れやすいのがゼミナールの単位です。ゼミナールIは数が少ないので、II期IV期で5回出ていないことが多いです。情報事務に行くと何回出席したか教えてくれるので、自分が要件を満たしているかどうか怪しい人は必ず確認しましょう。

また、ゼミナール以外の単位が足りていない人はIII期でコンプリートしておきましょう。IV期は出席重視の授業ばかりですし、修士論文書きながら出るのはものすごく苦しいです。(自分がそれやって泣きそうだった) 専門科目が足りていない人はいないでしょうが、特に情報系出身の人で一般科目が足りない人はがんばって埋めておいてください。

11月

修士論文のテーマを NL 研もしくは年次大会で発表しようという人はそろそろまとめに入る時期です。修士のうちに1回でも発表しておくのは(研究に進むにしろ就職するにしろ)とても勉強になります。機会があれば積極的に挑戦してみてください。M2 でドクター進学する人は合同研で発表が半ば義務なので、いずれにせよ研究を外部の人にも分かるようにまとめるつもりでがんばりましょう。

12月

師走に入るともう追い込みの季節です。松本研では12月最後の研究会が修士論文の目次発表と決まっています。クリスマスから正月明けまでは基本的に目次発表で突っ込まれたところの再実験なんかしないといけないので、けっこうシビアです。関連研究を調べたりするのは年内にやっておかないと年明けてからでは厳しいので、余裕のあるうちに書けるとこから書き始めておくのが吉です。

2月

2月頭に修士論文の提出〆切があります。年次大会に出す人は〆切がもろに被るので、かなりつらい1週間を覚悟してください。ただ、出したら出したでいい経験になるので、修士で自然言語処理は終わりという人も、ドクターに進学する人も、研究成果をまとめて発表しておくと一生の思い出になります。

2月中旬には副査の人も加えて修士論文の発表会があります。スライドを作成して練習して臨みましょう。

共同研究のアルバイトをしている人は年度末の報告書がこの時期なので、終わって一息つく間もなく報告書を書かないといけなかったりするので、あまり遊ぶ予定は入れておかない方が懸命です。

3月

3月上旬が修士論文再提出〆切です。言語処理学会年次大会で発表しない人はこれで本当におしまいです。修了式は毎年3月23日周辺のようです。引っ越しの準備に時間がかかるので、少しずつ準備しましょう。どうもお疲れさまでした :-)

松本研用語集

研究会
週に1回(水曜日)行われる研究室全体の研究発表。1回あたり2人から3人が研究の進捗報告やサーベイ発表などをする。就職活動などやむをえない事情がない限り基本的に研究室のメンバー全員が参加。入学したてだと勉強会と研究会の区別がつかない(名前がほとんど同じだし)が、勉強会とは別物なので注意。
勉強会
だいたい週に1回集まって論文紹介や研究報告などを行うワークグループ。松本研のメンバーは少なくとも1つの勉強会をメイン勉強会として、そこでは毎回出席して論文紹介または研究報告のローテーションに組み込まれなければならない。(逆に言うとメイン勉強会以外では興味のある回だけ聞きに行くだけでもよい)
1年生向けの勉強会
FSNLP (自然言語処理の基礎)勉強会と D-Math (離散数学)勉強会、そして D-Lec (ドクターレクチャー)のこと。FSNLP と D-Math は発表や演習問題の回答説明担当が回ってくる。D-Lec は聞きに行くだけでよいが、M1 は出ることを強く推奨されている。M1 の間は授業の他にこれらの勉強会があるためにたいへん忙しい。
オープンキャンパス
年2回開催される大学・研究室開放フェスティバル。1回は一般向けで1回は受験生向け。松本研で作っているツールのデモや受験相談が行われる。入学生にはオープンキャンパス参加者が意外と多い。
合同研
東工大・NAIST・JAIST が中心となって秋に開催される自然言語処理の合同研究会。ドクターの人が研究発表をする。行かない人も多い。
言語処理学会
毎年3月に行われる学会。日本で自然言語処理の研究をしている人が一堂に会するお祭り。発表する人は年明け1月は忙しい。
NL研
情報処理学会の研究会で、自然言語処理研究会のこと。2ヶ月に1回開かれていて、ドクターの人がよく研究発表に行く。

Mamoru Komachi <komachi--at--tmu.ac.jp>
Tokyo Metropolitan University