勉強会:読解支援
概要
前半:2015/04/21-2015/06/09
毎週担当を決め、言い換えや機械翻訳を含む読解支援に関する論文紹介を行います。
毎週火曜日13:00-14:30の90分間および毎週金曜日9:20-10:20の60分間です。
1人30分の持ち時間で、15分から25分でスライドを使って説明し、残り時間で質疑応答を行います。
後半:2015/06/12-2015/07/31
論文紹介と並行して、読解支援に関する研究の進捗報告を行います。
進捗報告
毎週火曜日12:50-14:30の100分間です。
1人25分の持ち時間で、進捗報告を行います。
前回までの概要、前回からの差分、次回までの予定を報告してください。
論文紹介
毎週金曜日9:00-10:20の80分間です。
1人20分の持ち時間で、10分から15分でスライド10枚を使って説明し、残り時間で質疑応答を行います。
夏休み:2015/08/08-2015/08/26
論文紹介と進捗報告を引き続き行います。
また、3日間で集中して「実践機械学習システム(code)」を用いてPythonで機械学習の実装を行います(9:00-18:00)。
論文紹介
火曜日の8:50-12:00(1限と2限)です。
1人45分の持ち時間で、7本の論文を紹介してください。
10分で紹介 × 2本
人工知能学会論文誌の論文(自然言語処理に関するもの)
情報処理学会論文誌の論文(自然言語処理に関するもの)
5分で紹介 × 5本
人工知能学会全国大会の論文(自然言語処理に関するもの)
英語の論文を少なくとも毎週1本(ロングでもショートでも良いです)は読んでください。
言い換えや読解支援に関する論文を少なくとも毎週1本は読んでください。
キーワードが決まっていれば、「site:http://www.anlp.jp/ キーワード」や「site:https://kaigi.org/jsai/ キーワード」で検索もできます。
進捗報告
火曜日の13:00-(3限-)です。
スライドを使ったこれまで通りの進捗報告の他、ポスターを使って発表練習もします。
来週までに読む予定の論文についても報告してください。
メンバー
RA
梶原
参加者
叶内
朝倉
小平
塩田
関沢
野口
スケジュール
2015/07/31(金)論文紹介:統計的機械翻訳によるテキスト平易化
2015/08/11(火)論文紹介・進捗報告
小平2:佐藤理史. 均衡コーパスを規範とするテキスト難易度判定. 情報処理学会論文誌, Vol.52, No.4, pp.1777-1789, 2011.
小平4:伊藤美咲姫, 佐藤理史, 駒谷和範. 難しい日本語文の自動検出のための基礎調査. 言語処理学会第19回年次大会発表論文集, pp.886-889, 2013.
塩田2:大和田裕亮, 水野淳太, 岡崎直観, 乾健太郎, 石塚満. 返信・非公式リツイートに基づくツイート空間の論述構造解析. 自然言語処理, Vol.20, No.3, pp.423-459. 2013.
塩田3:大野正樹, 村上明子, 日本アイ・ビー・エム株式会社 東京基礎研究所. Twitterからの同意・非同意表現抽出. 言語処理学会第18回年次大会発表論文集. pp.89-92. 2012.
塩田6:斉藤いつみ, 貞光九月, 浅野久子, 松尾義博. 崩れ表記語の生成確率を用いた表記正規化と形態素解析. 言語処理学会第21回年次大会発表論文集. pp.51-54. 2015.
塩田7:貞光九月, 齋藤邦子, 今村賢治, 松尾義博, 菊井玄一郎. トピック情報を用いたブートストラップ法に基づく語彙獲得. 自然言語処理, Vol.19, No.2, pp89-106. 2012.
関沢1:鈴木敏.辞書からの上位語情報抽出とオントロジー自動生成.自然言語処理 vol.16, No 1, pp.101-116, 2009.
関沢2:高山 泰博, 今村 誠, 鍜治 伸裕, 豊田 正史, 喜連川 優. Webマイニングにおける語義曖昧性解消のための擬似負例を用いた能動学習. 情報処理学会論文誌, vol 2, No 2, pp.1-9,2009.
関沢3:Wang Ling, Chris Dyer, Alan W Black, Isabel Trancoso.Two/Too Simple Adaptations of Word2Vec for Syntax Problems. NAACL2015, 1142, pp,1299-1304, 2015.
野口2:藤沼祥成, 横野光, 相澤彰子. Twitter 上の「おはよう」を例とした崩れた表記の検出と分析. 人工知能学会第27回全国大会発表論文集, 1F4-3, 2013.
野口3: 田村吉宏, 山内崇資, 林佑樹, 中野有紀子. Wikipedia 記事情報に基づく歴史学習問題の自動生成手法. 人工知能学会第28回全国大会発表論文集, 3D4-2, 2014.
野口4:岡崎直観, 石塚満. 言い換え可能な括弧表現の抽出法. 言語処理学会第13回年次大会 (NLP2007), pp. 911—914, 龍谷大学瀬田学舎(京都), 2007.
2015/08/18(火)論文紹介・進捗報告
小平3:松井 都志子 馬場 雪乃 神嶌 敏弘 鹿島 久嗣, クラウドソーシングによって得られた順序データの統合, 人工知能学会第27回全国大会発表論文集, 2M4-OS-07a-4, 2013.
小平4:石川真太郎 佐久間淳, クラウドソーシングを用いた順序統合, 人工知能学会第27回全国大会発表論文集, 2M4-OS-07a-5, 2013
小平5:Pulkit Kathuria 白井 清昭, パラレルコーパスから自動獲得した用例に基づく語義曖昧性解消, 情報処理学会研究報告, NL-207, 2012
小平6:泉 朋子, 柴田 知秀, 齋藤 邦子, 松尾 義博, 黒橋 禎夫, 複数の言語的特徴を用いた日本語述部の同義判定, 自然言語処理 2013, Vol. 20, No. 4, pp.539-561
塩田1:酒井浩之, 梅村祥之, 増山繁, 交通事故例に含まれる事故原因表現の新聞記事からの抽出, 言語処理学会, Vol13, No.2, p99-123, 2006
塩田2:
塩田3:
塩田4:
塩田5:
塩田6:
関沢1:永田亮,河合綾子,須田幸次,掛川淳一,森広浩一郎,作文履歴をトレース可能な子供コーパスの構築,自然言語処理Vol.17,No.2,pp.51-65,2010
関沢2:柴田知秀,姜ナウン,黒橋禎夫,同一文抽出に基づく類似ページの検出と分類,人工知能学会論文誌,Vol.25,No.1,pp,224-232,2010
関沢6:栗原健,松本和幸,土屋誠司,任福継,意味素に基づく隠喩の名詞句“AのB”の意味解析,情報処理学会研究報告自然言語処理Vol.195,No.1,pp,1-6,2010
関沢7:石川大介,関洋平,栗山和子,神門典子,Q&Aサイトにおける ベストアンサー推定可能性の検証,情報処理学会研究報告自然言語処理,Vol.195,No.8,pp.1-7,2010
野口1:
野口2:
野口3:
野口4:
野口5:
野口6:
野口7:
2015/08/21(金)実践機械学習システム2
5章:クラス分類:悪い回答を判別する(塩田)
6章:クラス分類2:感情分析(野口)
7章:回帰:レコメンド(関沢)
8章:回帰:レコメンドの改良(小平)
2015/08/25(火)論文紹介・進捗報告
小平1:
小平2:
小平3:
小平4:
小平5:
小平6:
小平7:
塩田1:
塩田2:
塩田3:
塩田4:
塩田5:
塩田6:
関沢1:
関沢2:
関沢3:
関沢4:
関沢5:
関沢6:
関沢7:
野口1:
野口2:
野口3:
野口4:
野口5:
野口6:
野口7:
2015/08/26(水)実践機械学習システム3
9章:クラス分類3:音楽ジャンル分類(塩田)
10章:コンピュータビジョン:パターン認識(関沢)
11章:次元削減(野口)
12章:ビッグデータ(小平)
2015/09/01(火)論文紹介・進捗報告
小平1:
小平2:
小平3:
小平4:
小平5:
小平6:
小平7:
塩田1:
塩田2:
塩田3:
塩田4:
塩田5:
塩田6:
塩田7:
関沢1:
関沢2:
関沢3:
関沢4:
関沢5:
関沢6:
関沢7:
野口1:
野口2:
野口3:
野口4:
野口5:
野口6:
野口7:
過去ログ
2015/04/14(火)キックオフ
論文の割り当て
関連する研究分野の説明
2015/04/21(火)論文紹介
2015/04/24(金)論文紹介
2015/04/28(火)論文紹介
2015/05/01(金)論文紹介
野口:藤田篤, 柴田知秀, 松吉俊, 渡邉陽太郎, 梶原智之. 言い換え認識技術の評価に適した言い換えコーパスの構築指針. 言語処理学会第21回年次大会ワークショップ『自然言語処理におけるエラー分析』発表論文集, ID:20, 11 pages (e-pub only), 2015.
朝倉:後藤功雄, 熊野正, 田中英輝. 一般のニュースからやさしい日本語ニュースへの書き換えの分析. 言語処理学会第20回年次大会発表論文集, pp.15-18, 2014.
関沢:後藤功雄, 熊野正, 田中英輝. やさしい表現へのニュースの自動変換評価用データセットの構築. 言語処理学会第21回年次大会発表論文集, pp.151-154, 2015.
2015/05/12(火)論文紹介
2015/05/15(金)論文紹介
2015/05/19(火)論文紹介
小平:平原一帆, 難波英嗣, 竹澤寿幸, 奥村学. 言い換えを用いたテキスト要約の自動評価. 情報処理学会論文誌(TOD), 3(2), pp.91-101, 2010.
塩田:荒牧英治, 増川佐知子, 宮部真衣, 森田瑞樹, 保田祥. 頻出語ではなく使用者が多い語が自然な日本語である. 言語処理学会第19回年次大会発表論文集, pp.544–547, 2013.
梶原:William Coster, David Kauchak. Simple wikipedia: A new simplification task. In Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, pp.665–669, 2011.
2015/05/22(金)論文紹介
朝倉:天野成昭, 近藤公久. NTTデータベースシリーズ「日本語の語彙特性」について. 音声研究, 4(2), pp.44–50, 2000.
関沢:松吉俊, 佐藤理史. 文体と難易度を制御可能な日本語機能表現の言い換え. 自然言語処理, 15(2), pp.75-99, 2008.
梶原:Lucia Specia, Sujay Kumar Jauhar, Rada Mihalcea. SemEval-2012 Task 1: English Lexical Simplification. In Proceedings of the 6th International Workshop on Semantic Evaluation (SemEval-2012), pp.347-355, 2012.
2015/05/26(火)論文紹介
小平:David Kauchak. Improving text simplification language modeling using unsimplified text data. In Proceedings of the 51st Annual Meeting of the Association for Computational Linguistics, pp.1537–1546, 2013.
塩田:Dan Feblowitz, David Kauchak. Sentence simplification as tree transduction. In Proceedings of the Second Workshop on Predicting and Improving Text Readability for Target Reader Populations, pp.1–10, 2013.
野口:Colby Horn, Cathryn Manduca, David Kauchak. Learning lexical simplifier using wikipedia. In Proceedings of the 52nd Annual Meeting of the Association for Computational Linguistics, pp.458–463, 2014.
2015/06/02(火)研究テーマ決め + 課題提出
いくつかの研究テーマを紹介しますので、その中から選んでください。
課題:はじめに自分が読んだ論文の手法をPythonで実装して来てください。
2015/06/05(金)論文紹介
関沢:Yuval Marton, Chris Callison-Burch, Philip Resnik. Improved statistical machine translation using monolingually-derived paraphrases. In Proceedings of the 2009 Conference on Empirical Methods in Natural Language Processing, pp.381–390, 2009.
野口:Wei He, Hua Wu, Haifeng Wang, Ting Liu. Improve smt quality with automatically extracted paraphrase rules. In Proceedings of the 50th Annual Meeting of the Association for Computational Linguistics, pp.979–987, 2012.
2015/06/09(火)論文紹介
2015/06/12(金)論文紹介:サーベイ1
2015/06/16(火)進捗報告
小平、塩田、関沢、野口
2015/06/19(金)論文紹介:サーベイ2
小平:Jan De Belder, Marie-Francine Moens. A Dataset for the Evaluation of Lexical Simplification. In Proceedings of the 13th International Conference on Computational Linguistics and Intelligent Text Processing, pp.426-437, 2012.
塩田:荒牧英治, 増川佐知子, 森田瑞樹, 保田祥. 日本人のオンライン・コミュニケーション上での平均使用語彙数は8,000語である. 情報処理学会第208回自然言語処理研究会, NL-208, 2012.
関沢:吉井和輝, Eric Nichols, 中野幹生, 青野雅樹. 日本語単語ベクトルの構築とその評価. 情報処理学会第221回自然言語処理研究会, NL-221, 2015.
2015/06/23(火)進捗報告(小町先生)
小平、塩田、関沢、野口
2015/06/26(金)論文紹介:サーベイ3
塩田:梶原智之, 山本和英. 高頻度語は平易語なのか?. NLP若手の会第9回シンポジウム, 発表P02. September 2014.
2015/06/30(火)進捗報告
小平、塩田、関沢、野口
2015/07/03(金)論文紹介:サーベイ4
小平:Sujay Kumar Jauhar, Lucia Specia. UOW-SHEF: SimpLex – Lexical Simplicity Ranking based on Contextual and Psycholinguistic Features. In Proceedings of the 6th International Workshop on Semantic Evaluation, pp.477-481, 2012.
関沢:Tomas Mikolov, Ilya Sutskever, Kai Chen, Greg Corrado, Jeffrey Dean. Distributed Representations of Words and Phrases and their Compositionality. In Advances on Neural Information Processing Systems, 2013.
野口:Kentaro Inui, Atsushi Fujita, Tetsuro Takahashi, Ryu Iida, Tomoya Iwakura. Text Simplification for Reading Assistance: A Project Note. In Proceedings of the 2nd International Workshop on Paraphrasing: Paraphrase Acquisition and Applications, pp.9-16, 2003.
2015/07/07(火)進捗報告(小町先生)
小平、塩田、関沢、野口
2015/07/13(月)論文紹介:テキスト平易化に関するサーベイ論文
野口:2.D. Statistical Machine Translation, 2.E. Non-English Approaches, 3. Research Challenges, 4. Conclusion
塩田:Rada Mihalcea, Ravi Sinha, Diana McCarthy. SemEval-2010 Task 2: Cross-Lingual Lexical Substitution. In Proceedings of the 5th International Workshop on Semantic Evaluations, pp.9-14, 2010.
関沢:Quoc Le and Tomas Mikolov. Distributed Representations of Sentences and Documents. In Proceedings of the 31st International Conference on Machine Learning, 2014.
2015/07/14(火)進捗報告
小平、塩田、関沢、野口
2015/07/17(金)論文紹介:機械翻訳の自動評価
2015/07/17(金)論文紹介:機械翻訳の自動評価
2015/07/24(金)論文紹介:語彙の平易化、構文の平易化
2015/08/03(月)進捗報告(小町先生)
小平、塩田、関沢、野口
2015/08/08(土)実践機械学習システム1
1章:Pythonではじめる機械学習(野口)
2章:実例を対象とした分類法入門(塩田)
3章:クラスタリング:関連のある文書を見つける(関沢)
4章:トピックモデル(小平)
2015/08/11(火)論文紹介・進捗報告
小平3:小島健輔, 佐藤理史, 藤田篤. 文字bigramモデルを用いた日本語テキストの難易度推定. 言語処理学会第15回年次大会発表論文集, pp.897-900, 2009.
塩田4:井手厚, 東藍, 松本裕治. Webフィルタリング処理時における表記ゆれの動的解決. 情報処理学会研究報告, NL-196(7), 2010.
塩田5:菊井玄一郎, なにをつぶやいているのか?: マイクロブログの機能的分類の試み. 言語処理学会第18回年次大会発表論文集. pp.759-762. 2012.
関沢4:風間淳一, Stijn De Saeger, 鳥澤健太郎, 村田真樹.係り受けの確率的クラスタリングを用いた大規模類似語リストの作成.言語処理学会第15回年次大会発表論文集, pp.84-87, 2009
関沢5:木俵豊, 赤峯享, 河原大輔, 加藤義清, 中川哲治, 黒橋禎夫, 中澤聡, 乾健太郎, 森辰則.Webコンテンツの信頼性分析.言語処理学会第15回年次大会発表論文集, pp.308-311, 2009
関沢6:塚原裕常, 宮崎林太郎, 西村純, 前田直人, 森辰則, 小林寛之, 石川雄介, 田中裕也, 翁松齢. ネットオークションの出品情報文書からの2段階属性抽出.言語処理学会第15回年次大会発表論文集, pp.400-403, 2009
関沢7:橋本力, 河原大輔, 黒橋禎夫, 新里圭司, 永田昌明. 構文・照応・評判情報つきブログコーパスの構築. 言語処理学会第15回年次大会発表論文集, pp.614-617, 2009