[日本語 / English]

早稲田大学 基幹理工学部 情報通信学科
河原研究室

About

人間と同程度に言語を理解することのできる人工知能システムについて研究しています。
特に、計算機科学と言語学の知見・技術を融合することによって、世界知識の獲得・利活用、テキストの解析・理解の研究に取り組んでいます。さらに、人が言語を理解する機構の解明、あるいは、そのような機構を組み込んだシステムの研究を進めています。

News

2022/9/24: 夏ゼミ合宿 実施
9/22-24に軽井沢セミナーハウスにて夏ゼミ合宿を実施しました。
    2022/6/23: NAACL 2022 Student Research Workshop (SRW) 発表
    7/10-15に開催されるNAACL 2022 SRWで以下の研究発表をします。
    • Ryoma Sakaeda and Daisuke Kawahara. Generate, Evaluate, and Select: A Dialogue System with a Response Evaluator for Diversity-Aware Response Generation.
    • Ritvik Choudhary and Daisuke Kawahara. Grounding in Social Media: An Approach to Building a Chit-chat Dialogue Model.
    • Tomohito Kasahara, Daisuke Kawahara, Nguyen Tung, Shengzhe Li, Kenta Shinzato, and Toshinori Sato. Building a Personalized Dialogue System with Prompt-Tuning.
    2022/4/24: ACL 2022 Student Research Workshop (SRW) 発表
    5/22-27に開催されるACL 2022 SRWで以下の研究発表をします。
    • Tatsuya Ide and Daisuke Kawahara. Building a Dialogue Corpus Annotated with Expressed and Experienced Emotions.
    2022/4/11: LREC 2022 発表
    6/21-25に開催されるLREC 2022で以下の研究発表をします。
    • Kentaro Kurihara, Daisuke Kawahara, and Tomohide Shibata. JGLUE: Japanese General Language Understanding Evaluation.
    2022/4/1: 新メンバー配属
    6名の学部生が新たに配属されました。
    2022/3/17:言語処理学会第28回年次大会(NLP2022) 言語資源賞受賞
    M1の栗原健太郎さんが「JGLUE: 日本語言語理解ベンチマーク」で言語資源賞を受賞しました。日本語の言語理解のための標準的なベンチマークとして利用され,研究分野全体の発展に貢献することが期待されます。
    【栗原】日本の資源不足の危機を救いました。
    2022/3/13:言語処理学会第28回年次大会(NLP2022) 発表
    3/14-18に開催されるNLP2022で以下の研究発表をします。
    • 笠原智仁, 河原大輔. Prompt-Tuningによる個性を持った対話システムの構築.
    • 榮田亮真, 河原大輔. 応答の生成・評価・選択による対話システム.
    • 井手竜也, 河原大輔. 表出感情と経験感情をタグ付けした対話コーパスの構築.
    • Ritvik Choudhary, 河原大輔. ソーシャルメディア上のインタラクションを利用したオープンドメイン対話応答生成.
    • 吉田あいり, 河原大輔. 構造的曖昧性に基づく読みづらさの検出.
    • 栗原健太郎, 河原大輔, 柴田知秀. JGLUE: 日本語言語理解ベンチマーク.
    2022/2/14: オープンラボ2022の開催
    3月22日(火)〜24(木)にハイブリッド(予定)でオープンラボを行います。河原研究室への配属を希望する方は是非参加してください。ここから予約をお願いします。
    2021/12/29: GPT-2日本語Pretrainedモデル公開
    形態素解析した日本語WikipediaだけでGPT-2をpretrainingした以下のモデルをHuggingface Modelsに公開しました。
    2021/12/22: RoBERTa日本語Pretrainedモデル公開
    形態素解析した日本語テキストでRoBERTaをpretrainingした以下のモデルをHuggingface Modelsに公開しました。
    2021/8/25: NLP若手の会(YANS)第16回シンポジウム 発表
    8/30-31に開催されるYANS第16回シンポジウムで以下の研究発表をします。
    • 栗原健太郎, 河原大輔, 柴田知秀. 日本語版GLUE構築に向けて.
    • 榮田亮真, 河原大輔. 応答の自動評価モデルとそれを利用した対話システム.
    2021/8/3: LINE株式会社と共同研究開始
    LINE株式会社と共同研究「超大規模日本語言語モデルを用いた対話システムの研究」を開始しました。超大規模日本語言語モデルの効果的な利用方法、評価方法などについて研究を進めます。
    2021/7/15: ヤフー株式会社と共同研究開始
    ヤフー株式会社と共同研究「自然言語処理における日本語評価セットの構築」を開始しました。日本語版言語理解ベンチマークを構築し、公開する予定です。
    2021/4/1: 新メンバー配属
    7名の学部生が新たに配属されました。
    2021/3/27: NAACL-HLT 2021 Student Research Workshop (SRW) 発表
    6/6-11に開催されるNAACL-HLT 2021 SRWで以下の研究発表をします。
    • Tatsuya Ide and Daisuke Kawahara. Multi-Task Learning of Generation and Classification for Emotion-Aware Dialogue Response Generation.
    2021/3/16: 言語処理学会第27回年次大会(NLP2021) 発表
    3/15-19に開催されるNLP2021で以下の研究発表をします。
    • 井手竜也, 河原大輔. 生成と分類のマルチタスク学習による感情が考慮された対話応答生成.
    • 榮田亮真, 河原大輔. 逆翻訳とフィルタリングによる擬似対話コーパスの生成とそれを用いた対話システムの学習.
    • 栗原健太郎, 河原大輔. ファクトチェック支援のための含意関係認識システム.
    • 小原京子, 河原大輔, 笹野遼平, 関根聡. 集合知を用いた大規模意味的フレーム知識の構築.
    • 田中佑, 村脇有吾, 河原大輔, 黒橋禎夫. 日本語Wikipediaの編集履歴に基づく入力誤りデータセットと訂正システムの改良.
    2021/1/15: 2021年度研究室配属個別面談の開催
    3月22日(月)、23(火)に、河原研究室への配属についての個別面談をオンラインで行います。ここから予約してください。質問があれば、河原にメールしてください。
    2020/7/15: COVID-19世界情報集約サイト
    国内の大学・研究機関の情報系研究室とのコラボレーションによって、COVID-19に関する世界の情報を集約するサイトを構築し、公開しています。
    2020/4/1: 研究室活動開始
    配属が決定した学部生のみなさんにはメールしたとおり、4月1日(水)にオンライン・オフライン併用で最初のミーティングを行います。
    2020/3/14: 研究室配属個別面談の開催
    3月20日(金)、23(月)に、河原研究室への配属についての個別面談を行います。ここから予約してください。場所は55号館N棟9階マルチメディア室です。質問があれば、河原にメールしてください。

    Members

    教授

    修士2年

    井手 竜也

    栗原 健太郎

    榮田 亮真

    吉田 あいり

    Rachel Ung

    Ritvik Choudhary

    修士1年

    伊藤 俊太朗

    今井 咲良

    太田 聖三郎

    笠原 智仁

    清水 博文

    学部4年

    植松 拓也

    小林 俊介

    近藤 瑞希

    田村 稔行

    堀尾 海斗

    村田 栄樹

    Research

    言語理解に関する基礎研究

    タグ付きコーパスの構築
    形態素、構文(係り受け)、述語項構造、共参照、固有表現等のアノテーション付きコーパスを構築し、公開しています。
    言語解析器の開発
    形態素解析器、構文解析器、述語項構造解析器、照応解析器を開発し、公開しています。 また、入力誤り(タイポ)訂正のデータセットを構築し、それに基づく訂正システムを開発しています。
    BERT系事前学習モデルの構築
    転移学習モデルBERT、RoBERTa、GPT2、BARTの事前学習モデルを構築し、公開しています。 また、画像と言語のマルチモーダル事前学習モデルについて研究しています。
    言語理解に資するデータセットの構築
    機械翻訳やクラウドソーシングを用いて自然言語推論(NLI)、常識推論、文章読解データセットを構築し、公開しています。

    応用システム

    対話システムの開発
    感情、性格、個性をもった人間らしい対話システム、また、バラエティのある応答や知識に基づく応答ができる対話システムを開発しています。
    低リソース機械翻訳手法の研究
    低リソース言語対の機械翻訳手法について研究しています。また、古典・現代語変換への応用も検討しています。
    ファクトチェック支援システムの開発
    自然言語推論を利用して、フェイクニュースの判定を支援するためのシステムを開発しています。
    SNSなどの速報性メディアの分析
    国内の大学・研究機関の情報系研究室とのコラボレーションによって、COVID-19に関する世界の情報を集約するサイトを構築し、公開しています。