• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

内部 英治  UCHIBE Eiji

ORCIDORCID連携する *注記
研究者番号 20426571
その他のID
所属 (現在) 2025年度: 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主幹研究員
所属 (過去の研究課題情報に基づく) *注記 2015年度 – 2024年度: 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主幹研究員
2014年度: 沖縄科学技術大学院大学, 神経計算ユニット, グループリーダー
2013年度: 沖縄科学技術大学院大学, 神経計算ユニット, 研究員
2012年度: 沖縄科学技術大学院大学, その他の研究科, 研究員
審査区分/研究分野
研究代表者
複合領域 / 小区分61050:知能ロボティクス関連 / 知能ロボティクス / 知覚情報処理・知能ロボティクス
キーワード
研究代表者
強化学習 / 逆強化学習 / モデルベース / モデルフリー / 非同期制御 / 並列学習 / 機械学習 / 重点サンプリング / 深層学習 / EMアルゴリズム … もっと見る / 密度比推定法 / 線形可解マルコフ決定過程 / 非同期分散 / 深層強化学習 / 非同期分散アーキテクチャ / 実時間制御 / マルチタイムスケール / マルチモジュール / 非同期分散型 / モデル学習 / 模倣学習 / 人工知能 / KL制御 / 知能ロボティックス / マルチエージェント強化学習 / 進化的計算 / 進化計算 / スマートフォンロボット / ロボット学習 / 部分観測環境 / KLダイバージェンス / 密度比推定 / 報酬関数 / 最適制御 隠す
  • 研究課題

    (7件)
  • 研究成果

    (83件)
  • 共同研究者

    (1人)
  •  遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2021 – 2024
    • 研究種目
      基盤研究(B)
    • 審査区分
      小区分61050:知能ロボティクス関連
    • 研究機関
      株式会社国際電気通信基礎技術研究所
  •  モデルフリーとモデルベースの協同による深層並列強化学習研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2019 – 2020
    • 研究種目
      新学術領域研究(研究領域提案型)
    • 審査区分
      複合領域
    • 研究機関
      株式会社国際電気通信基礎技術研究所
  •  並列深層強化学習研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2017 – 2018
    • 研究種目
      新学術領域研究(研究領域提案型)
    • 審査区分
      複合領域
    • 研究機関
      株式会社国際電気通信基礎技術研究所
  •  カルバックライブラー制御法と内的報酬を統合した強化学習研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2016 – 2018
    • 研究種目
      挑戦的萌芽研究
    • 研究分野
      知能ロボティクス
    • 研究機関
      株式会社国際電気通信基礎技術研究所
  •  部分観測環境下におけるモデルベース・モデルフリー強化学習の役割分担研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2014 – 2015
    • 研究種目
      新学術領域研究(研究領域提案型)
    • 審査区分
      複合領域
    • 研究機関
      株式会社国際電気通信基礎技術研究所
      沖縄科学技術大学院大学
  •  モデルベース予測状態フィードバックを組み込んだ強化学習研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2012 – 2013
    • 研究種目
      新学術領域研究(研究領域提案型)
    • 審査区分
      複合領域
    • 研究機関
      沖縄科学技術大学院大学
  •  強化学習のための情報理論に基づく報酬の設計論研究代表者

    • 研究代表者
      内部 英治
    • 研究期間 (年度)
      2012 – 2014
    • 研究種目
      基盤研究(C)
    • 研究分野
      知覚情報処理・知能ロボティクス
    • 研究機関
      沖縄科学技術大学院大学

すべて 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 その他

すべて 雑誌論文 学会発表 産業財産権

  • [雑誌論文] Modular deep reinforcement learning from reward and punishment for robot navigation2021

    • 著者名/発表者名
      Jiexin Wang, Stefan Elfwing, and Eiji Uchibe
    • 雑誌名

      Neural Networks

      巻: 135 ページ: 115-126

    • DOI

      10.1016/j.neunet.2020.12.001

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [雑誌論文] Constrained Deep Q-Learning Gradually Approaching Ordinary Q-Learning2019

    • 著者名/発表者名
      Shota Ohnishi, Eiji Uchibe, Yotaro Yamaguchi, Kosuke Nakanishi, Yuji Yasui, and Shin Ishii
    • 雑誌名

      Frontiers in Neurorobotics

      巻: 13

    • DOI

      10.3389/fnbot.2019.00103

    • 査読あり / オープンアクセス
    • データソース
      KAKENHI-PUBLICLY-19H05001, KAKENHI-PLANNED-17H06310, KAKENHI-PROJECT-19H04180
  • [雑誌論文] Cooperative and Competitive Reinforcement and Imitation Learning for a Mixture of Heterogeneous Learning Modules2018

    • 著者名/発表者名
      Eiji Uchibe
    • 雑誌名

      Frontiers in Neurorobotics

      巻: 12

    • DOI

      10.3389/fnbot.2018.00061

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042, KAKENHI-PROJECT-16K12504
  • [雑誌論文] Model-Free Deep Inverse Reinforcement Learning by Logistic Regression2018

    • 著者名/発表者名
      Eiji Uchibe
    • 雑誌名

      Neural Processing Letters

      巻: 47 号: 3 ページ: 891-905

    • DOI

      10.1007/s11063-017-9702-7

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [雑誌論文] Robustness of linearly solvable Markov games employing inaccurate dynamics model2018

    • 著者名/発表者名
      Ken Kinjo, Eiji Uchibe, and Kenji Doya
    • 雑誌名

      Artificial Life and Robotics

      巻: 23 号: 1 ページ: 1-9

    • DOI

      10.1007/s10015-017-0401-2

    • 査読あり / オープンアクセス
    • データソース
      KAKENHI-PROJECT-16K12504, KAKENHI-PUBLICLY-17H06042
  • [雑誌論文] Sigmoid-weighted linear units for neural network function approximation in reinforcement learning2018

    • 著者名/発表者名
      Elfwing S, Uchibe E, Doya K
    • 雑誌名

      Neural Networks

      巻: 2017 Specail issue ページ: 30297-6

    • DOI

      10.1016/j.neunet.2017.12.012

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PLANNED-16H06563, KAKENHI-PUBLICLY-17H06042
  • [雑誌論文] ロボット制御のための決定論的方策探査法2017

    • 著者名/発表者名
      内部 英治, 王 潔心
    • 雑誌名

      日本神経回路学会誌

      巻: 24 号: 4 ページ: 195-203

    • DOI

      10.3902/jnns.24.195

    • NAID

      130006337689

    • ISSN
      1340-766X, 1883-0455
    • 言語
      日本語
    • データソース
      KAKENHI-PROJECT-16K12504, KAKENHI-PUBLICLY-17H06042
  • [雑誌論文] Adaptive Baseline Enhances EM-based Policy Search: Validation in a View-based Positioning Task of a Smartphone Balancer2017

    • 著者名/発表者名
      Jiexin Wang, Eiji Uchibe, Kenji Doya
    • 雑誌名

      Frontiers in Neurorobotics

      巻: 11 ページ: 1-15

    • DOI

      10.3389/fnbot.2017.00001

    • NAID

      120005980916

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PLANNED-16H06563, KAKENHI-PROJECT-16K12504
  • [雑誌論文] 線形可解マルコフ決定過程を用いた順・逆強化学習2016

    • 著者名/発表者名
      内部英治
    • 雑誌名

      日本神経回路学会誌

      巻: 23 号: 1 ページ: 2-13

    • DOI

      10.3902/jnns.23.2

    • NAID

      130005150459

    • ISSN
      1340-766X, 1883-0455
    • 言語
      日本語
    • 謝辞記載あり
    • データソース
      KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-26120727
  • [雑誌論文] EM-based policy hyper parameter exploration: application to standing and balancing of a two-wheeled smartphone robot2016

    • 著者名/発表者名
      Wang J, Uchibe E, Doya K
    • 雑誌名

      Artificial Life and Robotics

      巻: 21 号: 1 ページ: 125-131

    • DOI

      10.1007/s10015-015-0260-7

    • 査読あり / 謝辞記載あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-26120727
  • [雑誌論文] Expected energy-based restricted Boltzmann machine for classification2014

    • 著者名/発表者名
      Elfwing S.,Uchibe E., Doya K.
    • 雑誌名

      Neural Networks

      巻: 64 ページ: 29-38

    • DOI

      10.1016/j.neunet.2014.09.006

    • 査読あり / オープンアクセス
    • データソース
      KAKENHI-ORGANIZER-23120001, KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-26120727
  • [雑誌論文] Evaluation of linearly solvable Markov decision process with dynamic model learning in a mobile robot navigation task2013

    • 著者名/発表者名
      Kinjo K, Uchibe E, Doya K
    • 雑誌名

      Frontiers in Neurorobotics

      巻: 7 ページ: 7-7

    • DOI

      10.3389/fnbot.2013.00007

    • 査読あり
    • データソース
      KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-24120527
  • [産業財産権] Direct Inverse Reinforcement Learning with Density Ratio Estimation2016

    • 発明者名
      Eiji Uchibe and Kenji Doya
    • 権利者名
      OIST
    • 産業財産権種類
      特許
    • 出願年月日
      2016-03-15
    • 外国
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [産業財産権] Inverse Reinforcement Learning by Density Ratio Estimation2015

    • 発明者名
      Eiji Uchibe and Kenji Doya
    • 権利者名
      OIST
    • 産業財産権種類
      特許
    • 出願年月日
      2015-08-07
    • 外国
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [産業財産権] Estimating goals using inverse reinforcement learning based on density ratio estimation2014

    • 発明者名
      E. Uchibe and K. Doya
    • 権利者名
      E. Uchibe and K. Doya
    • 産業財産権種類
      特許
    • 出願年月日
      2014-07-31
    • 外国
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [産業財産権] Estimating goals using inverse reinforcement learning based on density ratio estimation2014

    • 発明者名
      E. Uchibe and K. Doya
    • 権利者名
      E. Uchibe and K. Doya
    • 産業財産権種類
      特許
    • 出願年月日
      2014-07-31
    • 外国
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] 方策とモデルのエントロピ正則を導入したオフラインモデルベース模倣学習2023

    • 著者名/発表者名
      内部英治
    • 学会等名
      第37回人工知能学会全国大会
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] 方策の積による報酬と罰からの並列強化学習2023

    • 著者名/発表者名
      内部英治
    • 学会等名
      第33回 日本神経回路学会全国大会
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] 偏りのあるエキスパートデータから学習する生成模倣学習の多重化2023

    • 著者名/発表者名
      内部英治
    • 学会等名
      第41回日本ロボット学会学術講演会
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] Asynchronous competition and cooperation between model-based and model-free reinforcement learning systems2022

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      Neuro 2022シンポジウム「適応的・予測的行動制御を支える並列的・階層的神経メカニズム」
    • 招待講演
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] モデルベース・モデルフリー強化学習の調停について2022

    • 著者名/発表者名
      内部英治
    • 学会等名
      第36回人工知能学会全国大会
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] 決定論的方策を学習するためのモデルベース強化学習2022

    • 著者名/発表者名
      内部英治
    • 学会等名
      ロボティクス・メカトロニクス講演会予稿集
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] 多目的強化学習のための経験再生バッファの分離2022

    • 著者名/発表者名
      内部英治
    • 学会等名
      第40回日本ロボット学会学術講演会予稿集
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] モデルフリーとモデルベース強化学習のための非同期並列学習2021

    • 著者名/発表者名
      内部英治
    • 学会等名
      第35回人工知能学会全国大会
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] 深層並列強化学習2021

    • 著者名/発表者名
      内部英治
    • 学会等名
      第15回Motor Control研究会
    • データソース
      KAKENHI-PROJECT-23K21710
  • [学会発表] Parallel deep reinforcement learning with model-free and model-based methods2020

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      International Symposium on Artificial Intelligence and Brain Science
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] モデルフリーとモデルベースの協同による並列深層強化学習2020

    • 著者名/発表者名
      内部英治
    • 学会等名
      第34回人工知能学会全国大会
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] Latent brain dynamics estimation and deep generative imitation learning2020

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      31st U.S.-Japan Technology Forum
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] Parallel reward and punishment learning under entropy regularization2019

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      第29回日本神経回路学会全国大会
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] 階層強化学習の進展2019

    • 著者名/発表者名
      内部英治
    • 学会等名
      第13回Motor Control研究会
    • 招待講演
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] Theoretical Analysis of Efficiency and Robustness of Softmax and Gap-Increasing Operators in Reinforcement Learning2019

    • 著者名/発表者名
      Tadashi Kozuno, Eiji Uchibe, and Kenji Doya
    • 学会等名
      The 22nd International Conference on Artificial Intelligence and Statistics
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Imitation learning under entropy regularization2019

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      Workshop on Reinforcement Learning & Biological Intelligence
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] 強化学習と逆強化学習を組み合わせた模倣学習2019

    • 著者名/発表者名
      内部英治
    • 学会等名
      第25回ステアラボ人工知能セミナー
    • 招待講演
    • データソース
      KAKENHI-PUBLICLY-19H05001
  • [学会発表] Imitation learning under entropy regularization2019

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      Workshop on Reinforcement Learning & Biological Intelligence
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] Online Meta-Learning by Parallel Algorithm Competition2018

    • 著者名/発表者名
      Stefan Elfwing, Eiji Uchibe, and Kenji Doya
    • 学会等名
      Genetic and Evolutionary Computation Conference
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] EM-based policy search for learning foraging and mating behaviors2018

    • 著者名/発表者名
      Jiexin Wang and Eiji Uchibe
    • 学会等名
      ロボティクス・メカトロニクス講演会
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] Cooperative and competitive reinforcement and imitation learning2018

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Forward and inverse reinforcement learning and generative adversarial formulation2018

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      NC/IBISML/IPSJ-MPS/IPSJ-BIO合同研究会
    • 招待講演
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] Cooperative and competitive reinforcement and imitation learning2018

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] 方策探査法のための多重重点サンプリングを用いた経験再利用2018

    • 著者名/発表者名
      内部英治
    • 学会等名
      ロボティクス・メカトロニクス講演会
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] 方策探査法のための多重重点サンプリングを用いた経験再利用2018

    • 著者名/発表者名
      内部英治
    • 学会等名
      ロボティクス・メカトロニクス講演会
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] Efficient sample reuse in policy search by multiple importance sampling2018

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      Genetic and Evolutionary Computation Conference
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] EM-based policy search for learning foraging and mating behaviors2018

    • 著者名/発表者名
      Jiexin Wang and Eiji Uchibe
    • 学会等名
      ロボティクス・メカトロニクス講演会
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture2018

    • 著者名/発表者名
      Jiexin Wang, Stefan Elfwing, and Eiji Uchibe
    • 学会等名
      The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Forward and inverse reinforcement learning and generative adversarial formulation2018

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      NC/IBISML/IPSJ-MPS/IPSJ-BIO合同研究会
    • 招待講演
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Efficient Sample Reuse in Policy Search by Multiple Importance Sampling2018

    • 著者名/発表者名
      Eiji Uchibe
    • 学会等名
      Genetic and Evolutionary Computation Conference
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture2018

    • 著者名/発表者名
      Jiexin Wang, Stefan Elfwing, and Eiji Uchibe
    • 学会等名
      The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] ディープNNによる順・逆強化学習2017

    • 著者名/発表者名
      内部英治
    • 学会等名
      第27回日本神経回路学会全国大会
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] Deep inverse reinforcement learning2017

    • 著者名/発表者名
      E. Uchibe
    • 学会等名
      The Third International Workshop on Intrinsically Motivated Open-ended learning
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-17H06042
  • [学会発表] From Neuroscience to Artificial Intelligence: Maximizing Average Reward in Episodic Reinforcement Learning Tasks with an Ensemble of Q-Learners2016

    • 著者名/発表者名
      Chris Reinke, Eiji Uchibe, and Kenji Doya
    • 学会等名
      Third CiNet Conference, Neural mechanisms of decision making: Achievements and new directions
    • 発表場所
      Osaka, Japan
    • 年月日
      2016-02-03
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Learning of Stress Adaptive Habits with an Ensemble of Q-Learners2016

    • 著者名/発表者名
      Chris Reinke, Eiji Uchibe, and Kenji Doya
    • 学会等名
      The 2nd International Workshop on Cognitive Neuroscience Robotics
    • 発表場所
      Osaka, Japan
    • 年月日
      2016-02-21
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Emergence of communication among reinforcement learning agents under coordination environment2016

    • 著者名/発表者名
      Qiong Huang, Eiji Uchibe, and Kenji Doya
    • 学会等名
      6th Joint IEEE International Conference on Developmental Learning and Epigenetic Robotics
    • 発表場所
      Cergy-Pontoise / Paris
    • 年月日
      2016-09-19
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-16K12504
  • [学会発表] Inverse reinforcement learning for behavior analysis and control2015

    • 著者名/発表者名
      Eiji Uchibe, and Kenji Doya
    • 学会等名
      International Symposium on Prediction and Decision Making 2015
    • 発表場所
      Tokyo, Japan
    • 年月日
      2015-10-31
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Forward and inverse reinforcement learning for playing games2015

    • 著者名/発表者名
      Eiji Uchibe, and Kenji Doya
    • 学会等名
      新学術領域研究「予測と意思決定の脳内計算機構の解明による人間理解と応用」第10回領域会議、2015年度包括脳冬のワークショップ
    • 発表場所
      Tokyo, Japan
    • 年月日
      2015-12-17
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Inverse Reinforcement Learning with Density Ratio Estimation2015

    • 著者名/発表者名
      Eiji Uchibe, and Kenji Doya
    • 学会等名
      The 2nd Multidisciplinary Conference on Reinforcement Learning and Decision Making
    • 発表場所
      The University of Alberta
    • 年月日
      2015-06-07
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Maximizing the average reward in episodic reinforcement learning tasks2015

    • 著者名/発表者名
      Chris Reinke, Eiji Uchibe, and Kenji Doya
    • 学会等名
      IEEE International Conference on Intelligent Informatics and Biomedical Sciences
    • 発表場所
      Okinawa, Japan
    • 年月日
      2015-11-28
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Robustness of Linearly Solvable Markov Games with Inaccurate Dynamics Models2014

    • 著者名/発表者名
      K. Kinjo, E. Uchibe, and K. Doya
    • 学会等名
      Proc. of International Symposium on Artificial Life and Robotics
    • 発表場所
      Beppu, Japan
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs2014

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      Proc. of IEEE International Conference on Robotics and Automation
    • 発表場所
      Hong Kong
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Robustness of Linearly Solvable Markov Games with Inaccurate Dynamics Models2014

    • 著者名/発表者名
      K. Kinjo, E. Uchibe, and K. Doya
    • 学会等名
      Proc. of International Symposium on Artificial Life and Robotics
    • 発表場所
      Beppu, Japan
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs2013

    • 著者名/発表者名
      E. Uchibe, and K. Doya
    • 学会等名
      Neuro 2013
    • 発表場所
      Kyoto International Conference Center
    • 招待講演
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Analysis of human behaviors by inverse reinforcement learning in a pole balancing task2013

    • 著者名/発表者名
      S. Ota, E. Uchibe, and K. Doya
    • 学会等名
      The 3rd International Symposium on The Biology of Decision Making
    • 発表場所
      Paris, France
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs2013

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      Neuro 2013
    • 発表場所
      Kyoto International Conference Center
    • 招待講演
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Inverse reinforcement learning for understanding human behaviors2013

    • 著者名/発表者名
      E. Uchibe
    • 学会等名
      International Symposium on Past and Future Directions of Cognitive Developmental Robotics
    • 発表場所
      Osaka University Nakanoshima Center
    • 招待講演
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Inverse reinforcement learning for understanding human behaviors2013

    • 著者名/発表者名
      E. Uchibe
    • 学会等名
      International Symposium on Past and Future Directions of Cognitive Developmental Robotics
    • 発表場所
      Osaka University Nakanoshima Center 10F
    • 招待講演
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Inverse reinforcement learning for analysis of human behaviors2013

    • 著者名/発表者名
      E. Uchibe, S. Ota, and K. Doya
    • 学会等名
      The 1st Multidisciplinary Conference on Reinforcement Learning and Decision Making
    • 発表場所
      Princeton University
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Analysis of human behaviors by inverse reinforcement learning in a pole balancing task2013

    • 著者名/発表者名
      S. Ota, E. Uchibe, and K. Doya
    • 学会等名
      The 3rd International Symposium on The Biology of Decision Making
    • 発表場所
      Paris, France
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Scaled free-energy based reinforcement learning for robust and efficient learning in high-dimensional state spaces2013

    • 著者名/発表者名
      E. Uchibe, S. Elfwing, and K. Doya
    • 学会等名
      Neuro 2013
    • 発表場所
      Kyoto International Conference Center
    • 招待講演
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Inverse reinforcement learning for analysis of human behaviors2013

    • 著者名/発表者名
      E. Uchibe, S. Ota, and K. Doya
    • 学会等名
      The 1st Multidisciplinary Conference on Reinforcement Learning and Decision Making
    • 発表場所
      Princeton University, New Jersey, USA
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Inverse reinforcement learning by density ratio estimation2013

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      第16回情報論的学習理論ワークショップIBIS2013
    • 発表場所
      東京工業大学蔵前会館
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Standing-up and Balancing Behaviors of Android Phone Robot -- Control of Spring Attached Wheeled Inverted Pendulum --2013

    • 著者名/発表者名
      J. Wang, E. Uchibe, and K. Doya
    • 学会等名
      IEICE Technical Committee on Nonlinear Problems (NLP)
    • 発表場所
      City University of Hong Kong
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] Scaled free-energy based reinforcement learning for robust and efficient learning in high-dimensional state spaces2013

    • 著者名/発表者名
      E. Uchibe, S. Elfwing, and K. Doya
    • 学会等名
      Neuro 2013
    • 発表場所
      Kyoto International Conference Center
    • 招待講演
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Standing-up and Balancing Behaviors of Android Phone Robot -- Control of Spring Attached Wheeled Inverted Pendulum --2013

    • 著者名/発表者名
      J. Wang, E. Uchibe, and K. Doya
    • 学会等名
      IEICE Technical Committee on Nonlinear Problems (NLP)
    • 発表場所
      City University of Hong Kong
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Inverse reinforcement learning by density ratio estimation2013

    • 著者名/発表者名
      E. Uchibe, and K. Doya
    • 学会等名
      第16回情報論的学習理論ワークショップIBIS2013
    • 発表場所
      東京工業大学蔵前会館
    • データソース
      KAKENHI-PUBLICLY-24120527
  • [学会発表] 密度比推定を用いた逆強化学習

    • 著者名/発表者名
      内部英治,銅谷賢治
    • 学会等名
      第32回日本ロボット学会学術講演会
    • 発表場所
      九州産業大学
    • 年月日
      2014-09-04 – 2014-09-06
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Two-wheeled smartphone robot learns to stand up and balance by EM-based policy hyper parameter exploration

    • 著者名/発表者名
      J. Wang, E. Uchibe, and K. Doya
    • 学会等名
      20th International Symposium on Artificial Life and Robotics
    • 発表場所
      Beppu
    • 年月日
      2015-01-21 – 2015-01-23
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Control of Two-Wheeled Balancing and Standing-up Behaviors by an Android Phone Robot

    • 著者名/発表者名
      J. Wang, E. Uchibe, and K. Doya.
    • 学会等名
      第32回日本ロボット学会学術講演会
    • 発表場所
      九州産業大学
    • 年月日
      2014-09-04 – 2014-09-06
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Inverse Reinforcement Learning Using Dynamic Policy Programming

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      4th Joint IEEE International Conference on Development and Learning and on Epigenetic Robotics
    • 発表場所
      Genoa
    • 年月日
      2014-10-13 – 2014-10-16
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Inverse Reinforcement Learning Using Dynamic Policy Programming

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      Proc. of the 4th Joint IEEE International Conference on Development and Learning and on Epigenetic Robotics
    • 発表場所
      Genoa
    • 年月日
      2014-10-13 – 2014-10-16
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Control of Two-Wheeled Balancing and Standing-up Behaviors by an Android Phone Robot

    • 著者名/発表者名
      J. Wang, E. Uchibe, and K. Doya
    • 学会等名
      第32回日本ロボット学会学術講演会
    • 発表場所
      九州産業大学
    • 年月日
      2014-09-04 – 2014-09-06
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Two-wheeled smartphone robot learns to stand up and balance by EM-based policy hyper parameter exploration

    • 著者名/発表者名
      J. Wang, E. Uchibe, and K. Doya
    • 学会等名
      International Symposium on Artificial Life and Robotics
    • 発表場所
      Beppu
    • 年月日
      2015-01-21 – 2015-01-23
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      Proc. of IEEE International Conference on Robotics and Automation
    • 発表場所
      Hong Kong
    • 年月日
      2014-05-31 – 2014-06-07
    • データソース
      KAKENHI-PROJECT-24500249
  • [学会発表] 密度比推定を用いた逆強化学習

    • 著者名/発表者名
      内部英治、銅谷健司
    • 学会等名
      第32回日本ロボット学会学術講演会
    • 発表場所
      九州産業大学
    • 年月日
      2014-09-04 – 2014-09-06
    • データソース
      KAKENHI-PUBLICLY-26120727
  • [学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs

    • 著者名/発表者名
      E. Uchibe and K. Doya
    • 学会等名
      IEEE International Conference on Robotics and Automation
    • 発表場所
      Hong Kong
    • 年月日
      2014-05-31 – 2014-06-07
    • データソース
      KAKENHI-PUBLICLY-26120727
  • 1.  銅谷 賢治
    共同の研究課題数: 0件
    共同の研究成果数: 5件

URL: 

この研究者とORCID iDの連携を行いますか?
※ この処理は、研究者本人だけが実行できます。

Are you sure that you want to link your ORCID iD to your KAKEN Researcher profile?
* This action can be performed only by the researcher himself/herself who is listed on the KAKEN Researcher’s page. Are you sure that this KAKEN Researcher’s page is your page?

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi