内部英治 UCHIBE Eiji

研究者番号	20426571
その他のID
所属 (現在)	2025年度: 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主幹研究員
所属 (過去の研究課題情報に基づく) *注記	2015年度 – 2024年度: 株式会社国際電気通信基礎技術研究所, 脳情報通信総合研究所, 主幹研究員 2014年度: 沖縄科学技術大学院大学, 神経計算ユニット, グループリーダー 2013年度: 沖縄科学技術大学院大学, 神経計算ユニット, 研究員 2012年度: 沖縄科学技術大学院大学, その他の研究科, 研究員
審査区分/研究分野	研究代表者複合領域 / 小区分61050:知能ロボティクス関連 / 知能ロボティクス / 知覚情報処理・知能ロボティクス
キーワード	研究代表者強化学習 / 逆強化学習 / モデルベース / モデルフリー / 非同期制御 / 並列学習 / 機械学習 / 重点サンプリング / 深層学習 / EMアルゴリズム … もっと見る / 密度比推定法 / 線形可解マルコフ決定過程 / 非同期分散 / 深層強化学習 / 非同期分散アーキテクチャ / 実時間制御 / マルチタイムスケール / マルチモジュール / 非同期分散型 / モデル学習 / 模倣学習 / 人工知能 / KL制御 / 知能ロボティックス / マルチエージェント強化学習 / 進化的計算 / 進化計算 / スマートフォンロボット / ロボット学習 / 部分観測環境 / KLダイバージェンス / 密度比推定 / 報酬関数 / 最適制御隠す

遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2021 – 2024
- 研究種目
  
  基盤研究(B)
- 審査区分
  
  小区分61050:知能ロボティクス関連
- 研究機関
  株式会社国際電気通信基礎技術研究所
モデルフリーとモデルベースの協同による深層並列強化学習研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2019 – 2020
- 研究種目
  
  新学術領域研究(研究領域提案型)
- 審査区分
  
  複合領域
- 研究機関
  株式会社国際電気通信基礎技術研究所
並列深層強化学習研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2017 – 2018
- 研究種目
  
  新学術領域研究(研究領域提案型)
- 審査区分
  
  複合領域
- 研究機関
  株式会社国際電気通信基礎技術研究所
カルバックライブラー制御法と内的報酬を統合した強化学習研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2016 – 2018
- 研究種目
  
  挑戦的萌芽研究
- 研究分野
  
  知能ロボティクス
- 研究機関
  株式会社国際電気通信基礎技術研究所
部分観測環境下におけるモデルベース・モデルフリー強化学習の役割分担研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2014 – 2015
- 研究種目
  
  新学術領域研究(研究領域提案型)
- 審査区分
  
  複合領域
- 研究機関
  株式会社国際電気通信基礎技術研究所
   沖縄科学技術大学院大学
モデルベース予測状態フィードバックを組み込んだ強化学習研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2012 – 2013
- 研究種目
  
  新学術領域研究(研究領域提案型)
- 審査区分
  
  複合領域
- 研究機関
  沖縄科学技術大学院大学
強化学習のための情報理論に基づく報酬の設計論研究代表者
- 研究代表者
  
  内部英治
- 研究期間 (年度)
  2012 – 2014
- 研究種目
  
  基盤研究(C)
- 研究分野
  
  知覚情報処理・知能ロボティクス
- 研究機関
  沖縄科学技術大学院大学

すべて 2023 2022 2021 2020 2019 2018 2017 2016 2015 2014 2013 その他

すべて雑誌論文学会発表産業財産権

[雑誌論文] Modular deep reinforcement learning from reward and punishment for robot navigation2021
- 著者名/発表者名
  Jiexin Wang, Stefan Elfwing, and Eiji Uchibe
- 雑誌名
  
  Neural Networks
  
  巻: 135 ページ: 115-126
- DOI
  10.1016/j.neunet.2020.12.001
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-19H05001
[雑誌論文] Constrained Deep Q-Learning Gradually Approaching Ordinary Q-Learning2019
- 著者名/発表者名
  Shota Ohnishi, Eiji Uchibe, Yotaro Yamaguchi, Kosuke Nakanishi, Yuji Yasui, and Shin Ishii
- 雑誌名
  
  Frontiers in Neurorobotics
  
  巻: 13
- DOI
  10.3389/fnbot.2019.00103
- 査読あり / オープンアクセス
- データソース
  KAKENHI-PUBLICLY-19H05001, KAKENHI-PLANNED-17H06310, KAKENHI-PROJECT-19H04180
[雑誌論文] Cooperative and Competitive Reinforcement and Imitation Learning for a Mixture of Heterogeneous Learning Modules2018
- 著者名/発表者名
  Eiji Uchibe
- 雑誌名
  
  Frontiers in Neurorobotics
  
  巻: 12
- DOI
  10.3389/fnbot.2018.00061
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042, KAKENHI-PROJECT-16K12504
[雑誌論文] Model-Free Deep Inverse Reinforcement Learning by Logistic Regression2018
- 著者名/発表者名
  Eiji Uchibe
- 雑誌名
  
  Neural Processing Letters
  
  巻: 47 号: 3 ページ: 891-905
- DOI
  10.1007/s11063-017-9702-7
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[雑誌論文] Robustness of linearly solvable Markov games employing inaccurate dynamics model2018
- 著者名/発表者名
  Ken Kinjo, Eiji Uchibe, and Kenji Doya
- 雑誌名
  
  Artificial Life and Robotics
  
  巻: 23 号: 1 ページ: 1-9
- DOI
  10.1007/s10015-017-0401-2
- 査読あり / オープンアクセス
- データソース
  KAKENHI-PROJECT-16K12504, KAKENHI-PUBLICLY-17H06042
[雑誌論文] Sigmoid-weighted linear units for neural network function approximation in reinforcement learning2018
- 著者名/発表者名
  Elfwing S, Uchibe E, Doya K
- 雑誌名
  
  Neural Networks
  
  巻: 2017 Specail issue ページ: 30297-6
- DOI
  10.1016/j.neunet.2017.12.012
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PLANNED-16H06563, KAKENHI-PUBLICLY-17H06042
[雑誌論文] ロボット制御のための決定論的方策探査法2017
- 著者名/発表者名
  内部英治, 王潔心
- 雑誌名
  
  日本神経回路学会誌
  
  巻: 24 号: 4 ページ: 195-203
- DOI
  10.3902/jnns.24.195
- NAID
  130006337689
- ISSN
  1340-766X, 1883-0455
- 言語
  日本語
- データソース
  KAKENHI-PROJECT-16K12504, KAKENHI-PUBLICLY-17H06042
[雑誌論文] Adaptive Baseline Enhances EM-based Policy Search: Validation in a View-based Positioning Task of a Smartphone Balancer2017
- 著者名/発表者名
  Jiexin Wang, Eiji Uchibe, Kenji Doya
- 雑誌名
  
  Frontiers in Neurorobotics
  
  巻: 11 ページ: 1-15
- DOI
  10.3389/fnbot.2017.00001
- NAID
  120005980916
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PLANNED-16H06563, KAKENHI-PROJECT-16K12504
[雑誌論文] 線形可解マルコフ決定過程を用いた順・逆強化学習2016
- 著者名/発表者名
  内部英治
- 雑誌名
  
  日本神経回路学会誌
  
  巻: 23 号: 1 ページ: 2-13
- DOI
  10.3902/jnns.23.2
- NAID
  130005150459
- ISSN
  1340-766X, 1883-0455
- 言語
  日本語
- 謝辞記載あり
- データソース
  KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-26120727
[雑誌論文] EM-based policy hyper parameter exploration: application to standing and balancing of a two-wheeled smartphone robot2016
- 著者名/発表者名
  Wang J, Uchibe E, Doya K
- 雑誌名
  
  Artificial Life and Robotics
  
  巻: 21 号: 1 ページ: 125-131
- DOI
  10.1007/s10015-015-0260-7
- 査読あり / 謝辞記載あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-26120727
[雑誌論文] Expected energy-based restricted Boltzmann machine for classification2014
- 著者名/発表者名
  Elfwing S.,Uchibe E., Doya K.
- 雑誌名
  
  Neural Networks
  
  巻: 64 ページ: 29-38
- DOI
  10.1016/j.neunet.2014.09.006
- 査読あり / オープンアクセス
- データソース
  KAKENHI-ORGANIZER-23120001, KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-26120727
[雑誌論文] Evaluation of linearly solvable Markov decision process with dynamic model learning in a mobile robot navigation task2013
- 著者名/発表者名
  Kinjo K, Uchibe E, Doya K
- 雑誌名
  
  Frontiers in Neurorobotics
  
  巻: 7 ページ: 7-7
- DOI
  10.3389/fnbot.2013.00007
- 査読あり
- データソース
  KAKENHI-PLANNED-23120007, KAKENHI-PUBLICLY-24120527
[産業財産権] Direct Inverse Reinforcement Learning with Density Ratio Estimation2016
- 発明者名
  Eiji Uchibe and Kenji Doya
- 権利者名
  OIST
- 産業財産権種類
  特許
- 出願年月日
  2016-03-15
- 外国
- データソース
  KAKENHI-PUBLICLY-26120727
[産業財産権] Inverse Reinforcement Learning by Density Ratio Estimation2015
- 発明者名
  Eiji Uchibe and Kenji Doya
- 権利者名
  OIST
- 産業財産権種類
  特許
- 出願年月日
  2015-08-07
- 外国
- データソース
  KAKENHI-PUBLICLY-26120727
[産業財産権] Estimating goals using inverse reinforcement learning based on density ratio estimation2014
- 発明者名
  E. Uchibe and K. Doya
- 権利者名
  E. Uchibe and K. Doya
- 産業財産権種類
  特許
- 出願年月日
  2014-07-31
- 外国
- データソース
  KAKENHI-PUBLICLY-26120727
[産業財産権] Estimating goals using inverse reinforcement learning based on density ratio estimation2014
- 発明者名
  E. Uchibe and K. Doya
- 権利者名
  E. Uchibe and K. Doya
- 産業財産権種類
  特許
- 出願年月日
  2014-07-31
- 外国
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] 方策とモデルのエントロピ正則を導入したオフラインモデルベース模倣学習2023
- 著者名/発表者名
  内部英治
- 学会等名
  第37回人工知能学会全国大会
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] 方策の積による報酬と罰からの並列強化学習2023
- 著者名/発表者名
  内部英治
- 学会等名
  第33回日本神経回路学会全国大会
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] 偏りのあるエキスパートデータから学習する生成模倣学習の多重化2023
- 著者名/発表者名
  内部英治
- 学会等名
  第41回日本ロボット学会学術講演会
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] Asynchronous competition and cooperation between model-based and model-free reinforcement learning systems2022
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  Neuro 2022シンポジウム「適応的・予測的行動制御を支える並列的・階層的神経メカニズム」
- 招待講演
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] モデルベース・モデルフリー強化学習の調停について2022
- 著者名/発表者名
  内部英治
- 学会等名
  第36回人工知能学会全国大会
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] 決定論的方策を学習するためのモデルベース強化学習2022
- 著者名/発表者名
  内部英治
- 学会等名
  ロボティクス・メカトロニクス講演会予稿集
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] 多目的強化学習のための経験再生バッファの分離2022
- 著者名/発表者名
  内部英治
- 学会等名
  第40回日本ロボット学会学術講演会予稿集
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] モデルフリーとモデルベース強化学習のための非同期並列学習2021
- 著者名/発表者名
  内部英治
- 学会等名
  第35回人工知能学会全国大会
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] 深層並列強化学習2021
- 著者名/発表者名
  内部英治
- 学会等名
  第15回Motor Control研究会
- データソース
  KAKENHI-PROJECT-23K21710
[学会発表] Parallel deep reinforcement learning with model-free and model-based methods2020
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  International Symposium on Artificial Intelligence and Brain Science
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] モデルフリーとモデルベースの協同による並列深層強化学習2020
- 著者名/発表者名
  内部英治
- 学会等名
  第34回人工知能学会全国大会
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] Latent brain dynamics estimation and deep generative imitation learning2020
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  31st U.S.-Japan Technology Forum
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] Parallel reward and punishment learning under entropy regularization2019
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  第29回日本神経回路学会全国大会
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] 階層強化学習の進展2019
- 著者名/発表者名
  内部英治
- 学会等名
  第13回Motor Control研究会
- 招待講演
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] Theoretical Analysis of Efficiency and Robustness of Softmax and Gap-Increasing Operators in Reinforcement Learning2019
- 著者名/発表者名
  Tadashi Kozuno, Eiji Uchibe, and Kenji Doya
- 学会等名
  The 22nd International Conference on Artificial Intelligence and Statistics
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Imitation learning under entropy regularization2019
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  Workshop on Reinforcement Learning & Biological Intelligence
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] 強化学習と逆強化学習を組み合わせた模倣学習2019
- 著者名/発表者名
  内部英治
- 学会等名
  第25回ステアラボ人工知能セミナー
- 招待講演
- データソース
  KAKENHI-PUBLICLY-19H05001
[学会発表] Imitation learning under entropy regularization2019
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  Workshop on Reinforcement Learning & Biological Intelligence
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] Online Meta-Learning by Parallel Algorithm Competition2018
- 著者名/発表者名
  Stefan Elfwing, Eiji Uchibe, and Kenji Doya
- 学会等名
  Genetic and Evolutionary Computation Conference
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] EM-based policy search for learning foraging and mating behaviors2018
- 著者名/発表者名
  Jiexin Wang and Eiji Uchibe
- 学会等名
  ロボティクス・メカトロニクス講演会
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] Cooperative and competitive reinforcement and imitation learning2018
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Forward and inverse reinforcement learning and generative adversarial formulation2018
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  NC/IBISML/IPSJ-MPS/IPSJ-BIO合同研究会
- 招待講演
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] Cooperative and competitive reinforcement and imitation learning2018
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] 方策探査法のための多重重点サンプリングを用いた経験再利用2018
- 著者名/発表者名
  内部英治
- 学会等名
  ロボティクス・メカトロニクス講演会
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] 方策探査法のための多重重点サンプリングを用いた経験再利用2018
- 著者名/発表者名
  内部英治
- 学会等名
  ロボティクス・メカトロニクス講演会
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] Efficient sample reuse in policy search by multiple importance sampling2018
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  Genetic and Evolutionary Computation Conference
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] EM-based policy search for learning foraging and mating behaviors2018
- 著者名/発表者名
  Jiexin Wang and Eiji Uchibe
- 学会等名
  ロボティクス・メカトロニクス講演会
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture2018
- 著者名/発表者名
  Jiexin Wang, Stefan Elfwing, and Eiji Uchibe
- 学会等名
  The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Forward and inverse reinforcement learning and generative adversarial formulation2018
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  NC/IBISML/IPSJ-MPS/IPSJ-BIO合同研究会
- 招待講演
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Efficient Sample Reuse in Policy Search by Multiple Importance Sampling2018
- 著者名/発表者名
  Eiji Uchibe
- 学会等名
  Genetic and Evolutionary Computation Conference
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Deep reinforcement learning by parallelizing reward and punishment using MaxPain architecture2018
- 著者名/発表者名
  Jiexin Wang, Stefan Elfwing, and Eiji Uchibe
- 学会等名
  The 8th Joint IEEE International Conference on Development and Learning and Epigenetic Robotics
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] ディープNNによる順・逆強化学習2017
- 著者名/発表者名
  内部英治
- 学会等名
  第27回日本神経回路学会全国大会
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] Deep inverse reinforcement learning2017
- 著者名/発表者名
  E. Uchibe
- 学会等名
  The Third International Workshop on Intrinsically Motivated Open-ended learning
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-17H06042
[学会発表] From Neuroscience to Artificial Intelligence: Maximizing Average Reward in Episodic Reinforcement Learning Tasks with an Ensemble of Q-Learners2016
- 著者名/発表者名
  Chris Reinke, Eiji Uchibe, and Kenji Doya
- 学会等名
  Third CiNet Conference, Neural mechanisms of decision making: Achievements and new directions
- 発表場所
  Osaka, Japan
- 年月日
  2016-02-03
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Learning of Stress Adaptive Habits with an Ensemble of Q-Learners2016
- 著者名/発表者名
  Chris Reinke, Eiji Uchibe, and Kenji Doya
- 学会等名
  The 2nd International Workshop on Cognitive Neuroscience Robotics
- 発表場所
  Osaka, Japan
- 年月日
  2016-02-21
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Emergence of communication among reinforcement learning agents under coordination environment2016
- 著者名/発表者名
  Qiong Huang, Eiji Uchibe, and Kenji Doya
- 学会等名
  6th Joint IEEE International Conference on Developmental Learning and Epigenetic Robotics
- 発表場所
  Cergy-Pontoise / Paris
- 年月日
  2016-09-19
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-16K12504
[学会発表] Inverse reinforcement learning for behavior analysis and control2015
- 著者名/発表者名
  Eiji Uchibe, and Kenji Doya
- 学会等名
  International Symposium on Prediction and Decision Making 2015
- 発表場所
  Tokyo, Japan
- 年月日
  2015-10-31
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Forward and inverse reinforcement learning for playing games2015
- 著者名/発表者名
  Eiji Uchibe, and Kenji Doya
- 学会等名
  新学術領域研究「予測と意思決定の脳内計算機構の解明による人間理解と応用」第10回領域会議､2015年度包括脳冬のワークショップ
- 発表場所
  Tokyo, Japan
- 年月日
  2015-12-17
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Inverse Reinforcement Learning with Density Ratio Estimation2015
- 著者名/発表者名
  Eiji Uchibe, and Kenji Doya
- 学会等名
  The 2nd Multidisciplinary Conference on Reinforcement Learning and Decision Making
- 発表場所
  The University of Alberta
- 年月日
  2015-06-07
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Maximizing the average reward in episodic reinforcement learning tasks2015
- 著者名/発表者名
  Chris Reinke, Eiji Uchibe, and Kenji Doya
- 学会等名
  IEEE International Conference on Intelligent Informatics and Biomedical Sciences
- 発表場所
  Okinawa, Japan
- 年月日
  2015-11-28
- 国際共著/国際学会である
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Robustness of Linearly Solvable Markov Games with Inaccurate Dynamics Models2014
- 著者名/発表者名
  K. Kinjo, E. Uchibe, and K. Doya
- 学会等名
  Proc. of International Symposium on Artificial Life and Robotics
- 発表場所
  Beppu, Japan
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs2014
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  Proc. of IEEE International Conference on Robotics and Automation
- 発表場所
  Hong Kong
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Robustness of Linearly Solvable Markov Games with Inaccurate Dynamics Models2014
- 著者名/発表者名
  K. Kinjo, E. Uchibe, and K. Doya
- 学会等名
  Proc. of International Symposium on Artificial Life and Robotics
- 発表場所
  Beppu, Japan
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs2013
- 著者名/発表者名
  E. Uchibe, and K. Doya
- 学会等名
  Neuro 2013
- 発表場所
  Kyoto International Conference Center
- 招待講演
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Analysis of human behaviors by inverse reinforcement learning in a pole balancing task2013
- 著者名/発表者名
  S. Ota, E. Uchibe, and K. Doya
- 学会等名
  The 3rd International Symposium on The Biology of Decision Making
- 発表場所
  Paris, France
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs2013
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  Neuro 2013
- 発表場所
  Kyoto International Conference Center
- 招待講演
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Inverse reinforcement learning for understanding human behaviors2013
- 著者名/発表者名
  E. Uchibe
- 学会等名
  International Symposium on Past and Future Directions of Cognitive Developmental Robotics
- 発表場所
  Osaka University Nakanoshima Center
- 招待講演
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Inverse reinforcement learning for understanding human behaviors2013
- 著者名/発表者名
  E. Uchibe
- 学会等名
  International Symposium on Past and Future Directions of Cognitive Developmental Robotics
- 発表場所
  Osaka University Nakanoshima Center 10F
- 招待講演
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Inverse reinforcement learning for analysis of human behaviors2013
- 著者名/発表者名
  E. Uchibe, S. Ota, and K. Doya
- 学会等名
  The 1st Multidisciplinary Conference on Reinforcement Learning and Decision Making
- 発表場所
  Princeton University
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Analysis of human behaviors by inverse reinforcement learning in a pole balancing task2013
- 著者名/発表者名
  S. Ota, E. Uchibe, and K. Doya
- 学会等名
  The 3rd International Symposium on The Biology of Decision Making
- 発表場所
  Paris, France
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Scaled free-energy based reinforcement learning for robust and efficient learning in high-dimensional state spaces2013
- 著者名/発表者名
  E. Uchibe, S. Elfwing, and K. Doya
- 学会等名
  Neuro 2013
- 発表場所
  Kyoto International Conference Center
- 招待講演
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Inverse reinforcement learning for analysis of human behaviors2013
- 著者名/発表者名
  E. Uchibe, S. Ota, and K. Doya
- 学会等名
  The 1st Multidisciplinary Conference on Reinforcement Learning and Decision Making
- 発表場所
  Princeton University, New Jersey, USA
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Inverse reinforcement learning by density ratio estimation2013
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  第16回情報論的学習理論ワークショップIBIS2013
- 発表場所
  東京工業大学蔵前会館
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Standing-up and Balancing Behaviors of Android Phone Robot -- Control of Spring Attached Wheeled Inverted Pendulum --2013
- 著者名/発表者名
  J. Wang, E. Uchibe, and K. Doya
- 学会等名
  IEICE Technical Committee on Nonlinear Problems (NLP)
- 発表場所
  City University of Hong Kong
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] Scaled free-energy based reinforcement learning for robust and efficient learning in high-dimensional state spaces2013
- 著者名/発表者名
  E. Uchibe, S. Elfwing, and K. Doya
- 学会等名
  Neuro 2013
- 発表場所
  Kyoto International Conference Center
- 招待講演
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Standing-up and Balancing Behaviors of Android Phone Robot -- Control of Spring Attached Wheeled Inverted Pendulum --2013
- 著者名/発表者名
  J. Wang, E. Uchibe, and K. Doya
- 学会等名
  IEICE Technical Committee on Nonlinear Problems (NLP)
- 発表場所
  City University of Hong Kong
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Inverse reinforcement learning by density ratio estimation2013
- 著者名/発表者名
  E. Uchibe, and K. Doya
- 学会等名
  第16回情報論的学習理論ワークショップIBIS2013
- 発表場所
  東京工業大学蔵前会館
- データソース
  KAKENHI-PUBLICLY-24120527
[学会発表] 密度比推定を用いた逆強化学習
- 著者名/発表者名
  内部英治，銅谷賢治
- 学会等名
  第32回日本ロボット学会学術講演会
- 発表場所
  九州産業大学
- 年月日
  2014-09-04 – 2014-09-06
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Two-wheeled smartphone robot learns to stand up and balance by EM-based policy hyper parameter exploration
- 著者名/発表者名
  J. Wang, E. Uchibe, and K. Doya
- 学会等名
  20th International Symposium on Artificial Life and Robotics
- 発表場所
  Beppu
- 年月日
  2015-01-21 – 2015-01-23
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Control of Two-Wheeled Balancing and Standing-up Behaviors by an Android Phone Robot
- 著者名/発表者名
  J. Wang, E. Uchibe, and K. Doya.
- 学会等名
  第32回日本ロボット学会学術講演会
- 発表場所
  九州産業大学
- 年月日
  2014-09-04 – 2014-09-06
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Inverse Reinforcement Learning Using Dynamic Policy Programming
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  4th Joint IEEE International Conference on Development and Learning and on Epigenetic Robotics
- 発表場所
  Genoa
- 年月日
  2014-10-13 – 2014-10-16
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Inverse Reinforcement Learning Using Dynamic Policy Programming
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  Proc. of the 4th Joint IEEE International Conference on Development and Learning and on Epigenetic Robotics
- 発表場所
  Genoa
- 年月日
  2014-10-13 – 2014-10-16
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Control of Two-Wheeled Balancing and Standing-up Behaviors by an Android Phone Robot
- 著者名/発表者名
  J. Wang, E. Uchibe, and K. Doya
- 学会等名
  第32回日本ロボット学会学術講演会
- 発表場所
  九州産業大学
- 年月日
  2014-09-04 – 2014-09-06
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Two-wheeled smartphone robot learns to stand up and balance by EM-based policy hyper parameter exploration
- 著者名/発表者名
  J. Wang, E. Uchibe, and K. Doya
- 学会等名
  International Symposium on Artificial Life and Robotics
- 発表場所
  Beppu
- 年月日
  2015-01-21 – 2015-01-23
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  Proc. of IEEE International Conference on Robotics and Automation
- 発表場所
  Hong Kong
- 年月日
  2014-05-31 – 2014-06-07
- データソース
  KAKENHI-PROJECT-24500249
[学会発表] 密度比推定を用いた逆強化学習
- 著者名/発表者名
  内部英治、銅谷健司
- 学会等名
  第32回日本ロボット学会学術講演会
- 発表場所
  九州産業大学
- 年月日
  2014-09-04 – 2014-09-06
- データソース
  KAKENHI-PUBLICLY-26120727
[学会発表] Combining learned controllers to achieve new goals based on linearly solvable MDPs
- 著者名/発表者名
  E. Uchibe and K. Doya
- 学会等名
  IEEE International Conference on Robotics and Automation
- 発表場所
  Hong Kong
- 年月日
  2014-05-31 – 2014-06-07
- データソース
  KAKENHI-PUBLICLY-26120727

1. 銅谷賢治

共同の研究課題数: 0件

共同の研究成果数: 5件

内部 英治 UCHIBE Eiji

研究課題

研究成果

共同研究者

遅延を考慮した非同期分散型マルチモジュール・タイムスケール深層強化学習の開発研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

モデルフリーとモデルベースの協同による深層並列強化学習研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

並列深層強化学習研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

カルバックライブラー制御法と内的報酬を統合した強化学習研究代表者

研究代表者

研究期間 (年度)

研究種目

研究分野

研究機関

部分観測環境下におけるモデルベース・モデルフリー強化学習の役割分担研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

モデルベース予測状態フィードバックを組み込んだ強化学習研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

強化学習のための情報理論に基づく報酬の設計論研究代表者

研究代表者

研究期間 (年度)

研究種目

研究分野

研究機関

[雑誌論文] Modular deep reinforcement learning from reward and punishment for robot navigation2021

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Constrained Deep Q-Learning Gradually Approaching Ordinary Q-Learning2019

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Cooperative and Competitive Reinforcement and Imitation Learning for a Mixture of Heterogeneous Learning Modules2018

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Model-Free Deep Inverse Reinforcement Learning by Logistic Regression2018

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Robustness of linearly solvable Markov games employing inaccurate dynamics model2018

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Sigmoid-weighted linear units for neural network function approximation in reinforcement learning2018

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] ロボット制御のための決定論的方策探査法2017

著者名/発表者名

雑誌名

DOI

内部英治 UCHIBE Eiji