李勝 Li Sheng

研究者番号	70840940
その他のID	https://orcid.org/0000-0001-7636-3797
所属 (現在)	2026年度: 東京科学大学, 工学院, 助教
所属 (過去の研究課題情報に基づく) *注記	2024年度: 東京科学大学, 工学院, 助教 2021年度 – 2024年度: 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所先進的音声翻訳研究開発推進センター, 研究員 2020年度: 国立研究開発法人情報通信研究機構, 先進的音声翻訳研究開発推進センター先進的音声技術研究室, 研究員 2019年度: 国立研究開発法人情報通信研究機構, 先進的音声翻訳研究開発推進センター先進的音声技術研究室, 研究員
審査区分/研究分野	研究代表者小区分61030:知能情報学関連 / 小区分61050:知能ロボティクス関連 / 1002:人間情報学、応用情報学およびその関連分野研究代表者以外合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連 / 小区分60030:統計科学関連 / 小区分61030:知能情報学関連
キーワード	研究代表者 speech recognition / quality estimation / federated learning / multilingual / Low-resource / Multilingual / Multimodal / Multitask / low-resource / multitask … もっと見る / multimodal / large language model / Deep neural network / Adversarial attack / Dialogue robotic system / Speech recognition / speech enhancement / adversarial attacks / spoken dialogue system / privacy preserving / security / spoken dialogue / deepfake detection / privacy perserving / adversarial attack / speaker diarization / end-to-end / code-switched / disordered speech / language identification / multi-unit modeling / speech translation / low-resourced modeling / multilingual modeling / End-to-End / articulation … もっと見る研究代表者以外メタ介入 / 多言語対話 / 意図理解 / 音声対話翻訳 / 感情を捉えた音声翻訳 / 音声翻訳 / 感情音声認識隠す

意図を的確に伝える音声対話翻訳の基盤技術の創出
- 研究代表者
  
  チョシンキ
- 研究期間 (年度)
  2024 – 2026
- 研究種目
  
  基盤研究(B)
- 審査区分
  
  小区分61030:知能情報学関連
   小区分60030:統計科学関連
   合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連
- 研究機関
  京都大学
M3OLR: Towards Effective Multilingual, Multimodal and Multitask Oriental Low-resourced Language Speech Recognition研究代表者
- 研究代表者
  
  李勝
- 研究期間 (年度)
  2023 – 2025
- 研究種目
  
  基盤研究(C)
- 審査区分
  
  小区分61030:知能情報学関連
- 研究機関
  東京科学大学
   国立研究開発法人情報通信研究機構
Phantom in the Opera: the Vulnerabilities of Speech Interface for Robotic Dialogue System研究代表者
- 研究代表者
  
  李勝
- 研究期間 (年度)
  2021 – 2022
- 研究種目
  
  若手研究
- 審査区分
  
  小区分61050:知能ロボティクス関連
- 研究機関
  国立研究開発法人情報通信研究機構
Next generation multilingual End-to-End speech recognition (from G30 to G200)研究代表者
- 研究代表者
  
  李勝
- 研究期間 (年度)
  2019 – 2020
- 研究種目
  
  研究活動スタート支援
- 審査区分
  
  1002:人間情報学、応用情報学およびその関連分野
- 研究機関
  国立研究開発法人情報通信研究機構

すべて 2025 2024 2023 2022 2021 2020 2019

すべて雑誌論文学会発表図書産業財産権

[図書] Phantom in the Opera: The Vulnerabilities of Speech-based Artificial Intelligence Systems2022
- 著者名/発表者名
  Sheng Li
- 総ページ数
  110
- 出版者
  NICT
- ISBN
  9784904020265
- データソース
  KAKENHI-PROJECT-21K17837
[図書] Voices of the Himalayas: Investigation of Speech Recognition Technology for the Tibetan Language2022
- 著者名/発表者名
  Sheng Li
- 総ページ数
  112
- 出版者
  NICT
- ISBN
  9784904020289
- データソース
  KAKENHI-PROJECT-21K17837
[図書] Automatic speech recognition2020
- 著者名/発表者名
  X. Lu, S. Li, M. Fujimoto
- 総ページ数
  18
- 出版者
  Springer Singapore
- ISBN
  9789811505959
- データソース
  KAKENHI-PROJECT-19K24376
[雑誌論文] Addressing Domain Mismatch in Unsupervised Neural Machine Translation2025
- 著者名/発表者名
  Lin Youyuan、Wang Rui、Chu Chenhui
- 雑誌名
  
  IEEE Transactions on Audio, Speech and Language Processing
  
  巻: 33 ページ: 472-482
- DOI
  10.1109/taslpro.2025.3527896
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[雑誌論文] Robust voice activity detection using an auditory-inspired masked modulation encoder based convolutional attention network2024
- 著者名/発表者名
  Li Nan、Wang Longbiao、Ge Meng、Unoki Masashi、Li Sheng、Dang Jianwu
- 雑誌名
  
  Speech Communication
  
  巻: 157 ページ: 103024-103024
- DOI
  10.1016/j.specom.2023.103024
- 査読あり / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[雑誌論文] Phantom in the opera: adversarial music attack for robot dialogue system2024
- 著者名/発表者名
  Li Sheng、Li Jiyi、Cao Yang
- 雑誌名
  
  Frontiers in Computer Science, 15 February 2024
  
  巻: 6 ページ: 1-9
- DOI
  10.3389/fcomp.2024.1355975
- 査読あり / オープンアクセス
- データソース
  KAKENHI-PROJECT-23K11227, KAKENHI-PROJECT-23K28092
[雑誌論文] End-to-end Japanese-English Speech-to-text Translation with Spoken-to-Written Style Conversion2024
- 著者名/発表者名
  Yang Zhengdong、Shimizu Shuichiro、Chu Chenhui、Li Sheng、Kurohashi Sadao
- 雑誌名
  
  自然言語処理
  
  巻: 31 号: 3 ページ: 935-957
- DOI
  10.5715/jnlp.31.935
- ISSN
  1340-7619, 2185-8314
- 言語
  英語
- 査読あり / オープンアクセス
- データソース
  KAKENHI-PROJECT-23K28144, KAKENHI-PROJECT-23KJ1356
[雑誌論文] Voices of the Himalayas: Benchmarking Speech Recognition Systems for the Tibetan Language2024
- 著者名/発表者名
  Li Sheng、Li Jiyi、Chu Chenhui
- 雑誌名
  
  International Journal of Asian Language Processing
  
  巻: 34 号: 01 ページ: 2450001-2450001
- DOI
  10.1142/s2717554524500012
- 査読あり
- データソース
  KAKENHI-PROJECT-23K28092, KAKENHI-PROJECT-23K28144
[雑誌論文] Disordered speech recognition considering low resources and abnormal articulation2023
- 著者名/発表者名
  Lin Yuqin、Dang Jianwu、Wang Longbiao、Li Sheng、Ding Chenchen
- 雑誌名
  
  Speech Communication
  
  巻: 155 ページ: 103002-103002
- DOI
  10.1016/j.specom.2023.103002
- 査読あり / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[雑誌論文] Finetuning Pretrained Model with Embedding of Domain and Language Information for ASR of Very Low-Resource Settings2023
- 著者名/発表者名
  Soky Kak、Li Sheng、Chu Chenhui、Kawahara Tatsuya
- 雑誌名
  
  International Journal of Asian Language Processing
  
  巻: 33 号: 04 ページ: 2350024-2350024
- DOI
  10.1142/s2717554523500248
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227, KAKENHI-PROJECT-23K28144, KAKENHI-PROJECT-21H05054
[雑誌論文] Cross-Lingual Transfer Learning for End-to-End Speech Translation2022
- 著者名/発表者名
  Shimizu Shuichiro、Chu Chenhui、Li Sheng、Kurohashi Sadao
- 雑誌名
  
  自然言語処理
  
  巻: 29 号: 2 ページ: 611-637
- DOI
  10.5715/jnlp.29.611
- ISSN
  1340-7619, 2185-8314
- 言語
  英語
- 査読あり / オープンアクセス
- データソース
  KAKENHI-PROJECT-21K17837
[雑誌論文] TriECCC: Trilingual Corpus of the Extraordinary Chambers in the Courts of Cambodia for Speech Recognition and Translation Studies2022
- 著者名/発表者名
  Soky Kak、Mimura Masato、Kawahara Tatsuya、Chu Chenhui、Li Sheng、Ding Chenchen、Sam Sethserey
- 雑誌名
  
  International Journal of Asian Language Processing
  
  巻: 31 号: 03n04 ページ: 1-21
- DOI
  10.1142/s2717554522500072
- 査読あり / オープンアクセス
- データソース
  KAKENHI-PROJECT-20H00602, KAKENHI-PROJECT-21K17837, KAKENHI-PROJECT-21H05054
[雑誌論文] Improving low-resource Tibetan end-to-end ASR by multilingual and multilevel unit modeling2022
- 著者名/発表者名
  Qin Siqing、Wang Longbiao、Li Sheng、Dang Jianwu、Pan Lixin
- 雑誌名
  
  EURASIP Journal on Audio, Speech, and Music Processing
  
  巻: 2022 号: 1 ページ: 1-10
- DOI
  10.1186/s13636-021-00233-4
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-20K11883, KAKENHI-PROJECT-21K17837
[雑誌論文] Adversarial Attack and Defense on Deep Neural Network-Based Voice Processing Systems: An Overview2021
- 著者名/発表者名
  Chen Xiaojiao、Li Sheng、Huang Hao
- 雑誌名
  
  Applied Sciences
  
  巻: 11 号: 18 ページ: 8450-8450
- DOI
  10.3390/app11188450
- 査読あり / オープンアクセス / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[雑誌論文] Knowledge Distillation-based Representation Learning for Short-Utterance Spoken Language Identification2020
- 著者名/発表者名
  P. Shen, X. Lu, S. Li, H. Kawai.
- 雑誌名
  
  IEEE/ACM Trans. Audio, Speech \& Language Process.
  
  巻: 28 ページ: 2674-2683
- DOI
  10.1109/taslp.2020.3023627
- 査読あり
- データソース
  KAKENHI-PROJECT-19K24376
[産業財産権] 推論器および推論器の学習方法2020
- 発明者名
  李勝、ルーシュガン、河井恒
- 権利者名
  国立研究開発法人情報通信研究機構
- 産業財産権種類
  特許
- 産業財産権番号
  2020-059962
- 出願年月日
  2020
- データソース
  KAKENHI-PROJECT-19K24376
[産業財産権] 推論器、推論プログラムおよび学習方法2019
- 発明者名
  李勝、ルーシュガン、丁塵辰、河原達也、河井恒
- 権利者名
  国立研究開発法人情報通信研究機構
- 産業財産権種類
  特許
- 産業財産権番号
  2019-163555
- 出願年月日
  2019
- データソース
  KAKENHI-PROJECT-19K24376
[産業財産権] 言語識別モデルの訓練方法及び装置、並びにそのためのコンピュータプログラム2019
- 発明者名
  沈鵬, ルーシュガン , 李勝 , 河井恒
- 権利者名
  国立研究開発法人情報通信研究機構
- 産業財産権種類
  特許
- 産業財産権番号
  2019-086005
- 出願年月日
  2019
- 取得年月日
  2020
- データソース
  KAKENHI-PROJECT-19K24376
[産業財産権] 推論器、学習方法および学習プログラム2019
- 発明者名
  李勝、ルーシュガン、ダブレラジ、河井恒
- 権利者名
  国立研究開発法人情報通信研究機構
- 産業財産権種類
  特許
- 産業財産権番号
  2019-051008
- 出願年月日
  2019
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] 大規模言語モデルを用いた英語学習者発話のCEFR-Jレベル推定2025
- 著者名/発表者名
  篠﨑隆宏，佐藤秋太朗，李勝
- 学会等名
  CEFR-J 2025 International Symposium
- 招待講演
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Similarity-based accent recognition with continuous and discrete self-supervised speech representations2025
- 著者名/発表者名
  Jun-You Wang, Sheng Li, Li-An Lu, Sydney Chia-Chun Kao, Jyh-Shing Roger Jang
- 学会等名
  in Proc. IEEE-ICASSP, pp. 1-5, 2025.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Domain-Aware Adaptation for Unsupervised Machine Translation2025
- 著者名/発表者名
  Youyuan Lin, Rui Wang, Chenhui Chu
- 学会等名
  言語処理学会第31回年次大会. pp.212-216
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Enhancing Multi-Step Reasoning in Language Models with Synthetic Math Data Augmentation (HP_Fighters team)2025
- 著者名/発表者名
  Jieqing Mei, Jiyi Li, Qianying Liu, Sheng Li
- 学会等名
  NLP2025 ワークショップ：大規模言語モデルのファインチューニング技術と評価
- 招待講演
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Extending Whisper for Emotion Prediction Using Word-level Pseudo Labels2025
- 著者名/発表者名
  Chin Yuen Kwok, Sheng Li, Jia Qi Yip, Chenhui Chu, Tatsuya Kawahara, Eng Siong Chng
- 学会等名
  in Proc. IEEE-ICASSP, pp. 1-5, 2025.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Cross-lingual Mapping for Hierarchical Softmax in Low-Resource Multilingual Speech Recognition2024
- 著者名/発表者名
  Zhengdong Yang, Qianying Liu, Sheng Li, Chenhui Chu, Fei Cheng, Sadao Kurohashi
- 学会等名
  日本音響学会第 150 回(2023 年秋季)研究発表会
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] MELD-ST: An Emotion-aware Speech Translation Dataset2024
- 著者名/発表者名
  Sirou Chen, Sakiko Yahata, Shuichiro Shimizu, Zhengdong Yang, Yihang Li, Chenhui Chu, Sadao Kurohashi
- 学会等名
  In Proceedings of the 62nd Annual Meeting of the Association for Computational Linguistics (ACL 2024): Findings Volume, pp.10118-10126
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Investigating Effective Methods for Combining Large Language Model with Speech Recognition System2024
- 著者名/発表者名
  Sheng Li, Zhengdong Yang, Wangjin Zhou, Chenhui Chu, Hisashi Kawai
- 学会等名
  日本音響学会第151回(2024年春季)研究発表会
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Data Selection using Spoken Language Identification for Low-Resource and Zero-Resource Speech Recognition2024
- 著者名/発表者名
  Jianan Chen, Chenhui Chu, Sheng Li, Tatsuya Kawahara
- 学会等名
  In Proceedings of the 16th Asia Pacific Signal and Information Processing Association Annual Summit and Conference
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] MOS-FAD: Improving Fake Audio Detection via Automatic Mean Opinion Score Prediction2024
- 著者名/発表者名
  Wangjin Zhou, Zhengdong Yang, Chenhui Chu, Sheng Li, Raj Dabre, Yi Zhao, Tatsuya Kawahara
- 学会等名
  In Proceedings of the 2024 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2024), pp.876-880
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Investigating effective methods for combining large language model with speech recognition system2024
- 著者名/発表者名
  李勝, 楊正東, 周汪勁, Chenhui Chu, 河井恒
- 学会等名
  日本音響学会第151回(2024年春季)研究発表会
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Combining Large Language Model with Speech Recognition System in Low-resource Settings2024
- 著者名/発表者名
  李勝, 楊正東, 周汪勁, Chenhui Chu, Chen Chen, Chng Eng Siong, 河井恒
- 学会等名
  言語処理学会第30回年次大会
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Data Selection using Spoken Language Identification for Low-Resource and Zero-Resource Speech Recognition2024
- 著者名/発表者名
  Jianan Chen, Chenhui Chu, Sheng Li, Tatsuya Kawahara
- 学会等名
  in Proc. APSIPA ASC, pp. 1--6, 2024.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] MOS-FAD: Improving Fake Audio Detection Via Automatic Mean Opinion Score Prediction2024
- 著者名/発表者名
  Wangjin Zhou, Zhengdong Yang, Chenhui Chu, Sheng Li, Raj Dabre, Yi Zhao, Tatsuya Kawahara
- 学会等名
  IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2024
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Automatic Post-Editing of Speech Recognition System Output Using Large Language Models2024
- 著者名/発表者名
  Sheng Li, Jiyi Li, Yang Cao
- 学会等名
  in Proc. International Conference on Database Systems for Advanced Applications (DASFAA) Workshop, pp. 178--186, 2024.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] LLM as decoder: Investigating Lattice-based Speech Recognition Hypotheses Rescoring Using LLM,2024
- 著者名/発表者名
  Sheng Li, Yuka Ko, Akinori Ito
- 学会等名
  in Proc. APSIPA ASC, pp. 1--5, 2024.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Low-resource Language Adaptation with Ensemble of PEFT Approaches2024
- 著者名/発表者名
  Chin Yuen Kwok, Sheng Li, Jia Qi Yip, Eng Siong Chng
- 学会等名
  in Proc. APSIPA ASC, pp. 1--6, 2024.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Investigating ASR Error Correction with Large Language Model and Multilingual 1-best Hypotheses2024
- 著者名/発表者名
  Sheng Li, Chen Chen, Kwok Yuen, Chenhui Chu, Eng Siong Chng, Hisashi Kawai
- 学会等名
  Interspeech 2024. pp.1315-1319
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Investigating ASR Error Correction with Large Language Model and Multilingual 1-best Hypotheses.2024
- 著者名/発表者名
  Sheng Li, Chen Chen, Chin Yuen Kwok, Chenhui Chu, Eng Siong Chng, Hisashi Kawai
- 学会等名
  in Proc. INTERSPEECH, pp. 1315--1319, 2024.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Combining Large Language Model with Speech Recognition System in Low-resource Settings2024
- 著者名/発表者名
  Sheng Li, Zhengdong Yang, Wangjin Zhou, Chenhui Chu, Chen Chen, Eng Siong Chng, Hisashi Kawai
- 学会等名
  言語処理学会第30回年次大会
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition2023
- 著者名/発表者名
  Qianying Liu, Zhuo Gong, Zhengdong Yang, Yuhang Yang, Sheng Li, Chenchen Ding, Nobuaki Minematsu, Hao Huang, Fei Cheng, Chenhui Chu, Sadao Kurohashi
- 学会等名
  In Proceedings of the 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] GhostVec: A New Threat to Speaker Privacy of End-to-End Speech Recognition System2023
- 著者名/発表者名
  Xiaojiao Chen, Sheng Li, Jiyi Li, Yang Cao, Hao Huang, Liang He
- 学会等名
  ACM Multimedia Asia
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Kyoto Speech-to-Speech Translation System for IWSLT 20232023
- 著者名/発表者名
  Zhengdong Yang, Shuichiro Shimizu, Zhou Wangjin, Sheng Li, Chenhui Chu
- 学会等名
  In Proceedings of the 20th International Conference on Spoken Language Translation (IWSLT 2023). pp.357-362
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Dialogue State Tracking with Sparse Local Slot Attention2023
- 著者名/発表者名
  Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki
- 学会等名
  ACL 2023 Workshop on NLP for Conversational AI
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] KyotoMOS: An Automatic MOS Scoring System for Speech Synthesis2023
- 著者名/発表者名
  Wangjin Zhou, Zhengdong Yang, Sheng Li, Chenhui Chu
- 学会等名
  ACM Multimedia Asia Workshops 2023
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Self-Supervised Learning MOS Prediction with Listener Enhancement2023
- 著者名/発表者名
  Sheng Li
- 学会等名
  VoiceMOS mini workshop
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Towards Speech Dialogue Translation Mediating Speakers of Different Languages2023
- 著者名/発表者名
  Shuichiro Shimizu, Chenhui Chu, Sheng Li, Sadao Kurohashi
- 学会等名
  In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023): Findings Volume. pp.1122-1134
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] Hierarchical Softmax for End-To-End Low-Resource Multilingual Speech Recognition2023
- 著者名/発表者名
  Qianying Liu Zhuo Gong Zhengdong Yang Yuhang Yang Sheng Li Chenchen Ding Nobuaki Minematsu Hao Huang Fei Cheng Chenhui Chu Sadao Kurohashi
- 学会等名
  2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Reprogramming Self-supervised Learning-based Speech Representations for Speaker Anonymization2023
- 著者名/発表者名
  Xiaojiao Chen, Sheng Li, Jiyi Li, Hao Huang, Yang Cao, Liang He
- 学会等名
  ACM Multimedia Asia
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Video-Helpful Multimodal Machine Translation2023
- 著者名/発表者名
  Yihang Li, Shuichiro Shimizu, Chenhui Chu, Sadao Kurohashi, Wei Li
- 学会等名
  In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023). pp.4281-4299
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] The Kyoto Speech-to-Speech Translation System for IWSLT 20232023
- 著者名/発表者名
  Zhengdong Yang, Shuichiro Shimizu, Wangjin Zhou, Sheng Li, Chenhui Chu
- 学会等名
  International Conference on Spoken Language Translation (IWSLT) 2023
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Multi-Domain Dialogue State Tracking with Disentangled Domain-Slot Attention2023
- 著者名/発表者名
  Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki
- 学会等名
  In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023): Findings
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Towards Speech Dialogue Translation Mediating Speakers of Different Languages2023
- 著者名/発表者名
  Shuichiro Shimizu, Chenhui Chu, Sheng Li, Sadao Kurohashi
- 学会等名
  In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023): Findings
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] GENERAL OR SPECIFIC? INVESTIGATING EFFECTIVE PRIVACY PROTECTION IN FEDERATED LEARNING FOR SPEECH EMOTION RECOGNITION2023
- 著者名/発表者名
  Chao Tan, Yang Cao, Sheng Li and Masatoshi Yoshikawa
- 学会等名
  ICASSP
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Domain and Language Adaptation Using Heterogeneous Datasets for Wav2vec2.0-based Speech Recognition of Low-resource Language2023
- 著者名/発表者名
  Kak Soky, Sheng Li, Chenhui Chu, Tatsuya Kawahara
- 学会等名
  In Proceedings of the 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] LE-SSL-MOS: Self-Supervised Learning MOS Prediction with Listener Enhancement2023
- 著者名/発表者名
  Zili Qi, Xinhui Hu, Wangjin Zhou, Sheng Li, Hao Wu, Jian Lu, Xinkang Xu
- 学会等名
  IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2023
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] FedCPC: An Effective Federated Contrastive Learning Method for Privacy Preserving Early-Stage Alzheimers Speech Detection2023
- 著者名/発表者名
  Wenqing Wei, Zhengdong Yang, Yuan Gao, Jiyi Li, Chenhui Chu, Shogo Okada, Sheng Li
- 学会等名
  IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2023
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] KyotoMOS: An Automatic MOS Scoring System for Speech Synthesis2023
- 著者名/発表者名
  Wangjin Zhou, Zhengdong Yang, Sheng Li, Chenhui Chu
- 学会等名
  In Proceedings of ACM Multimedia Asia Workshop of Multimodal, Multilingual and Multitask Modeling Technologies for Oriental Languages (M3Oriental)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K28144
[学会発表] DOMAIN AND LANGUAGE ADAPTATION USING HETEROGENEOUS DATASETS FOR WAV2VEC2.0-BASED SPEECH RECOGNITION OF LOW-RESOURCE LANGUAGE2023
- 著者名/発表者名
  Kak Soky, Sheng Li, Chenhui Chu, Tatsuya Kawahara
- 学会等名
  ICASSP
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Correction while Recognition: Combining Pretrained Language Model for Taiwan-Accented Speech Recognition2023
- 著者名/発表者名
  Sheng Li, Jiyi Li
- 学会等名
  Artificial Neural Networks and Machine Learning (ICANN) 2023
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-23K11227
[学会発表] Compressing Transformer-based ASR Model by Task-driven Loss and Attention-based Multi-level Feature Distillation2022
- 著者名/発表者名
  Y. Lv, L. Wang, M. Ge, S. Li, C. Ding, L. Pan, Y. Wang, J. Dang, K. Honda
- 学会等名
  in Proc. IEEE-ICASSP, pp. 7992--7996, 2022.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Leveraging Simultaneous Translation for Enhancing Transcription of Low-resource Language via Cross Attention Mechanism2022
- 著者名/発表者名
  Kak Soky, Sheng Li, Masato Mimura, Chenhui Chu, Tatsuya Kawahara
- 学会等名
  INTERSPEECH 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Mining Hard Samples Locally and Globally for Improved Speech Separation2022
- 著者名/発表者名
  K. Wang, Y. Peng, H. Huang, Y. Hu, and S. Li
- 学会等名
  in Proc. IEEE-ICASSP, pp. 6037--6041, 2022.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] The System Description for VoiceMOS Challenge 2022 (KK team, main/ood tasks)2022
- 著者名/発表者名
  S. Li, R. Dabre, R. Raphael, W. Zhou, Z. Yang, C. Chu, Y. Zhao
- 学会等名
  VoiceMOS Challenge 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Relationship Between Speakers' Physiological Structure and Acoustic Speech Signals: Data-Driven Study Based on Frequency-Wise Attentional Neural Network2022
- 著者名/発表者名
  Kai Li, Xugang Lu, Masato Akagi, Jianwu Dang, Sheng Li, Masashi Unoki
- 学会等名
  30th European Signal Processing Conference (EUSIPCO)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Augmented Adversarial Self-Supervised Learning for Early-Stage Alzheimer's Speech Detection2022
- 著者名/発表者名
  Longfei Yang, Wenqing Wei, Sheng Li, Jiyi Li, Takahiro Shinozaki
- 学会等名
  INTERSPEECH 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Subband-based Spectrogram Fusion for Speech Enhancement by Combining Mapping and Masking Approaches2022
- 著者名/発表者名
  Hao Shi, Longbiao Wang, Sheng Li, Jianwu Dang, Tatsuya Kawahara
- 学会等名
  Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Self-Adaptive Multilingual ASR Rescoring with Language Identification and Unified Language Model2022
- 著者名/発表者名
  Z. Gong, D. Saito, L. Yang, T. Shinozaki, S. Li, H. Kawai and N. Minematsu
- 学会等名
  ISCA-Odyssey (The Speaker and Language Recognition Workshop)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Adversarial Speech Generation and Natural Speech Recovery for Speech Content Protection2022
- 著者名/発表者名
  S. Li, J. Li, Q. Liu and Z. Gong
- 学会等名
  LREC (Language Resources and Evaluation Conference)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Can We Train a Language Model Inside an End-to-End ASR Model? - Investigating Effective Implicit Language Modeling2022
- 著者名/発表者名
  Zhuo Gong, Saito Daisuke, Sheng Li, Hisashi Kawai, Minematsu Nobuaki
- 学会等名
  Proceedings of the Second Workshop on When Creative AI Meets Conversational AI
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Nict-Tib1: A Public Speech Corpus Of Lhasa Dialect For Benchmarking Tibetan Language Speech Recognition Systems2022
- 著者名/発表者名
  Kak Soky, Zhuo Gong, Sheng Li
- 学会等名
  25th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques (O-COCOSDA)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Fusion of Self-supervised Learned Models for MOS Prediction2022
- 著者名/発表者名
  Zhengdong Yang, Wangjin Zhou, Chenhui Chu, Sheng Li, Raj Dabre, Raphael Rubino, Yi Zhao
- 学会等名
  INTERSPEECH 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Multi-Domain Dialogue State Tracking with Top-k Slot Self Attention2022
- 著者名/発表者名
  Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki
- 学会等名
  SIGdial Meeting Discourse \& Dialogue 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Monaural Speech Enhancement Based on Spectrogram Decomposition for Convolutional Neural Network-sensitive Feature Extraction2022
- 著者名/発表者名
  Hao Shi, Longbiao Wang, Sheng Li, Jianwu Dang, Tatsuya Kawahara
- 学会等名
  INTERSPEECH 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Data Augmentation Using McAdams-Coefficient-Based Speaker Anonymization for Fake Audio Detection2022
- 著者名/発表者名
  Kai Li, Sheng Li, Xugang Lu, Masato Akagi, Meng Liu, Lin Zhang, Chang Zeng, Longbiao Wang, Jianwu Dang, Masashi Unoki
- 学会等名
  INTERSPEECH 2022
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] An investigation of using hybrid modeling units for improving End-to-End speech recognition systems.2021
- 著者名/発表者名
  S. Chen, X. Hu, S. Li, X. Xu,
- 学会等名
  IEEE-ICASSP, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Adversarial Attack and Defense on Deep Neural Network-based Voice Processing Systems: An Overview2021
- 著者名/発表者名
  X. Chen, H. Huang, and S. Li
- 学会等名
  National Conference on Man-Machine Speech Communication (NCMMSC), 2021. (report is selected to publish in Applied Sciences, Special Issues of Machine Speech Communication)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Robust voice activity detection using a masked auditory encoder based convolutional neural network.2021
- 著者名/発表者名
  N. Li, L. Wang, M. Unoki, S. Li, R. Wang, M. Ge, J. Dang,
- 学会等名
  IEEE-ICASSP, 2021
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Speech Dereverberation Based on Scale-aware Mean Square Error Loss2021
- 著者名/発表者名
  L. Qiang, H. Shi, M. Ge, H. Yin, N. Li, L. Wang, S. Li and J. Dang
- 学会等名
  International Conference on Neural Information Processing (ICONIP2021), pp 55-63, Springer, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] System description of Alzheimer's disease early detection (Silk-road team, short speech track)2021
- 著者名/発表者名
  W. Wei, R. Wong, S. Li, Y. Guo and H. Huang
- 学会等名
  In special session of NCMMSC2021 (Alzheimer's disease detection challenge), 2021
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Spectrograms Fusion-based End-to-End Robust Automatic Speech Recognition2021
- 著者名/発表者名
  H. Shi, L. Wang, S. Li, C. Fan, J. Dang, and T. Kawahara
- 学会等名
  In Proc. APSIPA ASC, pp. 438--442, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Encoder-Decoder based pitch tracking and joint model training for Mandarin tone classification.2021
- 著者名/発表者名
  H. Huang, K. Wang, Y. Hu, S. Li,
- 学会等名
  IEEE-ICASSP, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Exploring Effective Speech Representation via ASR for High-Quality End-to-End Multispeaker TTS2021
- 著者名/発表者名
  D. Liu, L. Wang, S. Li, H. Li, C. Ding, J. Zhang and J. Dang
- 学会等名
  International Conference on Neural Information Processing (ICONIP2021), pp 110-118, Springer, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] The RoyalFlush-NICT System Description for AP21-OLR Challenge (Silk-road team, full tasks)2021
- 著者名/発表者名
  D. Wang, S. Ye, X. Hu, S. Li
- 学会等名
  OLR2021 (oriental language recognition challenge)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Multilingual Approach to Joint Speech and Accent Recognition with DNN-HMM Framework2021
- 著者名/発表者名
  Y. Peng, J. Zhang, H. Zhang, H. Xu, H. Huang, S. Li, and E.S. Chng
- 学会等名
  In Proc. APSIPA ASC, pp. 1043--1048, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] On the Use of Speaker Information for Automatic Speech Recognition in Speaker-imbalanced Corpora2021
- 著者名/発表者名
  K. Soky, S. Li, M. Mimura, C. Chu, and T. Kawahara
- 学会等名
  In Proc. APSIPA ASC, pp. 433--437, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] An End-to-End Dialect Identification System with Transfer Learning from a Multilingual Automatic Speech Recognition Model2021
- 著者名/発表者名
  D. Wang, S. Ye, X. Hu, S. Li, and X. Xu
- 学会等名
  in Proc. INTERSPEECH, pp. 3266--3270, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] End-to-End Speech Separation Using Orthogonal Representation in Complex and Real Time- Frequency Domain2021
- 著者名/発表者名
  K. Wang, H. Huang, Y. Hu, Z. Huang, and S. Li
- 学会等名
  in Proc. INTERSPEECH, pp. 3046--3050, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Simultaneous Progressive Filtering-based Monaural Speech Enhancement2021
- 著者名/発表者名
  H. Yin, L. Qiang, H. Shi, L. Wang, S. Li, M. Ge, G. Zhang and J. Dang
- 学会等名
  International Conference on Neural Information Processing (ICONIP2021), pp 213-221, Springer, 2021.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-21K17837
[学会発表] Comparison of End-to-End Models for Joint Speaker and Speech Recognition2021
- 著者名/発表者名
  K. Soky, S. Li, M. Mimura, C. Chu, T. Kawahara,
- 学会等名
  IEICE-SP, 2021.
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Improvement of x-vector for short utterance spoken language identification,2020
- 著者名/発表者名
  P. Shen, X. Lu, K. Sugiura, S. Li, H. Kawai,
- 学会等名
  Acoustical Society of Japan, spring, 2020.
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Spectrograms Fusion with Minimum Difference Masks Estimation for Monaural Speech Dereverberation.2020
- 著者名/発表者名
  H. Shi, L. Wang, M. Ge, S. Li, and J. Dang.
- 学会等名
  IEEE-ICASSP
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Effectively Synthesizing Code-switched Speech Using Highly Imbalanced Mix-lingual Data and mask embedding2020
- 著者名/発表者名
  S. Guo, L. Wang, S. Li, J. Zhang, C. Gong, Y. Wang, J. Dang, K. Honda
- 学会等名
  Interspeech 2020 Satellite Workshop (SLIMTS2020)
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Multilingual transformer training for Khmer automatic speech recognition2020
- 著者名/発表者名
  K. Soky, S. Li, T. Kawahara, S. Seng,
- 学会等名
  Interspeech 2020 Satellite Workshop (SLIMTS2020)
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] System Description for Voice Privacy Challenge (Kyoto Team).2020
- 著者名/発表者名
  Y. Han, S. Li, Y. Cao, M. Yoshikawa,
- 学会等名
  In special session of INTERSPEECH 2020 (VoicePrivacy challenge 2020).
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Staged Knowledge Distillation for End-to-End Dysarthric Speech Recognition and Speech Attribute Transcription2020
- 著者名/発表者名
  Y. Lin, L. Wang, S. Li, J. Dang, and C. Ding.
- 学会等名
  In Proc. INTERSPEECH, 2020 (Travel Granted by ISCA).
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Voice-Indistinguishability: Protecting Voiceprint in Privacy Preserving Speech Data Release.2020
- 著者名/発表者名
  Y. Han, S. Li, Y. Cao, Q. Ma and M. Yoshikawa.
- 学会等名
  IEEE-ICME
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Compensation on x-vector for short utterance spoken language identification.2020
- 著者名/発表者名
  P. Shen, X. Lu, K. Sugiura, S. Li and H. Kawai.
- 学会等名
  ISCA-Odyssey (The Speaker and Language Recognition Workshop)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] VOIS: The First Speech Therapy App in the World for Myanmar Hearing-Impaired Children.2020
- 著者名/発表者名
  A. Thida, N. Han, S. Oo, S. Li and C. Ding.
- 学会等名
  In Proc. O-COCOSDA, 2020.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] End-to-End Articulatory Attribute Modeling for Low-resource Multilingual Speech Recognition,2020
- 著者名/発表者名
  S. Li, C. Ding, X. Lu, P. Shen and H. Kawai,
- 学会等名
  Acoustical Society of Japan, spring, 2020.
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] End-to-End Speech Translation with Cross-lingual Transfer Learning2020
- 著者名/発表者名
  S. Shimizu, C. Chu, S. Li, S. Kurohashi,
- 学会等名
  NLP, 2021.
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Effectively Synthesizing Code-switched Speech Using Highly Imbalanced Mix-lingual Data2020
- 著者名/発表者名
  S. Guo, L. Wang, S. Li, J. Zhang, C. Gong, Y. Wang, J. Dang, K. Honda.
- 学会等名
  In Proc. ICONIP, 2020.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Singing Voice Extraction with Attention based Spectrograms Fusion.2020
- 著者名/発表者名
  H. Shi, L. Wang, S. Li, C. Ding, M. Ge, N. Li, J. Dang, and H. Seki.
- 学会等名
  In Proc. INTERSPEECH, 2020 (Travel Granted by ISCA).
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Voice-Indistinguishability: Protecting Voiceprint with Differential Privacy under an Untrusted Server.2020
- 著者名/発表者名
  Y. Han, Y. Cao, S. Li, Q. Ma, M. Yoshikawa.
- 学会等名
  ACM conference on Computer and Communications Security (CCS), demo, 2020.
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Joint Training End-to-End Speech Recognition Systems with Speaker Attributes.2020
- 著者名/発表者名
  S. Li, X. Lu, R. Dabre, P. Shen and H. Kawai
- 学会等名
  ISCA-Odyssey (The Speaker and Language Recognition Workshop)
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] A Mixture of Character and Word End-to-End System for Keyword Spotting2020
- 著者名/発表者名
  H. Zhang, S. Ueno, M. Mimura, S. Li, W. Zhang, T. Kawahara,
- 学会等名
  Interspeech 2020 Satellite Workshop (SLIMTS2020)(full paper).
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Voice-Indistinguishability: Protecting Voiceprint in Privacy-Preserving Speech Data Release,2020
- 著者名/発表者名
  Y. Han, Y. Cao, S. Li, Q. Ma, M. Yoshikawa.
- 学会等名
  Interspeech 2020 Satellite Workshop (SLIMTS2020) (invited report).
- 招待講演 / 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Phantom in the Opera: Effective Adversarial Music Attack on Keyword Spotting Systems.2020
- 著者名/発表者名
  H. Zhang, S. Li, X. Ma, Y. Zhao, Y. Cao, T. Kawahara,
- 学会等名
  IEEE-SLT, 2021
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] Joint Training End-to-End Systems for Speech and Speaker Recognition with Speaker Attributes,2020
- 著者名/発表者名
  S. Li, X. Lu, R. Dabre, P. Shen and H. Kawai,
- 学会等名
  Acoustical Society of Japan, spring, 2020.
- データソース
  KAKENHI-PROJECT-19K24376
[学会発表] End-To-End Articulatory Modeling for Dysarthria Articulatory Attribute Detection.2020
- 著者名/発表者名
  Y. Lin, L. Wang, J. Dang, S. Li, and C. Ding.
- 学会等名
  IEEE-ICASSP
- 国際共著/国際学会である
- データソース
  KAKENHI-PROJECT-19K24376

1. チョシンキ (70784891)

共同の研究課題数: 2件

共同の研究成果数: 28件
2. 李吉屹 (30726667)

共同の研究課題数: 1件

共同の研究成果数: 30件
3. 党建武

共同の研究課題数: 0件

共同の研究成果数: 1件
4. 河原達也

共同の研究課題数: 0件

共同の研究成果数: 1件

李 勝 Li Sheng

研究課題

研究成果

共同研究者

意図を的確に伝える音声対話翻訳の基盤技術の創出

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

M3OLR: Towards Effective Multilingual, Multimodal and Multitask Oriental Low-resourced Language Speech Recognition研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

Phantom in the Opera: the Vulnerabilities of Speech Interface for Robotic Dialogue System研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

Next generation multilingual End-to-End speech recognition (from G30 to G200)研究代表者

研究代表者

研究期間 (年度)

研究種目

審査区分

研究機関

[図書] Phantom in the Opera: The Vulnerabilities of Speech-based Artificial Intelligence Systems2022

著者名/発表者名

総ページ数

出版者

ISBN

データソース

[図書] Voices of the Himalayas: Investigation of Speech Recognition Technology for the Tibetan Language2022

著者名/発表者名

総ページ数

出版者

ISBN

データソース

[図書] Automatic speech recognition2020

著者名/発表者名

総ページ数

出版者

ISBN

データソース

[雑誌論文] Addressing Domain Mismatch in Unsupervised Neural Machine Translation2025

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Robust voice activity detection using an auditory-inspired masked modulation encoder based convolutional attention network2024

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Phantom in the opera: adversarial music attack for robot dialogue system2024

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] End-to-end Japanese-English Speech-to-text Translation with Spoken-to-Written Style Conversion2024

著者名/発表者名

雑誌名

DOI

ISSN

言語

データソース

[雑誌論文] Voices of the Himalayas: Benchmarking Speech Recognition Systems for the Tibetan Language2024

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Disordered speech recognition considering low resources and abnormal articulation2023

著者名/発表者名

雑誌名

DOI

データソース

[雑誌論文] Finetuning Pretrained Model with Embedding of Domain and Language Information for ASR of Very Low-Resource Settings2023

著者名/発表者名

李勝 Li Sheng