• 研究課題をさがす
  • 研究者をさがす
  • KAKENの使い方
  1. 前のページに戻る

李 勝  Li Sheng

研究者番号 70840940
その他のID
  • ORCIDhttps://orcid.org/0000-0001-7636-3797
所属 (現在) 2025年度: 東京科学大学, 工学院, 助教
所属 (過去の研究課題情報に基づく) *注記 2021年度 – 2024年度: 国立研究開発法人情報通信研究機構, ユニバーサルコミュニケーション研究所先進的音声翻訳研究開発推進センター, 研究員
2020年度: 国立研究開発法人情報通信研究機構, 先進的音声翻訳研究開発推進センター 先進的音声技術研究室, 研究員
2019年度: 国立研究開発法人情報通信研究機構, 先進的音声翻訳研究開発推進センター先進的音声技術研究室, 研究員
審査区分/研究分野
研究代表者
小区分61030:知能情報学関連 / 小区分61050:知能ロボティクス関連 / 1002:人間情報学、応用情報学およびその関連分野
研究代表者以外
合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連 / 小区分60030:統計科学関連 / 小区分61030:知能情報学関連
キーワード
研究代表者
speech recognition / quality estimation / federated learning / Low-resource / Multilingual / Multimodal / Multitask / Deep neural network / Adversarial attack / Dialogue robotic system … もっと見る / Speech recognition / speech enhancement / adversarial attacks / spoken dialogue system / privacy preserving / security / spoken dialogue / deepfake detection / privacy perserving / adversarial attack / speaker diarization / end-to-end / code-switched / disordered speech / language identification / multi-unit modeling / speech translation / low-resourced modeling / multilingual modeling / End-to-End / articulation / multilingual … もっと見る
研究代表者以外
メタ介入 / 音声翻訳 / 感情音声認識 / 多言語対話 / 意図理解 / 音声対話翻訳 隠す
  • 研究課題

    (4件)
  • 研究成果

    (92件)
  • 共同研究者

    (4人)
  •  意図を的確に伝える音声対話翻訳の基盤技術の創出

    • 研究代表者
      チョ シンキ
    • 研究期間 (年度)
      2023 – 2026
    • 研究種目
      基盤研究(B)
    • 審査区分
      小区分61030:知能情報学関連
      小区分60030:統計科学関連
      合同審査対象区分:小区分60030:統計科学関連、小区分61030:知能情報学関連
    • 研究機関
      京都大学
  •  M3OLR: Towards Effective Multilingual, Multimodal and Multitask Oriental Low-resourced Language Speech Recognition研究代表者

    • 研究代表者
      李 勝
    • 研究期間 (年度)
      2023 – 2025
    • 研究種目
      基盤研究(C)
    • 審査区分
      小区分61030:知能情報学関連
    • 研究機関
      国立研究開発法人情報通信研究機構
  •  Phantom in the Opera: the Vulnerabilities of Speech Interface for Robotic Dialogue System研究代表者

    • 研究代表者
      李 勝
    • 研究期間 (年度)
      2021 – 2022
    • 研究種目
      若手研究
    • 審査区分
      小区分61050:知能ロボティクス関連
    • 研究機関
      国立研究開発法人情報通信研究機構
  •  Next generation multilingual End-to-End speech recognition (from G30 to G200)研究代表者

    • 研究代表者
      李 勝
    • 研究期間 (年度)
      2019 – 2020
    • 研究種目
      研究活動スタート支援
    • 審査区分
      1002:人間情報学、応用情報学およびその関連分野
    • 研究機関
      国立研究開発法人情報通信研究機構

すべて 2024 2023 2022 2021 2020 2019

すべて 雑誌論文 学会発表 図書 産業財産権

  • [図書] Phantom in the Opera: The Vulnerabilities of Speech-based Artificial Intelligence Systems2022

    • 著者名/発表者名
      Sheng Li
    • 総ページ数
      110
    • 出版者
      NICT
    • ISBN
      9784904020265
    • データソース
      KAKENHI-PROJECT-21K17837
  • [図書] Voices of the Himalayas: Investigation of Speech Recognition Technology for the Tibetan Language2022

    • 著者名/発表者名
      Sheng Li
    • 総ページ数
      112
    • 出版者
      NICT
    • ISBN
      9784904020289
    • データソース
      KAKENHI-PROJECT-21K17837
  • [図書] Automatic speech recognition2020

    • 著者名/発表者名
      X. Lu, S. Li, M. Fujimoto
    • 総ページ数
      18
    • 出版者
      Springer Singapore
    • ISBN
      9789811505959
    • データソース
      KAKENHI-PROJECT-19K24376
  • [雑誌論文] Robust voice activity detection using an auditory-inspired masked modulation encoder based convolutional attention network2024

    • 著者名/発表者名
      Li Nan、Wang Longbiao、Ge Meng、Unoki Masashi、Li Sheng、Dang Jianwu
    • 雑誌名

      Speech Communication

      巻: 157 ページ: 103024-103024

    • DOI

      10.1016/j.specom.2023.103024

    • 査読あり / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [雑誌論文] Phantom in the opera: adversarial music attack for robot dialogue system2024

    • 著者名/発表者名
      Li Sheng、Li Jiyi、Cao Yang
    • 雑誌名

      Frontiers in Computer Science, 15 February 2024

      巻: 6 ページ: 1-9

    • DOI

      10.3389/fcomp.2024.1355975

    • 査読あり / オープンアクセス
    • データソース
      KAKENHI-PROJECT-23K11227
  • [雑誌論文] Disordered speech recognition considering low resources and abnormal articulation2023

    • 著者名/発表者名
      Lin Yuqin、Dang Jianwu、Wang Longbiao、Li Sheng、Ding Chenchen
    • 雑誌名

      Speech Communication

      巻: 155 ページ: 103002-103002

    • DOI

      10.1016/j.specom.2023.103002

    • 査読あり / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [雑誌論文] Finetuning Pretrained Model with Embedding of Domain and Language Information for ASR of Very Low-Resource Settings2023

    • 著者名/発表者名
      Soky Kak、Li Sheng、Chu Chenhui、Kawahara Tatsuya
    • 雑誌名

      International Journal of Asian Language Processing

      巻: 33 号: 04 ページ: 2350024-2350024

    • DOI

      10.1142/s2717554523500248

    • 査読あり
    • データソース
      KAKENHI-PROJECT-23K11227, KAKENHI-PROJECT-23K28144
  • [雑誌論文] Cross-Lingual Transfer Learning for End-to-End Speech Translation2022

    • 著者名/発表者名
      Shimizu Shuichiro、Chu Chenhui、Li Sheng、Kurohashi Sadao
    • 雑誌名

      自然言語処理

      巻: 29 号: 2 ページ: 611-637

    • DOI

      10.5715/jnlp.29.611

    • ISSN
      1340-7619, 2185-8314
    • 言語
      英語
    • 査読あり / オープンアクセス
    • データソース
      KAKENHI-PROJECT-21K17837
  • [雑誌論文] TriECCC: Trilingual Corpus of the Extraordinary Chambers in the Courts of Cambodia for Speech Recognition and Translation Studies2022

    • 著者名/発表者名
      Soky Kak、Mimura Masato、Kawahara Tatsuya、Chu Chenhui、Li Sheng、Ding Chenchen、Sam Sethserey
    • 雑誌名

      International Journal of Asian Language Processing

      巻: 31 号: 03n04 ページ: 1-21

    • DOI

      10.1142/s2717554522500072

    • 査読あり / オープンアクセス
    • データソース
      KAKENHI-PROJECT-20H00602, KAKENHI-PROJECT-21K17837, KAKENHI-PROJECT-21H05054
  • [雑誌論文] Improving low-resource Tibetan end-to-end ASR by multilingual and multilevel unit modeling2022

    • 著者名/発表者名
      Qin Siqing、Wang Longbiao、Li Sheng、Dang Jianwu、Pan Lixin
    • 雑誌名

      EURASIP Journal on Audio, Speech, and Music Processing

      巻: 2022 号: 1 ページ: 1-10

    • DOI

      10.1186/s13636-021-00233-4

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-20K11883, KAKENHI-PROJECT-21K17837
  • [雑誌論文] Adversarial Attack and Defense on Deep Neural Network-Based Voice Processing Systems: An Overview2021

    • 著者名/発表者名
      Chen Xiaojiao、Li Sheng、Huang Hao
    • 雑誌名

      Applied Sciences

      巻: 11 号: 18 ページ: 8450-8450

    • DOI

      10.3390/app11188450

    • 査読あり / オープンアクセス / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [雑誌論文] Knowledge Distillation-based Representation Learning for Short-Utterance Spoken Language Identification2020

    • 著者名/発表者名
      P. Shen, X. Lu, S. Li, H. Kawai.
    • 雑誌名

      IEEE/ACM Trans. Audio, Speech \& Language Process.

      巻: 28 ページ: 2674-2683

    • DOI

      10.1109/taslp.2020.3023627

    • 査読あり
    • データソース
      KAKENHI-PROJECT-19K24376
  • [産業財産権] 推論器および推論器の学習方法2020

    • 発明者名
      李勝、ルーシュガン、河井恒
    • 権利者名
      国立研究開発法人情報通信研究機構
    • 産業財産権種類
      特許
    • 産業財産権番号
      2020-059962
    • 出願年月日
      2020
    • データソース
      KAKENHI-PROJECT-19K24376
  • [産業財産権] 推論器、推論プログラムおよび学習方法2019

    • 発明者名
      李勝、 ルーシュガン、 丁塵辰、 河原達也、 河井恒
    • 権利者名
      国立研究開発法人情報通信研究機構
    • 産業財産権種類
      特許
    • 産業財産権番号
      2019-163555
    • 出願年月日
      2019
    • データソース
      KAKENHI-PROJECT-19K24376
  • [産業財産権] 言語識別モデルの訓練方法及び装置、並びにそのためのコンピュータプログラム2019

    • 発明者名
      沈 鵬, ルー シュガン , 李 勝 , 河井 恒
    • 権利者名
      国立研究開発法人情報通信研究機構
    • 産業財産権種類
      特許
    • 産業財産権番号
      2019-086005
    • 出願年月日
      2019
    • 取得年月日
      2020
    • データソース
      KAKENHI-PROJECT-19K24376
  • [産業財産権] 推論器、学習方法および学習プログラム2019

    • 発明者名
      李勝、 ルーシュガン、 ダブレラジ、 河井恒
    • 権利者名
      国立研究開発法人情報通信研究機構
    • 産業財産権種類
      特許
    • 産業財産権番号
      2019-051008
    • 出願年月日
      2019
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Cross-lingual Mapping for Hierarchical Softmax in Low-Resource Multilingual Speech Recognition2024

    • 著者名/発表者名
      Zhengdong Yang, Qianying Liu, Sheng Li, Chenhui Chu, Fei Cheng, Sadao Kurohashi
    • 学会等名
      日本音響学会第 150 回(2023 年秋季)研究発表会
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Investigating Effective Methods for Combining Large Language Model with Speech Recognition System2024

    • 著者名/発表者名
      Sheng Li, Zhengdong Yang, Wangjin Zhou, Chenhui Chu, Hisashi Kawai
    • 学会等名
      日本音響学会第151回(2024年春季)研究発表会
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] Investigating effective methods for combining large language model with speech recognition system2024

    • 著者名/発表者名
      李 勝, 楊 正東, 周 汪勁, Chenhui Chu, 河井 恒
    • 学会等名
      日本音響学会第151回(2024年春季)研究発表会
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Combining Large Language Model with Speech Recognition System in Low-resource Settings2024

    • 著者名/発表者名
      李 勝, 楊 正東, 周 汪勁, Chenhui Chu, Chen Chen, Chng Eng Siong, 河井 恒
    • 学会等名
      言語処理学会第30回年次大会
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] MOS-FAD: Improving Fake Audio Detection Via Automatic Mean Opinion Score Prediction2024

    • 著者名/発表者名
      Wangjin Zhou, Zhengdong Yang, Chenhui Chu, Sheng Li, Raj Dabre, Yi Zhao, Tatsuya Kawahara
    • 学会等名
      IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP) 2024
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Combining Large Language Model with Speech Recognition System in Low-resource Settings2024

    • 著者名/発表者名
      Sheng Li, Zhengdong Yang, Wangjin Zhou, Chenhui Chu, Chen Chen, Eng Siong Chng, Hisashi Kawai
    • 学会等名
      言語処理学会 第30回年次大会
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] Hierarchical Softmax for End-to-End Low-resource Multilingual Speech Recognition2023

    • 著者名/発表者名
      Qianying Liu, Zhuo Gong, Zhengdong Yang, Yuhang Yang, Sheng Li, Chenchen Ding, Nobuaki Minematsu, Hao Huang, Fei Cheng, Chenhui Chu, Sadao Kurohashi
    • 学会等名
      In Proceedings of the 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] GhostVec: A New Threat to Speaker Privacy of End-to-End Speech Recognition System2023

    • 著者名/発表者名
      Xiaojiao Chen, Sheng Li, Jiyi Li, Yang Cao, Hao Huang, Liang He
    • 学会等名
      ACM Multimedia Asia
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Kyoto Speech-to-Speech Translation System for IWSLT 20232023

    • 著者名/発表者名
      Zhengdong Yang, Shuichiro Shimizu, Zhou Wangjin, Sheng Li, Chenhui Chu
    • 学会等名
      In Proceedings of the 20th International Conference on Spoken Language Translation (IWSLT 2023). pp.357-362
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] Dialogue State Tracking with Sparse Local Slot Attention2023

    • 著者名/発表者名
      Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki
    • 学会等名
      ACL 2023 Workshop on NLP for Conversational AI
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] KyotoMOS: An Automatic MOS Scoring System for Speech Synthesis2023

    • 著者名/発表者名
      Wangjin Zhou, Zhengdong Yang, Sheng Li, Chenhui Chu
    • 学会等名
      ACM Multimedia Asia Workshops 2023
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Self-Supervised Learning MOS Prediction with Listener Enhancement2023

    • 著者名/発表者名
      Sheng Li
    • 学会等名
      VoiceMOS mini workshop
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Towards Speech Dialogue Translation Mediating Speakers of Different Languages2023

    • 著者名/発表者名
      Shuichiro Shimizu, Chenhui Chu, Sheng Li, Sadao Kurohashi
    • 学会等名
      In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023): Findings Volume. pp.1122-1134
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] Hierarchical Softmax for End-To-End Low-Resource Multilingual Speech Recognition2023

    • 著者名/発表者名
      Qianying Liu Zhuo Gong Zhengdong Yang Yuhang Yang Sheng Li Chenchen Ding Nobuaki Minematsu Hao Huang Fei Cheng Chenhui Chu Sadao Kurohashi
    • 学会等名
      2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Reprogramming Self-supervised Learning-based Speech Representations for Speaker Anonymization2023

    • 著者名/発表者名
      Xiaojiao Chen, Sheng Li, Jiyi Li, Hao Huang, Yang Cao, Liang He
    • 学会等名
      ACM Multimedia Asia
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Video-Helpful Multimodal Machine Translation2023

    • 著者名/発表者名
      Yihang Li, Shuichiro Shimizu, Chenhui Chu, Sadao Kurohashi, Wei Li
    • 学会等名
      In Proceedings of the 2023 Conference on Empirical Methods in Natural Language Processing (EMNLP 2023). pp.4281-4299
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] The Kyoto Speech-to-Speech Translation System for IWSLT 20232023

    • 著者名/発表者名
      Zhengdong Yang, Shuichiro Shimizu, Wangjin Zhou, Sheng Li, Chenhui Chu
    • 学会等名
      International Conference on Spoken Language Translation (IWSLT) 2023
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Multi-Domain Dialogue State Tracking with Disentangled Domain-Slot Attention2023

    • 著者名/発表者名
      Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki
    • 学会等名
      In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023): Findings
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Towards Speech Dialogue Translation Mediating Speakers of Different Languages2023

    • 著者名/発表者名
      Shuichiro Shimizu, Chenhui Chu, Sheng Li, Sadao Kurohashi
    • 学会等名
      In Proceedings of the 61st Annual Meeting of the Association for Computational Linguistics (ACL 2023): Findings
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] GENERAL OR SPECIFIC? INVESTIGATING EFFECTIVE PRIVACY PROTECTION IN FEDERATED LEARNING FOR SPEECH EMOTION RECOGNITION2023

    • 著者名/発表者名
      Chao Tan, Yang Cao, Sheng Li and Masatoshi Yoshikawa
    • 学会等名
      ICASSP
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Domain and Language Adaptation Using Heterogeneous Datasets for Wav2vec2.0-based Speech Recognition of Low-resource Language2023

    • 著者名/発表者名
      Kak Soky, Sheng Li, Chenhui Chu, Tatsuya Kawahara
    • 学会等名
      In Proceedings of the 2023 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP 2023)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] LE-SSL-MOS: Self-Supervised Learning MOS Prediction with Listener Enhancement2023

    • 著者名/発表者名
      Zili Qi, Xinhui Hu, Wangjin Zhou, Sheng Li, Hao Wu, Jian Lu, Xinkang Xu
    • 学会等名
      IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2023
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] FedCPC: An Effective Federated Contrastive Learning Method for Privacy Preserving Early-Stage Alzheimers Speech Detection2023

    • 著者名/発表者名
      Wenqing Wei, Zhengdong Yang, Yuan Gao, Jiyi Li, Chenhui Chu, Shogo Okada, Sheng Li
    • 学会等名
      IEEE Automatic Speech Recognition and Understanding Workshop (ASRU) 2023
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] KyotoMOS: An Automatic MOS Scoring System for Speech Synthesis2023

    • 著者名/発表者名
      Wangjin Zhou, Zhengdong Yang, Sheng Li, Chenhui Chu
    • 学会等名
      In Proceedings of ACM Multimedia Asia Workshop of Multimodal, Multilingual and Multitask Modeling Technologies for Oriental Languages (M3Oriental)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K28144
  • [学会発表] DOMAIN AND LANGUAGE ADAPTATION USING HETEROGENEOUS DATASETS FOR WAV2VEC2.0-BASED SPEECH RECOGNITION OF LOW-RESOURCE LANGUAGE2023

    • 著者名/発表者名
      Kak Soky, Sheng Li, Chenhui Chu, Tatsuya Kawahara
    • 学会等名
      ICASSP
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Correction while Recognition: Combining Pretrained Language Model for Taiwan-Accented Speech Recognition2023

    • 著者名/発表者名
      Sheng Li, Jiyi Li
    • 学会等名
      Artificial Neural Networks and Machine Learning (ICANN) 2023
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-23K11227
  • [学会発表] Compressing Transformer-based ASR Model by Task-driven Loss and Attention-based Multi-level Feature Distillation2022

    • 著者名/発表者名
      Y. Lv, L. Wang, M. Ge, S. Li, C. Ding, L. Pan, Y. Wang, J. Dang, K. Honda
    • 学会等名
      in Proc. IEEE-ICASSP, pp. 7992--7996, 2022.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Leveraging Simultaneous Translation for Enhancing Transcription of Low-resource Language via Cross Attention Mechanism2022

    • 著者名/発表者名
      Kak Soky, Sheng Li, Masato Mimura, Chenhui Chu, Tatsuya Kawahara
    • 学会等名
      INTERSPEECH 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Mining Hard Samples Locally and Globally for Improved Speech Separation2022

    • 著者名/発表者名
      K. Wang, Y. Peng, H. Huang, Y. Hu, and S. Li
    • 学会等名
      in Proc. IEEE-ICASSP, pp. 6037--6041, 2022.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] The System Description for VoiceMOS Challenge 2022 (KK team, main/ood tasks)2022

    • 著者名/発表者名
      S. Li, R. Dabre, R. Raphael, W. Zhou, Z. Yang, C. Chu, Y. Zhao
    • 学会等名
      VoiceMOS Challenge 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Relationship Between Speakers' Physiological Structure and Acoustic Speech Signals: Data-Driven Study Based on Frequency-Wise Attentional Neural Network2022

    • 著者名/発表者名
      Kai Li, Xugang Lu, Masato Akagi, Jianwu Dang, Sheng Li, Masashi Unoki
    • 学会等名
      30th European Signal Processing Conference (EUSIPCO)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Augmented Adversarial Self-Supervised Learning for Early-Stage Alzheimer's Speech Detection2022

    • 著者名/発表者名
      Longfei Yang, Wenqing Wei, Sheng Li, Jiyi Li, Takahiro Shinozaki
    • 学会等名
      INTERSPEECH 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Subband-based Spectrogram Fusion for Speech Enhancement by Combining Mapping and Masking Approaches2022

    • 著者名/発表者名
      Hao Shi, Longbiao Wang, Sheng Li, Jianwu Dang, Tatsuya Kawahara
    • 学会等名
      Asia-Pacific Signal and Information Processing Association Annual Summit and Conference (APSIPA ASC)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Self-Adaptive Multilingual ASR Rescoring with Language Identification and Unified Language Model2022

    • 著者名/発表者名
      Z. Gong, D. Saito, L. Yang, T. Shinozaki, S. Li, H. Kawai and N. Minematsu
    • 学会等名
      ISCA-Odyssey (The Speaker and Language Recognition Workshop)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Adversarial Speech Generation and Natural Speech Recovery for Speech Content Protection2022

    • 著者名/発表者名
      S. Li, J. Li, Q. Liu and Z. Gong
    • 学会等名
      LREC (Language Resources and Evaluation Conference)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Can We Train a Language Model Inside an End-to-End ASR Model? - Investigating Effective Implicit Language Modeling2022

    • 著者名/発表者名
      Zhuo Gong, Saito Daisuke, Sheng Li, Hisashi Kawai, Minematsu Nobuaki
    • 学会等名
      Proceedings of the Second Workshop on When Creative AI Meets Conversational AI
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Nict-Tib1: A Public Speech Corpus Of Lhasa Dialect For Benchmarking Tibetan Language Speech Recognition Systems2022

    • 著者名/発表者名
      Kak Soky, Zhuo Gong, Sheng Li
    • 学会等名
      25th Conference of the Oriental COCOSDA International Committee for the Co-ordination and Standardisation of Speech Databases and Assessment Techniques (O-COCOSDA)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Fusion of Self-supervised Learned Models for MOS Prediction2022

    • 著者名/発表者名
      Zhengdong Yang, Wangjin Zhou, Chenhui Chu, Sheng Li, Raj Dabre, Raphael Rubino, Yi Zhao
    • 学会等名
      INTERSPEECH 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Multi-Domain Dialogue State Tracking with Top-k Slot Self Attention2022

    • 著者名/発表者名
      Longfei Yang, Jiyi Li, Sheng Li, Takahiro Shinozaki
    • 学会等名
      SIGdial Meeting Discourse \& Dialogue 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Monaural Speech Enhancement Based on Spectrogram Decomposition for Convolutional Neural Network-sensitive Feature Extraction2022

    • 著者名/発表者名
      Hao Shi, Longbiao Wang, Sheng Li, Jianwu Dang, Tatsuya Kawahara
    • 学会等名
      INTERSPEECH 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Data Augmentation Using McAdams-Coefficient-Based Speaker Anonymization for Fake Audio Detection2022

    • 著者名/発表者名
      Kai Li, Sheng Li, Xugang Lu, Masato Akagi, Meng Liu, Lin Zhang, Chang Zeng, Longbiao Wang, Jianwu Dang, Masashi Unoki
    • 学会等名
      INTERSPEECH 2022
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] An investigation of using hybrid modeling units for improving End-to-End speech recognition systems.2021

    • 著者名/発表者名
      S. Chen, X. Hu, S. Li, X. Xu,
    • 学会等名
      IEEE-ICASSP, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Adversarial Attack and Defense on Deep Neural Network-based Voice Processing Systems: An Overview2021

    • 著者名/発表者名
      X. Chen, H. Huang, and S. Li
    • 学会等名
      National Conference on Man-Machine Speech Communication (NCMMSC), 2021. (report is selected to publish in Applied Sciences, Special Issues of Machine Speech Communication)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Robust voice activity detection using a masked auditory encoder based convolutional neural network.2021

    • 著者名/発表者名
      N. Li, L. Wang, M. Unoki, S. Li, R. Wang, M. Ge, J. Dang,
    • 学会等名
      IEEE-ICASSP, 2021
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Speech Dereverberation Based on Scale-aware Mean Square Error Loss2021

    • 著者名/発表者名
      L. Qiang, H. Shi, M. Ge, H. Yin, N. Li, L. Wang, S. Li and J. Dang
    • 学会等名
      International Conference on Neural Information Processing (ICONIP2021), pp 55-63, Springer, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] System description of Alzheimer's disease early detection (Silk-road team, short speech track)2021

    • 著者名/発表者名
      W. Wei, R. Wong, S. Li, Y. Guo and H. Huang
    • 学会等名
      In special session of NCMMSC2021 (Alzheimer's disease detection challenge), 2021
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Spectrograms Fusion-based End-to-End Robust Automatic Speech Recognition2021

    • 著者名/発表者名
      H. Shi, L. Wang, S. Li, C. Fan, J. Dang, and T. Kawahara
    • 学会等名
      In Proc. APSIPA ASC, pp. 438--442, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Encoder-Decoder based pitch tracking and joint model training for Mandarin tone classification.2021

    • 著者名/発表者名
      H. Huang, K. Wang, Y. Hu, S. Li,
    • 学会等名
      IEEE-ICASSP, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Exploring Effective Speech Representation via ASR for High-Quality End-to-End Multispeaker TTS2021

    • 著者名/発表者名
      D. Liu, L. Wang, S. Li, H. Li, C. Ding, J. Zhang and J. Dang
    • 学会等名
      International Conference on Neural Information Processing (ICONIP2021), pp 110-118, Springer, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] The RoyalFlush-NICT System Description for AP21-OLR Challenge (Silk-road team, full tasks)2021

    • 著者名/発表者名
      D. Wang, S. Ye, X. Hu, S. Li
    • 学会等名
      OLR2021 (oriental language recognition challenge)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Multilingual Approach to Joint Speech and Accent Recognition with DNN-HMM Framework2021

    • 著者名/発表者名
      Y. Peng, J. Zhang, H. Zhang, H. Xu, H. Huang, S. Li, and E.S. Chng
    • 学会等名
      In Proc. APSIPA ASC, pp. 1043--1048, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] On the Use of Speaker Information for Automatic Speech Recognition in Speaker-imbalanced Corpora2021

    • 著者名/発表者名
      K. Soky, S. Li, M. Mimura, C. Chu, and T. Kawahara
    • 学会等名
      In Proc. APSIPA ASC, pp. 433--437, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] An End-to-End Dialect Identification System with Transfer Learning from a Multilingual Automatic Speech Recognition Model2021

    • 著者名/発表者名
      D. Wang, S. Ye, X. Hu, S. Li, and X. Xu
    • 学会等名
      in Proc. INTERSPEECH, pp. 3266--3270, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] End-to-End Speech Separation Using Orthogonal Representation in Complex and Real Time- Frequency Domain2021

    • 著者名/発表者名
      K. Wang, H. Huang, Y. Hu, Z. Huang, and S. Li
    • 学会等名
      in Proc. INTERSPEECH, pp. 3046--3050, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Simultaneous Progressive Filtering-based Monaural Speech Enhancement2021

    • 著者名/発表者名
      H. Yin, L. Qiang, H. Shi, L. Wang, S. Li, M. Ge, G. Zhang and J. Dang
    • 学会等名
      International Conference on Neural Information Processing (ICONIP2021), pp 213-221, Springer, 2021.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-21K17837
  • [学会発表] Comparison of End-to-End Models for Joint Speaker and Speech Recognition2021

    • 著者名/発表者名
      K. Soky, S. Li, M. Mimura, C. Chu, T. Kawahara,
    • 学会等名
      IEICE-SP, 2021.
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Improvement of x-vector for short utterance spoken language identification,2020

    • 著者名/発表者名
      P. Shen, X. Lu, K. Sugiura, S. Li, H. Kawai,
    • 学会等名
      Acoustical Society of Japan, spring, 2020.
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Spectrograms Fusion with Minimum Difference Masks Estimation for Monaural Speech Dereverberation.2020

    • 著者名/発表者名
      H. Shi, L. Wang, M. Ge, S. Li, and J. Dang.
    • 学会等名
      IEEE-ICASSP
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Effectively Synthesizing Code-switched Speech Using Highly Imbalanced Mix-lingual Data and mask embedding2020

    • 著者名/発表者名
      S. Guo, L. Wang, S. Li, J. Zhang, C. Gong, Y. Wang, J. Dang, K. Honda
    • 学会等名
      Interspeech 2020 Satellite Workshop (SLIMTS2020)
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Multilingual transformer training for Khmer automatic speech recognition2020

    • 著者名/発表者名
      K. Soky, S. Li, T. Kawahara, S. Seng,
    • 学会等名
      Interspeech 2020 Satellite Workshop (SLIMTS2020)
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] System Description for Voice Privacy Challenge (Kyoto Team).2020

    • 著者名/発表者名
      Y. Han, S. Li, Y. Cao, M. Yoshikawa,
    • 学会等名
      In special session of INTERSPEECH 2020 (VoicePrivacy challenge 2020).
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Staged Knowledge Distillation for End-to-End Dysarthric Speech Recognition and Speech Attribute Transcription2020

    • 著者名/発表者名
      Y. Lin, L. Wang, S. Li, J. Dang, and C. Ding.
    • 学会等名
      In Proc. INTERSPEECH, 2020 (Travel Granted by ISCA).
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Voice-Indistinguishability: Protecting Voiceprint in Privacy Preserving Speech Data Release.2020

    • 著者名/発表者名
      Y. Han, S. Li, Y. Cao, Q. Ma and M. Yoshikawa.
    • 学会等名
      IEEE-ICME
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Compensation on x-vector for short utterance spoken language identification.2020

    • 著者名/発表者名
      P. Shen, X. Lu, K. Sugiura, S. Li and H. Kawai.
    • 学会等名
      ISCA-Odyssey (The Speaker and Language Recognition Workshop)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] VOIS: The First Speech Therapy App in the World for Myanmar Hearing-Impaired Children.2020

    • 著者名/発表者名
      A. Thida, N. Han, S. Oo, S. Li and C. Ding.
    • 学会等名
      In Proc. O-COCOSDA, 2020.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] End-to-End Articulatory Attribute Modeling for Low-resource Multilingual Speech Recognition,2020

    • 著者名/発表者名
      S. Li, C. Ding, X. Lu, P. Shen and H. Kawai,
    • 学会等名
      Acoustical Society of Japan, spring, 2020.
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] End-to-End Speech Translation with Cross-lingual Transfer Learning2020

    • 著者名/発表者名
      S. Shimizu, C. Chu, S. Li, S. Kurohashi,
    • 学会等名
      NLP, 2021.
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Effectively Synthesizing Code-switched Speech Using Highly Imbalanced Mix-lingual Data2020

    • 著者名/発表者名
      S. Guo, L. Wang, S. Li, J. Zhang, C. Gong, Y. Wang, J. Dang, K. Honda.
    • 学会等名
      In Proc. ICONIP, 2020.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Singing Voice Extraction with Attention based Spectrograms Fusion.2020

    • 著者名/発表者名
      H. Shi, L. Wang, S. Li, C. Ding, M. Ge, N. Li, J. Dang, and H. Seki.
    • 学会等名
      In Proc. INTERSPEECH, 2020 (Travel Granted by ISCA).
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Voice-Indistinguishability: Protecting Voiceprint with Differential Privacy under an Untrusted Server.2020

    • 著者名/発表者名
      Y. Han, Y. Cao, S. Li, Q. Ma, M. Yoshikawa.
    • 学会等名
      ACM conference on Computer and Communications Security (CCS), demo, 2020.
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Joint Training End-to-End Speech Recognition Systems with Speaker Attributes.2020

    • 著者名/発表者名
      S. Li, X. Lu, R. Dabre, P. Shen and H. Kawai
    • 学会等名
      ISCA-Odyssey (The Speaker and Language Recognition Workshop)
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] A Mixture of Character and Word End-to-End System for Keyword Spotting2020

    • 著者名/発表者名
      H. Zhang, S. Ueno, M. Mimura, S. Li, W. Zhang, T. Kawahara,
    • 学会等名
      Interspeech 2020 Satellite Workshop (SLIMTS2020)(full paper).
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Voice-Indistinguishability: Protecting Voiceprint in Privacy-Preserving Speech Data Release,2020

    • 著者名/発表者名
      Y. Han, Y. Cao, S. Li, Q. Ma, M. Yoshikawa.
    • 学会等名
      Interspeech 2020 Satellite Workshop (SLIMTS2020) (invited report).
    • 招待講演 / 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Phantom in the Opera: Effective Adversarial Music Attack on Keyword Spotting Systems.2020

    • 著者名/発表者名
      H. Zhang, S. Li, X. Ma, Y. Zhao, Y. Cao, T. Kawahara,
    • 学会等名
      IEEE-SLT, 2021
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] Joint Training End-to-End Systems for Speech and Speaker Recognition with Speaker Attributes,2020

    • 著者名/発表者名
      S. Li, X. Lu, R. Dabre, P. Shen and H. Kawai,
    • 学会等名
      Acoustical Society of Japan, spring, 2020.
    • データソース
      KAKENHI-PROJECT-19K24376
  • [学会発表] End-To-End Articulatory Modeling for Dysarthria Articulatory Attribute Detection.2020

    • 著者名/発表者名
      Y. Lin, L. Wang, J. Dang, S. Li, and C. Ding.
    • 学会等名
      IEEE-ICASSP
    • 国際共著/国際学会である
    • データソース
      KAKENHI-PROJECT-19K24376
  • 1.  チョ シンキ (70784891)
    共同の研究課題数: 2件
    共同の研究成果数: 18件
  • 2.  李 吉屹 (30726667)
    共同の研究課題数: 1件
    共同の研究成果数: 20件
  • 3.  党 建武
    共同の研究課題数: 0件
    共同の研究成果数: 1件
  • 4.  河原 達也
    共同の研究課題数: 0件
    共同の研究成果数: 1件

URL: 

サービス概要 検索マニュアル よくある質問 お知らせ 利用規程 科研費による研究の帰属

Powered by NII kakenhi