问答 2024-06-30 来自:开发者社区

3D-Speaker是如何结合语音信息和语义信息来优化说话人日志结果的?

3D-Speaker是如何结合语音信息和语义信息来优化说话人日志结果的?

文章 2023-05-13 来自:开发者社区

EMNLP 2022论文解读 | SOND:基于显式语音重叠建模的说话人日志模型

Empirical Methods in Natural Language Processing (EMNLP)是由国际计算语言学协会(Association for Computational Linguistics, ACL)举办的自然语言处理和人工智能方面的重量级国际会议,历届会议都会受到全球各地人工智能领域人士的广泛关注。近期,阿里巴巴达摩院语音实验室的论文“Speaker Overla....

EMNLP 2022论文解读 | SOND:基于显式语音重叠建模的说话人日志模型
文章 2022-12-23 来自:开发者社区

EMNLP 2022论文解读 | SOND:基于显式语音重叠建模的说话人日志模型

▏研究背景在多方会议分析中,准确地识别出说话人的身份信息尤为重要。近期,研究者们提出了各种各样的说话人日志技术来解决这一问题,它们大致可以分为三类,分别是基于聚类的算法、端到端的模型化方法,以及这两者的混合系统。基于聚类的说话人日志技术主要包括三个部分,分别是语音分割Segmentation、嵌入码提取Embedding Extraction和聚类算法Clustering Algorithm。其....

EMNLP 2022论文解读 | SOND:基于显式语音重叠建模的说话人日志模型

本页面内关键词为智能算法引擎基于机器学习所生成,如有任何问题,可在页面下方点击"联系我们"与我们沟通。

产品推荐

阿里云日志服务SLS

SLS是一站式云原生可观测性数据平台,一站式提供数据采集、加工、查询与分析、可视化等功能。日常更新产品最新动态,最佳实践以及技术大咖的观点和经验。

+关注