设为首页添加收藏

您好! 欢迎来到leyu·乐鱼(中国)体育官方网站

微博
扫码关注官方微博
微信
扫码关注官方微信
电话:18953348812

您的位置: leyu乐鱼体育 > 新闻资讯
新闻资讯

leyu·乐鱼(中国)体育官方网站腾讯QQ亮相2021谷歌开发者大会官网 AI语

发布日期:2024-04-08 来源: 网络 阅读量(

  当6亿用户习惯每天通过QQ发送语音和进行视频通话,或者在群里与网友语音接龙完成一场Pia戏,又或是与好友一起派对语音答题的时候,大家可曾想过,在不同场景下始终清晰、流畅的QQ音视频体验背后,到底是什么黑科技在支撑这些场景中“声”与“线开发者大会期间,大会官网更新了一则案例《TensorFlow助力:AI语音降噪打造QQ音视频通话新体验》,作者正是QQ音视频通话技术团队。作为谷歌TensorFlow的优秀应用案例,腾讯QQ团队在该文中详细揭秘了语音增强技术在QQ音视频功能中的研发与应用。

leyu·乐鱼(中国)体育官方网站腾讯QQ亮相2021谷歌开发者大会官网 AI语(图1)

  目前,主流降噪方案主要有传统降噪和AI降噪两种。传统降噪方法计算量低,具有实时进行语音降噪的优势,但与此同时,因其基于数学和物理原理进行推导,过程中难免基于人认知的理想先验假设,这使得传统降噪对实际场景中频发的多种类、非平稳噪声表现不佳。AI 降噪是最近兴起的基于数据驱动的降噪方法,能够有效的应对各种突发的非平稳噪声,但前期需要经过大量的数据训练,以及搭建合适的数据模型作为基础。而模型在移动端的部署leyu·乐鱼(中国)体育官方网站,需要权衡模型大小、降噪效果、CPU 占用率和内存占用率等多个因素,由此给降噪技术的实现带来了一定的挑战。

  为解决6亿用户对QQ音视频的庞大需求,腾讯QQ 团队基于开源TensorFlow机器学习平台,搭建了 AI 降噪与噪声场景分类的并行训练框架,并设计了音频降噪、音质提升和模型优化算法。

leyu·乐鱼(中国)体育官方网站腾讯QQ亮相2021谷歌开发者大会官网 AI语(图2)

  音频降噪模块主要是通过针对带噪声音频中的干净人声进行建模,再提取出带噪音频的频域特征,将带噪声音频与干净音频的的频域特征进行对比和计算,从而使AI对人声之外常见的开门声、键盘声、走路声等音频具备更精准的识别能力和降噪处理,从嘈杂环境中剥离出干净语音。

  在此基础上leyu·乐鱼(中国)体育官方网站,腾讯QQ团队又加入了音质提升模块,以平衡降噪幅度,确保噪声去除的更加干净,同时避免导致有用的音频被消音,确保实时降噪过程中“有用的信息都进来,无用的噪音都隔离”。

leyu·乐鱼(中国)体育官方网站腾讯QQ亮相2021谷歌开发者大会官网 AI语(图3)

  为测试AI降噪面向不同场景的深度优化能力,腾讯QQ团队还选取了办公场景下常见的百种噪声:键盘声、关门声、风扇声等噪音,结合干净人声按照 0dB、5dB、10dB 和 15dB 信噪比制作混合音频,分别测试原始降噪模型以及采用蒸馏技术提升后的AI-Denoise-student模型的表现。

  而在每一条文字或语音信息的背后,在每一通音频或视频通话的背后,都有来自无数环节的技术支持,每一个环节的优劣,也都关系着用户体验的好坏用一句比较流行的话来说,就是“用尽了全身力气,才能显得毫不费力”。

  腾讯QQ团队基于TensorFlow研发的降噪技术,能够通过AI算法带来智能的降噪功能和清晰、干净的音视频体验,对于行业难点之一的音频降噪同时保证音质效果,也有了针对性的优化方案,对语音质量和视频通话带来更好的技术保障。腾讯QQ一直专注社交与沟通,致力于提供优质的社交体验leyu·乐鱼(中国)体育官方网站。许多音视频相关的功能如趣味变声、语音暂停等功能都率先出现在QQ中。这些功能也受到了年轻人的普遍喜爱。据悉,腾讯QQ未来还将在AI基础算法、模型方面加强研究,拓展更多元的社交应用场景。leyu·乐鱼(中国)体育官方网站腾讯QQ亮相2021谷歌开发者大会官网 AI语音降噪打造音视频通话新体验