当前位置：首页 > 新闻资讯 > 谷歌用AI从嘈杂环境中提取独立音轨：或存隐私担忧

相关新闻

靠谱的北京网站建设公司
2026-05-23 07:26
从2013年开始，互联网发展驶入了“高速路”，很多北京企业，特别是传统行业的商家越来越重视互联网宣传，都在逐渐地转变着自己的经营模式，互联网电子商务业务渠道发展成为了大势所趋。网站建设哪家公
网站顶部导航的设计
2026-05-22 23:50
在做网站顶部导航设计时，要先了解它有哪些元素，不要盲目去设计。一般网站开发顶部栏包括菜单、提示消息、语言切换、品牌商标、品牌logo、搜索框、登陆注册、其他召唤链接、产品的移动端下载等等，在
北京网站建设之企业站的几大必知要素
2026-05-19 15:31
随着互联网信息时代的不断更迭与升级，网站开发设计对于企业站来说，是一种比较常见的网站类型，也通用于各种行业，站如其名，企业网站开发的主要功能就是展示产品或者活动等元素，用户通过北京企业网站去
深度刨析“互联网+医疗”发展前景
2026-05-18 12:19
互联网医疗领域吸引众多投资目光进入2010年后，互联网网站开发医疗投资案例数目不断上升，且增长十分迅速。互联网医疗行业的发展逐步进入成熟阶段，站在投资轮次的角度来分析，2015年的线上
“零食产业”被赋能互联网能量后，如何发展？
2026-05-04 20:36
坚果炒货、肉干肉铺、糖果巧克力种类繁多，光图片把胃口勾去大半，在加上打折，优惠，满减卷，冲破理智围栏，下单付款，一气呵成。这则景象在线上异常火爆，商场却冷清。零食终于做成了一块大“蛋糕”。2

谷歌用AI从嘈杂环境中提取独立音轨：或存隐私担忧

返回列表

发布时间：2026-05-17 06:34

北京时间4月16日早间消息，谷歌研究人员开发了一种深度学习系统，可以帮助电脑在嘈杂环境中更好地识别和区分一个人的声音。
集团网站建设案例

本周在谷歌研究博客中发布的文章显示，该公司的一个内部团队试图让人工智能(AI)像人类的大脑一样，可以主动关注一个声源，同时过滤其他声源——像你在聚会上跟朋友对话时的做法。
谷歌的方法使用了一个视听模型，使之可以集中精力区分一段视频中的声音。该公司还发布了多段YouTube视频，演示这项技术的实际效果。
谷歌表示，这项技术可以适用于单音轨视频，而且可以通过算法分离出视频中不同人的音频内容，也可以让用户手动选取视频中的人脸，专门收听此人的声音。
谷歌表示，视觉元素是关键，因为这项技术会关注一个人的嘴唇运动，从而更好地判断某个时点应该关注哪段声音，并为一段较长的视频创造更精确的独立音轨。
谷歌研究人员通过收集10万段YouTube“演讲视频”开发了这个模型，总共提取了大约2000小时的内容，然后将这些音轨混合后，添加上人工背景噪音。
谷歌之后训练该技术通过观察每一格视频中的人脸和视频音轨的频谱图，把混合后的音频进行分割。这套系统可以区分哪个声源在特定时间内属于哪张脸，并为每个人制作一段独立的音轨。
谷歌认为，隐藏式字幕系统会成为该系统的一大应用领域，他们还在设想更广泛的应用方向，而且还在探索更多的机会，希望将其整合到各种谷歌产品中。例如，如果把它加入到Google Home智能音箱中，便可区分出不同用户发出的指令。
不过，这个模型需要配合视频才能更好地发挥作用，所以可能更适合亚马逊Echo Show。谷歌今年早些时候面向Echo Show这样的智能显示器开放了谷歌助手，但该公司本身尚未推出这样的产品。
但这项技术可能也会引发隐私担忧。虽然该技术的实际效果远没有视频演示得那么好，但经过一些细微调整，的确有可能成为强大的监听和监视工具。

0755-99078172 现在就想找顾问聊聊立即咨询

靠谱的北京网站建设公司

网站顶部导航的设计

北京网站建设之企业站的几大必知要素

深度刨析“互联网+医疗”发展前景

“零食产业”被赋能互联网能量后，如何发展？

谷歌用AI从嘈杂环境中提取独立音轨：或存隐私担忧