你听说过“鸡尾酒会问题”吗?

2017年 11月 7日

从鸡尾酒会到公共交通,在许多日常环境中都有相互竞争的声源。如果你想听一个特定的声音,例如在复杂的听觉环境中听到一个朋友的问题,那么必须区分周围的声音,并专注于感兴趣的声音。这种情况被称为“鸡尾酒会问题”。了解人类如何解决这个问题有助于助听器设计的进步。

什么是“鸡尾酒会问题”?

想象一下你正在新年前夕参加一个热闹的鸡尾酒会:空气中弥漫着刺耳的音乐和笑声,你和一个朋友在人群中间聊天,等待倒计时开始。

现在,请闭上你的眼睛,想试着听清楚朋友讲的话。

An illustration of two friends at a party, illustrating the cocktail party problem in action.

你怎么从周围的杂音中识别出朋友的声音呢?

我们可以在“鸡尾酒会”效应中找到答案。这个概念由 Colin Cherry 在 1953 年提出。“鸡尾酒会问题”是指在一个声音相互竞争的环境中,集中注意力并倾听一个感兴趣的声音,比如一个语言信号。

为此,你需要克服两个挑战:

  1. 分析混合的声音并挑选出感兴趣的特定声音,以便于理解;
  2. 将注意力转移到感兴趣的声音上,而忽略其他声音
    • 这可能涉及当倾听两个对话时转移注意力;

当聚会规模更大且有更多竞争的声源时,这些挑战将更为困难。最终,你将很难确定你所感兴趣的语言信号,从周围的混音中分辨出来,然后加以注意。尽管面临着诸多挑战,但许多人能够自然地解决这个问题而无需多想。

那么,应该怎么做呢?下面,我们来看看…

人体如何解决“鸡尾酒会问题”?

根据此问题的来源,这里发挥主要作用的是我们的大脑能够使用分组提示来确定哪些声音会一起出现。例如,单个声音在不同频率上通常具有相同的振幅变化。这意味着当我们遇到同时停止和开始的多个频率的声音时,我们的大脑会将这些声音解释为属于同一声源。另外,当混音中的频率具有谐波关系时,由于它们很可能相互关联,因此经常被听成一种声音。

自然声音的波动也能使声音区分变得更加容易。尽管不同的声音有时会相互掩盖,但当它们波动时,我们可以在嘈杂的环境中听到潜在声音。我们的听觉系统可以通过对模糊的声音精确分组来填充其空白。

 

按下播放键,我们将会被带到嘈杂的鸡尾酒会上。起初,我们只能听到混杂的声音。然后,你遇到一个老朋友,他开始与您交谈。当你专注于朋友说的话时,就可以过滤掉聚会中的其他声音,有效地将它们变成背景噪音。

我们的大脑解决此问题的另一种方式是利用我们对各种声音的理解。回到鸡尾酒会的例子,如果你的朋友正在说话,并且他们的语言是连贯的句子而不是胡言乱语,你将会更容易听到他们说话。此外,如果你熟悉朋友的口音,那你对声音的感知就会更加准确。

定位和视觉线索也有助于我们将注意力转移到正确的听觉来源上。例如,如果目标声音与不想要的声音位于不同的位置,我们就可以更容易地利用空间听觉来区分它们,从而使其余声音变成背景噪音。

应对“鸡尾酒会问题”遇到的挑战

虽然一般的人能够自行化解“鸡尾酒会”问题,但是听力受损的人可能会在嘈杂的环境中挣扎。为了了解更多信息,我们联系了丹麦技术大学的 Abigail Kressner。Kressner 提到一个被普遍接受的理论:听力受损的人常挣扎于嘈杂的环境,这是由于“可听性信号混合(即,信号是否足够大以至于听力受损的人能够听到)和低时间分辨率导致的。”

Kressner 详细地阐述,这些问题可能“会影响听力受损的听众在复杂的声学场景(如鸡尾酒会)中分离不同声音流的能力,并且它们也可能会减少注意力隔离”。那些听力受损的人也不太可能在相互的干扰声源波动中“倾听”。正如我们前面所提到的,这些声波使听力正常的人感受到了目标语音,因此,它们为理解会话提供了线索。在助听器的机器算法中复制这种能力对于助听器设计者来说是一个挑战。

设计会考虑“鸡尾酒会效应”的高级助听器

当然,设计助听器的首要目标是使助听器用户能够听到声音。但是在满足该要求之后,我们还可以添加很多其他功能,包括:

  • 定向麦克风或波束形成器,以减弱来自特定角度(例如在用户身后)的声音的影响
  • 计算语音隔离系统可自动区分目标语音和干扰的背景噪声,并有助于抑制背景噪声

Kressner 指出,这些方法都面临着区分声音信号和找到听众想要听到的声音的挑战。例如,你可能想听一个朋友在你面前讲话,或者在房间另一侧的一个刚叫你名字的人说话。

A photograph of a hearing aid.
助听器。图片由 Udo Schröter 提供自己的作品。通过 Wikimedia CommonsCC BY-SA 3.0下获得许可。

助听器如何知道用户想要听哪个信号?COCOHA 项目认为答案是大脑信号(EEG 信号)。但是,这个解决方案还有很多工作要做,包括进行更多的研究解码认知注意力,然后使用此信息调整设备并抑制不需要的信号。

寻找设计更好的助听器的灵感

现在,让我们远离想象中的鸡尾酒会,在茂密的森林里散散步吧。在一个温暖的春天的夜晚,您可能会听到 Cope 灰色树蛙的合唱。虽然每个个体的叫声相似,但更健康的雄性树蛙发出的叫声更快、更长。雌性树蛙通过倾听这些叫声,排除掉额外的噪声来收听感兴趣的叫声。研究这些青蛙是如何实现这一壮举,以及它们的耳朵与人耳之间的差异,可以帮助工程师改善助听器和语音识别系统的设计。

Photograph of a Cope's gray treefrog.
在自然界中寻找灵感来改善助听器的设计;Cope 灰色树蛙的照片。图片由Fredlyfish4 提供自己的作品。通过Wikimedia CommonsCC BY-SA 4.0下获得许可。

Kressner 指出,到目前为止,有关解释鸡尾酒会问题的助听器设计的大量研究“已经通过非常可控但不符合实际的实验获得。”因为“我们在实验室中看到的东西与在现实世界中看到的东西之间存在脱节”, 所以这不是理想的。为了进一步缩小这一差距,Kressner 建议,可以使用数值模型或更实际的心理声学再现技术来更好地了解现实世界中发生的事情。

 

在仿真中寻找灵感;使用 COMSOL Multiphysics® 软件模拟一种可与助听器结合使用的探管麦克风

了解有关鸡尾酒会问题和声学的更多信息

博客分类


评论 (0)

正在加载...
浏览 COMSOL 博客