武汉丝绸服装鉴定社区

听自己的录音时,为什么会觉得自己的声音陌生?该录音声就是别人听到的你的声音么?

gh_3658882c68122018-09-19 14:30:37

为什么我们的声音听起来和录音设备中的不一样?这是听觉领域中一个非常接地气的问题,当然,我们首先想到的回答一定是——

“都怪这个录音设备太low,明明人家声音如此甜美,怎么录的音这么土声土气的呢!”

呵呵哒,这是一种解释,不过我认为,其实这个原因并不是主要因素(因为大多数情况下别人会无情的告诉你他们听到的你的声音就是这样子的),并且作为一个医学和生物背景的工科妹子(没错就是这样),我当然也不会给大家分析录音设备里面的玄机,但是,我会给大家详细介绍这个现象出现的生物学机理,作为一个搞听觉神经工程的我怎么说也要正经的回答一个关于听觉神经领域的问题吧(严肃脸)。


-------------------------------------------------------------------------------

首先,要想搞清为什么自己的声音和录音中自己的声音不一样,先要搞清我们自己是怎样听到声音的,换句话来讲,就是搞清听觉传导通路。


听觉传导通路

1.1声波通过空气传导介导的听觉传导通路

许多声源都会使空气压强产生周期性变化,那这种空气压强的振动是怎样转化为神经活动的呢?首先先上一张耳的解剖图(见图1)。



1. 外耳、中耳和内耳。


如图所示,由皮肤覆盖软骨所形成的类似漏斗状的耳廓(pinna)使得我们收集声音更集中,耳廓以内的所有的结构都是耳的组成成分,包括外耳(耳廓至鼓膜)、中耳(鼓膜和听小骨)、内耳(卵圆窗内侧部分,包括耳蜗和耳迷路)。

声音从外耳传递到中耳,声波使鼓膜发生运动,当气压推动鼓膜时,使三块听小骨(锤骨、砧骨和镫骨)发挥出杠杆作用,进而使镫骨底板在卵圆窗(oval window)处向内推进。通过改变作用力和表面积使得卵圆窗上的压强大于鼓膜压强,让声音导致的鼓膜大幅运动被转换成卵圆窗上小幅却更有力的震动(卵圆窗上的压力比鼓膜的压力提高大约20倍哦),这为之后顺利使内耳的液体产生运动提供了方便(如图2)。



2. 中耳


如图中箭头所示,当气压推动鼓膜时,锤骨的底部也被往里推,听小骨的杠杆作用使得镫骨底板在卵圆窗处向内推进。由于镫骨底板的表面积远小于卵圆窗的表面积,使得卵圆窗上的压力远大于鼓膜上的夜里。


接着就到了听觉传导通路中非常精彩的一环了。刚才提到卵圆窗在听小骨的作用下发生运动,卵圆窗内侧的部分紧接着就是耳蜗,耳蜗在将声音转换成神经信号的过程中非常重要。耳蜗(cochlea),顾名思义,就是个形似蜷缩在壳中的蜗牛,耳蜗内充满液体,耳蜗中的前庭膜和基底膜将耳蜗分成前庭阶、中阶和鼓阶这三个小室,前庭阶和鼓阶中液体叫外淋巴,而中阶充满内淋巴,这些液体在听觉传导过程中非常重要(如图3)。



3. 耳蜗的3个小室。


从横切面看,耳蜗含有3个平行小室。这些小室由前庭膜和基底膜分隔开。科蒂氏器官含有听觉感受器,位于基底膜上,而为盖膜所覆盖。


特别的,位于基底膜上有一个含听觉感受神经元的器官,称科蒂氏器官(organ of Corti,也称螺旋器),它包括毛细胞(将机械能转化成膜电位极性的听觉感受器细胞)、科蒂氏杆和各种支持细胞。毛细胞被夹在基底膜和网状板之间,它分为外毛细胞和内毛细胞,外毛细胞的尖端终止于凝胶状的盖膜中,而内毛细胞终止于盖膜下。(如图4)



4. 科蒂氏器官。


基底膜支持的组织包括内、外毛细胞和刚性的科蒂氏杆。盖膜从骨性蜗轴上一直延伸到毛细胞上突出的静纤毛上,并将其覆盖住。


好了,将重点完整的连起来讲就是:声波在卵圆窗处推动镫骨底板,使得外淋巴在前庭阶移动而内淋巴在中阶移动,内淋巴的运动使基底膜在基底部发生弯曲,由于基底膜、科蒂氏杆、网状板和毛细胞都是刚性连接的,这些结构呈一体化运动,会形成对盖膜的轴向运动,因为盖膜支撑着外毛细胞静纤毛的底部,网状板与盖膜相对的侧向运动使得外毛细胞的静纤毛发生朝向某一方向的倾斜(如图5)。这样,这个神奇的器官就将正弦波震动变成了左右震动。



5. 基底膜的向上运动所造成的纤毛倾斜。(a)静息时,毛细胞位于网状板和基底膜之间,外贸细胞的静纤毛尖端连于盖膜。(b)当声音使基底膜向上倾斜时,网状板向上移动,进入蜗轴,从而使得静纤毛向外倾斜。


接着,神奇的事情又发生了,因为毛细胞上的钾离子通道是机械打开的(很特别有么有!),当纤毛倾斜时,静纤毛顶端钾离子通道开启,引起毛细胞感受器电位的变化,并且毛细胞只在一个方向上打开离子通道,而在相反方向则使通道关闭(如图6(a))。K+流入毛细胞导致细胞去极化,继而激活钙离子通道,钙离子的流入使得神经递质释放,进而激活了毛细胞突触后的螺旋神经纤维(如图6(b))。



6. 毛细胞的去极化。(a)当连接静纤毛的剪短伸展时,静纤毛尖端的钾通道开放。(b)钾离子的流入使毛细胞发生去极化,从而打开电压门控的Ca2+通道。Ca2+的流入导致神经递质从突触囊泡中释放,然后弥散至突触后螺旋神经节细胞的突起。


来自螺旋神经节的传入神经,通过听-前庭神经进入脑干,向耳蜗核投射,然后再到上橄榄(superior olive),接着是下丘(inferior colliculus),丘脑,最后是听皮层,然后皮层的信息整合分析后,最后让我们“听到了声音”(如图7)。


7. 听觉通路。从螺旋神经节到听觉皮层的神经信号传递有多种途径。此处给出(a)主要通路的框图和(b)通过脑干的横切面。注意,只给出了一侧的连接。


1.2小结:


声波通过空气传导介导的听觉传导通路(我就知道你们喜欢看结论)

声波→耳廓→外耳道→鼓膜→三块听小骨,起杠杆作用,放大信号20倍→耳蜗,耳蜗里面有液体,会随震动而震动→基底膜会随液体震动而震动,膜上有inner/outer hair cell(内/外毛细胞)→正弦波震动改成左右震动→毛细胞上的钾离子通道是机械打开的,内毛细胞只超一个方向才会打开离子通道→产生动作电位→脑干(耳蜗核)→上橄榄(binaural processing)→下丘(inferior colliculus)→丘脑→听皮层


个人感觉听觉通路相对于视觉通路还是挺复杂的,在这里先向逆天的生物进化致个敬,然后谈谈另一个听觉传导通路,也就是我们常说的骨传导(bone conduction)。


1.3声波通过骨头传导介导的听觉传导通路


声音的本质是机械波,是由机械振动在介质中传播形成的。 所以,声音的传播需要介质,而传播介质并不只有空气,液体和固体也可以是介质,甚至声音在固体中传输的速度比在空气中的更快,也就是说声波也是可以通过颅骨来传播的。声波传到头骨,头骨发生振动,然后直接传入内耳到达耳蜗,接着就跟空气传导的听觉通路一样,淋巴液振动导致基底膜的振动,内毛和外毛细胞发生倾斜,然后机械性打开钾离子通道,导致毛细胞去极化进而激活电压门控的钙离子通道,最后使得神经递质释放,继而激活了毛细胞突出后的螺旋神经节纤维,来自螺旋神经节的传入神经经过多级传送最后到听觉皮层。


其实生活中骨传导的例子还是很多的,比如你有没有发现你自己吃脆苹果的时候感觉声音很响,但是其实别人可能并没什么感觉;你将上下牙合紧时发出的响声你旁边的人可能一点都听不到,但是你自己却能清楚的听到。


另外,我们著名的贝多芬爷爷在几乎全聋的状态下get了一种新技能来听自己的钢琴演奏:将木棒一头抵在钢琴上,然后自己用牙咬着木棒另一头。当演奏时,钢琴的振动通过木棒传到下颌骨,由于头骨的骨头之间都是相连的,下颌骨的振动可以传到颞骨,然后不经过外耳和中耳(不经过耳道鼓膜等)直接传入内耳(如图8)。


8. 贝多芬利用骨传导听自己的演奏。

(图来自网络,侵删)


1.4小结:


声波通过骨头传导介导的听觉传导通路(既然大家都喜欢看结论妹妹我就给大家放个结论吧~)

声波→颅骨→耳蜗,耳蜗里面有液体,会随震动而震动→基底膜会随液体震动而震动,膜上有inner/outer hair cell(内/外毛细胞)→正弦波震动改成左右震动→毛细胞上的钾离子通道是机械打开的,内毛细胞只超一个方向才会打开离子通道→产生动作电位→脑干(耳蜗核)→上橄榄(binaural processing)→下丘(inferior colliculus)→丘脑→听皮层


所以说,跟经空气传导的通路相比,骨传导显得更加“简单粗暴”些,所以它的优点也是很明显的:速度更快,能量衰减小,音色变化小。


2. 为什么我们的声音听起来和录音设备中的不一样


好了,有我上面长篇大论的听觉传导通路做基础,这部分就容易理解多了。我想很多人已经领悟到我想用骨传导来解释这个问题,没错,这也确实是你能在百度里搜索到的绝大多数回答,但是,既然我准备诚心诚意的回答这个问题,我会告诉你除了骨传导,还有大脑里面的调制机制在里面起作用。


2.1 原因一:骨传导


在1中的听觉传导通路中讲过空气传导和骨传导的传导通路,骨传导中,声音不经过外耳和中耳(不经过耳道鼓膜等)直接传入内耳,声音的速度更快,能量衰减小,音色变化更小。当我们说话时,自己听到的声音其实一般都既有气传导又有骨传导,是这两种声音传播方式叠加的效果,根据说话音量的大小,自己听到的气传导和骨传导产生的声音所占比例也不同。然而,当别人听你讲话时,只产生了空气传导这一个听觉传导通路,而只有空气传导的话会使声音能量大大衰减,音色也发生改变,所以自然我们听自己的声音和别人听到的或者说录音机里面的声音就不一样(如图9)。



9. 空气传导和骨传导的区别。

(图来自网络,侵删)


2.2 原因二:大脑的调制作用


简单的结论就是:我们的发声系统在说话过程中可以调节听觉皮层。

首先,当我们自己说话或者发音时,我们的听觉皮层中的神经元是被抑制的,甚至,在我们没开口前,我们的听皮层神经元已经被抑制了(如图10)。



10-1.Representative example of the suppression of spontaneous neural activities in the auditory cortex by self-initiated vocalizations. A: a unit with high spontaneous activity is completely suppressed while the animal is vocalizing. The suppression appears to begin before the onset of the vocalization.



10-2 Average suppressed vocalization response. A population histogram for all suppressed responses aligned by vocal onset is shown (binwidth = 20ms). The vocal onset is indicated by a red line, and the time axis is referenced to this point. The blue line is a moving average (100-ms window) and shows that suppression begins prior to vocalization as indicated an arrow. The green bar indicates the period over which suppression was continuously significant (P < 0.05). Suppression was significant starting 220ms before vocal onset and remained until 1,730 ms after vocal onset. Inset: a population histogram aligned by vocal offset is shown. The green line indicates significant suppression (P < 0.05) that lasts until 20ms after vocalization. The binwidth and the window size for the moving average (blue line) are the same in both plots.


另外,我们说话是需要反馈的,这样才能使自己调节自己所讲的东西,也就是说我们的听觉系统对我们说话的声音是有反馈监控作用的,这种self-monitoring在区分自我和外界产生的声音输入是很重要的,并且可以帮助我们检测我们的发声错误。有研究发现,当marmoset(狨猴,一种小型猴子)发声频率发生改变时,此时声音的反馈(feedback)使听皮层中神经元的抑制状态发生改变(如图11)。



11. Effect of altered feedback on auditory cortex neurons. (a) Marmoset in a recording studio. Investigators recorded from auditory cortical neurons as a marmoset vocalized. The auditory feedback from the vocalization was relayed to the marmoset without delay under both normal and altered conditions. (b) Peristimulus time histogram exhibiting the basic effect. This auditory cortical neuron was suppressed during normal vocalization (blue trace). However, when the auditory feedback of the vocalization was shifted in the frequency domain, the neuron exhibited a large increase in firing rate (red trace).


举个简化的例子,当我突然对身边的小Vi说“你今天好漂亮哇”,小Vi静静的站在那,于是我的声音通过空气传导介导的听觉传导通路到达小Vi大脑听觉皮层,让小Vi听到了“你今天好漂亮哇”这句话,在这个过程中,小Vi脑中不会提前产生对这句话的前馈调节(第一,这不是她自己说的;第二,她可不知道我会说她漂亮,虽然她确实那么美哈哈)。而对我来讲,我的大脑里是有一个forward model来通过vocal modulation调节我的听觉皮层的,我真实的vocal feedback(“你今天好漂亮哇”)和我脑中这句话期待的或者说预测的声音状态会进行比较,来发现是否有vocal error,如果我的这句话符合我的预期,可能在这个动态调控过程中我不会再调整这句话的发音啊,语音语调等等。但是如果我的这句话语音语调,或者分贝值等不符合预期的话,大脑会进行调控,让我说的“你今天好漂亮哇”这句话向预期状态调整。


3. 总结


为什么自己的声音和录音中自己的声音不一样?从神经生物学上来看:

第一,骨传导。当我们说话时,自己听到的声音其实一般都既有气传导又有骨传导,是这两种声音传播方式叠加的效果,然而当别人听你讲话时,只产生了空气传导这一个听觉传导通路,而只有空气传导的话会使声音能量大大衰减,音色也发生改变,所以自然我们听自己的声音和别人听到的或者说录音机里面的声音就不一样。

第二,发声系统在说话过程中可以调节听觉皮层(如图12)。



12. Auditory-vocal interactions in auditory cortex.

(图来自清华大学《系统与计算神经科学》课件,侵删)


最后,开一下脑洞,既然知道了自己的声音和录音中自己的声音不一样这个现象发生的机制,那么,亲爱的你想不想做一个“美音听听”的App,能让录音中自己的的声音和自己所听到的声音一样的美妙动听呢?



Reference:


[1] Eliades, S. J. & Wang, X. Neural substrates of vocalization feedback monitoring in primate auditory cortex. Nature453, 1102-1106, doi:10.1038/nature06910 (2008).

[2] Mark F. Bear, Barry W. Conners, Michael A. Paradiso. Neuroscience: exploring the brain [M].U.S.A:Lippincott Williams & Wilkins,2007.

[3] Eliades, S. J. & Wang, X. Sensory-motor interaction in the primate auditory cortex during self-initiated vocalizations. J Neurophysiol89, 2194-2207, doi:10.1152/jn.00627.2002 (2003).

[4] Dale Purves, George J. Augustine, David Fitzpatrick et al. Neuroscience (Third Edition) [M]. U.S.A: Sinauer Associates, Inc., 2004.


友情链接

Copyright © 武汉丝绸服装鉴定社区@2017