Başla ilgili aktarım işlevi - Head-related transfer function

HRTF filtreleme etkisi

Bir kafa ile ilgili transfer fonksiyonu ( HRTF bazen olarak da bilinir), anatomik transfer fonksiyonu (ATF) bir nasıl karakterize bir yanıttır kulak uzayda bir noktaya bir ses alır. Ses dinleyiciye çarptığında, başın boyutu ve şekli, kulaklar, kulak kanalı, başın yoğunluğu, burun ve ağız boşluklarının boyutu ve şekli, tümü sesi dönüştürür ve nasıl algılandığını etkiler, bazı frekansları artırır ve diğerlerini azaltır. . Genel olarak konuşursak, HRTF 2,700 Hz'de +17 dB birincil rezonans ile 2-5 kHz arasındaki frekansları artırır. Ancak tepki eğrisi tek bir çarpmadan daha karmaşıktır, geniş bir frekans spektrumunu etkiler ve kişiden kişiye önemli ölçüde değişir.

Uzayda belirli bir noktadan geliyormuş gibi görünen bir çift kulaklı sesi sentezlemek için iki kulak için bir çift HRTF kullanılabilir . Belirli bir noktadan gelen sesin kulağa nasıl ulaşacağını (genellikle işitsel kanalın dış ucunda ) tanımlayan bir aktarım işlevidir . Stereo (iki hoparlörlü) kulaklıklardan surround ses üretmek üzere tasarlanmış bazı tüketici ev eğlence ürünleri HRTF'leri kullanır. Bazı HRTF işleme biçimleri, hoparlörlerden surround ses çalmayı simüle etmek için bilgisayar yazılımına dahil edilmiştir.

İnsanların sadece iki kulağı vardır , ancak sesleri üç boyutta bulabilirler - aralıkta (mesafe), yukarı ve aşağı yön (yükseklik), ön ve arka ve ayrıca her iki tarafa (azimut). Bu mümkündür çünkü beyin, iç kulak ve dış kulak ( pinna ) konum hakkında çıkarımlarda bulunmak için birlikte çalışır. Ses kaynaklarını lokalize etme yeteneği insanlarda ve atalarda evrimsel bir gereklilik olarak gelişmiş olabilir, çünkü gözler bir izleyicinin etrafındaki dünyanın sadece bir kısmını görebilir ve karanlıkta görme engellenirken, bir ses kaynağını lokalize etme yeteneği bir ses kaynağında çalışır. çevreleyen ışıktan bağımsız olarak, değişen doğrulukta tüm yönler.

İnsanlar bir kulak (türetilen ipuçları alarak kaynağının konumunu tahmin mono ipuçları ve her iki kulak (alınan ipuçları karşılaştırılmasıyla) fark ipuçlarının veya çift sesli ipuçları ). Fark ipuçları arasında varış ve yoğunluk farklılıklarının zaman farklılıkları vardır. Tek sesli ipuçları, ses kaynağı ile orijinal kaynak sesin işitsel sistem tarafından işlenmek üzere kulak kanalına girmeden önce değiştirildiği insan anatomisi arasındaki etkileşimden gelir. Bu modifikasyonlar kaynak konumunu kodlar ve kaynak konumu ve kulak konumu ile ilgili olan bir dürtü yanıtı yoluyla yakalanabilir . Bu dürtü yanıtı, kafa ile ilgili dürtü yanıtı (HRIR) olarak adlandırılır . Kıvrım HRIR ile keyfi bir kaynak sesin o alıcı konumunda dinleyicinin kulağına sahip kaynak konumunda oynanan olsaydı dinleyici tarafından duyulmuş edilecek olanla sesi dönüştürür. HRIR'ler sanal surround ses üretmek için kullanılmıştır.

HRTF, HRIR'nin Fourier dönüşümüdür .

Sol ve sağ kulak için HRTF'ler (yukarıda HRIR olarak ifade edilmiştir), bir ses kaynağının ( x ( t )) sol ve sağ kulakta sırasıyla x L ( t ) ve x R ( t ) olarak algılanmadan önce filtrelenmesini tanımlar .

HRTF aynı zamanda bir sesin serbest havadaki bir yönden kulak zarına geldiğinde sese yaptığı değişiklikler olarak da tanımlanabilir . Bu değişiklikler dinleyicinin dış kulağının şeklini, dinleyicinin başının ve vücudunun şeklini, sesin çalındığı boşluğun akustik özelliklerini vb. içerir. Tüm bu özellikler, bir dinleyicinin bir sesin hangi yönden geldiğini doğru bir şekilde nasıl söyleyebileceğini (veya söyleyip söyleyemeyeceğini) etkileyecektir.

AES69-2015 standardında, Audio Engineering Society (AES), kafa ile ilgili aktarım işlevleri (HRTF'ler) gibi uzamsal olarak yönlendirilmiş akustik verileri depolamak için SOFA dosya biçimini tanımlamıştır. SOFA yazılım kitaplıkları ve dosyaları, Sofa Conventions web sitesinde toplanır.

HRTF nasıl çalışır?

İlişkili mekanizma, baş ve kulak şekilleri farklı olduğu için bireyler arasında farklılık gösterir.

HRTF, belirli bir ses dalgası girişinin (frekans ve kaynak konumu olarak parametrelendirilmiş), ses kulak zarı ve iç kulağın iletim mekanizmasına ulaşmadan önce , başın , kulak kepçesinin ve gövdenin kırınım ve yansıma özellikleri tarafından nasıl filtrelendiğini açıklar (bkz. işitsel sistem). ). Biyolojik olarak, bu dış yapıların kaynağa-konuma özgü ön filtreleme etkileri, kaynak konumunun nöral olarak belirlenmesine , özellikle de kaynağın yüksekliğinin belirlenmesine yardımcı olur (bkz. dikey ses lokalizasyonu ).

Teknik türetme

Kulakların frekans yanıtı örneği:
  • yeşil eğri : sol kulak   X L ( f )
  • mavi eğri : sağ kulak X R ( f )
yukarı önden bir ses kaynağı için.
Bir referans noktasından alınan azimut ile HRTF eğiminin nasıl elde edildiğine dair bir örnek

Lineer sistem analizi, transfer fonksiyonunu çıkış sinyali spektrumu ile frekansın bir fonksiyonu olarak giriş sinyali spektrumu arasındaki karmaşık oran olarak tanımlar . Blauert (1974; Blauert, 1981'de alıntılanmıştır) başlangıçta transfer fonksiyonunu serbest alan transfer fonksiyonu (FFTF) olarak tanımlamıştır. Diğer terimler, serbest alandan kulak zarına transfer fonksiyonunu ve serbest alandan kulak zarına basınç dönüşümünü içerir. Daha az spesifik açıklamalar, kulak kepçesi aktarım işlevini, dış kulak aktarım işlevini, kulak kepçesi yanıtını veya yönlü aktarım işlevini (DTF) içerir.

Transfer fonksiyonu , H ( f herhangi bir doğrusal arasında) zaman içinde değişmez sistem frekansı, f olduğu:

H ( f ) = Çıktı( f ) / Girdi( f )

Bu nedenle, belirli bir kaynak konumundan HRTF'yi elde etmek için kullanılan bir yöntem , kaynağa yerleştirilen darbe Δ ( t ) için kulak zarındaki kafa ile ilgili darbe yanıtını (HRIR), h ( t ) ölçmektir . HRTF H ( f ), HRIR h ( t )' nin Fourier dönüşümüdür .

İdealleştirilmiş geometrinin "kukla kafası" için ölçüldüğünde bile, HRTF, frekansın ve üç uzamsal değişkenin karmaşık işlevleridir . Bununla birlikte, kafadan 1 m'den daha büyük mesafeler için, HRTF'nin menzille ters orantılı olarak zayıfladığı söylenebilir. En sık ölçülen , bu uzak HRTF, H ( f , θ , φ ) alanıdır . Daha yakın mesafede, kulaklar arasında gözlemlenen seviye farkı, uzak alanda ihmal edilebilir seviye farklılıklarının gözlendiği düşük frekans bölgesinde bile oldukça büyüyebilir.

HRTF'ler, erken yansımaların ve yankılanmanın ölçülen yanıt üzerindeki etkisini en aza indirmek için tipik olarak yankısız bir odada ölçülür. HRTF küçük artışlarla ölçülür θ ile, yatay bir düzlemde, örneğin 15 ° kadar ° ya da 30 interpolasyon sentez için kullanılan HRTF isteğe bağlı pozisyonlarında s İçeride ISTV melerin RWMAIWi'nin . Bununla birlikte, küçük artışlarla bile, enterpolasyon ön-arka karışıklığa yol açabilir ve enterpolasyon prosedürünü optimize etmek aktif bir araştırma alanıdır.

Ölçülen bir HRTF'de sinyal-gürültü oranını (SNR) maksimize etmek için , üretilen darbenin yüksek hacimli olması önemlidir. Bununla birlikte, pratikte, yüksek hacimlerde impuls üretmek zor olabilir ve üretilirlerse insan kulağına zarar verebilirler, bu nedenle HRTF'lerin doğrudan frekans alanında bir frekans süpürme sinüs dalgası kullanılarak doğrudan hesaplanması daha yaygındır. veya maksimum uzunluk dizilerini kullanarak . Bununla birlikte, kullanıcı yorgunluğu hala bir sorundur ve daha az ölçüme dayalı enterpolasyon yeteneği ihtiyacını vurgulamaktadır.

Kafa ile ilgili transfer işlevi, ITD ve ILD'nin koninin "0" kısmı etrafındaki birçok konumdan gelen ses kaynakları için aynı olduğu bir dizi nokta olan Karışıklık Konisi'nin çözümlenmesinde rol oynar . Bir ses kulak tarafından alındığında bu ya kulak kanalı içerisine kulak düz aşağı gidebilir veya kapalı yansıtılabilir memelerine harici olarak ikinci bir fraksiyon daha sonra kulak kanalı içerisine, kulak. Ses birçok frekans içerecektir, bu nedenle bu sinyalin birçok kopyası, frekanslarına bağlı olarak (yansıma, kırınım ve bunların yüksek ve düşük frekanslarla etkileşimlerine ve sesin yapılarının boyutuna göre) farklı zamanlarda kulaktan inecektir. kulak.) Bu kopyalar birbiriyle örtüşür ve bu sırada bazı sinyaller güçlendirilir (sinyallerin fazlarının eşleştiği yerde), diğer kopyalar iptal edilir (sinyalin fazlarının eşleşmediği durumlarda). Esasen beyin, sinyalde sesin bilinen belirli yönlerine karşılık gelen frekans çentikleri arar.

Başka bir kişinin kulakları değiştirilirse, güçlendirme ve iptal kalıpları, kişinin işitsel sisteminin alışkın olduğu kalıplardan farklı olacağından, kişi sesi hemen lokalize edemezdi. Bununla birlikte, birkaç hafta sonra, işitsel sistem yeni kafa ile ilgili transfer işlevine uyum sağlayacaktır. HRTF'lerin spektrumlarındaki denekler arası değişkenlik, küme analizleri yoluyla incelenmiştir.

Kişinin kulağı arasındaki değişimler üzerinden varyasyonu değerlendirerek, bakış açımızı başın serbestlik dereceleri ve uzamsal alanla olan ilişkisi ile sınırlayabiliriz. Bu sayede, karmaşıklık katan eğim ve diğer koordinat parametrelerini ortadan kaldırıyoruz. Kalibrasyon amacıyla, yalnızca kulaklarımıza yönelik yön seviyesi ile ilgileniyoruz, dolayısıyla belirli bir serbestlik derecesi. HRTF'yi kalibre etmek için bir ifade çıkarmanın yollarından bazıları şunlardır:

  1. Sanal İşitsel uzayda sesin yerelleştirilmesi
  2. HRTF Faz sentezi
  3. HRTF Büyüklük sentezi

Sanal işitsel uzayda sesin yerelleştirilmesi

Sanal bir işitsel alanın yaratılmasındaki temel varsayım, dinleyicinin kulak zarlarında bulunan akustik dalga biçimlerinin kulaklıklar altında serbest alandaki ile aynı olması durumunda, dinleyicinin deneyiminin de aynı olması gerektiğidir.

Tipik olarak, kulaklıklardan üretilen sesler kafanın içinden geliyormuş gibi algılanır. Sanal işitsel alanda, kulaklıklar sesi "dışsallaştırabilmelidir". HRTF'yi kullanarak, aşağıda açıklanan teknik kullanılarak sesler uzamsal olarak konumlandırılabilir.

x 1 ( t ) bir hoparlörü çalıştıran bir elektrik sinyalini ve y 1 ( t ) dinleyicinin kulak zarı içindeki bir mikrofon tarafından alınan sinyali temsil etsin . Benzer şekilde, x 2 ( t ) bir kulaklığı çalıştıran elektrik sinyalini ve y 2 ( t ) sinyale verilen mikrofon yanıtını temsil etsin . Sanal işitsel uzayın amacı x 2 ( t )' yi y 2 ( t ) = y 1 ( t ) olacak şekilde seçmektir . Fourier dönüşümünü bu sinyallere uygulayarak aşağıdaki iki denklemi elde ederiz:

Y 1 = X 1 LFM ve
Y, 2 = x 2 HM,

burada L , hoparlörün serbest alandaki aktarım işlevidir, F HRTF'dir, M mikrofon aktarım işlevidir ve H , kulaklıktan kulak zarına aktarım işlevidir. Y 1 = Y 2 ayarı ve X 2 verimi için çözümleme

X 2 = X 1 LF/H.

Gözlem yoluyla, istenen transfer fonksiyonu

T = LF / H .

Dolayısıyla teorik olarak x 1 ( t ) bu filtreden geçirilir ve ortaya çıkan x 2 ( t ) kulaklıkta çalınırsa kulak zarında da aynı sinyali üretmesi gerekir. Filtre sadece tek bir kulak için geçerli olduğundan, diğer kulak için bir başkasının türetilmesi gerekir. Nyquist kriterlerine göre örnekleme koşullarının belirlenmesini sağlarken, yeniden oluşturulacak her pozisyon için kafa ile ilgili transfer fonksiyonları dizisi oluşturmak için bu işlem sanal ortamdaki birçok yer için tekrarlanır .

HRTF faz sentezi

Frekans bandının çok düşük kısmında daha az güvenilir faz tahmini vardır ve üst frekanslarda faz yanıtı pinna'nın özelliklerinden etkilenir. Daha önceki çalışmalar ayrıca, HRTF faz yanıtının çoğunlukla doğrusal olduğunu ve dinleyicilerin, dalga formunun birleşik düşük frekanslı kısmının kulaklar arası zaman gecikmesi (ITD) korunduğu sürece kulaklar arası faz spektrumunun ayrıntılarına duyarsız olduğunu göstermektedir. Bu, yön ve yüksekliğe bağlı olarak, konu HRTF'nin bir zaman gecikmesi olarak modellenen faz yanıtıdır.

Ölçekleme faktörü, antropometrik özelliklerin bir fonksiyonudur. Örneğin, N denekten oluşan bir eğitim seti, her bir HRTF aşamasını dikkate alacak ve grubun ortalama gecikmesi olarak tek bir ITD ölçeklendirme faktörünü tanımlayacaktır. Bu hesaplanan ölçeklendirme faktörü, belirli herhangi bir birey için yön ve yüksekliğin fonksiyonu olarak zaman gecikmesini tahmin edebilir. Sol ve sağ kulaklar için zaman gecikmesini faz yanıtına dönüştürmek önemsizdir.

HRTF aşaması, ITD ölçekleme faktörü ile tanımlanabilir . Bu da, referans kaynağı olarak alınan belirli bir bireyin antropometrik verileriyle ölçülür. Genel durumda biz dikkate β seyrek vektörü olarak

deneğin antropometrik özelliklerini, eğitim verilerinden (y ' = β T X) antropometrik özelliklerin doğrusal bir süperpozisyonu olarak temsil eden ve ardından aynı seyrek vektörü doğrudan H ölçeklendirme vektörüne uygulayan. Bu görevi bir minimizasyon problemi olarak yazabiliriz. , negatif olmayan bir küçülen parametre λ için :

Bundan, ITD ölçekleme faktörü değeri H ' şu şekilde tahmin edilir:

burada veri kümesindeki tüm kişiler için ITD ölçeklendirme faktörleri bir HR N vektöründe istiflenir , bu nedenle H n değeri n'inci kişinin ölçeklendirme faktörüne karşılık gelir.

HRTF büyüklük sentezi

Yukarıdaki minimizasyon problemini Least Absolute Shrinkage and Selection Operator (LASSO) kullanarak çözüyoruz. HRTF'lerin antropometrik özelliklerle aynı ilişkiyle temsil edildiğini varsayıyoruz. Bu nedenle, antropometrik özelliklerden seyrek vektör β'yı öğrendiğimizde, onu doğrudan HRTF tensör verilerine ve deneğin HRTF değerlerine H ' aşağıdaki şekilde uygularız :

burada her özne için HRTF'ler, D  ×  K boyutunda bir tensör tarafından tanımlanır , burada D , HRTF yönlerinin sayısıdır ve K , frekans kutuları sayısıdır. Tüm H , n , D , K eğitim setinin tüm HRTF karşılık gelir, yeni bir tensör yığılır HR K x D x K , değeri, H, böylece , n, D, K için tekabül k için inci frekans kutusu d n . kişinin -th HRTF yönü . Ayrıca H ' d , k karşılık için k sentezlenmiş HRTF her D-inci HRTF yönü için inci frekans.

Kayıt teknolojisi

Bir bilgisayar oyun ortamında (bkz. A3D , EAX ve OpenAL ), dinleyicinin HRTF'sine yaklaşan bir HRTF aracılığıyla işlenen kayıtlar, stereo kulaklık veya hoparlörler aracılığıyla duyulabilir ve her yönden gelen sesleri içeriyormuş gibi yorumlanabilir başın her iki tarafında sadece iki nokta yerine. Sonucun algılanan doğruluğu, HRTF veri setinin kişinin kendi kulaklarının özellikleriyle ne kadar yakından eşleştiğine bağlıdır.

Ayrıca bakınız

Referanslar

Dış bağlantılar