Nirengi (bilgisayar görüşü) - Triangulation (computer vision)

Gelen bilgisayar vizyonu nirengi iki veya daha fazla, görüntüler üzerine Tahminlerini verilen 3 boyutlu uzayda bir noktaya belirleme sürecinde ifade eder. Bu problemi çözmek için, kamera matrisleri ile temsil edilen en basit durumda, ilgili kameralar için kamera projeksiyon fonksiyonunun parametrelerini 3B'den 2'ye bilmek gerekir . Nirengi, bazen yeniden inşa veya kesişme olarak da adlandırılır .

Nirengi problemi prensipte önemsizdir. Bir görüntüdeki her nokta 3B uzayda bir çizgiye karşılık geldiğinden, 3B'de çizgi üzerindeki tüm noktalar görüntüdeki noktaya yansıtılır. İki veya daha fazla görüntüde bir çift karşılık gelen nokta bulunabilirse, bunların ortak bir 3B noktasının projeksiyonu olması gerekir x . Kesişen gereken görüntü noktaları tarafından oluşturulan çizgiler grubu x (3D noktası) ve koordinat cebirsel formülasyonun x (3D noktası) olarak aşağıdaki gibidir, çeşitli şekillerde de hesaplanabilir.

Ancak pratikte, görüntü noktalarının koordinatları keyfi doğrulukla ölçülemez. Bunun yerine, mercek bozulmasından kaynaklanan geometrik gürültü veya ilgi noktası algılama hatası gibi çeşitli gürültü türleri, ölçülen görüntü koordinatlarında yanlışlıklara yol açar. Sonuç olarak, karşılık gelen görüntü noktaları tarafından oluşturulan çizgiler her zaman 3B uzayda kesişmez. O halde sorun, ölçülen görüntü noktalarına en iyi şekilde uyan bir 3B nokta bulmaktır. Literatürde, optimalliğin nasıl tanımlanacağına ve optimal 3B noktasının nasıl bulunacağına dair birçok öneri bulunmaktadır. Farklı optimallik kriterlerine dayandıklarından, çeşitli yöntemler gürültü söz konusu olduğunda 3 boyutlu x noktasının farklı tahminlerini üretir .

Giriş

Aşağıda, iğne deliği kameraları tarafından oluşturulan iki görünümden karşılık gelen görüntü noktalarında üçgenlemenin yapıldığı varsayılmaktadır . Bu varsayımlardan genelleme burada tartışılmaktadır .

İdeal epipolar geometri durumu. Bir 3B noktası x , her kameranın odak noktası O 1 ve O 2 ile kesişen çizgiler (yeşil) aracılığıyla iki kamera görüntüsüne yansıtılır . Ortaya çıkan görüntü noktaları y 1 ve y 2'dir . Yeşil çizgiler x noktasında kesişiyor .
Uygulamada, y 1 ve y 2 görüntü noktaları keyfi doğrulukla ölçülemez. Bunun yerine y ' 1 ve y' 2 noktaları tespit edilir ve nirengi için kullanılır. Karşılık gelen projeksiyon çizgileri (mavi) genel olarak 3B uzayda kesişmez ve ayrıca x noktası ile kesişmeyebilir .

Soldaki görüntü , iğne deliği modelinin bir çift stereo kamerasının epipolar geometrisini göstermektedir . Bir nokta x 3D uzayda (3D noktası) kameranın geçen bir hat (yeşil) boyunca karşılık gelen görüntü düzlemine izdüşümü bir odak noktası , ve karşılık gelen iki görüntü noktaları ile sonuçlanır ve . Verilirse ve iki kameranın geometrisi biliniyorsa, iki projeksiyon çizgisi (yeşil çizgiler) belirlenebilir ve x noktasında (3D noktası) kesişmeleri gerekir . Kesişme noktasının basit bir şekilde belirlenebileceği temel doğrusal cebir kullanılarak .

Sağdaki resim gerçek durumu göstermektedir. Görüntü noktalarının konumu ve tam olarak ölçülemez. Nedeni, aşağıdaki gibi faktörlerin birleşimidir

  • Geometrik bozulma, örneğin lens distorsiyonu , bu, kameranın 3D'den 2D'ye eşlemesinin iğne deliği kamera modelinden saptığı anlamına gelir . Bir dereceye kadar bu hatalar, geriye kalan geometrik bir hata bırakarak telafi edilebilir.
  • X (3B nokta) ' dan gelen tek bir ışık ışını, bir noktaya yayılma fonksiyonuna göre kameraların lens sistemine dağıtılır . Görüntülerdeki dağınık yoğunluk fonksiyonunun ölçümlerinden karşılık gelen görüntü noktasının kurtarılması hatalar verir.
  • Dijital bir kamerada, görüntü yoğunluğu işlevi yalnızca ayrık sensör elemanlarında ölçülür. Doğru olanı elde etmek için ayrık yoğunluk fonksiyonunun tam olmayan enterpolasyonu kullanılmalıdır.
  • Nirengi için kullanılan görüntü noktaları y 1 ' ve y 2 ' genellikle çeşitli tiplerde özellik çıkarıcılar kullanılarak bulunur, örneğin genel olarak köşeler veya ilgi noktaları. Komşuluk işlemlerine dayalı herhangi bir özellik çıkarma türü için doğal bir yerelleştirme hatası vardır .

Sonuç olarak, ölçülen görüntü noktaları ve yerine ve şeklindedir . Ancak, projeksiyon çizgilerinin (mavi) 3B alanda kesişmesi veya x'e yaklaşması gerekmez . Aslında, bu çizgileri ancak ve ancak kesişir ve tatmin Epipolar kısıtlaması ile tanımlanır temel matris . Ölçüm gürültüsünü Verilen ve bunun Epipolar kısıt memnun değil ve projeksiyon çizgileri kesiştiği bilmediğimiz oldukça muhtemeldir.

Bu gözlem, nirengi ile çözülen soruna yol açar. Hangi 3B nokta x tahmini verilen x ve kameraların geometrisinin en iyi tahminidir ? Cevap genellikle x est'e bağlı bir hata ölçüsü tanımlayarak ve ardından bu hatayı en aza indirerek bulunur. Aşağıdaki bölümlerde, literatürde sunulan çeşitli x est hesaplama yöntemlerinden bazıları kısaca açıklanmaktadır.

Tüm üçgenleme yöntemleri , bu durumda ve yani epipolar kısıtlama sağlandığında x est = x üretir (tekil noktalar hariç, aşağıya bakın). Yöntemler arasında farklılık gösteren kısıtlama sağlanmadığında olan şeydir.

Özellikleri

Bir nirengi yöntemi, bir fonksiyon açısından tanımlanabilir, öyle ki

tespit edilen görüntü noktalarının homojen koordinatları nerede ve kamera matrisleridir. x (3B nokta), ortaya çıkan 3B noktanın homojen gösterimidir. İşareti olduğunu gösterir , sadece eşit olan bir vektör üretmek için gerekli olan x homojen vektörler söz konusu olduğundan, sıfır olmayan bir skaler ile bir çarpma üzere.

Spesifik metotlara, yani spesifik fonksiyonlara bakmadan önce , metotlarla ilgili açıklanması gereken bazı genel kavramlar vardır. Belirli bir problem için hangi nirengi yönteminin seçildiği bir ölçüde bu özelliklere bağlıdır.

Tekillikler

Yöntemlerden bazıları, bazı kombinasyonlarına karşılık gelen 3B alanın belirli bir alt kümesinde yer alıyorsa x (3B nokta) tahminini doğru bir şekilde hesaplayamaz . Bu alt kümedeki bir nokta , nirengi yönteminin tekilliğidir . Başarısızlığın nedeni, çözülecek bazı denklem sistemlerinin eksik belirlenmiş olması veya x est'in projektif temsilinin tekil noktalar için sıfır vektörü olması olabilir.

Değişmezlik

Bazı uygulamalarda, üçgenlemenin 3B noktaları temsil etmek için kullanılan koordinat sisteminden bağımsız olması istenir; nirengi problemi bir koordinat sisteminde formüle edilir ve daha sonra başka bir koordinat sistemine dönüştürülürse, ortaya çıkan x tahmini de aynı şekilde dönüşmelidir. Bu özellik genellikle değişmezlik olarak adlandırılır . Her üçgenleme yöntemi değişmezliği garanti etmez, en azından genel koordinat dönüşüm türleri için.

3B koordinatların homojen bir temsili için, en genel dönüşüm, bir matris ile temsil edilen yansıtmalı bir dönüşümdür . Homojen koordinatlar şuna göre dönüştürülürse

sonra kamera matrisleri ( C k ) olarak dönüştürülmelidir

aynı homojen görüntü koordinatlarını üretmek için ( y k )

Üçgenleştirme işlevi değişmez ise , aşağıdaki ilişki geçerli olmalıdır

onu takip eden

  hepsi için

Her nirengi yöntemi için bu son ilişkinin geçerli olup olmadığı belirlenebilir. Eğer öyleyse, yalnızca yansıtmalı dönüşümlerin bir alt kümesi için, örneğin katı veya afin dönüşümler için karşılanabilir.

Hesaplama karmaşıklığı

İşlev , uygulamada nispeten karmaşık olabilen bir hesaplamanın yalnızca soyut bir temsilidir. Bazı yöntemler , kapalı formda sürekli bir fonksiyon olan a ile sonuçlanırken, diğerlerinin örneğin SVD veya bir polinomun köklerini bulmayı içeren bir dizi hesaplama adımına ayrıştırılması gerekir . Yine , bazı parametrelerin yinelemeli tahminine dayanması gereken başka bir yöntem sınıfı ortaya çıkar . Bu, hem hesaplama süresinin hem de ilgili işlemlerin karmaşıklığının farklı yöntemler arasında değişebileceği anlamına gelir.

Yöntemler

Orta nokta yöntemi

İki görüntü noktasının her biri ve (yukarıda doğru resimde mavi) karşılık gelen bir çıkıntı hattı vardır, burada olarak gösterilir ve kamera matrisleri verilen tespit edilebilir, . Izin vermek , bir (3B çizgi) L ve bir x (3B noktası) arasında, ve arasındaki Öklid mesafesi olan bir mesafe fonksiyonu olsun . Orta nokta yöntemi noktası bulur X est olan en aza indirir

Görünüşe göre x est , iki izdüşüm çizgisini birleştiren en kısa çizgi parçasının tam ortasında yer almaktadır.

Doğrudan doğrusal dönüşüm

Temel matris aracılığıyla

Orada çözülmesi gereken sorun, karşılık gelen normalize edilmiş görüntü koordinatlarının nasıl hesaplanacağıdır ve . Eğer gerekli matris bilinen ve karşılık gelen döndürme ve dönüşümler tespit edilmiştir, bu algoritma (Longuet-Higgins'in yazıda anlatılan) bir çözüm sağlamaktadır.

Let anlamında olabildikleri satır k rotasyon matrisi :

İki koordinat sistemindeki 3B koordinatlar arasındaki yukarıdaki ilişkileri ve daha önce açıklanan 3B ve 2B noktalar arasındaki eşlemeyi birleştirmek,

veya

Bir kez belirlendiğinde, diğer iki koordinat şu şekilde hesaplanabilir:

Yukarıdaki türetme benzersiz değildir. Buna göre bir ifade ile başlamak ve bir ifade türetmek de mümkündür .

İdeal durumda, kamera 3B noktaları mükemmel bir iğne deliği kamerasına göre eşlediğinde ve ortaya çıkan 2B noktalar herhangi bir gürültü olmadan algılanabildiğinde, iki ifade eşittir. Ancak uygulamada, bunlar değildir ve örneğin bir tür ortalama açısından iki tahmininin birleştirilmesi avantajlı olabilir .

Yukarıdaki hesaplamaların mümkün olan başka uzantı türleri de vardır. Hazırlanmış görüntü koordinatlarının bir ifadesiyle ve primlenmemiş sistemde türetilmiş 3B koordinatlarla başladılar. Primer olmayan görüntü koordinatlarıyla başlamak ve nihayetinde prime edilmemiş 3B koordinatlara dönüştürülebilen hazır 3B koordinatlar elde etmek de mümkündür. Yine ideal durumda, sonuç yukarıdaki ifadelere eşit olmalıdır, ancak pratikte sapma gösterebilir.

Son bir açıklama, temel matrisin karşılık gelen görüntü koordinatından belirlenmesi durumunda, ki bu genellikle 3B noktaların bu şekilde belirlendiği durumda, çeviri vektörünün yalnızca bilinmeyen bir pozitif ölçeklemeye kadar bilindiği gerçeğiyle ilgilidir . Sonuç olarak, yeniden yapılandırılmış 3B noktalar da pozitif bir ölçeklendirme açısından belirsizdir.

Optimal üçgenleme

Ayrıca bakınız

Referanslar

  • Richard Hartley ve Andrew Zisserman (2003). Bilgisayarla görüşte Çoklu Görünüm Geometrisi . Cambridge University Press. ISBN   978-0-521-54051-3 .

Dış bağlantılar