Bulanık kümeleme - Fuzzy clustering

Bulanık kümeleme (aynı zamanda şu şekilde de ifade yumuşak kümelenme veya yumuşak k anlamına gelmektedir ) her biri kümelenme şeklidir veri noktası birden fazla kümeye ait olabilir.

Kümeleme veya küme analizi , aynı kümedeki öğeler mümkün olduğunca benzerken, farklı kümelere ait öğeler mümkün olduğunca farklı olacak şekilde kümelere veri noktaları atamayı içerir. Kümeler, benzerlik ölçütleriyle tanımlanır. Bu benzerlik ölçütleri mesafe, bağlanabilirlik ve yoğunluğu içerir. Verilere veya uygulamaya bağlı olarak farklı benzerlik ölçüleri seçilebilir.

Sert kümeleme ile karşılaştırma

Bulanık olmayan kümelemede (sert kümeleme olarak da bilinir), veriler, her bir veri noktasının yalnızca bir kümeye ait olabileceği farklı kümelere bölünür. Bulanık kümelemede, veri noktaları potansiyel olarak birden çok kümeye ait olabilir. Örneğin, bir elma kırmızı veya yeşil olabilir (sert kümeleme), ancak bir elma aynı zamanda kırmızı VE yeşil olabilir (bulanık kümeleme). Burada elma belli bir dereceye kadar kırmızı, belli bir dereceye kadar yeşil olabilir. Yeşile [yeşil = 1] ait olan ve kırmızıya [kırmızı = 0] ait olmayan elma yerine, elma yeşil [yeşil = 0,5] ve kırmızıya [kırmızı = 0,5] ait olabilir. Bu değerler 0 ile 1 arasında normalize edilir; ancak, olasılıkları temsil etmezler, bu nedenle iki değerin 1'e eşit olması gerekmez.

Üyelik

Üyelik dereceleri, veri noktalarının (etiketlerin) her birine atanır. Bu üyelik dereceleri, veri noktalarının her bir kümeye ait olma derecesini gösterir. Bu durumda, bir kümenin kenarı üzerindeki noktalar, düşük üyelik dereceleri ile, olabilir küme küme merkezinde noktalarından daha düşük bir dereceye kadar.

Bulanık C-ortalama kümeleme

En yaygın olarak kullanılan bulanık kümeleme algoritmalarından biri, Bulanık C-ortalamalar kümeleme (FCM) algoritmasıdır.

Tarih

Bulanık c-ortalamalar (FCM) kümeleme, 1973'te JC Dunn tarafından geliştirildi ve 1981'de JC Bezdek tarafından geliştirildi.

Genel açıklama

Bulanık c- means algoritması, k- means algoritmasına çok benzer :

  • Birkaç küme seçin .
  • Kümelerde olmak için her veri noktasına rastgele katsayılar atayın.
  • Algoritma yakınsayana kadar tekrarlayın (yani, iki yineleme arasındaki katsayıların değişimi , verilen duyarlılık eşiğinden fazla değildir):
    • Her küme için ağırlık merkezini hesaplayın (aşağıda gösterilmiştir).
    • Her veri noktası için kümelerde bulunma katsayılarını hesaplayın.

merkez

Herhangi bir nokta X olma derecesi veren katsayıları kümesi vardır k inci küme ağırlık k ( x ). Bulanık c- ortalamalarla, bir kümenin ağırlık merkezi, kümeye ait olma derecelerine göre ağırlıklandırılan tüm noktaların ortalamasıdır veya matematiksel olarak,

burada m , kümenin ne kadar bulanık olacağını kontrol eden hiper parametredir. Ne kadar yüksekse, küme sonunda o kadar bulanık olacaktır.

algoritma

FCM algoritması, belirli bir kritere göre sonlu bir eleman koleksiyonunu bir c bulanık küme koleksiyonuna bölmeye çalışır .

Sonlu bir veri kümesi verildiğinde, algoritma bir küme merkezleri listesi ve bir bölüm matrisi döndürür.

, burada her öğe, , öğesinin kümeye ait olma derecesini söyler .

FCM, bir amaç fonksiyonunu en aza indirmeyi amaçlar:

nerede:

K-araç kümeleme ile karşılaştırma

K-ortalama kümeleme ayrıca yukarıda gösterilen amaç fonksiyonunu en aza indirmeye çalışır. Bu yöntem , üyelik değerlerinin ve fuzzifier, , ile eklenmesiyle k-ortalamalar amaç fonksiyonundan farklıdır . Bulanıklaştırıcı , küme bulanıklığının seviyesini belirler. Büyük , daha küçük üyelik değerleriyle ve dolayısıyla daha bulanık kümelerle sonuçlanır. Limitte , üyelikler 0 veya 1'e yakınsar, bu da net bir bölümleme anlamına gelir. Deney veya etki alanı bilgisinin yokluğunda , genellikle 2'ye ayarlanır. Algoritma küme içi varyansı da en aza indirir, ancak 'k'-araçlarıyla aynı sorunlara sahiptir; minimum yerel bir minimumdur ve sonuçlar başlangıçtaki ağırlık seçimine bağlıdır.

İlgili algoritmalar

Küme sayısı için otomatik olarak belirlenen Fuzzy C-ortalamalar (FCM), algılama doğruluğunu artırabilir. Beklenti-maksimizasyon algoritması ile birlikte Gauss'ların bir karışımını kullanmak , şu fikirlerin bazılarını içeren daha istatistiksel olarak resmi bir yöntemdir: sınıflara kısmi üyelik.

Misal

Bu prensibi daha iyi anlamak için, aşağıda bir x ekseni üzerinde klasik bir tek boyutlu veri örneği verilmiştir.

Bulanık Örnek 1.jpg

Bu veri seti geleneksel olarak iki kümeye ayrılabilir. X ekseninde bir eşik seçilerek veriler iki kümeye ayrılır. Ortaya çıkan kümeler, aşağıdaki resimde görüldüğü gibi 'A' ve 'B' olarak etiketlenmiştir. Bu nedenle, veri kümesine ait her nokta, 1 veya 0 üyelik katsayısına sahip olacaktır. Karşılık gelen her veri noktasının bu üyelik katsayısı, y ekseninin dahil edilmesiyle temsil edilir.

Örnek 2.jpg

Bulanık kümelemede, her veri noktasının birden çok kümeye üyeliği olabilir. Üyelik katsayılarının tanımını kesinlikle 1 veya 0'dan gevşeterek, bu değerler 1'den 0'a kadar herhangi bir değer arasında değişebilir. Aşağıdaki görüntü önceki kümelemeden gelen veri kümesini göstermektedir, ancak şimdi bulanık c-ortalama kümelemesi uygulanmaktadır. İlk olarak, iki kümeyi tanımlayan yeni bir eşik değeri oluşturulabilir. Daha sonra, her bir veri noktası için yeni üyelik katsayıları, küme merkez noktalarına ve ayrıca her küme merkezine olan uzaklığa dayalı olarak oluşturulur.

Örnek 3.jpg

Görüldüğü gibi, ortadaki veri noktası A kümesine ve B kümesine aittir. 0,3 değeri bu veri noktasının A kümesi için üyelik katsayısıdır.

Uygulamalar

Kümeleme problemlerinin yüzey bilimi, biyoloji, tıp, psikoloji, ekonomi ve diğer birçok disiplinde uygulamaları vardır.

biyoinformatik

Biyoinformatik alanında, bir dizi uygulama için kümeleme kullanılmaktadır. Bir kullanım, RNA dizileme verilerinden veya diğer teknolojilerden gen ekspresyon verilerini analiz etmek için bir model tanıma tekniğidir. Bu durumda, benzer ifade modellerine sahip genler aynı kümede gruplanır ve farklı kümeler farklı, iyi ayrılmış ifade kalıpları sergiler. Kümelemenin kullanılması, gen işlevi ve düzenlemesi hakkında fikir verebilir. Bulanık kümeleme, genlerin birden fazla kümeye ait olmasına izin verdiği için, koşullu olarak birlikte düzenlenen veya birlikte ifade edilen genlerin tanımlanmasına izin verir. Örneğin, bir gen üzerinde birden fazla transkripsiyon faktörü etkili olabilir ve bir gen, birden fazla işlevi olan bir proteini kodlayabilir. Bu nedenle, bulanık kümeleme, sert kümelemeye göre daha uygundur.

Görüntü analizi

Bulanık c-ortalamalar, bir görüntüdeki nesnelerin kümelenmesinde görüntü işleme için çok önemli bir araç olmuştur. 1970'lerde matematikçiler, gürültü altında kümelemenin doğruluğunu geliştirmek için uzamsal terimi FCM algoritmasına dahil ettiler. Ayrıca, FCM algoritmaları, Hu ve Zernike Moments gibi görüntü tabanlı özellikleri kullanarak farklı etkinlikleri ayırt etmek için kullanılmıştır. Alternatif olarak, HSL renk uzayının HSL ve HSV'nin üç bileşeni üzerinde tanımlanan bulanık kümeler üzerinde bir bulanık mantık modeli tanımlanabilir ; Üyelik fonksiyonları renkleri tanımlamayı amaçlar, renk tanımlamanın insan sezgisini takip eder.

Pazarlama

Pazarlamada müşteriler, ihtiyaçlarına, marka seçimlerine, psiko-grafik profillerine veya pazarlamayla ilgili diğer bölümlere göre bulanık kümeler halinde gruplandırılabilir.

Görüntü işleme örneği

Orijinal (sol üstte), kümelenmiş (sağ üstte) ve üyelik haritası (altta) ile bulanık kümelemeyle bölümlere ayrılmış görüntü

K-ortalama kümeleme algoritmalarını kullanan görüntü segmentasyonu , örüntü tanıma, nesne algılama ve tıbbi görüntüleme için uzun süredir kullanılmaktadır. Ancak, gürültü, gölgeleme ve kameralardaki farklılıklar gibi gerçek dünya sınırlamaları nedeniyle, geleneksel sabit kümeleme, yukarıda belirtildiği gibi görüntü işleme görevlerini genellikle güvenilir bir şekilde yerine getiremez. Bu görevlerin gerçekleştirilmesinde daha uygulanabilir bir algoritma olarak bulanık kümeleme önerilmiştir. Verilen, Matlab'da bulanık kümelemeye maruz kalmış gri ölçekli bir görüntüdür. Orijinal görüntü, kümelenmiş bir görüntünün yanında görülür. Renkler, her pikselin üyeliğini tanımlamak için kullanılan üç farklı kümenin görsel bir temsilini vermek için kullanılır. Aşağıda, bunlara karşılık gelen yoğunluk değerlerinin bulanık üyelik katsayılarını tanımlayan bir grafik verilmiştir.

Bulanık kümeleme katsayılarının kullanılacağı uygulamaya bağlı olarak, RGB görüntülere farklı ön işleme teknikleri uygulanabilir . RGB'den HCL'ye dönüştürme yaygın bir uygulamadır.

Ayrıca bakınız

Referanslar