Veri goruntuleme - Data visualization

Veri görselleştirme (genellikle kısaltılmış veri yani ) disiplinler arası bir alandır ile fırsatlar olduğunu grafik gösterimi ait verileri . Veriler, örneğin bir zaman serisi gibi çok sayıda olduğunda iletişim kurmanın özellikle verimli bir yoludur .

Akademik bir bakış açısından, bu gösterim, orijinal veriler (genellikle sayısal) ve grafik öğeler (örneğin, bir çizelgedeki çizgiler veya noktalar) arasındaki bir eşleme olarak düşünülebilir. Eşleme, bu öğelerin niteliklerinin verilere göre nasıl değiştiğini belirler. Bu ışıkta, bir çubuk grafik, bir çubuğun uzunluğunun bir değişkenin büyüklüğüne eşlenmesidir. Haritalamanın grafik tasarımı bir grafiğin okunabilirliğini olumsuz etkileyebileceğinden, haritalama Veri görselleştirmesinin temel bir yetkinliğidir.

Veri görselleştirmenin kökleri İstatistik alanındadır ve bu nedenle genellikle Tanımlayıcı İstatistiklerin bir dalı olarak kabul edilir . Ancak, etkili bir şekilde görselleştirmek için hem tasarım becerileri hem de istatistiksel ve hesaplama becerileri gerektiğinden, bazı yazarlar tarafından hem Sanat hem de Bilim olduğu tartışılmaktadır.

İnsanların çeşitli görselleştirme türlerini nasıl okuyup yanlış okuduklarına ilişkin araştırmalar, görselleştirmelerin hangi türlerinin ve özelliklerinin en anlaşılır ve bilgi aktarımında etkili olduğunu belirlemeye yardımcı olur.

genel bakış

Veri görselleştirme, verileri analiz etme ve kullanıcılara sunma adımlarından biridir.

Bilgileri açık ve verimli bir şekilde iletmek için veri görselleştirme, istatistiksel grafikler , çizimler , bilgi grafikleri ve diğer araçları kullanır. Sayısal veriler, nicel bir mesajı görsel olarak iletmek için noktalar, çizgiler veya çubuklar kullanılarak kodlanabilir. Etkili görselleştirme, kullanıcıların veri ve kanıtları analiz etmelerine ve bunlar hakkında akıl yürütmelerine yardımcı olur. Karmaşık verileri daha erişilebilir, anlaşılır ve kullanılabilir hale getirir. Kullanıcıların karşılaştırma yapma veya nedenselliği anlama gibi belirli analitik görevleri olabilir ve grafiğin tasarım ilkesi (yani karşılaştırmaları gösterme veya nedenselliği gösterme) görevi takip eder. Tablolar genellikle kullanıcıların belirli bir ölçümü arayacakları yerlerde kullanılırken, çeşitli türlerdeki grafikler bir veya daha fazla değişken için verilerdeki kalıpları veya ilişkileri göstermek için kullanılır.

Veri görselleştirme, verileri veya bilgileri grafiklerde bulunan görsel nesneler (örn. noktalar, çizgiler veya çubuklar) olarak kodlayarak iletmek için kullanılan teknikleri ifade eder. Amaç, bilgileri kullanıcılara açık ve verimli bir şekilde iletmektir. Veri analizi veya veri bilimindeki adımlardan biridir . Vitaly Friedman'a (2008) göre "veri görselleştirmenin temel amacı, bilgileri grafik araçlar aracılığıyla açık ve etkili bir şekilde iletmektir. Bu, veri görselleştirmenin işlevsel olması için sıkıcı veya güzel görünmesi için aşırı derecede karmaşık görünmesi gerektiği anlamına gelmez. Fikirleri iletmek için" Etkili bir şekilde, hem estetik biçim hem de işlevsellik el ele gitmeli ve anahtar yönlerini daha sezgisel bir şekilde ileterek oldukça seyrek ve karmaşık bir veri kümesine ilişkin içgörüler sağlamalıdır.Yine de tasarımcılar genellikle biçim ve işlev arasında bir denge kuramazlar ve muhteşem görüntüler oluştururlar. asıl amaçlarına hizmet etmeyen veri görselleştirmeleri - bilgi iletmek".

Gerçekten de, Fernanda Viegas ve Martin M. Wattenberg , ideal bir görselleştirmenin yalnızca net bir şekilde iletişim kurması değil, aynı zamanda izleyici katılımını ve dikkatini teşvik etmesi gerektiğini öne sürdüler.

Veri görselleştirme, bilgi grafikleri , bilgi görselleştirme , bilimsel görselleştirme , keşifsel veri analizi ve istatistiksel grafiklerle yakından ilişkilidir . Yeni binyılda, veri görselleştirme aktif bir araştırma, öğretme ve geliştirme alanı haline geldi. Post et al. (2002), bilimsel ve bilgi görselleştirmeyi birleştirmiştir.

Ticari ortamda veri görselleştirmeye genellikle panolar denir . Infographics , çok yaygın bir başka veri görselleştirme biçimidir.

temeller

Etkili grafik ekranların özellikleri

Charles Joseph Minard'ın Napolyon Fransa'sının Rusya'yı işgalini gösteren 1869 diyagramı , bir bilgi grafiğinin erken bir örneği

Bir resmin en büyük değeri, bizi görmeyi hiç beklemediğimiz şeyleri fark etmeye zorlamasıdır.

John Tukey

Profesör Edward Tufte , bilgi ekranlarının kullanıcılarının karşılaştırma yapmak gibi belirli analitik görevleri yerine getirdiğini açıkladı . Tasarım prensibi bilgi grafik analitik görevi desteklemelidir. William Cleveland ve Robert McGill'in gösterdiği gibi, farklı grafik öğeler bunu az çok etkili bir şekilde gerçekleştirir. Örneğin, nokta grafikler ve çubuk grafikler, pasta grafiklerden daha iyi performans gösterir.

Onun 1983 kitabında Kantitatif Bilginin Görsel Görüntü , Edward Tufte tanımlar 'grafiksel görüntüler' ve aşağıdaki pasajda etkili grafik gösterimi için ilkeler: "Mükemmellik istatistiksel grafik netlik, kesinlik ve verimlilik ile tebliğ karmaşık fikirlerin oluşur grafiksel görüntüler gerektiği. :

  • verileri göster
  • İzleyiciyi metodoloji, grafik tasarım, grafik üretim teknolojisi ya da başka bir şey hakkında düşünmek yerine öz hakkında düşünmeye teşvik etmek
  • verilerin söyleyeceklerini çarpıtmaktan kaçının
  • küçük bir alanda birçok sayı sunun
  • büyük veri kümelerini tutarlı hale getirin
  • gözü farklı veri parçalarını karşılaştırmaya teşvik edin
  • Geniş bir genel bakıştan ince yapıya kadar verileri çeşitli ayrıntı seviyelerinde ortaya çıkarın
  • oldukça açık bir amaca hizmet eder: açıklama, keşif, tablolama veya dekorasyon
  • bir veri setinin istatistiksel ve sözlü açıklamalarıyla yakından bütünleştirilmelidir.

Grafikler verileri ortaya çıkarır . Gerçekten de grafikler, geleneksel istatistiksel hesaplamalardan daha kesin ve açıklayıcı olabilir."

Örneğin, Minard diyagramı, 1812-1813 döneminde Napolyon'un ordusunun uğradığı kayıpları göstermektedir. Altı değişken çizilir: ordunun büyüklüğü, iki boyutlu bir yüzeydeki konumu (x ve y), zaman, hareket yönü ve sıcaklık. Çizgi genişliği bir karşılaştırmayı (zamandaki noktalarda ordunun büyüklüğü) gösterirken, sıcaklık ekseni ordu büyüklüğündeki değişimin bir nedenini gösterir. İki boyutlu bir yüzey üzerindeki bu çok değişkenli görüntü, güvenilirlik oluşturmak için kaynak verileri tanımlarken hemen kavranabilecek bir hikaye anlatır. Tufte 1983'te şöyle yazdı: "Şimdiye kadar çizilmiş en iyi istatistiksel grafik olabilir."

Bu ilkelerin uygulanmaması yanıltıcı grafiklere , mesajın çarpıtılmasına veya hatalı bir sonucun desteklenmesine neden olabilir . Tufte'ye göre, chartjunk , mesajı veya gereksiz üç boyutlu veya perspektif efektleri geliştirmeyen grafiğin yabancı iç dekorasyonunu ifade eder. Açıklayıcı anahtarı gereksiz yere görüntünün kendisinden ayırmak, gözün görüntüden anahtara ileri geri gitmesini gerektiren bir "idari enkaz" biçimidir. Mümkün olan yerlerde veri olmayan mürekkebi silinerek "verinin mürekkebe" oranı en üst düzeye çıkarılmalıdır.

Kongre Bütçe Ofisi bir Haziran 2014 sunuda grafiksel ekranlar için birkaç iyi uygulamaları özetlenmiştir. Bunlar: a) Hedef kitlenizi tanımak; b) Rapor bağlamı dışında tek başına durabilen grafikler tasarlamak; ve c) Rapordaki temel mesajları ileten grafiklerin tasarlanması.

nicel mesajlar

ABD federal harcamalarındaki ve zaman içindeki gelirdeki eğilimleri gösteren bir çizgi grafikle gösterilen bir zaman serisi
Zaman içinde ölçülen iki değişken (enflasyon ve işsizlik) arasındaki negatif korelasyonu gösteren bir dağılım grafiği

Yazar Stephen Few, kullanıcıların bir dizi veriden anlamaya veya iletişim kurmaya çalışabilecekleri sekiz tür nicel mesajı ve mesajı iletmeye yardımcı olmak için kullanılan ilgili grafikleri tanımladı:

  1. Zaman serisi: 10 yıllık bir süre boyunca işsizlik oranı gibi bir süre boyunca tek bir değişken yakalanır. Eğilimi göstermek için bir çizgi grafiği kullanılabilir.
  2. Sıralama: Kategorik alt bölümler, tek bir dönem boyunca satış görevlilerinin ( her satış görevlisinin kategorik bir alt bölüm olduğu kategori ) satış performansının sıralaması ( ölçü ) gibi artan veya azalan düzende sıralanır . Satış görevlileri arasındaki karşılaştırmayı göstermek için bir çubuk grafik kullanılabilir.
  3. Parçadan bütüne: Kategorik alt bölümler, bütüne oran olarak ölçülür (yani, %100 üzerinden bir yüzde). Bir pasta grafik veya çubuk grafik böyle bir pazarda rakipler tarafından temsil edilen pazar payı olarak oranları, karşılaştırmasını gösterebilir.
  4. Sapma: Kategorik alt bölümler, belirli bir süre için bir işletmenin çeşitli departmanları için gerçekleşen ve bütçe giderlerinin karşılaştırılması gibi bir referansla karşılaştırılır. Bir çubuk grafik, gerçek ile referans miktarın karşılaştırmasını gösterebilir.
  5. Frekans dağılımı: Hisse senedi getirisinin %0-10, %11-20 gibi aralıklar arasında olduğu yıl sayısı gibi belirli bir aralık için belirli bir değişkenin gözlem sayısını gösterir. Bir histogram , bir tür çubuk grafiği, bu analiz için kullanılabilir. Bir boxplot vb ortanca, çeyrek, aykırı olarak dağılımı hakkında görselleştirmek önemli istatistikleri, yardımcı olur
  6. Korelasyon: İki değişken (X,Y) tarafından temsil edilen gözlemlerin aynı yönde mi yoksa zıt yönlerde mi hareket etme eğiliminde olduklarını belirlemek için yapılan karşılaştırma. Örneğin, bir ay örneği için işsizlik (X) ve enflasyonun (Y) çizilmesi. Bu mesaj için genellikle bir dağılım grafiği kullanılır.
  7. Nominal karşılaştırma: Ürün koduna göre satış hacmi gibi belirli bir sırayla kategorik alt bölümleri karşılaştırma. Bu karşılaştırma için bir çubuk grafik kullanılabilir.
  8. Coğrafi veya jeo-uzamsal : Bir harita veya yerleşim düzeni boyunca bir değişkenin, devlete göre işsizlik oranı veya bir binanın çeşitli katlarındaki kişi sayısı gibi karşılaştırması. Bir kartogram , kullanılan tipik bir grafiktir.

Bir dizi veriyi inceleyen analistler, yukarıdaki mesajların ve grafik türlerinin bir kısmının veya tamamının görevlerine ve hedef kitlelerine uygulanabilir olup olmadığını değerlendirebilir. Verilerdeki anlamlı ilişkileri ve mesajları belirlemek için deneme yanılma süreci, keşifsel veri analizinin bir parçasıdır .

Görsel algı ve veri görselleştirme

Bir insan hat uzunluğu, şekil, yön, mesafeler ve renk (ton) farklarını önemli bir işleme çabası olmadan kolayca ayırt edebilir; bunlara " ön-dikkat öznitelikler " denir . Örneğin, "5" rakamının bir dizi sayı içinde kaç kez göründüğünü belirlemek için önemli bir zaman ve çaba ("dikkatli işlem") gerektirebilir; ancak bu rakamın boyutu, yönü veya rengi farklıysa, ön dikkatli işleme yoluyla rakamın örnekleri hızlı bir şekilde not edilebilir.

Etkileyici grafikler, ön özenli işleme ve niteliklerden ve bu niteliklerin göreceli gücünden yararlanır. Örneğin, insanlar yüzey alanından ziyade çizgi uzunluğundaki farklılıkları daha kolay işleyebildiklerinden, pasta grafikler (karşılaştırmayı göstermek için yüzey alanını kullanan) yerine bir çubuk grafik (karşılaştırmayı göstermek için çizgi uzunluğundan yararlanır) kullanmak daha etkili olabilir. ).

İnsan algısı/bilişi ve veri görselleştirme

Neredeyse tüm veri görselleştirmeleri insan tüketimi için oluşturulur. Sezgisel görselleştirmeler tasarlarken insan algısı ve bilişi bilgisi gereklidir. Biliş, insanlarda algı, dikkat, öğrenme, hafıza, düşünce, kavram oluşturma, okuma ve problem çözme gibi süreçleri ifade eder. İnsan görsel işlemesi, değişiklikleri tespit etmede ve miktarlar, boyutlar, şekiller ve hafiflikteki farklılıklar arasında karşılaştırmalar yapmada etkilidir. Sembolik verilerin özellikleri görsel özelliklerle eşleştirildiğinde, insanlar büyük miktarda veriye verimli bir şekilde göz atabilir. Beynin nöronlarının 2/3'ünün görsel işlemeye dahil olabileceği tahmin edilmektedir. Doğru görselleştirme, görselleştirilmemiş nicel verilerde o kadar açık olmayan potansiyel bağlantıları, ilişkileri vb. göstermek için farklı bir yaklaşım sağlar. Görselleştirme, bir veri araştırması aracı olabilir .

Araştırmalar, bireylerin ortalama olarak %19 daha az bilişsel kaynak kullandığını ve veri görselleştirmesini metinle karşılaştırırken ayrıntıları %4,5 daha iyi hatırlayabildiğini göstermiştir.

Tarih

Seçilmiş kilometre taşları ve buluşlar

Veri görselleştirmenin kapsamlı bir 'geçmişi' yoktur. Görsel düşüncenin tüm gelişimini ve verilerin görsel temsilini kapsayan ve farklı disiplinlerin katkılarını harmanlayan hiçbir hesap yoktur. York Üniversitesi'nden Michael Friendly ve Daniel J Denis, kapsamlı bir görselleştirme tarihi sağlamaya çalışan bir projeyle meşguller. Genel kanının aksine veri görselleştirme modern bir gelişme değildir. Tarih öncesinden beri, yıldız verileri veya yıldızların konumu gibi bilgiler , Pleistosen döneminden bu yana mağaraların duvarlarında ( Güney Fransa'daki Lascaux Mağarası'nda bulunanlar gibi) görselleştirildi . Mezopotamya kil jetonları (MÖ 5500), Inca quipus (MÖ 2600) ve Marshall Adaları çubuk çizelgeleri (nd) gibi fiziksel eserler de nicel bilgilerin görselleştirilmesi olarak düşünülebilir.

İlk belgelenmiş veri görselleştirmesi, jeolojik kaynakların dağılımını doğru bir şekilde gösteren ve bu kaynakların taşocakçılığı hakkında bilgi sağlayan Torino Papirüs Haritası ile MÖ 1160 yılına kadar izlenebilir . Bu tür haritalar, belirli bir coğrafi alanla bağlantılı belirli bir temayı göstermek için tasarlanmış coğrafi bir illüstrasyon aracılığıyla belirli verileri ve bilgileri sunan ve ileten bir veri görselleştirme türü olan tematik haritacılık olarak kategorize edilebilir . En eski belgelenmiş veri görselleştirme biçimleri, farklı kültürlerden çeşitli tematik haritalar ve gösterilen bilgilerin yorumlanmasını sağlayan ve sağlayan ideogramlar ve hiyerogliflerdi. Örneğin, Miken Linear B tabletleri , Akdeniz'deki Geç Tunç Çağı ticaretiyle ilgili bilgilerin görselleştirilmesini sağlamıştır. Koordinatlar fikri eski Mısırlı araştırmacılar tarafından şehirleri düzenlerken kullanıldı, dünyevi ve göksel konumlar en az MÖ 200'e kadar enlem ve boylam gibi bir şey tarafından belirlendi ve Claudius Ptolemy tarafından küresel bir dünyanın enlem ve boylam olarak harita projeksiyonu [ c.85–c. 165] İskenderiye'de 14. yüzyıla kadar referans standartlar olarak hizmet edecekti.

Kağıdın ve parşömenin icadı, tarih boyunca görselleştirmelerin daha da gelişmesine izin verdi. Şekil, manastır okullarında bir ders kitabının ekinde kullanılan, gezegen hareketinin bir gösterimi olması amaçlanan 10. veya muhtemelen 11. yüzyıldan bir grafiği göstermektedir. Görünüşe göre grafiğin, zamanın bir fonksiyonu olarak gezegen yörüngelerinin eğimlerinin bir grafiğini temsil etmesi gerekiyordu. Bu amaçla zodyakın bölgesi, zaman veya boyuna eksen olarak otuz parçaya bölünmüş yatay bir çizgi ile bir düzlemde temsil edildi. Dikey eksen, zodyakın genişliğini belirtir. Yatay ölçek, uzlaştırılamayan dönemler için her gezegen için ayrı ayrı seçilmiş gibi görünüyor. Ekteki metin yalnızca genliklere atıfta bulunur. Görünüşe göre eğriler zamanla ilişkili değil.

gezegen hareketleri

16. yüzyıla gelindiğinde, fiziksel niceliklerin ve coğrafi ve göksel konumun hassas bir şekilde gözlemlenmesi ve ölçülmesi için teknikler ve araçlar iyi bir şekilde geliştirildi (örneğin, Tycho Brahe [1546-1601] tarafından inşa edilen ve tüm duvarı kaplayan bir "duvar kadranı" . onun gözlemevi). Haritalama konumlarını doğru bir şekilde belirlemek için üçgenleme ve diğer yöntemlerin geliştirilmesi özellikle önemliydi. Çok erken dönemde, zaman ölçüsü bilim adamlarını verileri görselleştirmenin yenilikçi bir yolunu geliştirmeye yöneltti (örneğin, 1596'da Lorenz Codomann, 1596'da Johannes Temporarius).

Fransız filozof ve matematikçi René Descartes ve Pierre de Fermat, analitik geometri ve iki boyutlu koordinat sistemi geliştirdiler ve bu, değerlerin gösterilmesi ve hesaplanmasının pratik yöntemlerini büyük ölçüde etkiledi. Fermat ve Blaise Pascal'ın istatistik ve olasılık teorisi üzerine çalışmaları, şimdi veri olarak kavramsallaştırdığımız şeyin temelini attı. Etkileşim Tasarımı Vakfı'na göre, bu gelişmeler nicel verilerin grafiksel iletişimi için potansiyel gören William Playfair'in grafiksel istatistik yöntemleri oluşturmasına ve geliştirmesine izin verdi ve yardımcı oldu .

Playfair Zaman Serisi

20. yüzyılın ikinci yarısında, Jacques Bertin bilgiyi "sezgisel, açık, doğru ve verimli bir şekilde" temsil etmek için nicel grafikler kullandı.

John Tukey ve Edward Tufte, veri görselleştirmenin sınırlarını zorladı; Yeni istatistiksel keşifsel veri analizi yaklaşımıyla Tukey ve "The Visual Display of Quantitative Information" adlı kitabıyla Tufte, istatistikçilerden daha fazlası için veri görselleştirme tekniklerinin rafine edilmesinin yolunu açtı. Teknolojinin ilerlemesiyle birlikte veri görselleştirmenin ilerlemesi geldi; elle çizilmiş görselleştirmelerle başlayıp daha teknik uygulamalara dönüşerek – yazılım görselleştirmesine yol açan etkileşimli tasarımlar dahil.

SAS , SOFA , R , Minitab , Cornerstone ve daha fazlası gibi programlar istatistik alanında veri görselleştirmesine izin verir. D3 , Python ve JavaScript gibi programlama dilleri, daha odaklı ve bireylere özgü diğer veri görselleştirme uygulamaları, nicel verilerin görselleştirilmesini bir olasılık haline getirmeye yardımcı olur. Özel okullar ayrıca, Veri İnkübatörü gibi ücretsiz programlar veya Genel Kurul gibi ücretli programlar dahil olmak üzere veri görselleştirme ve ilgili programlama kitaplıklarını öğrenme talebini karşılamak için programlar geliştirmiştir .

2013'te "Veriden Keşfe" sempozyumuyla başlayarak, Pasadena'daki ArtCenter Tasarım Koleji, Caltech ve JPL, etkileşimli veri görselleştirme üzerine yıllık bir program yürütüyor. Program şunu soruyor: Etkileşimli veri görselleştirme, bilim adamlarının ve mühendislerin verilerini daha etkili bir şekilde keşfetmelerine nasıl yardımcı olabilir? Bilgi işlem, tasarım ve tasarım odaklı düşünme, araştırma sonuçlarını en üst düzeye çıkarmaya nasıl yardımcı olabilir? Bu alanlardaki bilgiden yararlanmak için en etkili metodolojiler nelerdir? Program, sorgulamaya ve nihayetinde verilere yeni bir bakış açısı kazandırmaya yardımcı olmak için ilişkisel bilgileri uygun görsel ve etkileşimli özelliklerle kodlayarak, tasarım düşüncesini ve bilgi işlem, kullanıcı merkezli tasarım, etkileşim tasarımından en son yöntemleri birleştirerek karmaşık bilim sorunlarına yeni disiplinler arası yaklaşımlar geliştirir. ve 3D grafikler.

terminoloji

Veri görselleştirme, bazıları istatistiklerden türetilen belirli terminolojiyi içerir. Örneğin, yazar Stephen Few, anlamlı bir analiz veya görselleştirmeyi desteklemek için birlikte kullanılan iki tür veri tanımlar:

  • Kategorik: Belirli bir özelliğe sahip nesne gruplarını temsil eder. Kategorik değişkenler nominal veya sıralı olabilir. Nominal değişkenler, örneğin cinsiyet, aralarında bir sıra yoktur ve bu nedenle nominaldir. Sıralı değişkenler, bir kişinin içine düştüğü yaş grubunu örnek olarak kaydetmek için bir sıraya sahip kategorilerdir.
  • Nicel: Bir kişinin boyu veya bir ortamın sıcaklığı gibi ölçümleri temsil eder. Nicel değişkenler sürekli veya ayrık olabilir . Sürekli değişkenler, ölçümlerin her zaman daha kesin olarak yapılabileceği fikrini yakalar. Ayrık değişkenler, bazı sonuçların sayısı veya tüm yıllarda ölçülen bir yaş gibi yalnızca sınırlı sayıda olasılığa sahipken.

Nicel ve kategorik değişkenler arasındaki ayrım önemlidir çünkü iki tür farklı görselleştirme yöntemleri gerektirir.

İki temel bilgi ekranı türü tablolar ve grafiklerdir.

  • Bir tablo , kategorik etiketlerle satırlar ve sütunlar halinde düzenlenmiş nicel veriler içerir. Öncelikle belirli değerleri aramak için kullanılır. Yukarıdaki örnekte, tablo, adı ( nitel bir değişken ) ve yaşı ( nicel bir değişken ) temsil eden kategorik sütun etiketlerine sahip olabilir ve her veri satırı bir kişiyi temsil eder (örneklenmiş deney birimi veya kategori alt bölümü ).
  • Bir grafik öncelikle veriler arasındaki ilişkileri göstermek için kullanılır ve görsel nesneler (örneğin çizgiler, çubuklar veya noktalar) olarak kodlanmış değerleri tasvir eder . Sayısal değerler, bir veya daha fazla eksenle sınırlandırılmış bir alanda görüntülenir . Bu eksenler , görsel nesnelere değer atamak ve etiketlemek için kullanılan ölçekleri (nicel ve kategorik) sağlar. Birçok grafiğe çizelge de denir .

Eppler ve Lengler, çeşitli veri görselleştirme yöntemlerini gösteren etkileşimli bir grafik olan "Periyodik Görselleştirme Yöntemleri Tablosu"nu geliştirdi. Altı tür veri görselleştirme yöntemi içerir: veri, bilgi, kavram, strateji, metafor ve bileşik.

Teknikler

İsim Görsel boyutlar Açıklama / Örnek kullanımlar
Haftanın gününe göre ipuçlarının çubuk grafiği
Grafik çubuğu
  • uzunluk/sayım
  • kategori
  • renk
  • Kategorik verileri , temsil ettikleri değerlerle orantılı yükseklikleri veya uzunlukları olan dikdörtgen çubuklarla sunar . Çubuklar dikey veya yatay olarak çizilebilir.
  • Bir çubuk grafik, ayrı kategoriler arasındaki karşılaştırmaları gösterir . Grafiğin bir ekseni karşılaştırılmakta olan belirli kategorileri gösterir ve diğer eksen ölçülen bir değeri temsil eder.
  • Bazı çubuk grafikler, birden fazla ölçülen değişkenin değerlerini gösteren, birden fazla gruplar halinde kümelenmiş çubuklar sunar. Bu kümelenmiş gruplar renk kullanılarak ayırt edilebilir.
  • Örneğin; tek bir zaman diliminde birkaç kişi veya işletme için satış performansı gibi değerlerin karşılaştırılması.
(1) nüfus, (2) kişi başına düşen sera gazı emisyonları ve (3) toplam sera gazı emisyonları ile ilgili değişken genişlikli çubuk grafik

Değişken genişlikli ("variwide") çubuk grafik

  • kategori (birinci boyutta boyut/sayı/kapsam)
  • ikinci boyutta boyut/sayı/kapsam
  • çubuğun alanı olarak boyut/sayım/kapsam
  • renk
  • Yukarıdaki temel çubuk grafiğin çoğu özelliğini içerir
  • Tekdüze olmayan genişlik çubuğunun alanı, yatay ve dikey eksenlerden birinci ve ikinci miktarlarla dolaylı olarak ilişkili olan üçüncü bir miktarın bilgisini açıkça iletir
Konut fiyatlarının histogramı
histogram
  • çöp kutusu sınırları
  • sayı/uzunluk
  • renk
  • Sayısal verilerin dağılımının yaklaşık bir gösterimi . Tüm değer aralığını bir dizi aralığa bölün ve ardından her aralığa kaç değer düştüğünü sayın buna binning denir . Kutular genellikle bir değişkenin ardışık, örtüşmeyen aralıkları olarak belirtilir . Kutular (aralıklar) bitişik olmalıdır ve genellikle (ancak olması zorunlu değildir) eşit boyuttadır.
  • Örneğin, %0-10, %11-20 vb. gibi belirli aralıklar (binler) içinde yıllık borsa yüzdesi getirilerinin sıklığını belirlemek. Çubuğun yüksekliği, ilgili bölme tarafından temsil edilen aralık.
İki değişkenin temel dağılım grafiği
Dağılım grafiği
  • x konumu
  • y konumu
  • sembol/glif
  • renk
  • boy
  • Bir veri kümesi için tipik olarak iki değişkenin değerlerini görüntülemek için Kartezyen koordinatları kullanır .
  • Ek değişkenleri görüntülemek için noktalar renk, şekil ve/veya boyut aracılığıyla kodlanabilir.
  • Grafikteki her nokta, kartezyen düzlemdeki konumunu belirleyen ilişkili bir x ve y terimine sahiptir.
  • Dağılım grafikleri genellikle değişkenler (x ve y) arasındaki korelasyonu vurgulamak için kullanılır.
Dağılım grafiği
Dağılım grafiği (3D)
  • konum x
  • y konumu
  • konum z
  • renk
  • sembol
  • boy
  • Yukarıdaki 2 boyutlu dağılım grafiğine benzer şekilde, 3 boyutlu dağılım grafiği, bir dizi veriden tipik olarak 3 değişken arasındaki ilişkiyi görselleştirir.
  • Yine nokta, ek değişkenleri görüntülemek için renk, şekil ve/veya boyut aracılığıyla kodlanabilir.
Ağ analizi
  • Ağdaki kümeleri bulma (örneğin, Facebook arkadaşlarını farklı kümeler halinde gruplandırma).
  • Ağdaki kümeler arasındaki köprüleri (bilgi aracıları veya sınır anahtarları) keşfetme
  • Ağdaki en etkili düğümlerin belirlenmesi (örneğin bir şirket, bir pazarlama kampanyası için Twitter'da küçük bir grup insanı hedeflemek istiyor).
  • Herhangi bir kümeye uymayan veya bir ağın çevresinde bulunan aykırı aktörleri bulmak.
Yuvarlak diyagram
Yuvarlak diyagram
  • renk
  • Sayısal oranı göstermek için dilimlere bölünmüş bir kategorik değişkeni temsil eder. Pasta grafiğinde, her dilimin yay uzunluğu (ve dolayısıyla merkez açısı ve alanı ), temsil ettiği miktarla orantılıdır .
  • Örneğin, sağdaki grafikte gösterildiği gibi, dünya çapında anadili İngilizce olan kişilerin oranı
Çizgi grafik
Çizgi grafik
  • x konumu
  • y konumu
  • sembol/glif
  • renk
  • boy
  • Bilgileri, düz çizgi parçalarıyla birbirine bağlanan 'işaretçiler' adı verilen bir dizi veri noktası olarak temsil eder.
  • Ölçüm noktalarının sıralanması (tipik olarak x ekseni değerlerine göre) ve düz çizgi parçalarıyla birleştirilmesi dışında dağılım grafiğine benzer .
  • Genellikle zaman aralıklarında - bir zaman serisi - verilerdeki bir eğilimi görselleştirmek için kullanılır, bu nedenle çizgi genellikle kronolojik olarak çizilir.
Akış grafiği
Akış grafiği
  • Genişlik
  • renk
  • zaman (akış)
  • Merkezi bir eksen etrafında kaydırılan ve akan bir şekille sonuçlanan bir yığın alan grafiği türü .
  • Katmanların bir eksen üzerinde yığıldığı geleneksel bir yığın alan grafiğinden farklı olarak, bir akış grafiğinde katmanlar, "kıpırdamalarını" en aza indirecek şekilde konumlandırılır.
  • Akış grafikleri, verileri yalnızca pozitif değerlerle görüntüler ve hem negatif hem de pozitif değerleri temsil edemez.
  • Örneğin, doğru görsel, 2012 yılının başında bir kullanıcının dinlediği müziği gösterir.
ağaç haritası
ağaç haritası
  • boy
  • renk
  • Genellikle dikdörtgenler olmak üzere iç içe geçmiş şekilleri kullanarak hiyerarşik verileri görüntüleme yöntemidir .
  • Örneğin, konuma / dosya türüne göre disk alanı
Gantt şeması
Gantt şeması
  • renk
  • zaman (akış)
Sıcaklık haritası
Sıcaklık haritası
  • renk
  • Kategorik değişken
  • Bir olgunun büyüklüğünü iki boyutta renk olarak temsil eder.
  • Isı haritalarının iki kategorisi vardır:
    • küme ısı haritası: büyüklüklerin, satırları ve sütunları kategorik veriler olan sabit hücre boyutu matrisine yerleştirildiği yer. Örneğin, sağdaki grafik.
    • uzaysal ısı haritası: örneğin bir ısı haritası gibi sabit hücre boyutu matrisinin olmadığı. Örneğin, coğrafi bir harita üzerinde görüntülenen nüfus yoğunluklarını gösteren bir ısı haritası
Çizgili grafik
Çizgili grafik
  • x konumu
  • renk
  • Uzun vadeli sıcaklık eğilimlerini görsel olarak tasvir etmek için kronolojik olarak sıralanmış bir dizi renkli şerit kullanır.
  • Küresel ısınmayı tasvir etmek için zaman içinde prototipik olarak sıcaklık olan tek bir değişkeni tasvir eder
  • Bilim adamı olmayanlarla sezgisel olarak iletişim kurmak için kasıtlı olarak minimalist - teknik göstergeler olmadan -
  • Çoğul serileri temsil etmek için "yığınlanabilir" ( örnek )
Hareketli sarmal grafik
Hareketli sarmal grafik
  • radyal mesafe (bağımlı değişken)
  • dönme açısı (aylar arasında döngü)
  • renk (geçen yıllar)
  • Küresel ısınmayı tasvir etmek için zaman içinde prototipik olarak sıcaklık olan tek bir bağımlı değişkeni tasvir eder
  • Bağımlı değişken, (a) sürekli dönen açının (devir başına on iki ay) ve (b) gelişen rengin (geçen yıllarda renk değişiklikleri) bir fonksiyonu olarak belirlenen sürekli bir "spiral" boyunca aşamalı olarak çizilir.
Kutu ve bıyık arsa
Kutu ve Bıyık Arsa
  • x ekseni
  • y ekseni
  • Sayısal veri gruplarını çeyrekleri aracılığıyla grafiksel olarak gösteren bir yöntem .
  • Kutu çizimleri ayrıca , üst ve alt çeyreklerin dışındaki değişkenliği gösteren kutulardan ( bıyıklar ) uzanan çizgilere sahip olabilir .
  • Aykırı değerler ayrı noktalar olarak çizilebilir.
  • Üst üste grafik çizilen iki kutu, verilerin ortadaki %50'sini temsil eder, iki kutuyu ayıran çizgi medyan veri değerini ve kutuların üst ve alt kenarları sırasıyla 75. ve 25. yüzdelik veri noktalarını temsil eder.
  • Kutu grafikleri parametrik değildir : temel istatistiksel dağılıma ilişkin herhangi bir varsayımda bulunmadan istatistiksel bir popülasyonun örneklerindeki varyasyonları gösterirler , bu nedenle bir veri setini ilk kez anlamak için kullanışlıdırlar. Örneğin, bir grup insan (örneğin erkek ve kadın) arasındaki yaş dağılımının karşılaştırılması.
Akış çizelgesi
Akış çizelgesi
  • Bir görevi çözmeye yönelik bir iş akışını , süreci veya adım adım yaklaşımı temsil eder.
  • Akış şeması, çeşitli türlerde kutular olarak adımları ve kutuları oklarla bağlayarak sırasını gösterir.
  • Örneğin, sağdaki şemada gösterildiği gibi, bir lamba çalışmıyorsa yapılması gereken eylemler.
Radar grafiği
Radar grafiği
  • Öznitellikler
  • niteliklere atanan değer
  • Aynı noktadan başlayarak eksenler üzerinde temsil edilen üç veya daha fazla nicel değişkenin iki boyutlu bir grafiği şeklinde çok değişkenli verileri görüntüler .
  • Eksenlerin göreceli konumu ve açısı tipik olarak bilgi vermez, ancak verileri maksimum toplam alan olarak çizen algoritmalar gibi çeşitli buluşsal yöntemler, değişkenleri (eksenleri) farklı korelasyonları, değiş tokuşları ortaya çıkaran göreli konumlara sıralamak için uygulanabilir. ve diğer birçok karşılaştırmalı önlem.
  • Örneğin, farklı üniversite derecelerinde (örneğin matematik, ekonomi, psikoloji) öğrenilen nitelikleri/becerileri (örneğin iletişim, analitik, BT becerileri) karşılaştırmak
Venn şeması
Venn şeması
  • Gösteriler tüm olası mantıksal farklı sonlu koleksiyonu arasındaki ilişkiler setleri .
  • Bu diyagramlar, elemanları düzlemdeki noktalar olarak ve kümeleri kapalı eğriler içindeki bölgeler olarak gösterir.
  • Bir Venn şeması, her biri bir kümeyi temsil eden, genellikle daireler olmak üzere, üst üste binen çok sayıda kapalı eğriden oluşur.
  • S ile etiketlenmiş bir eğrinin içindeki noktalar , S kümesinin öğelerini temsil ederken, sınırın dışındaki noktalar S kümesinde olmayan öğeleri temsil eder . Bu, sezgisel görselleştirmelere olanak tanır; Örneğin, her iki set üyesi olan tüm elemanları seti S ve T ile gösterilen ST ve "kesişimini okuma S ve T ", bölgelerin üst üste binme alanı tarafından görsel olarak temsil edilir S ve T . Venn diyagramlarında, eğriler, kümeler arasındaki tüm olası ilişkileri göstererek, mümkün olan her şekilde örtüşür.
Korelasyonların ikonografisi
Korelasyonların ikonografisi
  • eksen yok
  • Düz çizgi
  • noktalı çizgi
  • renk
  • Keşifsel veri analizi.
  • Bir korelasyon matrisini, "dikkate değer" korelasyonların düz bir çizgi (pozitif korelasyon) veya noktalı bir çizgi (negatif korelasyon) ile temsil edildiği bir diyagramla değiştirin.
  • Noktalar renk ile kodlanabilir.

etkileşim

Etkileşimli veri görselleştirme , öğeleri değiştirmek ve birden çok çizim arasında bağlantı kurmak için bir grafik çizim üzerinde doğrudan eylemler sağlar .

Etkileşimli veri görselleştirme, 1960'ların sonlarından bu yana istatistikçilerin peşinde olmuştur . Gelişmelerin örnekleri American Statistical Association video ödünç verme kitaplığında bulunabilir.

Ortak etkileşimler şunları içerir:

  • Fırçalama :bir çizimin öğelerinin rengini veya glifini doğrudan değiştirerek, bir boya fırçasını kontrol etmekiçin fareyi kullanarak çalışır. Boya fırçası bazen bir işaretçidir ve bazen noktaların etrafına bir çeşit anahat çizerek çalışır; anahat bazen bir kement gibi düzensiz şekillidir. Fırçalama, en yaygın olarak, birden fazla çizim görünür olduğunda ve çizimler arasında bazı bağlantı mekanizmaları mevcut olduğunda kullanılır. Fırçalama için birkaç farklı kavramsal model ve bir dizi ortak bağlantı mekanizması vardır. Saçılım grafiklerini fırçalama, aktif çizimdeki noktaların yalnızca yeni özelliklerini koruduğu geçici bir işlem olabilir. Aynı zamanda, fırça tarafından kapatılırlar veya kesişirler veya kalıcı bir işlem olabilir, böylece fırça uzaklaştırıldıktan sonra noktalar yeni görünümlerini korurlar. Geçici fırçalama, daha önce açıkladığımız gibi, genellikle bağlantılı fırçalama için seçilir.
  • Boyama : Kalıcı fırçalama, noktaları kümeler halinde gruplamak ve ardından grupları karşılaştırmak için tur gibi diğer işlemleri kullanmaya devam etmek istediğimizde yararlıdır. Kalıcı işlem resmi olarak adlandırmak yaygın bir terminoloji haline geliyor,
  • Tanımlama : etiketleme veya etiket fırçalama olarak da adlandırılabilen, bağlantılı olabilecek başka bir çizim manipülasyonudur. Grafiği veya bir barda bir nokta veya kenarına yakın imleci getirip barchart , o tanımlayan arsa elemanı görünmesi için bir etiket neden olur. Birçok etkileşimli grafikte yaygın olarak bulunur ve bazen fareyle üzerine gelme olarak adlandırılır.
  • Ölçekleme : verileri pencereye eşler ve alanındaki değişiklikler. haritalama işlevi, aynı arsadan farklı şeyler öğrenmemize yardımcı olur. Ölçekleme yaygın olarak dağılım grafiğinin kalabalık bölgelerini yakınlaştırmak için kullanılır ve ayrıca verilerin farklı özelliklerini ortaya çıkarmak için bir grafiğin en boy oranını değiştirmek için de kullanılabilir.
  • Bağlama : bir çizimde seçilen öğeleri başka bir çizimdeki öğelerle birleştirir. Her iki grafiğin de aynı verinin farklı izdüşümlerini gösterdiği ve bir çizimdeki bir noktanın diğerindeki tam olarak bir noktaya karşılık geldiği, bire bir bağlamanın en basit türü. Alan grafiklerini kullanırken, bir alanın herhangi bir bölümünü fırçalamak, hepsini fırçalamakla aynı etkiye sahiptir ve ilgili kategorideki tüm durumları seçmeye eşdeğerdir. Bazı olay örgüsü öğeleri birden fazla durumu temsil etse bile, temeldeki bağlantı kuralı yine de bir olay örgüsünde bir durumu diğer kurgulardaki aynı duruma bağlar. Bağlama, konu kimliği gibi kategorik bir değişkenle de olabilir, böylece o konuya karşılık gelen tüm veri değerleri, tüm görünür grafiklerde vurgulanır.

Diğer bakış açıları

Veri görselleştirme kapsamında farklı yaklaşımlar vardır. Friedman (2008) gibi ortak bir odak noktası bilgi sunumudur. Friendly (2008), veri görselleştirmenin iki ana bölümünü varsayar: istatistiksel grafikler ve tematik haritacılık . Bu satırda "Veri Görselleştirme: Modern Yaklaşımlar" (2007) makalesi yedi veri görselleştirme konusuna genel bir bakış sunar:

Tüm bu konular grafik tasarım ve bilgi temsili ile yakından ilgilidir .

Öte yandan, bilgisayar bilimi perspektifinden, Frits H. Post 2002'de alanı alt alanlara ayırdı:

The Harvard Business Review bünyesinde Scott Berinato, veri görselleştirmeye yaklaşmak için bir çerçeve geliştirdi. Görsel olarak düşünmeye başlamak için kullanıcıların iki soruyu düşünmesi gerekir; 1) Sahip oldukların ve 2) yaptıkların. İlk adım, hangi verilerin görselleştirilmesini istediğinizi belirlemektir. Son on yıldaki kâr gibi veriye dayalıdır veya belirli bir organizasyonun nasıl yapılandırıldığı gibi kavramsal bir fikirdir. Bu soru yanıtlandıktan sonra, bilgi iletmeye mi (bildirimsel görselleştirme) mi yoksa bir şeyi anlamaya mı (keşif görselleştirme) mi çalıştıklarına odaklanılabilir. Scott Berinato, her birinin kendi hedefleri olan dört tür görsel iletişim sağlamak için bu soruları birleştirir.

Bu dört tür görsel iletişim şu şekildedir;

  • fikir illüstrasyonu (kavramsal ve bildirimsel).
    • Kavramları öğretmek, açıklamak ve/veya basitçe anlatmak için kullanılır. Örneğin, organizasyon şemaları ve karar ağaçları.
  • fikir üretme (kavramsal ve keşifsel).
    • Problemleri keşfetmek, yenilik yapmak ve çözmek için kullanılır. Örneğin, bir beyin fırtınası oturumundan sonra bir beyaz tahta.
  • görsel keşif (veri odaklı ve keşif amaçlı).
    • Trendleri tespit etmek ve verileri anlamlandırmak için kullanılır. Bu tür görsel, veri kümesinin bir şekilde bilinmediği ve görevin açık uçlu olduğu büyük ve karmaşık verilerde daha yaygındır.
  • günlük veri görselleştirme (veriye dayalı ve bildirimsel).
    • Bağlamı onaylamak ve ayarlamak için kullanılan en yaygın ve basit görselleştirme türü. Örneğin, zaman içinde GSYİH'nın bir çizgi grafiği.

Veri sunum mimarisi

Sosyal medyadan bir veri görselleştirme

Veri sunum mimarisi ( DPA ), anlamı ve uygun bilgiyi en uygun şekilde iletecek şekilde verileri tanımlamayı, bulmayı, işlemeyi, biçimlendirmeyi ve sunmayı amaçlayan bir beceri setidir.

Tarihsel olarak, veri sunum mimarisi terimi Kelly Lautt'a atfedilir: "Veri Sunum Mimarisi (DPA), İş Zekasının başarısı ve değeri için kritik öneme sahip, nadiren uygulanan bir beceri setidir . Veri sunum mimarisi, keşfetmede sayıların, verilerin ve istatistiklerin bilimi ile birleşir. değerli bilgiler verme verilerden ve bu kullanışlı ilgili ve veri görselleştirme, iletişim, sanatı ile eyleme örgüt psikolojisi ve değişim yönetimi veri kapsamına, teslim zamanlaması, en etkili destek olacak format ve görselleştirme ile iş zekası çözümleri sağlamak amacıyla ve Anlaşılan iş (veya organizasyon) hedeflerine yönelik operasyonel, taktiksel ve stratejik davranışları yönlendirin. DPA ne bir BT ne de bir iş becerisi setidir, ancak ayrı bir uzmanlık alanı olarak bulunur. Genellikle veri görselleştirme ile karıştırılan veri sunum mimarisi, çok daha geniş bir beceri setidir. bu, hangi verilerin hangi programa ve ne zaman olduğuna karar vermeyi içerir. önceden seçilmiş verileri sunmanın en iyi yolu değil, tam formatta sunulmasıdır. Veri görselleştirme becerileri, DPA'nın bir unsurudur."

Hedefler

DPA'nın iki ana amacı vardır:

  • Bilgiyi mümkün olan en verimli şekilde sağlamak için verileri kullanmak (her izleyicinin ihtiyaçları ve rolleri göz önüne alındığında gürültüyü, karmaşıklığı ve gereksiz verileri veya ayrıntıları en aza indirin)
  • Bilgiyi mümkün olan en etkili şekilde sağlamak için verileri kullanmak (her izleyici üyesine önemli anlam ifade eden, eyleme geçirilebilir ve anlayışı, davranışı ve kararları etkileyebilecek açık ve anlaşılır bir şekilde ilgili, zamanında ve eksiksiz veriler sağlayın)

Kapsam

Yukarıdaki hedefler göz önünde bulundurularak, veri sunum mimarisinin asıl çalışması şunlardan oluşur:

  • Rollerine, görevlerine, konumlarına ve teknolojiye erişimlerine bağlı olarak her bir izleyici üyesi için etkili dağıtım mekanizmaları oluşturmak
  • Her bir bağlamda her izleyici üyesi tarafından ihtiyaç duyulan önemli anlamın (ilgili bilgi) tanımlanması
  • Veri güncellemelerinin gerekli periyodunun belirlenmesi (verinin para birimi)
  • Veri sunumu için doğru zamanlamanın belirlenmesi (kullanıcının verileri ne zaman ve ne sıklıkla görmesi gerektiği)
  • Doğru verileri bulma (konu alanı, tarihsel erişim, genişlik, ayrıntı düzeyi vb.)
  • Uygun analiz, gruplama, görselleştirme ve diğer sunum formatlarını kullanmak

İlgili alanlar

DPA çalışması, aşağıdakiler de dahil olmak üzere diğer birçok alanla ortak noktaları paylaşır:

  • İş hedeflerinin belirlenmesinde, gereksinimlerin toplanmasında, süreçlerin haritalandırılmasında iş analizi .
  • Amacının, iş hedeflerinin ilerletilmesi için eylemleri ve kararları iyileştirmek ve düzene sokmak olduğu için iş süreci iyileştirme
  • Veri sunumunda anlam veya önem eklemek veya vurgulamak için yerleşik görselleştirme teorilerini kullandığı için veri görselleştirme.
  • Bilgi mimarisi , ancak bilgi mimarisinin odak noktası yapılandırılmamış verilerdir ve bu nedenle hem analizi (istatistiksel/veri anlamında) hem de gerçek içeriğin (DPA için veriler) yeni varlıklara ve kombinasyonlara doğrudan dönüştürülmesini hariç tutar.
  • HCI ve etkileşim tasarımı , etkileşimli veri görselleştirmesinin nasıl tasarlanacağına ilişkin ilkelerin birçoğu HCI ile disiplinler arası geliştirilmiştir.
  • Görsel gazetecilik ve veriye dayalı gazetecilik veya veri gazeteciliği : Görsel gazetecilik, haber hikayelerinin anlatılmasının her türlü grafikle kolaylaştırılmasıyla ilgilidir ve veriye dayalı ve veri gazeteciliği mutlaka veri görselleştirme ile anlatılmaz. Bununla birlikte, gazetecilik alanı, verileri iletmek için yeni veri görselleştirmeleri geliştirmede ön plandadır.
  • Grafik tasarım , stil, tipografi, konum ve diğer estetik kaygılarla bilgi aktarımı.

Ayrıca bakınız

Notlar

Referanslar

daha fazla okuma

Dış bağlantılar