Gövde ve yaprak gösterimi - Stem-and-leaf display

20, 30, 32, 35, 41, 41, 43, 47, 48, 51, 53, 53, 54, 56, 57, 58, 58, 59, 60, 62, 64, 65, 65, 69, 71, 74, 77, 88 ve 102

Bir gövde-yaprak gösterimi veya gövde-yaprak grafiği , bir dağılımın şeklinin görselleştirilmesine yardımcı olmak için, bir histograma benzer bir grafik biçiminde nicel verileri sunan bir cihazdır . 1900'lerin başlarında Arthur Bowley'nin çalışmalarından evrimleşmişlerdir ve keşif amaçlı veri analizinde faydalı araçlardır . Stemplot'lar 1980'lerde John Tukey'nin keşifsel veri analizi üzerine olan kitabının 1977'de yayınlanmasından sonra daha yaygın bir şekilde kullanılmaya başlandı. O yıllardaki popülerlik , zamanın bilgisayar teknolojisinin kolayca üretmesine izin veren tek aralıklı (daktilo) yazı tiplerini kullanmalarına bağlanabilir. grafikler. Modern bilgisayarların üstün grafik yetenekleri, bu tekniklerin daha az kullanıldığı anlamına gelmektedir.

Bu arsa Octave ve R'de uygulanmıştır.

Bir kök ve yaprak arsa da adlandırılır stemplot , ancak ikinci terim genellikle bir grafik tipine karşılık gelir. Basit bir gövde grafiği, ortak bir x ekseni üzerine y değerlerinin bir matrisini çizmeyi ve ortak x değerini dikey bir çizgiyle ve tek tek y değerlerini çizgideki sembollerle tanımlamayı ifade edebilir .

Histogramlardan farklı olarak, gövde ve yaprak görüntüler, orijinal verileri en az iki anlamlı basamağa kadar tutar ve verileri sıraya koyar, böylece sıra tabanlı çıkarım ve parametrik olmayan istatistiklere geçişi kolaylaştırır .


Yapı

Bir gövde-yaprak gösterimi oluşturmak için, gözlemler önce artan düzende sıralanmalıdır: bu, yapraklar sıralanmamış olarak gövde-yaprak gösteriminin bir taslağı oluşturularak, ardından elle çalışılırsa en kolay şekilde yapılabilir. son gövde ve yaprak görüntüsünü üretmek için bırakır. Aşağıdaki örnekte kullanılacak sıralanmış veri değerleri kümesi aşağıda verilmiştir:

44, 46, 47, 49, 63, 64, 66, 68, 68, 72, 72, 75, 76, 81, 84, 88, 106

Daha sonra sapların neyi temsil edeceği ve yaprakların neyi temsil edeceği belirlenmelidir. Tipik olarak, yaprak, sayının son basamağını içerir ve gövde, diğer tüm basamakları içerir. Çok büyük sayılar olması durumunda, veri değerleri yapraklar için kullanılacak belirli bir basamak değerine (yüzler basamağı gibi) yuvarlanabilir . Yuvarlanan basamak değerinin solunda kalan rakamlar kök olarak kullanılır.

Bu örnekte, yaprak birler basamağını, gövde ise sayının geri kalanını (onlar basamağı ve üzeri) temsil edecektir.

Gövde ve yaprak gösterimi, dikey bir çizgiyle ayrılmış iki sütunla çizilir. Saplar dikey çizginin solunda listelenir. Her bir sapın yalnızca bir kez listelenmesi ve bazı sapların yaprakları olmadığı anlamına gelse bile hiçbir sayının atlanmaması önemlidir. Yapraklar, her sapın sağında art arda artan sırada listelenir.

Verilerde tekrarlanan bir sayı olduğunda (iki 72 gibi), grafiğin bunu yansıtması gerektiğini belirtmek önemlidir (böylece arsa, 72 72 75 76 sayılarına sahip olduğunda 7 | 2 2 5 6 7 gibi görünecektir). 77).

Anahtar:
Yaprak birimi: 1.0
Kök birimi: 10.0

Gövde ve yaprak görünümü oluşturmak için yuvarlama gerekebilir. Aşağıdaki veri kümesine dayalı olarak, aşağıdaki kök grafiği oluşturulacaktır:

−23.678758, −12.45, −3.4, 4.43, 5.5, 5.678, 16.87, 24.7, 56.8

Negatif sayılar için, kök birimin önüne hala X / 10 değeri olan bir negatif yerleştirilir. Tamsayı olmayanlar yuvarlanır. Bu, daha karmaşık veri kümeleri için bile gövde ve yaprak grafiğinin şeklini korumasına izin verdi. Aşağıdaki bu örnekte olduğu gibi:

Anahtar:

kullanım

Gövde ve yaprak göstergeleri, verilerin göreceli yoğunluğunu ve şeklini görüntülemek için kullanışlıdır ve okuyucuya dağılıma hızlı bir genel bakış sağlar. Ham sayısal verileri (çoğu) genellikle mükemmel bir bütünlük içinde tutarlar. Aykırı değerleri vurgulamak ve modu bulmak için de kullanışlıdırlar . Ancak, gövde ve yaprak gösterimleri yalnızca orta büyüklükteki veri kümeleri için kullanışlıdır (yaklaşık 15-150 veri noktası). Çok küçük veri kümeleriyle, kesin dağıtım özelliklerini oluşturmak için makul sayıda veri noktası gerektiğinden, gövde ve yaprak gösterimleri çok az kullanılabilir. Bu tür veriler için bir nokta grafiği daha uygun olabilir. Çok büyük veri kümeleriyle, her bir veri noktasının sayısal olarak temsil edilmesi gerektiğinden, gövde ve yaprak gösterimi çok karmaşık hale gelecektir. Veri boyutu arttıkça bir kutu grafiği veya histogram daha uygun hale gelebilir.

Notlar

Referanslar

  • Wild, C. ve Seber, G. (2000) Chance Encounters: A First Course in Data Analysis and Inference s. 49-54 John Wiley and Sons. ISBN  0-471-32936-3
  • Elliott, Jane; Catherine Marsh (2008). Verileri Keşfetmek: Sosyal Bilimciler için Veri Analizine Giriş (2. baskı). Poliçe Basın. ISBN'si 0-7456-2282-8.