Araştırma verilerini arşivleme - Research data archiving

Araştırma verilerini arşivleme , doğa bilimleri, sosyal bilimler ve yaşam bilimleri dahil olmak üzere bilimsel araştırma verilerinin uzun vadeli depolanmasıdır . Çeşitli akademik dergiler , araştırmacıların verilerinin ve yöntemlerinin ne kadarının halka açık bir arşivde depolaması gerektiğine ilişkin farklı politikalara sahiptir ve gerçekte neyin arşivlendiğine dair farklı disiplinler arasında büyük farklılıklar vardır. Benzer şekilde, büyük hibe veren kurumlar, verilerin kamuya açık arşivlenmesine yönelik farklı tutumlara sahiptir. Genel olarak, bilim geleneği, yayınların diğer araştırmacıların araştırmayı kopyalamasına ve dolayısıyla test etmesine izin verecek yeterli bilgi içermesi olmuştur. Son yıllarda, bu yaklaşım, bazı alanlardaki araştırmalar, bağımsız olarak kolayca kopyalanamayan büyük veri kümelerine bağlı olduğundan giderek daha fazla zorlanmaktadır.

Veri arşivleme bazı alanlarda diğerlerinden daha önemlidir. Birkaç alanda, çalışmayı kopyalamak için gerekli tüm veriler dergi makalesinde zaten mevcuttur. İlaç geliştirmede, araştırmacıların ilaç şirketlerinin yayınladığı raporların verileri doğru bir şekilde yansıttığını doğrulayabilmeleri için büyük miktarda veri oluşturulur ve arşivlenmelidir.

Veri arşivlemenin gerekliliği bilim tarihinde yeni bir gelişmedir . Bilgi teknolojisindeki gelişmeler, büyük miktarda verinin depolanmasına ve merkezi konumlardan erişilmesine izin vererek mümkün olmuştur . Örneğin, Amerikan Jeofizik Birliği (AGU) başlangıcından sonraki üç yıl yaklaşık 1993 yılında arşivlemeye verilere ilk politikasını kabul WWW . Bu politika, AGU belgelerinde belirtilen veri kümelerinin tanınmış bir veri merkezi tarafından arşivlenmesini zorunlu kılar; "veri kağıtlarının" oluşturulmasına izin verir; ve AGU'nun veri arşivlerinin korunmasındaki rolünü belirler. Ancak, kağıt yazarlarının verilerini arşivlemeleri için herhangi bir gereklilik yoktur.

Organize veri arşivlemeden önce, bir makaleyi değerlendirmek veya çoğaltmak isteyen araştırmacıların, yazardan veri ve yöntem bilgileri talep etmesi gerekir. Akademik topluluk, yazarlardan ek verileri paylaşmalarını bekler . Bu süreç zaman ve enerji israfı olarak kabul edildi ve karışık sonuçlar elde edildi. Yıllar geçtikçe bilgiler kaybolabilir veya bozulabilir. Bazı durumlarda, yazarlar bilgiyi vermeyi reddederler.

Araştırma sağlık sorunları veya kamu politikası oluşumuyla ilgilendiğinde veri arşivleme ve durum tespiti ihtiyacı büyük ölçüde artar.

Dergilere göre seçilen politikalar

Biyotropika

Biotropica , yayınlama koşulu olarak, makaledeki sonuçları destekleyen verilerin ve bunları açıklayan meta verilerin Dryad , Figshare , GenBank , TreeBASE veya NCBI gibi uygun bir halka açık arşivde arşivlenmesini gerektirir . Yazarlar, makale yayınlanır yayınlanmaz verileri kamuya açık hale getirmeyi veya arşiv teknolojisi izin veriyorsa, makalenin yayınlanmasından sonra üç yıla kadar verilere ambargo erişimi sağlamayı seçebilirler. Yazara talimatlarda açıklandığı gibi, Veri Kullanılabilirliğini açıklayan bir açıklama yazıya dahil edilecektir. Hassas bilgileri içeren çalışmalar için (örn. Nesli tükenmekte olan türlerin konumu), Baş Editörün takdirine bağlı olarak gerekli verilerin arşivlenmesine istisnalar verilebilir. Bu politikanın motivasyonunu açıklayan Editörümüz burada bulunabilir . Daha kapsamlı bir veri havuzları listesi burada mevcuttur . Veri toplayan ve arşivleyen araştırmacılarla bir işbirliği kültürünün teşvik edilmesi: Tropikal biyologlar tarafından toplanan veriler genellikle uzun vadeli, karmaşık ve toplanması pahalıdır. Biotropica Editörler Kurulu, arşivlenmiş veri setlerini veri arşivlerini yeniden kullanan yazarları, onları ilk olarak toplayan bilim insanlarını tam anlamıyla iş birliği yapan işbirlikçileri olarak dahil etmeleri için şiddetle teşvik eder. Bunun, veri toplayıcısının çalışma sisteminin doğal geçmişine ilişkin derin içgörülerinden yararlanarak, yeni analizlerde hata riskini azaltarak ve disiplinler arası ve kültürler arası çalışmaları teşvik ederek sonuçta ortaya çıkan araştırmanın kalitesini ve etkisini büyük ölçüde artıracağını düşünüyoruz. ATBC ve Biotropica'nın geniş çapta kabul gördüğü işbirliği ve eğitim .

Not: Biotropica , Dryad'a veri yatıran yazarların ücretlerini ödeyen yalnızca iki dergiden biridir.

Amerikan Doğa bilimcisi

American Naturalist , yazarların kabul edilen makaleler ile ilişkili verileri halka açık bir arşivde saklamasını ister. Gen dizisi verileri ve filogenetik ağaçlar için sırasıyla GenBank veya TreeBASE'de biriktirme gereklidir. Ekolojik ve evrimsel biyoloji verileri için Dryad deposu dahil olmak üzere belirli bir veri setine uyabilecek birçok olası arşiv vardır . GenBank, TreeBASE ve Dryad için tüm erişim numaraları, Üretime gitmeden önce kabul edilen yazılara dahil edilmelidir. Veriler başka bir yerde saklanmışsa, lütfen bir bağlantı sağlayın. Veriler yayınlanmış literatürden derlenmişse, okuyucularınızın rahatlığı için lütfen derlenmiş verileri Dryad'a koyun. Veri paylaşımının önündeki herhangi bir engel, uygun düzenlemelerin yapılabilmesi için sunum sırasında editörlerin dikkatine sunulmalıdır.

Kalıtım Dergisi

Bir makalenin sonuçlarının altında yatan birincil veriler, bilimsel girişimin doğrulanabilirliği ve şeffaflığı için kritik öneme sahiptir ve gelecekte on yıllarca kullanılabilir biçimde muhafaza edilmelidir. Bu nedenle Journal of Heredity , yeni bildirilen nükleotid veya amino asit sekanslarının ve yapısal koordinatların uygun halka açık veritabanlarına (örneğin, GenBank; EMBL Nucleotide Sequence Database ; DNA Database of Japan; Protein Data Bank  ; ve İsviçre) sunulmasını gerektirir. -Prot ). Makalenin son versiyonunda erişim numaraları yer almalıdır. Diğer veri biçimleri için (örneğin, mikro uydu genotipleri, bağlantı haritaları, görüntüler), Dergi, Dryad, TreeBASE gibi uygun bir halka açık arşivde tüm yazarları birincil veri kümelerini arşivlemeye teşvik eden Ortak Veri Arşivleme Politikasının (JDAP) ilkelerini onaylamaktadır. veya Biocomplexity için Bilgi Ağı. Yazarlar, verileri yayın sırasında kamuya açık hale getirmeye veya arşiv teknolojisi izin veriyorsa, yayınlandıktan sonraki bir yıla kadar verilere erişimi ambargo seçmeye teşvik edilir. Amerikan Genetik Derneği, büyük veri kümelerinin oluşturulması ve iyileştirilmesi için bireysel araştırmacıların büyük yatırımlarını da kabul ediyor. Sonuç olarak, bu yatırıma ikincil analizlerde veya meta-analizlerde zarif bir işbirliği ruhu içinde saygı gösterilmesini tavsiye ediyoruz.

-  oxfordjournals.org

Moleküler Ekoloji

Moleküler Ekoloji , makaledeki sonuçları destekleyen verilerin GenBank, Gene Expression Omnibus , TreeBASE, Dryad, Biocomplexity için Bilgi Ağı , kendi kurumsal veya fon sağlayıcı havuzunuz gibi uygun bir genel arşivde arşivlenmesini bekler . Moleküler Ekoloji web sitesi. Veriler, bilimsel girişimin önemli ürünleridir ve gelecekte on yıllarca saklanmalı ve kullanılabilir olmalıdır. Yazarlar, verilerin yayın sırasında kamuya açık olmasını seçebilir veya arşiv teknolojisi izin veriyorsa, yayınlandıktan sonra bir yıla kadar verilere erişimi ambargo kullanmayı tercih edebilir. Editörün takdirine bağlı olarak, özellikle insan denek verileri veya nesli tükenmekte olan türlerin konumu gibi hassas bilgiler için istisnalar tanınabilir.

-  Wiley

Doğa

Bu tür materyaller, akredite bağımsız bir sitede (URL ve erişim numaraları yazar tarafından sağlanacak) barındırılmalı veya derginin çevrimiçi gönderi hizmeti aracılığıyla yüklenerek ya da dosyalar çok büyük ya da çok büyükse, başvuru sırasında Nature dergisine gönderilmelidir . CD / DVD'de bu amaç için uygun olmayan bir format (beş kopya). Bu tür materyaller yalnızca bir yazarın kişisel veya kurumsal web sitesinde barındırılamaz. Doğa , gözden geçirenin tüm ek verilerin ve yöntemlerin arşivlenip arşivlenmediğini belirlemesini gerektirir. Politika, gözden geçirenlere aşağıdakiler dahil birkaç soruyu dikkate almalarını tavsiye eder: "Yazarlardan makaleye çevrimiçi olarak eşlik edecek ek yöntemler veya veriler sağlamaları istenmeli mi? (Bu tür veriler, modelleme çalışmaları için kaynak kodunu, ayrıntılı deneysel protokolleri veya matematiksel türevleri içerebilir.)

-  Doğa

Bilim

Bilim , bilimsel topluluğun kullanımı için yayınlanmış verileri bir araya getiren veri tabanlarının çabalarını destekler. Bu nedenle, yayınlamadan önce, büyük veri kümeleri (mikro dizi verileri, protein veya DNA dizileri ve makro moleküler yapılar için atomik koordinatlar veya elektron mikroskobu haritaları dahil) onaylanmış bir veri tabanında saklanmalı ve yayınlanan makaleye dahil edilmek üzere bir erişim numarası sağlanmalıdır. "Materyaller ve yöntemler" - Bilim artık yazarlardan, genel olarak, materyallerin ve yöntemlerin açıklamalarının büyük bir kısmını destek materyali olarak çevrimiçi olarak yerleştirmelerini ve yalnızca basılı el yazmasında metnin mantığını takip etmek için gerektiği kadar yöntem açıklamasını sağlamalarını talep etmektedir. . (Açıktır ki, makale temelde yeni bir yöntem veya tekniğin çalışmasıysa, bu kısıtlama geçerli olmayacaktır.)

-  Bilim

Kraliyet toplumu

Başkalarının Royal Society dergilerinde yayınlanan çalışmaları doğrulamasına ve geliştirmesine izin vermek için , yazarların makaledeki sonuçları destekleyen verileri, kodu ve araştırma materyallerini kullanıma sunması bir yayın koşuludur.

Veri kümeleri ve kod, uygun, tanınmış, kamuya açık bir havuzda saklanmalıdır. Veriye özgü havuzun bulunmadığı durumlarda, yazarlar veri setlerini Dryad (depo) veya Figshare gibi genel bir havuzda saklamalıdır .

Arkeolojik Bilimler Dergisi

Arkeolojik Bilimler Dergisi bir etti veri bilgilendirme politikasını en az 2013 yılından bu yana maddeye ilişkin tüm veriler Tamamlayıcı dosyalarında hazır veya tevdi dış depolarda ve makale içinde bağlantılı olmalıdır' olduğunu Onların politikamız. Politika, verilerin Arkeoloji Veri Hizmeti , Dijital Arkeolojik Kayıt veya PANGEA gibi bir havuzda saklanmasını önermektedir . Bir 2018 araştırması, bu politikanın zayıf uygulandığını veya editörler, hakemler ve yazarlar arasında bu politikanın nasıl yorumlanıp uygulanacağına dair eksik bir anlayışı yansıtan% 53'lük bir veri kullanılabilirlik oranı buldu.

Finansman ajanslarının politikaları

Amerika Birleşik Devletleri'nde, Ulusal Bilim Vakfı (NSF) veri arşivlemeye ilişkin gereksinimleri sıkılaştırdı. NSF'den finansman arayan araştırmacıların artık hibe başvurusuna iki sayfalık bir ek olarak bir veri yönetimi planı sunmaları gerekmektedir .

NSF Datanet girişimi, dünya çapındaki bilim adamları tarafından üretilen ekolojik ve çevresel veriler için bilimsel veri arşivlemesi sağlayacak olan Dünya için Veri Gözlem Ağı ( DataONE ) projesinin finanse edilmesiyle sonuçlandı . DataONE'nin belirttiği amaç, çok ölçekli, çok disiplinli ve çok uluslu verileri korumak ve bunlara erişim sağlamaktır. DataONE kullanıcıları topluluğu, bilim adamlarını, ekosistem yöneticilerini, politika yapıcıları, öğrencileri, eğitimcileri ve halkı içerir.

Alman DFG , araştırma verilerinin araştırmacının kendi kurumunda veya ülke çapında uygun bir altyapıda en az 10 yıl süreyle arşivlenmesini şart koşmaktadır.

İngiliz Dijital İyileştirme Merkezi , fon verenin veri politikalarına genel bir bakış sağlar.

Veri arşivleri

Araştırma verileri, veri kitaplıklarında veya veri arşivlerinde arşivlenir.

Ayrıca bakınız

Referanslar

Notlar