BÜYÜK COĞRAFİ VERİ SETLERİNİN KÜMELENMESİNDE MAP REDUCE MODELLEMELERİ YOLUYLA BİTKİ COĞRAFYASI VERİ TABANLARININ OLUŞTURULMASI
CREATING PLANT GEOGRAPHY DATA BASES WITH THE MAPREDUCE MODELING IN THE CLUSTERING OF THE GREAT GEOGRAPHIC DATA SETS

Author : Muhammed ÇETİN - - Ali MEYDAN
Number of pages : 213-240

Summary

Bugün dijitalleşme olgusunun giderek yaygınlaştığı veri ortamlarında büyük veriye duyulan ihtiyaçlar günden güne farklı biçimsel yapılarda karşımıza çıkmaktadır. Büyük veriler, karmaşık, hacimli olup, büyüyen verilerdir. Büyük veriler (Big data) Endüstri 4,0, veri madenciliği, bulut alt yapısı sistemlerindeki inovasyonel yenilikler ve değişimler sayesinde birçok veri havuzunda hızlı ağ özellikleri ile kolayca depolanabilme özelliğini kazanmıştır. Dolayısıyla büyük veriler birçok bilim dalında dinamik, fiziksel, biyolojik bir hız kazanmıştır. Özelde HDFS (Hadoop Distrubuted File System) ve Hadoop bileşenleri büyük veri setlerinde sıklıkla tercih edilen uygulamalar arasında yerini korumuştur. Günümüzde büyük veri ilişkisini yazılım mühendisliğinde, gıda mühendisliğinde, donanım mühendisliğinde, sağlık araştırmalarında, kodlama eğitimlerinde, endüstriyel modellemelerde daha popüler olduğunu görmekteyiz. Coğrafi verinin teknolojik anlamda kendini revize etmesine bağlı olarak söz konusu Coğrafi veriler artık büyük veri havuzlarının etkisi alanına girmiştir. Çünkü büyük veri olmadan dijital dünya ve dijital coğrafya süreçlerini tam anlamı ile idrak etmek zorlaşmıştır. Coğrafya biliminin mekânsal geleneğinin mekânsal analizlerle iç içe olması Coğrafya bilimini modern teknolojik uygulamalar, coğrafya ve istatistik tabanlı süreçlere, programlara yöneltmiştir. Bu manada bu çalışmanın kaleme alınmasının başlıca gayesi şunlardır: Büyük veri (big data) kullanım ve yaygınlığını oluşturulan Bitki coğrafyası veri tabanları ile gözler önüne sermek, büyük verinin kümelenmesinde önem arz eden, kullanılan teknolojik uygulamaları ve algoritmalardan kısaca bahsetmek, büyük veri ve coğrafi veri arasındaki benzerlik ve farklılık, kullanım alanlarını mukayese etmeye çalışmak, büyük verinin Hadoop stratejisi ve temel bileşenleri arasındaki ilişkisel bağlantıyı donanım dili örnekleriyle gözler önüne sermek vb. amaçlarla çalışma yürütülmeye çalışılmıştır. Çalışmanın kapsam alanında büyük veri, coğrafi veri, büyük veri bileşenleri, büyük veri kümelenme teknikleri ve algoritmaları, bitki veri tabanları, büyük veri kullanım alanları ve veri madenciliği uygulamaları yer almıştır. Çalışma kuramsal bir çerçevede yürütülmeye çalışılmıştır. İlgili literatür taramasında planlama, kaynakların araştırılma ve bulunması, kaynakların incelenmesi, literatür dokümanlarının hazırlanması ve literatürün metne aktarılması, yazılması şeklinde disiplinle takip edilmiştir. Araştırma da nicel araştırma yöntemi tercih edilmiştir. Araştırma tasarımı ve yöntemleri bakımından temelde pozitivist yaklaşım güdüldüğü için araştırmada pozitivist paradigma metodolojisi tercih edilmiştir. Pozitivist metodolojisi bakımından çalışma da bilgiyi elde etme yolunda “ tümdengelim” yoluna başvurulmuştur. Bu bağlamda nicel araştırma türleri bakımından ilgili çalışma da “ İstatiksel araştırma” türüne yer verilmiştir. Çalışma istatiksel araştırma türünde yer aldığı için veri toplama ve analiz teknikleri bakımından ağırlıklı olarak istatiksel analiz, matematik modellemelerine yer verilmiştir. Çalışmanın bulgular kısmında önceden oluşturulan örnek büyük Coğrafi veri setleri kendi içerisinde sistematik boyutlara ayrılarak MAP Reduce ilişkisel bağlantısı ile incelenmeye çalışılmıştır. Eşle – İndirgeme hesaplaması ile oluşturulan veri blokları anahtar değer, çiftler, anahtar gruplar, indirgeme (reduce) ile birleştirilmiştir. Veriler daha sonra Eşle- İndirgeme kelime sayma şematik gösterimleri ile zenginleştirilmiştir. Daha sonra örnek büyük veri örnekleri ile büyük Coğrafi veriler karşılaştırmaya tabi tutularak kendi içinde değerlendirilmiştir. Belirlenen türlerin tür dağılım veri tabanı için Global Biodiversity Informatıon Facılıty data setlerinden yararlanılmış. Çalışmanın sonuç kısmında bulgularda elde edilen bilgiler ve üretilen veriler Tablo, şekil ve şematik gösterimler değerlendirilmiş, yapılan çalışmanın mevcut Coğrafya literatürü ve Bitki Coğrafyası araştırmaları üzerine yenilikleri ortaya konulmaya çalışılmıştır. Çalışma da ayrıca büyük veri olgusu, büyük veri uygulama alanları, büyük veri analitiği ve boyutları da araştırılmıştır

Keywords

Büyük veri, Coğrafi veri, Map reduce, Bitki Coğrafyası, Veri madenciliği

Read:209

Download: 91