Yazar

Ferdi YILMAZ

 

 

Mart 2019

 

Veri Analizinde Lider Olmak?

 

Yeni nesil teknolojilerde elde edilen başarı, veri olanaklarının kilidini açma ve analitiği yaratıcı ve etkili yöntemlerle kullanmaya bağlıdır.

 

Yeni nesil teknolojilerin ve modellemelerin temelinde veri yer alıyor. Bu yeni döneme ayak uydurabilmek için veriyi iyi analiz edebilmek ve elde ettiğimiz verileri doğru kullanabilmek bizim lider kişiliğimizi ortaya çıkaracaktır. Peki biz makine öğrenmesi sonucu oluşacak büyük veri yığınlarını analiz etmek ya da analiz edecek algoritmalara önderlik etmek için ne kadar hazırız?

Makalemizde, verinin doğru kullanımından önce, veri hakkında bazı tanımlamalar yapalım. Veri analizi, yararlı bilgileri keşfetmek, sonuç çıkarmak ve karar vermeyi desteklemek amacıyla verileri incelemek, temizlemek, dönüştürmek ve modellemek için kullanılan bir süreçtir. Veri analizi, farklı iş, bilim ve sosyal bilim alanlarında çeşitli isimler altında çeşitli teknikleri kapsayan çok yönlü ve farklı yaklaşımlara sahiptir.

Verinin uygunluğu veri analiz öncülüğünde bulunacaktır. Veri analizi, veri görselleştirme ve veri dağılımı ile yakından ilişkilidir. Veri analizi terimi bazen veri modellemesi için eşanlamlı olarak da kullanılır.

Veri analizi, ham verilerden kullanıcıların karar vermesinde etkili olacak bilgileri elde etmek için kullanılan süreçtir. Veriler önce bir kümede toplanır. Bu veriler istenen soruların cevaplanması için hipotezler oluşturularak teorilerin cevaplanması için kullanılır.

Veri gereksinimleri, müşteri ihtiyaçlarına göre verilerin analizlerinin yapılması ve sonucunda sayısal veriler elde edip üretimde kullanmak olarak nitelendirebiliriz. Peki ihtiyaçları belirlemek için elde edilmesi gereken verileri nasıl toplayacağız, veri farklı kaynaklar aracılığı ile toplanabilmektedir. Örneğin bir trafik kamerası, uydu alıcıları, ses kayıt cihazları gibi mekanik veri toplayıcıları olduğu gibi analog veri toplayıcıları olarak da bir röportaj ya da ansiklopediler düşünülebilmektedir.

Toplanan verinin işlenmesi ve bir algoritmik düzene alınması gerekmektedir. Bunun için veri tabanı tabloları ya da istatiksel yazılımları kullanabilmekteyiz. Böylece veriler bir tabloda satır ve sütunlara yerleştirilmiş olacaktır.

Verilerin tablolarda tutulması sürecinde eksik ve tekrarlayan veriler, insani yararlara uygun olmayacak ahlaki yönden incelenmesi gereken veriler oluşacaktır. Bu verilerin temizlenmesi işlemini gerekli kılacaktır. Verinin temizleme işlemi adımları, kayıtların eşleştirilmesi, yanlış verilerin belirlenmesi ve veri kalitesini arttırmak için kayıtların eşleştirilerek tekrarsız satırların elde edilmesidir.

Verilerin temizlemesi ile analize açık hale gelmesi sonrasında Analistler için anlaşılır veri bulutları meydana gelmiş olacaktır. Bu veri bulutları içerisinden gerekirse ilave veri temizlikleri de yapılabilecektir. Verilerin anlaşılır olmasını sağlayacak ortalama ve medyan gibi tanımlayan istatistikler oluşturulması ile verinin görselleşmesi süreci grafikse analiz ve yorumlama işlemine olanak sağlayacaktır.

Algoritmik Modeller

Veri bulutu içerisinde yer alan değişken modeller arasında oluşacak ilişkileri belirlemek için korelasyon veya nedensellik gibi, algoritmalar uygulanabilir. istatistikleri belirli değişkenler arasındaki ilişkileri ölçmek için kullanılan teknikleri içerir.

Elde edilen veri, müşterilere gereksinimlerini karşılaması için sonuçlar üretmeye olanak sağlayacaktır. Müşterilerin analizle sonrası elde edilecek veri bulutları ve ürün örnekleri için kullanım sırasında geri bildirimler ile dönebilir, bu da ek analist sonuçlar ile ürün geliştirme ve iyileştirmede kullanılabilir doneler oluşturacaktır.