Bu kitapta verinin bilgiye dönüştürülmesi sürecinde yaklaşık %85'lik bir payla en uzun aşamayı oluşturan veri önişleme teknikleri ve algoritmaları uygulamalı olarak anlatılmaktadır. Kitapta veri bütünleştirme ve düzenleme, veri kontrolü, veri temizleme, eksik/kayıp değerlerin tamamlanması, aykırı değer ve gürültü temizleme, veri normalleştirme, veri dönüştürme ve indirgeme işlemleri, büyük veri ile çalışma, paralel hesaplamaya giriş, bellek ve hız yönetimi gibi veri bilimi konuları ayrıntılarıyla sunulmaktadır.
Kitapta veri önişlemeyle ilgili tekniklerin kuramsal temelleri yanında R ile uygulamaları da gösterilmektedir. R, istatistik analiz ve veri biliminde ihtiyaç duyulabilecek çok sayıda araca sahip olup alanındaki popüleritesi ile de üst sıralarda yer alan özgür bir analiz ve programlama ortamıdır. Hemen her konu için geliştirilmiş yaklaşık 19000 paketi ile işletmelerinin verimliliğini attırmak isteyen veri mühendisleri ve yeni algoritmalar geliştirmek isteyen veri bilimcileri için büyük kolaylıklar ve esneklikler sunmaktadır.
Sonuç olarak bu kitap, günümüzün en cazip mesleklerinden olan veri mühendisliği ve biliminde en önemli konulardan biri olan bilgi keşfi sürecinde veri önişlemeyi yine en popüler yazılım ve programlama dillerinden biri olan R ile öğrenmenizi sağlayacak bir başvuru kitabı ve öğrenme kaynağıdır.
Bu kitapta verinin bilgiye dönüştürülmesi sürecinde yaklaşık %85'lik bir payla en uzun aşamayı oluşturan veri önişleme teknikleri ve algoritmaları uygulamalı olarak anlatılmaktadır. Kitapta veri bütünleştirme ve düzenleme, veri kontrolü, veri temizleme, eksik/kayıp değerlerin tamamlanması, aykırı değer ve gürültü temizleme, veri normalleştirme, veri dönüştürme ve indirgeme işlemleri, büyük veri ile çalışma, paralel hesaplamaya giriş, bellek ve hız yönetimi gibi veri bilimi konuları ayrıntılarıyla sunulmaktadır.
Kitapta veri önişlemeyle ilgili tekniklerin kuramsal temelleri yanında R ile uygulamaları da gösterilmektedir. R, istatistik analiz ve veri biliminde ihtiyaç duyulabilecek çok sayıda araca sahip olup alanındaki popüleritesi ile de üst sıralarda yer alan özgür bir analiz ve programlama ortamıdır. Hemen her konu için geliştirilmiş yaklaşık 19000 paketi ile işletmelerinin verimliliğini attırmak isteyen veri mühendisleri ve yeni algoritmalar geliştirmek isteyen veri bilimcileri için büyük kolaylıklar ve esneklikler sunmaktadır.
Sonuç olarak bu kitap, günümüzün en cazip mesleklerinden olan veri mühendisliği ve biliminde en önemli konulardan biri olan bilgi keşfi sürecinde veri önişlemeyi yine en popüler yazılım ve programlama dillerinden biri olan R ile öğrenmenizi sağlayacak bir başvuru kitabı ve öğrenme kaynağıdır.