Bu kitap, veri işleme ve analiz dünyasında son yıllarda giderek önem kazanan iki temel konuya odaklanmaktadır: Metin Madenciliği ve Doğal Dil İşleme (DDİ). Her gün dijital dünyada milyonlarca yapılandırılmamış veri üretilirken, bu verilerden anlamlı sonuçlar çıkarma ihtiyacı hem akademik araştırmalar hem de ticari uygulamalar için giderek daha kritik bir hale gelmiştir. Python ile Metin Madenciliği ve Doğal Dil İşleme adlı bu kitap, Python programlama dilinin güçlü araçlarıyla bu zorlu sürecin nasıl yönetilebileceğine dair kapsamlı bir rehber sunmaktadır.
Kitabın ilk bölümleri, Python’un temel programlama prensiplerine ayrılmıştır. Python’da değişkenler, veri türleri, döngüler, kontrol ifadeleri ve nesneye yönelik programlama (OOP) gibi konular, okuyuculara metin madenciliği ve DDİ uygulamaları için sağlam bir temel kazandırmaktadır. Bu kitap, hem teorik bilgileri hem de pratik uygulamaları bir araya getirerek, Python ile metin madenciliği ve doğal dil işleme projeleri geliştirmek isteyen
okuyucular için yol gösterici bir kaynak olacaktır.
BÖLÜM 1 PYTHON PROGRAMLAMA TEMELLERI
1.1. Python Nedir?
1.2. Python Temelleri
1.3. Operatörler
1.4. Koşullu İfadeler (if-else)
1.5. Tekrarlayan İşlemler: Döngüler
1.7. Hata Yönetimi ve Hataların Denetimi
1.8. Fonksiyonlar ve Kullanımı
1.11. Hazır Fonksiyonlar
1.12. Dosyalama İşlemleri
1.13. Modüller ve Paketler
1.14. Nesneye Yönelik Programlama (Object-Oriented Programming - OOP)
BÖLÜM 2 TEMEL KAVRAMLAR
2.1. Doğal Dil İşleme (DDİ)
2.2. Metin Madenciliği
2.3. Makine Öğrenmesi (Machine Learning, ML)
2.4. Dilbilim
2.5. Sözdizimsel (sentaktik) analiz
2.6. Anlambilimsel (semantik) analiz
2.7. Kelimeler
2.8. Kök Bulma (Stemming)
2.9. Lemmatizasyon (Lemmatization)
2.10. DDİ Uygulama Alanları
2.11. Önemsiz Kelimeler (StopWords)
2.12. Öznitelikler (Features) ve Öznitelik Çıkarma Nedir?
2.13. Gözetimli Öğrenme (Supervised Learning)
2.14. Gözetimsiz Öğrenme
2.15. Pekiştirmeli öğrenme (Reinforcement Learning)
2.16. Kümeleme (Clustering)
2.17. Sınıflandırma
2.18. Uzman Sistemler
2.19. Part of Speech (POS)
2.20. Vec2Word
2.21. DDİ ve Metin Madenciliği için Python Kütüphaneleri
BÖLÜM 3 METIN MADENCILIĞI VE DOĞAL DIL İŞLEME: TEMEL TEKNIKLER
3.1. Varlık İsmi Tanıma (Named Entity Recognition - NER)
3.2. Metin Normalizasyonu (Text Normalization)
3.3. Tokenize İşlemi
3.4. Metin Sınıflandırma
3.5. Metin Özetleme
BÖLÜM 4 ÖZNITELIK ÇIKARIM YAKLAŞIMLARI
4.1. Kelime Çantası (Bag of Words, BOW)
4.2. TF-IDF (Term Frequency - Inverse Document Frequency)
4.3. One-Hot Encoding Yaklaşımı
4.4. Eş oluşum matrisleri (Co-occurrence Matrices)
4.5. N-Gram
4.6. Açı Örüntüler
4.7. Bir Boyutlu Yerel İkili Örüntüler
4.8. Motif Örüntüler
BÖLÜM 5 METIN GÖSELLEŞTIRME
5.1. Kelime Bulutu (Word Cloud)
5.2. Bar Chart (Çubuk Grafiği)
5.3. Heatmap (Isı Haritası)
5.4. Topic Modeling (Konu Modellemesi Görselleştirmesi)
5.5. Network Graphs (Ağ Grafikleri)
5.6. Word Tree (Kelime Ağacı)
5.7. N-Gram Analiz ve Görselleştirme
BÖLÜM 6 MAKINE ÖĞRENMESI VE METIN MADENCILIĞI SINIFLANDIRMA UYGULAMALARI
6.1. Veri Setleri
6.2. N-Gram ile Duygu Tespiti
6.3. Kelime Çantası (BOW) ile Duygu Tespiti
6.4. TF-IDF Öznitelikler ile Duygu Tespiti
6.5. One-Hot Encoding Yaklaşımı ile Spam E-Posta Tespiti
6.6. Eş oluşum matrisleri (Co-occurrence Matrices) ile Duygu Tespiti
6.7. Açı Örüntüler ile Spam E-Posta Tespiti
6.8. 1B-YİÖ ile Spam E-Posta Tespiti
6.9. Motif Örüntüler ile Spam E-Posta Tespiti
BÖLÜM 7 KONU MODELLEME (TOPIK MODELLEME)
7.1. Latent Dirichlet Allocation (LDA)
7.2. Latent Semantic Analysis (LSA)
7.3. Non-Negative Matrix Factorization (NMF)
7.4. Hierarchical Dirichlet Process (HDP)
7.5. Correlated Topic Model (CTM)
7.6. Biterm Topic Model (BTM)
7.7. BERTopic ile Topik Modelleme
BÖLÜM 8 DERIN ÖĞRENME METOTLARI İLE METIN SINIFLANDIRMA
8.1. LSTM (Long Short-Term Memory)
8.2. GRU (Gated Recurrent Unit)
8.4. Arıza Veri Seti
8.5. LSTM ile Metin Sınıflandırma
8.6. GRU (Gated Recurrent Unit) ile Metin Sınıflandırma
8.7. 1D-CNN (Bir Boyutlu Konvolüsyonel Sinir Ağı) ile Metin Sınıflandırma
BÖLÜM 9 EŞ OLUŞUM AĞLARI İLE METIN ANALIZI
9.1. Eş Oluşum Ağları Nedir?
9.2. Eş Oluşum Ağları ve Metin Madenciliği
9.3. Eş Oluşum Ağları için Veri Seti
9.4. Kelime Bazlı Eş Oluşum ağlarının Oluşturulması
BÖLÜM 10 ANAHTAR KELIME ÇIKARIM YAKLAŞIMLARI
10.1. RAKE (Rapid Automatic Keyword Extraction)
10.2. TextRank Yaklaşımı
10.3. YAKE! (Yet Another Keyword Extractor) Yaklaşımı
10.4. TF-IDF Tabanlı Anahtar Kelime Çıkarımı
10.5. KPMiner Yaklaşımı
10.6. Multipartite Rank Algoritması
BÖLÜM 11 BÜYÜK DIL MODELLERI VE PYTHON UYGULAMALARI
11.1. Büyük Dil Modelleri Nedir?
11.2. Büyük Dil Modellerinin Gelişim Süreci
11.3. Doğal Dil İşleme (NLP) ve Büyük Dil Modelleri
11.4. Dil Modellerinin Tarihçesi
11.5. İstatistiksel Dil Modelleri ve Derin Öğrenme Tabanlı Modeller
11.6. Transformer Mimarisine Giriş (BERT, GPT, vs.)
11.7. Dönüştürücülerin (Transformers) Çalışma Prensipleri
11.8. Büyük Dil Modellerinin Uygulamaları
11.9. Büyük Dil Modellerinin Python Uygulamaları
Bu kitap, veri işleme ve analiz dünyasında son yıllarda giderek önem kazanan iki temel konuya odaklanmaktadır: Metin Madenciliği ve Doğal Dil İşleme (DDİ). Her gün dijital dünyada milyonlarca yapılandırılmamış veri üretilirken, bu verilerden anlamlı sonuçlar çıkarma ihtiyacı hem akademik araştırmalar hem de ticari uygulamalar için giderek daha kritik bir hale gelmiştir. Python ile Metin Madenciliği ve Doğal Dil İşleme adlı bu kitap, Python programlama dilinin güçlü araçlarıyla bu zorlu sürecin nasıl yönetilebileceğine dair kapsamlı bir rehber sunmaktadır.
Kitabın ilk bölümleri, Python’un temel programlama prensiplerine ayrılmıştır. Python’da değişkenler, veri türleri, döngüler, kontrol ifadeleri ve nesneye yönelik programlama (OOP) gibi konular, okuyuculara metin madenciliği ve DDİ uygulamaları için sağlam bir temel kazandırmaktadır. Bu kitap, hem teorik bilgileri hem de pratik uygulamaları bir araya getirerek, Python ile metin madenciliği ve doğal dil işleme projeleri geliştirmek isteyen
okuyucular için yol gösterici bir kaynak olacaktır.
BÖLÜM 1 PYTHON PROGRAMLAMA TEMELLERI
1.1. Python Nedir?
1.2. Python Temelleri
1.3. Operatörler
1.4. Koşullu İfadeler (if-else)
1.5. Tekrarlayan İşlemler: Döngüler
1.7. Hata Yönetimi ve Hataların Denetimi
1.8. Fonksiyonlar ve Kullanımı
1.11. Hazır Fonksiyonlar
1.12. Dosyalama İşlemleri
1.13. Modüller ve Paketler
1.14. Nesneye Yönelik Programlama (Object-Oriented Programming - OOP)
BÖLÜM 2 TEMEL KAVRAMLAR
2.1. Doğal Dil İşleme (DDİ)
2.2. Metin Madenciliği
2.3. Makine Öğrenmesi (Machine Learning, ML)
2.4. Dilbilim
2.5. Sözdizimsel (sentaktik) analiz
2.6. Anlambilimsel (semantik) analiz
2.7. Kelimeler
2.8. Kök Bulma (Stemming)
2.9. Lemmatizasyon (Lemmatization)
2.10. DDİ Uygulama Alanları
2.11. Önemsiz Kelimeler (StopWords)
2.12. Öznitelikler (Features) ve Öznitelik Çıkarma Nedir?
2.13. Gözetimli Öğrenme (Supervised Learning)
2.14. Gözetimsiz Öğrenme
2.15. Pekiştirmeli öğrenme (Reinforcement Learning)
2.16. Kümeleme (Clustering)
2.17. Sınıflandırma
2.18. Uzman Sistemler
2.19. Part of Speech (POS)
2.20. Vec2Word
2.21. DDİ ve Metin Madenciliği için Python Kütüphaneleri
BÖLÜM 3 METIN MADENCILIĞI VE DOĞAL DIL İŞLEME: TEMEL TEKNIKLER
3.1. Varlık İsmi Tanıma (Named Entity Recognition - NER)
3.2. Metin Normalizasyonu (Text Normalization)
3.3. Tokenize İşlemi
3.4. Metin Sınıflandırma
3.5. Metin Özetleme
BÖLÜM 4 ÖZNITELIK ÇIKARIM YAKLAŞIMLARI
4.1. Kelime Çantası (Bag of Words, BOW)
4.2. TF-IDF (Term Frequency - Inverse Document Frequency)
4.3. One-Hot Encoding Yaklaşımı
4.4. Eş oluşum matrisleri (Co-occurrence Matrices)
4.5. N-Gram
4.6. Açı Örüntüler
4.7. Bir Boyutlu Yerel İkili Örüntüler
4.8. Motif Örüntüler
BÖLÜM 5 METIN GÖSELLEŞTIRME
5.1. Kelime Bulutu (Word Cloud)
5.2. Bar Chart (Çubuk Grafiği)
5.3. Heatmap (Isı Haritası)
5.4. Topic Modeling (Konu Modellemesi Görselleştirmesi)
5.5. Network Graphs (Ağ Grafikleri)
5.6. Word Tree (Kelime Ağacı)
5.7. N-Gram Analiz ve Görselleştirme
BÖLÜM 6 MAKINE ÖĞRENMESI VE METIN MADENCILIĞI SINIFLANDIRMA UYGULAMALARI
6.1. Veri Setleri
6.2. N-Gram ile Duygu Tespiti
6.3. Kelime Çantası (BOW) ile Duygu Tespiti
6.4. TF-IDF Öznitelikler ile Duygu Tespiti
6.5. One-Hot Encoding Yaklaşımı ile Spam E-Posta Tespiti
6.6. Eş oluşum matrisleri (Co-occurrence Matrices) ile Duygu Tespiti
6.7. Açı Örüntüler ile Spam E-Posta Tespiti
6.8. 1B-YİÖ ile Spam E-Posta Tespiti
6.9. Motif Örüntüler ile Spam E-Posta Tespiti
BÖLÜM 7 KONU MODELLEME (TOPIK MODELLEME)
7.1. Latent Dirichlet Allocation (LDA)
7.2. Latent Semantic Analysis (LSA)
7.3. Non-Negative Matrix Factorization (NMF)
7.4. Hierarchical Dirichlet Process (HDP)
7.5. Correlated Topic Model (CTM)
7.6. Biterm Topic Model (BTM)
7.7. BERTopic ile Topik Modelleme
BÖLÜM 8 DERIN ÖĞRENME METOTLARI İLE METIN SINIFLANDIRMA
8.1. LSTM (Long Short-Term Memory)
8.2. GRU (Gated Recurrent Unit)
8.4. Arıza Veri Seti
8.5. LSTM ile Metin Sınıflandırma
8.6. GRU (Gated Recurrent Unit) ile Metin Sınıflandırma
8.7. 1D-CNN (Bir Boyutlu Konvolüsyonel Sinir Ağı) ile Metin Sınıflandırma
BÖLÜM 9 EŞ OLUŞUM AĞLARI İLE METIN ANALIZI
9.1. Eş Oluşum Ağları Nedir?
9.2. Eş Oluşum Ağları ve Metin Madenciliği
9.3. Eş Oluşum Ağları için Veri Seti
9.4. Kelime Bazlı Eş Oluşum ağlarının Oluşturulması
BÖLÜM 10 ANAHTAR KELIME ÇIKARIM YAKLAŞIMLARI
10.1. RAKE (Rapid Automatic Keyword Extraction)
10.2. TextRank Yaklaşımı
10.3. YAKE! (Yet Another Keyword Extractor) Yaklaşımı
10.4. TF-IDF Tabanlı Anahtar Kelime Çıkarımı
10.5. KPMiner Yaklaşımı
10.6. Multipartite Rank Algoritması
BÖLÜM 11 BÜYÜK DIL MODELLERI VE PYTHON UYGULAMALARI
11.1. Büyük Dil Modelleri Nedir?
11.2. Büyük Dil Modellerinin Gelişim Süreci
11.3. Doğal Dil İşleme (NLP) ve Büyük Dil Modelleri
11.4. Dil Modellerinin Tarihçesi
11.5. İstatistiksel Dil Modelleri ve Derin Öğrenme Tabanlı Modeller
11.6. Transformer Mimarisine Giriş (BERT, GPT, vs.)
11.7. Dönüştürücülerin (Transformers) Çalışma Prensipleri
11.8. Büyük Dil Modellerinin Uygulamaları
11.9. Büyük Dil Modellerinin Python Uygulamaları