-
Notifications
You must be signed in to change notification settings - Fork 1
/
Copy path5_kategori_tahmin.py
30 lines (22 loc) · 962 Bytes
/
5_kategori_tahmin.py
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
# Ömer Gözüaçık
import pickle
import pandas as pd
import pre_processing_tr as pr
from sklearn.feature_extraction.text import CountVectorizer
# Sınıflandırılmak istenen metin girilir.
text = input("Sınıflandırmak istediğiniz haber metnini giriniz. \n\n")
# Metin ön işleyiciden geçirildikten sonra sonuç
text_processed = pr.pre_process(text)
print('\n Ön işleme sonucu metinin son hali: \n')
print(text_processed)
#Önceden eğitilmiş modellerin yüklenmesi
filename = 'modeller/5-kategori_vocab.sav'
loaded_vocab = pickle.load(open(filename, 'rb'))
cv = CountVectorizer(vocabulary=loaded_vocab)
text_vector = cv.fit_transform([text_processed])
filename = 'modeller/5-kategori.sav'
loaded_model = pickle.load(open(filename, 'rb'))
class_mapping = {0: 'Diğer', 1: 'Ekonomi', 2: 'Siyaset', 3: 'Spor', 4: 'Teknoloji_Bilim'}
#Tahmin aşaması
pred = loaded_model.predict(text_vector)
print(f"\nKategori tahmini: {class_mapping[pred[0]]}")