Sentiment – Türkçe Metinlerin Anlam Analizinde Son Nokta

Sentiment, önemli terimleri vurgulayarak, ucu açık yanıtları kategorilere ayırmaya olanak sağlayan nitelik araştırmasını daha hızlı ve kolay hale getiren metin analiz sistemidir.

Her dilin kendine özgü yaşam ve anlam çeşitliliği vardır. Yabancı bir dilde yüksek başarılar elde eden uluslararası bir metin analiz sistemi Türkçe metinlerde yetersiz kalmaktadır. Sentiment, Türkçe’yi bir çocuğun ana dili gibi benimser ve analizlerini bu öğrenimlere göre yorumlar.

Mevcutta yapılan metin analiz ve araştırmaları insan gücüne bağımlı olarak çalışmakta ve milyarlarca satır veri insan gözü ile analiz edilmektedir. Bilgisayar temelli metin analizinin en büyük faydası analiz yapan personelin iş gücünü azaltarak, verilerden daha sağlıklı ve güvenilir sonuçlar elde edilmesine yardımcı olur.

Sentiment, 2000’e yakın farklı metot kullanarak açık uçlu analizler yapar ve niteliksel araştırmayı daha hızlı ve kolay hale getirir. Kişilerin söylediklerini analiz etme yeteneğine sahip olan Sentiment kişilerin tutumları, davranışları, endişeleri, motivasyonları ve kültürleri hakkında bilgi edinmenize yardımcı olur.

Sentiment Nasıl Çalışır?

Analiz işlemi yapılırken, daha önceden görüş tarafı belli olan (pozitif / negatif /nötr) metinsel veriler kullanılarak eğitim veri seti oluşturulur.

Sisteme sunulan bu veriler metin madenciliği yöntemleri ile çeşitli ön işlemlerden geçirilip temizlenerek sınıflamaya uygun hale getirilir.

Bu ön işlemler arasında temel olarak; iletideki simge ve noktalama işaretlerinin temizlenmesi, metni kelimelere ayırma ve her bir kelimenin köklerinin bulunarak terim listelerinin oluşturulması, metin içerisindeki edat, bağlaç ve zamirlerden oluşan durak kelimelerin kaldırılması, terim frekansları ve ters doküman frekansları yardımıyla vektör uzay modelinin oluşturulması sayılabilir.

Vektör uzay modellerinde binary, terim frekansı, ters doküman frekansı, n gram gibi çeşitli yöntemler kullanılmaktadır.

Vektör uzay modeli oluşturulan bu veriler, yapay sinir ağları, destek vektör makinaları, karar ağaçları gibi sınıflama algoritmaları yardımıyla modellenir.

Çeşitli sınıflayıcılar tarafından eğitilen modeller yardımıyla yeni gelen duygu ve görüşler sınıflandırılır. Her oluşturulan sınıf için test metotları oluşturulur.

Sentiment Metodolojisi

Sistem tümüyle in-memory olarak çalışmaktadır.

Modeller flat file olarak oluşturulup aktif olanlar bellekte tutulmaktadır. Ayrıca çeşitli veriler için kendine ait ilişkisel veri tabanı bulunmaktadır.

Model karşılaştırmaları ve tüm analiz işlemleri multi-thread olarak gerçekleştirilmektedir.

Sistemde makine öğrenimi ve doğal dil işleme tabanlı yapay zekâ kullanılmaktadır.

Belli anahtar kelimeler veya kütüphane ile çalışmadan insan gibi bütün içeriği değerlendirmektedir.

Çok katmanlı yapay sinir ağları (MLP) ve destek vektör makinaları (SVM) algoritmaları kullanılmaktadır.

Sistem duygu analizi üzerine kurgulanmıştır.

Ekran Görüntüleri