Text mining w KNIME

Kiedy ktoś napisze mi wiadomość, dość łatwo rozpoznaję, czy jest ona życzliwa, czy wroga. Ale co zrobić, jeśli tysiąc osób napisze do mnie w krótkim czasie, a ja chciałbym się dowiedzieć, czy jest wśród nich więcej wrogów, czy przyjaciół?

INFO_30_44.jpg

Filmy science-fiction od dawna karmią nas wizją inteligentnego programu komputerowego, ewentualnie robota, który rozumie, co się do niego mówi. Żadnych skomplikowanych komend, żadnego wpisywania poleceń, nie trzeba nawet korzystać ze składni języka programowania. Mówimy do niego, a on wszystko rozumie. Jedyną barierą, która w tego typu opowieściach jest nieprzekraczalna, jest rozumienie emocji. Wspomniany program albo robot może z nami rozmawiać na każdy temat, ale nie będzie wiedział, że coś nam się podoba albo nie. A gdy wreszcie zaczyna dostrzegać jakieś wzorce i domyśla się, że przeżywamy coś, co nigdy nie będzie mu dane, jest niczym bajkowy Pinokio, stający się prawdziwym chłopcem.

W niniejszym artykule przeskoczymy od razu do końcówki tej opowieści i zamienimy bezduszną kukiełkę w rozpoznające ludzkie emocje stworzenie. A przynajmniej zobaczymy, na ile to możliwe. Oczywiście pomoże nam w tym, niczym bajkowy czarodziej, nasz dobry znajomy – KNIME. Więc można spodziewać się, że więcej będzie w tym matematyki niż magii.

Podstawy text miningu

Text mining to technika analizowania danych znajdujących się w tekście. Co ważne, dane te nie są opisane liczbami, a za pomocą zwykłego języka. Mogą to być artykuły naukowe lub popularne, zapisy medyczne lub giełdowe, maile, tweety, CV, odpowiedzi opisowe w ankietach lub komentarze na forach internetowych. Wszędzie tam skrywają się cenne informacje, które można poddać analizie.

Wykorzystałeś swój limit bezpłatnych treści

Pozostałe 86% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.

Kilka wariantów prenumeraty Pokaż opcje
Dwutygodniowy dostęp bez zobowiązań Wybieram

Abonament już od 100 zł miesięcznie

Dwutygodniowy dostęp bez zobowiązań

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

WYBIERAM

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Pełen dostęp do wszystkich treści portalu
to koszt 100 zł miesięcznie
przy jednorazowej płatności za rok

Dwutygodniowy dostęp do wszystkich treści
portalu za 99 zł netto, które odliczymy od ceny
regularnej przy przedłużeniu abonamentu

WYBIERAM

Polityka cookies

Dalsze aktywne korzystanie z Serwisu (przeglądanie treści, zamknięcie komunikatu, kliknięcie w odnośniki na stronie) bez zmian ustawień prywatności, wyrażasz zgodę na przetwarzanie danych osobowych przez EXPLANATOR oraz partnerów w celu realizacji usług, zgodnie z Polityką prywatności. Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.

Usługa Cel użycia Włączone
Pliki cookies niezbędne do funkcjonowania strony Nie możesz wyłączyć tych plików cookies, ponieważ są one niezbędne by strona działała prawidłowo. W ramach tych plików cookies zapisywane są również zdefiniowane przez Ciebie ustawienia cookies. TAK
Pliki cookies analityczne Pliki cookies umożliwiające zbieranie informacji o sposobie korzystania przez użytkownika ze strony internetowej w celu optymalizacji jej funkcjonowania, oraz dostosowania do oczekiwań użytkownika. Informacje zebrane przez te pliki nie identyfikują żadnego konkretnego użytkownika.
Pliki cookies marketingowe Pliki cookies umożliwiające wyświetlanie użytkownikowi treści marketingowych dostosowanych do jego preferencji, oraz kierowanie do niego powiadomień o ofertach marketingowych odpowiadających jego zainteresowaniom, obejmujących informacje dotyczące produktów i usług administratora strony i podmiotów trzecich. Jeśli zdecydujesz się usunąć lub wyłączyć te pliki cookie, reklamy nadal będą wyświetlane, ale mogą one nie być odpowiednie dla Ciebie.