Text mining w KNIME
Kiedy ktoś napisze mi wiadomość, dość łatwo rozpoznaję, czy jest ona życzliwa, czy wroga. Ale co zrobić, jeśli tysiąc osób napisze do mnie w krótkim czasie, a ja chciałbym się dowiedzieć, czy jest wśród nich więcej wrogów, czy przyjaciół?
Filmy science-fiction od dawna karmią nas wizją inteligentnego programu komputerowego, ewentualnie robota, który rozumie, co się do niego mówi. Żadnych skomplikowanych komend, żadnego wpisywania poleceń, nie trzeba nawet korzystać ze składni języka programowania. Mówimy do niego, a on wszystko rozumie. Jedyną barierą, która w tego typu opowieściach jest nieprzekraczalna, jest rozumienie emocji. Wspomniany program albo robot może z nami rozmawiać na każdy temat, ale nie będzie wiedział, że coś nam się podoba albo nie. A gdy wreszcie zaczyna dostrzegać jakieś wzorce i domyśla się, że przeżywamy coś, co nigdy nie będzie mu dane, jest niczym bajkowy Pinokio, stający się prawdziwym chłopcem.
W niniejszym artykule przeskoczymy od razu do końcówki tej opowieści i zamienimy bezduszną kukiełkę w rozpoznające ludzkie emocje stworzenie. A przynajmniej zobaczymy, na ile to możliwe. Oczywiście pomoże nam w tym, niczym bajkowy czarodziej, nasz dobry znajomy – KNIME. Więc można spodziewać się, że więcej będzie w tym matematyki niż magii.
Podstawy text miningu
Text mining to technika analizowania danych znajdujących się w tekście. Co ważne, dane te nie są opisane liczbami, a za pomocą zwykłego języka. Mogą to być artykuły naukowe lub popularne, zapisy medyczne lub giełdowe, maile, tweety, CV, odpowiedzi opisowe w ankietach lub komentarze na forach internetowych. Wszędzie tam skrywają się cenne informacje, które można poddać analizie.
Wykorzystałeś swój limit bezpłatnych treści
Pozostałe 86% artykułu dostępne jest dla zalogowanych użytkowników portalu. Zaloguj się, wybierz plan abonamentowy albo kup dostęp do artykułu/dokumentu.