지난 포스팅에서 워드넷에 대해서 이런저런 이야기를 드렸습니다. 제게 워드넷은 익숙하고 여전히 재밌으며 친숙한 주제이지만, 아직 워드넷이 낯설게 느끼시는 분들도 있으실 것 같아서 워드넷을 어떻게 활용할 수 있을지, 어디에 써먹으면 재밌을지 조금더 이야기해 보도록 하겠습니다. 글에 간간이 나오는 짧은 명령어들은 파이썬 코드에 기반하고 있습니다. 파이썬을 모르시는 분들도 부담없이 보실 수 있도록 설명을 포함하도록 하겠습니다. 그리고 파이썬을 약간이라도 다루어보신 분들이라면 쉽게 이해하고 활용하실 수 있으시리라 생각합니다. 먼저 워드넷을 사용하시려면 pip 등을 이용해서 설치하시고 다음과 같이 선언하시면 됩니다. from nltk.corpus import wordnet as wn 위 행은, 앞으로 워드넷이란 객..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/KvDS5/btquPNDsOz5/5z0nQUFeiTww3k9X6hN4k0/img.jpg)
word2vec이 매우 흥미롭다고 느낀 이유는 ‘단어 간 의미추론’이 가능한 것처럼 보였기 때문입니다. 언어라는 체계가 단어라는 요소와 요소 간의 관계로 이루어져 있다면, 이들 요소들 간의 의미 연산은 가능해야 하지 않을까라는 것이 저의 오랜, 개인적 화두였습니다. 예컨대 반대말, 비슷한말 같은 말놀이를 사람들은 즐기곤 합니다. ‘더위’의 반대말은 ‘추위’라든가, ‘길다’의 반대말은 ‘짧다’와 같은 추론을 인간은 비교적 자유자재로 할 수 있습니다. 하지만 프로그램을 만듦에 있어서 어떤 단어 입력이 주어졌을 때, 그것의 반대말을 산출하는 것은 매우 어려운 일입니다. 지금까지는 일일이 사람이 반대말 데이터를 쌍으로 입력하여, 그때그때 입력이 주어지면 출력을 했지만, 수백만 개의 단어가 넘는 언어 체계 내에서..
지난 글에서 컴퓨터에서 인간의 언어를 처리하기 위해서는 온톨로지가 필요하다는 이야기를 하였습니다. 제가 wordnet을 발견하고 얼마나 재미있었는지 수없이 많은 단어를 대입하며 그 결과를 음미하곤 했었습니다. 다음의 구조를 보시면 워드넷이 무엇인지 금방 알 수 있습니다. 동물 -새 -참새 -물고기 -고등어 -멸치 추상 -형태 -시간 -감정 -사랑 -행복 -분노 위 예시를 보시면 단어들이 가지는 의미의 위계를 알아볼 수 있습니다. 첫 번째 예에서 ‘물고기’로 주목해 보면, 물고기의 상위어는 동물입니다. 그리고 물고기의 하위어는 고등어, 멸치 등입니다. 상위어, 하위어가 중요한 이유는 어떤 개념이나 지식의 위계를 일목요연하게 파악할 수 있기 때문입니다. 단어라고해서 다 똑같은 단어가 아니라, 의미상 더 큰 ..
- Total
- Today
- Yesterday
- conceptnet
- lemma
- 유튜브시대
- 챗봇
- 실패준비
- 올바른해석
- 인공지능
- hypernyms
- 워드넷
- gensim
- 해석공동체
- 의미연산
- 실용주의자
- 의미표현
- 상위어
- 문장파싱
- 의미속성
- 단어벡터
- synset
- wordnet
- 소프트웨어오류
- 코퍼스
- 하위어
- 의미조작
- 단어의의미
- word2vec
- 뇌혁명
- hyponyms
- 대화프로그램
- 데이터베이스
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |