![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/2m0DD/btquW4Thvc7/HaMzQgiicEDvmetjcLJJc0/img.jpg)
의미의 문제를 다루다보면 필연적으로 해석이라는 영역을 마주하게 된다. 의미가 무엇인가에 대해서 아직 명확하게 대답할 수 없다면, 아직 의미라는 것은 객관적 기준을 확립할 수 없는, 주관성의 영역에 속해 있는 것은 아닌가하는 의심을 하게 된다. 물론 이러한 주관성의 함정 또는 애매함으로부터 벗어나고자 칸트와 같은 철학자들이 선험론적 인식론을 확립하고 인류 철학사에 큰 획을 그은 것이리라. 하지만 세상은 여전히 의미 문제로 대립하고 싸우고 전쟁을 벌이고 있다. 종교 그 자체로도 분쟁이 발생하지만, 어떤 문화나, 행동에 대한 종교적 해석을 가지고도 종파가 갈리며 상대에 대한 모욕으로 받아들이기도 하는 것이다. 주관성에 대한 체념으로부터 출발한다면, 결국 의미란, 해석의 문제라는 주장을 할 수도 있을 것이다. ..
워드넷을 활용하면 개념의 위계를 일목요연하게 파악할 수 있고, 관련된 다른 영역이나 관심사를 파악하는데 도움을 얻을 수 있습니다. 예컨대 '집'이라는 개념이 주어졌을 때 이것을 포함하는 상위 개념이 있는지, '집'과 유사한 기능을 하는 다른 단어들이 있는지, '집'이라는 개념 아래에 어떤 하위 개념들이 있는지 알아본다는 것은 개념들의 위계 관계를 조사한다는 것과 같은 의미입니다. 위계 관계를 파악하려면 주어진 어떤 단어의 상위개념어와 하위개념어를 알아야 합니다. 이것을 가능하게 하는 것이 wn.hyponyms() 과 wn.hypernyms()입니다. 처음에는 이 둘의 차이를 몰라서 헷갈리기도 했었는데요, hypernyms는 상위어를 조회할 수 있고 hyponyms는 하위어를 조회할 수 있습니다. 여기서는..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/QHe0Q/btquTRlH1te/cMDFY7H6k4zUCl8Rv6gdz1/img.jpg)
프로그래밍은 나에게 무엇일까? 한 문서 내에서 단어 빈도수 세기로 시작했던 나의 파이썬 경험. 초등학교 시절 고모의 권유로 컴퓨터 학원에 즐겁게 다녔으나 그당시 배웠던 basic 언어로는 사실 내가 할 수 있는 것이 많지 않았다. 물론 당시 개인 컴퓨팅 성능도 지금보다 현저히 낮은 때이기도 했다. 아주 오랜 시간 본격적인 프로그래밍을 배울 기회와 활용해야할 기회가 거의 없었다. 대학 때, 통계 공부를 열심히 했더라면, 그리고 동시에 프로그래밍 공부를 병행할 기회와 의지가 있었다면 얼마나 좋았을까라는 생각을 해본다. 그래도 이제 10년에 가까워지는 프로그래밍 여정이 삶을 더욱 풍부하게 해 준 것 같아 즐겁다. 다만, 프로그래밍 또는 소프트웨어 설계의 영역은 한도 끝도 없이 펼쳐진 바다와 같다는 생각을 한다..
지난 포스팅에서 워드넷에 대해서 이런저런 이야기를 드렸습니다. 제게 워드넷은 익숙하고 여전히 재밌으며 친숙한 주제이지만, 아직 워드넷이 낯설게 느끼시는 분들도 있으실 것 같아서 워드넷을 어떻게 활용할 수 있을지, 어디에 써먹으면 재밌을지 조금더 이야기해 보도록 하겠습니다. 글에 간간이 나오는 짧은 명령어들은 파이썬 코드에 기반하고 있습니다. 파이썬을 모르시는 분들도 부담없이 보실 수 있도록 설명을 포함하도록 하겠습니다. 그리고 파이썬을 약간이라도 다루어보신 분들이라면 쉽게 이해하고 활용하실 수 있으시리라 생각합니다. 먼저 워드넷을 사용하시려면 pip 등을 이용해서 설치하시고 다음과 같이 선언하시면 됩니다. from nltk.corpus import wordnet as wn 위 행은, 앞으로 워드넷이란 객..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/KvDS5/btquPNDsOz5/5z0nQUFeiTww3k9X6hN4k0/img.jpg)
word2vec이 매우 흥미롭다고 느낀 이유는 ‘단어 간 의미추론’이 가능한 것처럼 보였기 때문입니다. 언어라는 체계가 단어라는 요소와 요소 간의 관계로 이루어져 있다면, 이들 요소들 간의 의미 연산은 가능해야 하지 않을까라는 것이 저의 오랜, 개인적 화두였습니다. 예컨대 반대말, 비슷한말 같은 말놀이를 사람들은 즐기곤 합니다. ‘더위’의 반대말은 ‘추위’라든가, ‘길다’의 반대말은 ‘짧다’와 같은 추론을 인간은 비교적 자유자재로 할 수 있습니다. 하지만 프로그램을 만듦에 있어서 어떤 단어 입력이 주어졌을 때, 그것의 반대말을 산출하는 것은 매우 어려운 일입니다. 지금까지는 일일이 사람이 반대말 데이터를 쌍으로 입력하여, 그때그때 입력이 주어지면 출력을 했지만, 수백만 개의 단어가 넘는 언어 체계 내에서..
지난 글에서 컴퓨터에서 인간의 언어를 처리하기 위해서는 온톨로지가 필요하다는 이야기를 하였습니다. 제가 wordnet을 발견하고 얼마나 재미있었는지 수없이 많은 단어를 대입하며 그 결과를 음미하곤 했었습니다. 다음의 구조를 보시면 워드넷이 무엇인지 금방 알 수 있습니다. 동물 -새 -참새 -물고기 -고등어 -멸치 추상 -형태 -시간 -감정 -사랑 -행복 -분노 위 예시를 보시면 단어들이 가지는 의미의 위계를 알아볼 수 있습니다. 첫 번째 예에서 ‘물고기’로 주목해 보면, 물고기의 상위어는 동물입니다. 그리고 물고기의 하위어는 고등어, 멸치 등입니다. 상위어, 하위어가 중요한 이유는 어떤 개념이나 지식의 위계를 일목요연하게 파악할 수 있기 때문입니다. 단어라고해서 다 똑같은 단어가 아니라, 의미상 더 큰 ..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/wkW5h/btquJHR86b0/KHQSrLCRp10VlEUguu87U1/img.jpg)
‘어휘에 미쳐 살았던 날들 2부’를 써야하는데, 아무래도 그러자면 자료도 모으고, 방대한 이야기의 체계를 잡아야할 것 같아서, 중요하지만 한 번은 하고 넘어가야할 온톨로지에 대해서 이야기해 봐야할 것 같습니다. 어린 시절 보았던 SF영화들은 제 마음을 사로잡았습니다. 코드명j 라든지, 아니면 토탈리콜 등등의 영화들은 길을 걸으면서도 생각이 날 정도였죠. 토탈 리콜 원작은 좀 오래된 영화이긴 하지만, 지금도 우리에게 던지는 질문이 참 많습니다. 명장면도 많은데, 그 중에서 저에게 인상깊었던 장면은 주인공(당시 아놀드 슈왈츠제네거)이 택시를 탔는데, 인공지능 택시기사가 주인공에게 말을 걸고 운전을 하는 부분이었습니다. 인간과 로봇이 자연스럽게 대화를 하다니! 정말 그런 세상이 올 수 있을까? 저는 그게 정말..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/Ike1e/btquHaUP4NM/Ap4d1tmp5fZzjPjtLYHx81/img.png)
어휘에 미친 날들 1부. 어릴 때 적성검사를 하면, 언어 쪽에 점수가 높게 나왔었다. 어떤 친구들은 이과 쪽이 높게 나오고 또 어떤 친구들은 예술 쪽으로 좋게 나오는데 나는 초등학교 때부터 성인이 된 지금까지도 항상 ‘언어’쪽으로 나온다. 그래서 그런지 몰라도, 나는 언어, 그 중에서도 단어에 관심이 많았다. 아주 어렸을 때, 어떤 커다란 글자를 계속해서 뚫어져라 쳐다보면 점점 이상하게 보이고 내가 익히 아는 글자도 어색해지는 현상을 경험하기도 했다. 어릴 때 생각했던 것 중 하나는 “똑같은 의미인데 왜 여러 개의 단어가 필요할까?” 예컨대 그냥 사람의 나이라고 하면 되는데, 높임말에 따라 연세, 춘추를 가려써야 한다는 것이다. 살다보니 이런 비슷한 말들이 너무나 많았고, 단어 하나를 잘못 사용함에 따라..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/c3bFzM/btquGWIZUqy/KEpfhjr24S77RD2FueBKwk/img.jpg)
유튜브는 보는 재미가 있다. 사실 한번 빠지면 헤어나오기 힘들다. 하지마 한편으론 많은 유튜버, 인플루언서 들이 등장하면서 점점 각 영역별, 채널별로 포화상태로 가는 것 같다. 유튜브 시대에 나는 어떻게 살아야할까? 무엇을 배우고 가르쳐야할까? 유튜브 시대에 읽기란 어떤 의미일까. 쓰기는? 유튜브의 본질은 무엇일까? 그냥 영상? 타인으로부터 보고 듣는 것. 그 먼 옛날로부터 샤먼시대에서부터 보고 듣는 것은, 인간이 공동체를 이루고 살아가기 위한 기본적, 문화전승의 과정이었다. 이것이 가상의 공간으로 대체되면서 공동체 없이도 문화나 지식의 전수, 전승이 가능해졌다. 문제는 생산자가 늘어가는 긍정적 측면도 있지만, 소비하는 시청자, 문화적 전승이 누적만 되는 시청자가 늘어만간다. 이 시청자들이 서로간 소통하..
![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/r85pC/btquJs7lexe/gaTUnUrtT8hNllqxMN2Uzk/img.jpg)
1년전, 한 대학생이 저를 찾아왔습니다. 우연히 저에 관한 어떤 강연자의 이야기를 들었고, 조언을 바란다고 찾아왔습니다. 사실, 저 역시 제가 하고 있는 일이 급급한 상황이라 이제 막 스무살이 된 청년에게 무엇을 해야할지 조언해 주는 게 합당치 않다고 느꼈습니다. 조언이란 적시 적소에 제대로 이루어진다면 매우 효과적이겠지만, 괜히 어줍잖은 자기만의 주관적 신념에 매몰되어 억지주장을 펼칠 수도 있는 것이고, 또 그런 식의 자기편향적 조언이 상대의 많은 시간을 헛수고로 돌려버릴 수도 있기 때문입니다. 저도 젊은 날에는 내가 옳다고 믿는 것을, 열정적으로 때론 침을 튀겨가며 타인을 설득하기도 했었던 것 같습니다. 하지만 지나고보면, 내가 은연중에 설파했던 것들, 옳다고 주장했던 것들이 그렇지 않을수도 있다는 ..
- Total
- Today
- Yesterday
- 인공지능
- gensim
- hypernyms
- wordnet
- 문장파싱
- hyponyms
- synset
- conceptnet
- 데이터베이스
- 단어벡터
- 챗봇
- 코퍼스
- 의미속성
- 워드넷
- 실패준비
- 상위어
- 소프트웨어오류
- 뇌혁명
- 유튜브시대
- 의미연산
- 의미조작
- 의미표현
- word2vec
- 하위어
- lemma
- 실용주의자
- 해석공동체
- 대화프로그램
- 올바른해석
- 단어의의미
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |