챗봇을 어떻게 만들까 - 2
챗봇을 만들기로 결심을 하고, 거대한 DB에서 텍스트를 추출한 다음 고민한 것은, 커다란 텍스트를 어떻게 문장 단위로 잘라낼 수 있을까였다. 영어 논문을 쓰기 위해 essay writing 수업을 들었는데, 선생님께서 영어는 구두점을 철저하게 지켜써야지 그렇지 않으면 큰일(?)난다는 엄명을 내리셨었다. 처음엔 그게 뭐가 어려워라고 생각했으나 생각보다 내가 구두점을 잘 지켜쓰지 않는다는 사실을 발견하고 약간의 충격과 함께 잔소리를 많이 들었었다. 영어도 그러한데 한국어는 오죽하랴. 아니 오죽한 정도가 아니라 우주 대혼돈이라고 봐도 무방할 것이다. 사람에 따라, 취향에 따라 마침표를 찍지 않고 쓰는 경우가 너무나 많았고, 문장이 도대체 어디서 끝나는 건지 알 수 없는 텍스트가 부지기수였다. (아니, 한국어 ..
카테고리 없음
2019. 4. 18. 05:15
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 소프트웨어오류
- 의미조작
- 단어의의미
- 의미연산
- 해석공동체
- 의미표현
- 단어벡터
- 실패준비
- 문장파싱
- 대화프로그램
- 챗봇
- 유튜브시대
- hypernyms
- 상위어
- 데이터베이스
- 올바른해석
- 의미속성
- word2vec
- 실용주의자
- 뇌혁명
- 코퍼스
- gensim
- synset
- conceptnet
- 워드넷
- 하위어
- wordnet
- hyponyms
- 인공지능
- lemma
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함