![](http://i1.daumcdn.net/thumb/C148x148.fwebp.q85/?fname=https://blog.kakaocdn.net/dn/UmVog/btquDLTDxBo/ajokj3Fqe62rxssP2qPlK1/img.jpg)
챗봇을 만들기로 결심을 하고, 거대한 DB에서 텍스트를 추출한 다음 고민한 것은, 커다란 텍스트를 어떻게 문장 단위로 잘라낼 수 있을까였다. 영어 논문을 쓰기 위해 essay writing 수업을 들었는데, 선생님께서 영어는 구두점을 철저하게 지켜써야지 그렇지 않으면 큰일(?)난다는 엄명을 내리셨었다. 처음엔 그게 뭐가 어려워라고 생각했으나 생각보다 내가 구두점을 잘 지켜쓰지 않는다는 사실을 발견하고 약간의 충격과 함께 잔소리를 많이 들었었다. 영어도 그러한데 한국어는 오죽하랴. 아니 오죽한 정도가 아니라 우주 대혼돈이라고 봐도 무방할 것이다. 사람에 따라, 취향에 따라 마침표를 찍지 않고 쓰는 경우가 너무나 많았고, 문장이 도대체 어디서 끝나는 건지 알 수 없는 텍스트가 부지기수였다. (아니, 한국어 ..
카테고리 없음
2019. 4. 18. 05:15
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 대화프로그램
- 워드넷
- 데이터베이스
- hypernyms
- 의미연산
- 소프트웨어오류
- 상위어
- 문장파싱
- 의미표현
- gensim
- hyponyms
- synset
- 실용주의자
- wordnet
- 올바른해석
- 뇌혁명
- 단어의의미
- 단어벡터
- 인공지능
- 의미조작
- 하위어
- word2vec
- 의미속성
- 해석공동체
- conceptnet
- 코퍼스
- lemma
- 실패준비
- 유튜브시대
- 챗봇
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | ||||||
2 | 3 | 4 | 5 | 6 | 7 | 8 |
9 | 10 | 11 | 12 | 13 | 14 | 15 |
16 | 17 | 18 | 19 | 20 | 21 | 22 |
23 | 24 | 25 | 26 | 27 | 28 |
글 보관함