티스토리 뷰

최근 보잉사의 특정 기종에서 자동항법장치의 오류로 두 대의 비행기가 추락하는 슬픈 소식이 있었습니다. 그것이 정확히 무엇인지 모르겠지만 저는 그것을 소프트웨어 오류로 이해하였습니다. 이런 관점에서 본다면 ‘어떤 상황(입력)에 대한 판단(결과값)을 조작하는 알고리즘’이 잘못되었던 것이고, 어쩌면 그 작은 코드 조각 하나가 소중한 인명을 잃게 만든 것이 아닌가라는 생각이 들었습니다. 
그렇게 본다면 소프트웨어 설계와 작성은 얼마나 조심스럽고 신중해야하는지, 테스트를 얼마나 엄격히 해야하는지 등을 깨달을 수 있었습니다. 
사실 소프트웨어의 오류로 인해 커다란 피해를 입은 것은 한 두 해의 일이 아닙니다. 월스트리트에서는 설정 업데이트를 잘못 해서 커다란 금융회사가 파산한 경우도 있었고, 플래시 크래시라는, 아직도 이해하기 힘든 사건들도 벌어지기도 했었습니다. 
 


소프트웨어는 어떤 측면에서는 인간이 해야할 일들의 자동화라고도 볼 수 있습니다.
많은 것을 자동화함으로써 시간과 비용을 절약할 수 있습니다. 하지만 그 과정에 인간의 실수가 개입됨으로써 걷잡을 수 없고, 통제할 수 없는, 막대한 오류를 순식간에 생성해 버릴 수도 있죠. 아마 인간의 작업 속도가 느린 것은 이런 거대한 오류를 초기에 발견하여 수정하라는 진화적 목적의 산물일지도로 모른다는 생각이 듭니다. 

지금까지의 컴퓨터 소프트웨어는 앞으로도 그러할 것이지만, 수학적 기호에 근거해 있습니다. 수를 통해서 데이터를 표현하고, 결과값도 수로 표현합니다. 최종 사용자에게 보여지는 문자들마저도 사실은 수에 근거한 코드 체계로 환원될 수 있습니다. 아주 간단히 말하자면, 컴퓨터 소프트웨어란 수를 입력받아 수를 출력합니다.

자, 그럼 여기서 근본적인 의문이 시작됩니다. 
인간의 언어를 어떻게 수로 표현할 것인가?
컴퓨터의 입장에서는 어떻게든 언어를 수로 바꿔야만 연산 내지 조작을 할 수 있습니다. 
단어에서부터 시작해 볼까요? 사과라는 단어, 나무라는 단어는 어떻게 수로 표현해야할까요? 
사과를 1, 나무를 2, 그 다음 나타나는 단어를 순서대로 번호를 매길수도 있겠죠.
그런데 그렇게 해놓고 보면, 그 단어와 숫자는 단지 숫자라는 이름만 붙여놓았을뿐 
숫자들이 단어들의 관계와는 아무런 상관이 없습니다. 그냥 외워야할 뿐이죠.
인간에게는 이렇게 임의로 번호를 매긴 것이 별 도움이 되지 않습니다. 그저 단어를 임의의 숫자로 바꾸었을 뿐입니다. 수는 더하고 나누고 빼고 곱할 수가 있는데, 단어들에 매긴 숫자를 사칙연산한 결과가 어떤 다른 단어를 의미하지는 않습니다.
여기서 결론을 말하자면, 인공지능 연구에 있어서 인간의 언어는 항상 난관이었고, 인간의 언어를 수학적으로 표현할 수 없다는 것이 근본적인 이유였습니다. 


지금도 저는 고민합니다. 언어의 의미란 무엇인가?
그리고 그 의미를 어떻게 수로 표현할까? 사과라는 것의 의미는 어디서부터 어디까지인가.
‘사과’라는 말을 들을 때, 사람은 어디까지 떠올릴까? 사과의 모양, 맛, 색깔까지인지, 아니면 어린 시절 어머니가 사다주셨던 사랑의 기억까지인지..
사과의 ‘의미’를 따지다보면 가장 좁은 범위가 어디까지이고, 가장 넓은 범위가 어디까지인지 헷갈려지기 시작합니다. 그렇다면 그것을 수로 표현하려는 노력은 더더욱 어려워집니다. 의미를 수로 표현해야하는데, 의미가 다른 의미들로 이루어져 있다면, 일이 더 복잡하게 꼬여버리기 때문입니다. 

그래서 연구자들은 언어의 의미를 벡터로 표현하는 방법을 찾아냈습니다. 이 방법은 ‘의미’가 정확히 무엇인지는 모르겠으나, 단어가 사용된 빈도와 위치 등을 고려하여 단어의 의미가 가까운지 먼지를 다차원 상에서 거리 좌표로 나타낸 것입니다.
이 방법을 통해, ‘의미 표현’이라는 난제를 직접적으로 해결하지는 않았지만 우회적으로 ‘의미’를 연산할 수 있는 방법을 찾게 된 것이죠. 2013년에 구글의 미콜로프 등이 공개한 word2vec 그 대표적인 예입니다. 이것은 자연어 처리에 있어서 매우 놀라운 발견이었습니다. 
다음 포스팅에서는 그 이후 인공지능에서 어떻게 언어를 다루어왔는지를 이야기해 보겠습니다.

공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2025/02   »
1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28
글 보관함