튜링 테스트가 검사할 수 없는 것

NFS
2019-08-02
조회수 175



추적추적 비 내리는 주말 오후 전화가 왔다. 쓸쓸하게 속삭이는 여자 목소리.


“안녕하세요. 참 오랜만이죠?

그동안 말은 하지 못했지만 그대를 자주 생각했답니다.

아니 사실 많이 그리워했어요. 한 번도 그대를 잊어본 적이 없어요.”


누구일까? 전화기에서 들리는 그 목소리는 사람 목소리가 분명하다. 그런데 그것이 정말로 사람이 낸 목소리일까? 저기 건너편 전화기에서 소리를 낸 존재가 과연 마음을 가진 이였을까? 나는 전화기에서 들려오는 여자 목소리를 듣고서 그 목소리만으로도 나와 전화기로 연결된 그가 마음을 가진 존재라고 판단한다. 그가 마음을 지녔을 것이라는 내 판단은 무슨 근거가 있을까? 그 목소리는 혹시 컴퓨터가 스스로 만든 기계음이 아닐까?


 

튜링 머신을 고안한 앨런 튜링(Alan turing, 1912~1954)


컴퓨터 공학자들은 언젠가 컴퓨터도 마음을 가질 수 있을 것이라고 예상한다. 과연 컴퓨터도 사람처럼 마음을 지닐 수 있을까? 이 물음에 답변하기 위해서 동물이든 기계든 주어진 시스템이 마음을 가지고 있는지 없는지를 검사할 수 있는 방법을 먼저 고안해야 할 것이다. 컴퓨터 과학의 아버지라 불리는 앨런 튜링(Alan Mathison Turing, 1912~1954)은 이를 검사할 수 있는 방법을 고안했는데 그것을 “튜링 테스트”라고 한다.

튜링 테스트는 베일 뒤에 검사 대상을 놓고 그와 물음과 응답을 주고받으면서 그 대상이 사람인지 기계인지 알아맞히는 검사이다. 튜링은 검사 대상을 왜 베일 뒤에 감추어야 했을까? 검사 대상이 단순히 사람을 닮은 얼굴을 하고 있으면, 우리는 그가 마음을 가진다고 생각하기 십상이다. 그래서 얼굴만 보고 그가 마음을 가지고 있다고 예단해서 안 되겠기에 그 검사 대상을 베일 뒤에 감추어야 한다. 또한 튜링 테스트에서 물음과 응답은 문서나 모니터 출력을 통해 이루어지는 것이 좋다. 왜냐하면 검사 대상이 단순히 사람 비슷한 목소리를 낸다고 해서 그 대상이 사람이라고 예단해서는 안 되기 때문이다.

이제 베일 뒤에 누군가 놓여 있는데 우리는 그와 응답을 주고받아야 한다. 만일 우리가 그와 응답을 주고받으면서 그 대상이 사람인지 기계인지 잘 분간할 수 없다면, 우리는 어떤 결론을 내릴 수 있을까? 튜링은 이 경우에 그 검사 대상이 사람처럼 생각하고 있다고, 그래서 마음을 가지고 있다고 보아야 한다고 주장했다.

우리를 감쪽같이 속일 수 있는 기계가 만들어질 수 있을까? 1950년의 튜링은 향후 몇 십 년 후에 그런 기계가 만들어질 수 있다고 예견했다. 그것이 만들어지는 시점은 대용량저장장치를 갖춘 컴퓨터가 개발되는 때이다. 튜링이 추정한 정도의 저장용량을 갖춘 컴퓨터는 이미 오래 전에 개발되었다. 하지만 아직도 우리를 감쪽같이 속이는, 다시 말해 사람처럼 유창하게 대화할 수 있는, 사람을 거의 흉내 내는 컴퓨터는 아직 나오지 않았다. 하드웨어 기술이 아직 충분히 발달하지 못했기 때문일까? 아니면 소프트웨어의 문제일까?

사람처럼 유창하게 말하는 컴퓨터가 언제 만들어질지, 아니 우리가 그런 컴퓨터를 만들 수나 있을지는 답하기 어려운 문제이다. 하지만 말하는 컴퓨터가 실제로 생긴다면, 우리는 그것이 마음을 가지고 있다고 말할 수 있을 것이다. 나는 이것을 받아들인다. 그런데 여기서 사람처럼 ‘말한다’는 것은 정확히 무엇을 뜻하는가? 우리가 알아먹을 수 있는 문장들을 몇 개 출력한다고 해서 그것을 두고 ‘말한다’고 할 수 있을까? 앵무새는 과연 ‘말하는’ 것일까?

‘말한다’는 것은 뜻을 가진 뭔가를 표현한다는 것이다. 따라서 동물이든 기계든 말을 할 수 있으려면 그것은 뜻을 표현해야 한다. 이것은 한 시스템이 생각하는지 안 하는지, 마음을 갖고 있는지 않는지를 검사하는 테스트는 검사 대상이 뜻을 표현하는지 안 하는지를 검사할 수 있어야 한다는 것을 함축한다. 그러면 튜링 테스트는 한 시스템이 출력한 것이 뜻을 지니는지 않는지를 검사하는 데 적합할까? 우리가 하는 말의 문법을 지키는 몇몇 낱말들의 조합을 출력한다고 해서, 그렇게 출력된 낱말 꾸러미가 뜻을 가진 출력이라고 예단해서는 안 된다.

말이 통하기 위해서, 다시 말해 상대방 말을 이해하기 위해서 상대의 말뜻을 먼저 파악해야 한다. 하지만 말뜻은 문법에 의해 만들어지지 않고, 문장과 문장의 관계만으로 만들어지지 않는다. 단순히 표현과 표현이 관계를 이루고, 표현들이 내부 구조를 갖는 것만으로는 그 표현에 뜻이 깃들지 못한다. 표현에 뜻이 깃들어 있기 위해서는 표현하는 이에게 바깥 세계와 부단한 접촉 역사가 반드시 있어야 한다.

아이폰의 시리 또는 아이비엠의 왓슨이 “오늘 이곳 날씨가 맑다”고 말할 때 그 ‘오늘’이 오늘을 뜻하고 그 ‘이곳’이 이곳을 뜻하고 그 ‘날씨’가 날씨를 뜻한다는 것을 파악하기 위해서 그 말이 발화되는 바깥 열린 공간을 확인해야 한다. 다시 말해 검사대상의 표현 “오늘 이곳 날씨가 맑다”가 뜻을 가지는지 않는지가 당면 문제가 될 때는, 이 표현이 우리가 평소에 알고 있던 그런 뜻을 갖고 있다고 예단해서는 안 된다. 이것은 한 시스템이 사람처럼 생각하는지 안 하는지 검사하고자 할 때 그것이 예쁜 사람이라고 미리 단정해서는 안 되는 것과 같다.

한 시스템이 생각하는지 않는지, 그래서 마음을 갖는지 않는지 검사하고 싶다면, 밀실이 아니라 바깥에서 그와 대화해야 한다. 뜻은 기호들의 관계나 두뇌에 있지 않기 때문이다. 우리는 그 시스템이 출력한 ‘작년 설날에 서촌에서 만난 순이’라는 표현들이 바깥 사물과 접촉한 오랜 역사의 산물이라는 것을 확인해야 한다. 결국 가령 로봇에 시리 시스템을 장착하는 것 또는 로봇에 아이비엠 왓슨 시스템과 접속시키는 것은 말하는 이를 현장에 가져다 놓는 것이 아니다. 시리 시스템이든 왓슨 시스템은 오직 특정 장소에만 놓여 있다. 아니 보다 엄밀히 말해 그것은 특정 장소에 있지 않다. 설사 그것의 서버가 실리콘 벨리에 놓여 있든 서울에 놓여 있든 그것은 그 장소에 있는 것이 아니다.

하지만 우리 몸이 광주 또는 제주에 있다면 우리는 그 장소에서 벌어지는 것들을 지각하고 감각한다. 따라서 로봇이 말하기 위해 그 로봇은 자기가 놓인 특정 장소를 지각하고 그것에 반응해야 한다. 그 로봇이 사람처럼 말하는지 안 하는지 검사하기 위해 우리는 그 로봇이 뜻을 가진 표현을 출력하는지 검사해야 한다. 이를 검사하기 위해 우리는 열린 장소에서 그 로봇에게 말을 걸어 보아야 한다. 이 점에서 튜링 테스트는 생각을 검출하고, 마음을 검출하는 적절한 테스트가 될 수 없다. 왜냐하면 그 테스트는 검사 대상을 베일 뒤에 감추어 놓고 평가하기 때문이다. 뜻은 닫힌 곳이 아니라 오직 열린 공간에서만 드러난다. 또한 뜻, 의미, 생각, 마음은 오직 열린 시공간에서, 긴 경험의 역사를 통해서만 생성된다. 마음은 일시에 주입될 수 없고, 인큐베이터 안에서는 결코 어떤 아기도 마음을 가질 수 없다.

1 0