Moon Young Lee

월간
 
최소주의행정학





6

6

 
2
0
2
1

6

네이버와 다음을 통해 제공되는 뉴스의 편향성이 화두다. MBC의 <스트레이트>에 따르면, 뉴스가 노출된 위치, 빈도, 기간 모두 수구언론사의 기사가 압도하고 있다. 이에 국내 웹포탈(Web portal) 업체인 다음과 네이버는 인공지능(artificial intelligence)의 알고리듬(algorithm)이 한 일이라고 둘러댔다. 사람이 한 것이 아니라 컴퓨터가 한 일이니 공정하고 정확하다는 항변일 것이다. 박정희시절 세금문제를 따지는 민원인에게 국세청 직원이 퉁명스럽게 “컴퓨터로 출력했다”며 훈계했다는 얘기가 떠오른다.

알고리듬이 바로 인간의 마음이다

그저 웃음이 나온다. 인공지능의 알고리듬이 어디 하늘에서 떨어지기라도 했단 말인가? 이른바 기계학습(machine learning)이나 심층학습(deep learning or hierarchical learning)과 같은 아리송한 말로 사람들을 홀리고 있지만 진실은 간단하다. 신경망이든 양자 알고리듬이든 인간의 지능을 조금이라도 더 닮을 수 있을까, 어떻게 사람처럼 배울 수 있을까 하는 몸부림이다. 컴퓨터는 인간을 거울처럼 비치고 있다. 인공지능(알고리듬의 집합체)은 제작자의 마음과 의도를 고스란히 담고 있다. 아무리 처리속도가 빨라지고 저장능력이 커졌다 해도 사람이 만든 기계일 뿐이다. 인간의 마음과 의도를 반영하지 않는 기계는 아무리 우수해도 실패작이다. 부수어지고, 버려지고, 다른 기계에 끼워질 운명이다.

데이타가 운명을 좌우한다

둘째, AI는 철저하게 데이타에 의존한다(data-driven). 알고리듬의 논리구조에 따라 데이타를 분석하여 대상의 특성치(parameters)를 수정해 나간다. 이것이 학습이다. 따라서 규모가 크고 다양하고 믿을 만한 데이타는 좋은 결과를 낼 수 있다. 하지만 쓰레기를 입력하면 쓰레기가 나올 뿐이다. 아무리 수퍼컴퓨터에 초대형 데이타(big data)를 넣어 돌린다 해도 마찬가지다. 전통적인 확률이나 회귀분석을 P(y|θ)라고 표현한다면, Maximum Likelihood (ML)나 Baysian 회귀분석은 조건부 확률인 P(θ|y)라고 말할 수 있다(King 1998: 14-18). 여기서 y는 데이타이고 θ(theta)는 특성치가 포함된 모델이다. AI는 주어진 데이타에서 특성치를 수정하면서 찾아가는 베이지안 방법을 취하고 있다. ML이든 베이지안이든 특성치의 운명은 전적으로 데이타에 달려있다.

네이버와 다음이 웃기고 자빠졌다

웹포탈의 인공지능이 바로 그들의 의지다. 알고리듬이 한 것이 아니라 바로 네이버와 다음이 한 짓이다. 거울에 비친 자신에게 “니가 했지?”라고 손가락질하고 있다. 하지만 반드시 문재인 정권을 흔들고 말겠다는 웹포탈의 의도라기보다는 그들의 수익을 극대화하려는 욕망이다. 돈을 벌기 위해 클릭수와 노출시간에 매달릴 수밖에 없는 포탈의 셈법이다. 그들의 알고리듬은 이런 의도에 충실할 뿐이다. 이런 상황에서 사실과 상관없이 독자를 유혹하는 기사를 백미터 경주하듯 쏟아내야 하는 기자들의 강박이 있다. 기사를 쓰느라 취재할 시간이 없다는 황당한 푸념이다.

웹포탈의 인공지능이 뉴스내용을 이해하고 평가한다는 것은 불가능하다. AI의 학습은 진위를 판단하고 문맥을 파악하는 것이 아니라 패턴을 찾아 연결(추론)하는 것이다. 알파고가 바둑을 두는 것이 아닌 것처럼 AI는 기사를 읽는 것이 아니다. 컴퓨터는 단지 주어진 논리구조에서 계산을 굉장히 빠르게 할 뿐이다. 사람들은 경이로운 계산능력을 지식능력으로 착각하고 있을 뿐이다. 둘째, 뉴스 자체가 새로운 것이기 때문에 과거 데이타에 의존하는 AI는 쓸모가 별로 없다. 주가를 예측한다는 AI가 허무맹랑한 까닭이다. 입력된 데이타가 없으면 나올 것이 없고, 적으면 정확성과 신뢰도가 떨어진다. 그래서 알파고가 이세돌의 변칙에 속수무책일 수밖에 없다. 결국 웹포탈의 뉴스편집은 인공지능이 아닌 AI를 가장한 “인공직원”의 작품이다. 미끼상품을 골라 진열하는 일이다

정말 웹포탈이 인간의 역사, 정치, 사회, 문화, 종교 등을 이해하고 판단할 수 있는(더이상 데이타가 필요없이 정확한 θ값을 알고 있는), 그러면서 엄청난 계산능력을 장착한 인간을 구현해 냈다면, 이 알고리듬은 인류역사를 바꿀 수 있는 “제왕의 반지”다. 네이버와 다음이 불확실성(uncertainty)을 통제할 수 있다는 뜻이고, 세상을 지배한다는 의미다. 이자율과 주가를 예측할 수 있으니 온세상의 뭉치돈은 다 그들의 차지가 될 것이다(주가예측 AI를 광고한다는 자체가 어불성설이다. 그런 AI는 꽁꽁 숨겨놓고 혼자만 사용해서 돈을 긁어모을 일이다). 대통령, 국회의원, 법관, 검사, 경찰, 종교인을 손바닥에 올려놓고 주무를 것이다. 네이버와 다음은 웹포탈 시장의 푼돈이 아니라 전 세계의 패권을 차지하기 위해 전쟁도 불사할 것이다. 하지만 이런 걱정은 붙들어 매시라. 그들의 “수동 알고리듬”은 고작 문재인 정권을 흠집내고 낙인찍으려는 기사를 골라내고 있다. 한미정상회담을 해리스 부통령이 문대통령과 악수한 손을 닦은 것으로 요약하는 수준이다. 앙증맞지 않은가.

네이버와 다음은 뉴스에서 손을 떼라

웹포탈과 언론사의 거래와 상술에 기자들은 노예가 되고, 시민들은 불량기사를 습관처럼 보면서 매출을 올려주고 있다. 클릭수와 노출시간에 쫓긴 기레기는 이제 모이를 쪼아대는 닭처럼 쉴새없이 글쇠판을 두드리는 “계자鷄者”가 되었다. 수구세력이 지배하는 언론지형에서 AI의 편파성은 놀라운 것이 아니다. “Garbage in, garbage out”이라 했다. 시민들이 포탈이 골라주는 쓰레기를 생각없이 받아먹으면 거짓과 왜곡으로 꾸며진 메아리방(echo chamber)에 스스로를 가두게 된다. 허상에 중독되고 편파성이 강화된다. 사실 AI의 알고리듬을 공개하냐 마냐는 본질이 아니다. 포탈이 뉴스장사를 못하도록 해야 한다. 방송이든 신문이든 날조기사는 엄중히 처벌해서 퇴출시켜야 한다. 무엇보다도 깨어있는 시민 스스로가 진위를 따지고 진실을 밝히는 주체가 되어야 한다. Sojeong

참고문헌

같이 읽기

인용하기: 박헌명. 2021. 웹포탈의 알고리듬은 그들의 욕망이다. <최소주의행정학> 6(6): 1.

2021. 06. 11 마지막 고침