네이버㈜(대표이사 한성숙)가 자체 개발한 인공지능 콘텐츠 추천 시스템인 'AiRS(에어스)'에 딥러닝 기반의 인공신경망 기술 RNN(Recurrent Neural Network)을 새로 접목하고, 모바일 <뉴스> 판에 시범 적용한다.

 

기존의 AiRS는 CF(Collaborative Filtering, 협력 필터)기술을 중심으로, 비슷한 관심사를 가진 사용자 그룹을 시시각각 생성해 이들이 많이 읽은 뉴스를 랭킹화해 추천했다. 이에 따라 보다 다양한 뉴스 추천이 가능했다. 이번에 새롭게 추가된 RNN기술은 사용자 개인의 뉴스 소비 '패턴'을 학습·예측해 맥락에 따라 뉴스를 추천함으로써 이용자는 본인이 읽었던 뉴스와 관련있는 더욱 깊이 있는 뉴스를 접할 수 있게 됐다.

 

네이버는 CF기술과 RNN기술 각각의 장점을 융합한 AiRS를 모바일 뉴스판의 'AiRS 추천 뉴스(베타)' 영역에 적용하며, 다양성 뿐만 아니라 심도 있는 뉴스도 추천한다는 방침이다.

 

 

 

 

■ RNN기술, 이용자의 뉴스 '소비 패턴' 예측해 같은 맥락의 최신 뉴스 추천 가능…CF기술의 한계 보완

 

네이버는 AiRS에 RNN기술을 도입함으로써, 기존 CF기술의 한계점을 보완했다. 

 

CF기술은 이용자와 비슷한 관심사를 가진 실시간 사용자 네트워크를 구축해, 해당 구성원들이 많이 소비한 콘텐츠를 랭킹화해 추천한다. 하지만, 해당 기술은 이전에 사용자들이 클릭한 콘텐츠를 기반으로 추천하기 때문에 방금 전 생성된 최신 뉴스를 추천하기 어렵고, 하나의 이슈에 대한 깊이 있는 뉴스 추천에도 한계가 있었다.

 

AiRS팀은 RNN 기술 접목으로 CF기술의 단점을 해결하고자 했다. 특히, 뉴스의 주요한 '소비패턴' 중 사용자가 관심있는 이슈와 맥락이 같은 여러 개의 뉴스를 읽는다는 점에 주목했다. 뉴스에도 주제별로 콘텐츠를 소비하는 일련의 읽기 시퀀스(Sequence, 순서)가 있다고 판단해 RNN 기술을 접목했다.

 

예를 들어, 이용자가 하나의 뉴스를 소비한 후 다음 뉴스를 읽는 데까지의 시간이 수 분(mins) 이내였다면 비슷한 관심사로 판단하고, 새롭게 인입되는 뉴스도 동일한 맥락의 뉴스로 빠른 시간 안에 추천할 수 있다.

 

 

■ 딥러닝을 통해 뉴스의 내용을 벡터화하고 확률을 계산해, 이용자가 다음에 읽을만한 확률 높은 뉴스 추천

 

네이버는 RNN 기술을 AiRS에 적용하기 위해 뉴스와 같은 문서(Document)의 내용을 학습하고, 이를 벡터(Vector, n차원의 의미있는 수치)로 변화하는 '임베딩 기술(Doc2Vec)'을 활용했다. 

 

벡터화된 각각의 뉴스들은 일련의 뉴스 시퀀스 데이터를 형성하고, RNN은 해당 데이터를 기반으로 확률을 계산해, 이용자가 다음에 읽을만한 확률이 높은 뉴스를 추천한다.

※시퀀스 데이터: 네이버 뉴스, 동영상, 블로그/카페/지식iN/포스트, 쇼핑 등 다양한 서비스에서 사용자가 어떤 순서로 콘텐츠를 소비했는지, 정보 탐색 순서를 나타내는 데이터

 

이로써, 이용자가 이전에 소비했던 뉴스들과 동일한 맥락, 범위에 속하는 심도 있는 뉴스 추천이 가능해졌다.

 

 

■ 딥러닝 기술 접목한 뉴스 추천 시스템으로 첫 사례…세계 최고 권위의 컴퓨터•인공지능 학회인 ‘CIKM2017’에서 기술 공유

 

한편, 네이버는 오는 11월 세계 최고 권위의 컴퓨터·인공지능 학회인 'CIKM2017'에 참여해, RNN 기술을 활용한 추천 시스템에 대한 논문 <Deep Neural Networks for News Recommendations>을 발표할 예정이다.

 

CIKM2017은 올해로 26회를 맞은 데이터베이스, 정보검색(Information retrieval), 지식관리(Knowledge management) 분야의 권위 있는 학회로, 11월 6일부터 10일까지 싱가포르에서 개최된다.

 

네이버 AiRS 최재호 리더는 "인공지능 추천 시스템에 딥러닝을 접목하고, 네이버 뉴스라는 많은 이용자가 사용하는 실서비스에 적용한 사례는 AiRS가 처음인 만큼, 학계 및 업계로부터 큰 주목을 받고있다"며, "뉴스를 시작으로 웹툰, 동영상 등 다른 서비스에서도 CF기술과 RNN기술이 상호보완하며 개인의 관심사에 따라 다양하고 깊이있는 콘텐츠를 동시에 추천할 수 있도록 실험을 이어나갈 예정"이라고 밝혔다.