혹시 이 글을 보는 지금, 음악을 듣고 있진 않으신가요? 저는 이 글을 작성하는 지금 유튜브 뮤직을 이용해서 음악을 듣고 있습니다. 유튜브 뮤직의 메인 화면을 한번 같이 볼까요.
가장 위에는 제가 최근에 들었던 음악 목록을 제공하는데요, 저 음악 중 하나를 선택하면 노래가 재생되면서 유사한 곡들로 구성된 재생목록을 알아서 세팅해줍니다. 그 아래로는 즐겨 듣는 음악, (현재 저녁이기 때문에) 저녁에 어울리는 음악, 맞춤 믹스 재생목록 등을 사용자에게 제공해주고 있습니다. 차트100 처럼 현재 유행하는 곡을 보여주는 게 아니라 제가 자주 듣는 곡들을 보여주고 있죠. 인기곡, 인기뮤직미디오 같은 차트는 더 아래로 스크롤하거나, 아예 둘러보기 탭을 눌러야 접할 수 있습니다.
영화를 제공하는 대표적인 플랫폼인 왓챠도 한번 살펴볼게요. 왓챠 메인화면에서는 제가 평가했던 영화 평점들을 바탕으로 취향에 맞을 것 같은 인기작들을 추천해주고 있습니다. 가입을 할 때 이전에 보았던 영화나 방송프로그램들이 어땠는지 평점을 매기게 하더라구요. 여기 왓챠에서 제가 만약에 겨울왕국을 보게되면 비슷한 애니메이션 영화들, 디즈니의 인어공주나 픽사의 토이스토리들을 추가로 추천해주겠죠.
추천시스템이 추천하는 건 비단 음악, 영화 같은 컨텐츠 뿐만이 아닙니다. 어떤 상품을 사고 싶어 검색을 하면, 그 검색 기록을 바탕으로 연관되거나 유사한 상품을 추천해주기도 하고, 그 상품을 구매한 다른 이용자들이 함께 산 상품을 추천해주기도 합니다. 추천시스템은 이렇게 개인의 취향을 면밀하게 살펴보면서 사용자의 관심을 끌만한 컨텐츠, 상품, 정보 등등을 권합니다.
추천 시스템이 보편화되기 전에는 이렇게 이른바 "취향저격"을 당하기가 어려웠습니다. 인터넷이 발달하고 많은 사람들이 정보 제공자가 되면서 정보가 너무 많아져서 선택을 하기가 어려웠던 거죠. 하지만 추천 시스템이 등장하고 난 후에는 사용자의 취향, 욕구를 파악해준 덕분에 우리는 가만히 있어도(혹은 조금만 흔적을 남겨도) 정보를 취할 수 있게 되었습니다. "사용자가 기존에 이용했던 컨텐츠, 상품, 서비스에 몇 점을 주었는가? 얼마나 만족했는가?"를 바탕으로 맞춤형 정보를 제공하기 시작한거죠. 더이상 사용자는 너무 많은 정보 사이에서 길 잃을 필요 없이, 추천 시스템이 우선적으로 추천해주는 정보를 선택함으로써 시간을 크게 절약할 수 있게 됩니다. 때로는 알 수 없는 추천 알고리즘에 이끌려 자신도 몰랐던 새로운 취향을 발견하기도 하죠.
추천 시스템은 머신러닝의 여러 알고리즘 중에서도 비즈니스 관점에 부합하는 알고리즘입니다. (즉 돈이 된다) 수익 창출에 도움을 준다는 거죠. 컨텐츠(정보, 서비스, 상품도 마찬가지)가 다양해지고, 그걸 제공하는 플랫폼도 많아진 요즘 더더욱 그 중요성이 커지고 있습니다. 그래서 대부분의 플랫폼에서는 추천 시스템을 적용하여 고객 개개인에게 맞춤형 서비스를 제공하고 있습니다. 만약 고객이 추천 시스템의 결과를 마음에 들어하지 않는다면 해당 플랫폼을 더 이용하지않고 이탈하겠죠. 플랫폼 입장에서는 고객이 이탈하거나 매출이 하락하지 않도록 관심을 가질만한 것들을 제안하는 알고리즘이 필요한 것입니다.
추천시스템은 사용자가 관심을 가질만한 정보를 제공하는 시스템이라고 정리할 수 있습니다. 무엇에 관심을 가질지 알아내기 위해서는 데이터가 필요한데요, 사용자가 과거에 좋았거나 싫었다고 남겼던 피드백을 사용합니다. 이 피드백은 명시적 피드백(Explicit Feedback)과 암시적 피드백(Implicit Feedback)으로 나눌 수 있습니다. 각각의 정의와 특징을 정리해보면 다음과 같습니다.
명시적 피드백(Explicit Feedback) | 암시적 피드백(Implicit Feedback) |
✔ 사용자의 긍/부정을 수치로 나타낸 데이터 ✔ 아이템에 대한 사용자의 선호도를 직접적으로 알 수 있는 데이터 ✔ 직관적이지만 사용자가 직접 평가해야 하므로 데이터를 얻기 어렵고 크기가 작음. Ex) 영화나 맛집 평점, 좋아요/싫어요 |
✔ 사용자가 아이템을 얼마나 소비했는지를 기록한 데이터 ✔ 직관적으로 알 수 없는 경우 사용 ✔ 긍/부정에 대한 구분이 없음 ✔ 쉽게 구할 수 있음 ✔ 부정적인 피드백이 없고, 노이즈가 있음 ✔ 최근 추천 알고리즘들은 암시적 피드백을 사용하여 구현 Ex). 뉴스 클릭 수, 검색 기록, 페이지 유지 시간, 구매 내역 등 |
지금까지 추천시스템의 사례와 개념, 사용하는 데이터의 종류에 대해 알아보았습니다. 주변에서 쉽게 접할 수 있는 머신러닝 사례인 만큼 이해가 쉬웠을 것이라고 생각합니다. 다음 포스팅부터는 (가능하다면^^) 추천시스템에 사용되는 대표적인 알고리즘들을 소개해보려고 합니다. 읽어주셔서 감사합니다.🙃
이미지 출처
https://twitter.com/zzalmachine/status/717498609365684224
https://content.v.kakao.com/v/5dc924a2bcd34944b2b8d43f
https://m.asiailbo.co.kr/etnews/?fn=view&no=391060&cid=21080200#_enliple)
'繩鋸木斷水滴石穿 > AI | 머신러닝' 카테고리의 다른 글
배치 학습(오프라인 학습)과 온라인 학습 비교 (0) | 2022.03.15 |
---|---|
[추천시스템] 4) 협업필터링 - 이웃기반 협업필터링 (0) | 2021.10.16 |
[추천시스템] 3) 컨텐츠 기반 필터링(Contents-based Filtering) (0) | 2021.09.11 |
[추천시스템] 2) 사용하는 데이터와 추천알고리즘의 종류 (0) | 2021.07.10 |
Movielens 데이터 소개 (0) | 2021.05.31 |