지혜 씨의 행복한 고민
작은 마을에 새로 문을 연 도서관이 있어요. 이곳의 사서인 지혜 씨에게는 한 가지 목표가 생겼답니다. 바로, 도서관을 찾는 모든 사람이 자신만의 ‘인생 책’을 발견하고 돌아가게 하는 것이었죠.
하지만 사람들의 취향은 저마다 너무나도 다른걸요. 어떤 책을 추천해야 그들의 마음에 쏙 들 수 있을까요? 지혜 씨는 도서관의 대출 기록 카드를 하나씩 넘겨보며 고민에 빠졌습니다. 그리고 바로 그곳에서, 아주 흥미로운 두 가지 패턴을 발견하게 된답니다. 이 패턴이 바로 오늘 우리가 이야기할 **협업 필터링(Collaborative Filtering)**의 핵심 원리예요.
***
첫 번째 발견: 취향이 닮은 ‘영혼의 단짝’ 찾기
민준 씨와 소라 씨의 연결고리
지혜 씨는 대출 카드를 살피다 깜짝 놀랐어요. 민준 씨와 소라 씨라는 두 사람이 빌려본 책 목록이 놀라울 정도로 비슷했거든요. 두 사람 모두 판타지 소설을 사랑하고, 역사 미스터리를 즐겨 읽었죠.
어느 날, 민준 씨가 새로 들어온 판타지 소설 한 권을 빌려 가며 “이 책, 정말 최고예요!“라고 말했어요. 그 말을 들은 지혜 씨의 머릿속에 소라 씨가 떠올랐습니다.
‘아! 민준 씨가 이렇게나 좋아했다면, 분명 소라 씨도 마음에 들어 할 거야!’
지혜 씨는 다음에 소라 씨가 도서관에 방문했을 때, 망설임 없이 그 책을 추천해주었고, 소라 씨 역시 그 책의 열렬한 팬이 되었답니다.
이것이 바로 ‘사용자 기반 협업 필터링’
방금 지혜 씨가 한 일이 바로 사용자 기반(User-based) 협업 필터링의 기본 원리랍니다. 쉽게 말해 **‘당신과 비슷한 취향을 가진 다른 사람들이 좋아했던 것’**을 추천해주는 방식이에요.
- 넷플릭스 적용 사례: 제가 스릴러 영화 <서치>와 SF 영화 <인터스텔라>를 재미있게 봤다고 해봅시다. 넷플릭스는 저와 똑같이 <서치>와 <인터스텔라>를 높게 평가한 다른 수많은 사람들을 찾아내요. 그리고 그 사람들이 공통적으로 재미있게 본 다른 영화, 예를 들어 <나를 찾아줘>가 있다면, 저에게 그 영화를 추천해주는 거죠. 저는 한 번도 들어본 적 없는 영화일지라도, ‘나와 취향이 비슷한 사람들’이 이미 검증해준 셈이니 성공 확률이 높겠죠?
- 유튜브 적용 사례: 제가 ‘고양이’ 영상을 자주 보고, ‘게임 스트리밍’ 채널도 구독했다고 가정해볼게요. 유튜브는 저처럼 ‘고양이’와 ‘게임’이라는, 어찌 보면 서로 다른 두 카테고리를 함께 즐기는 다른 사용자 그룹을 찾아냅니다. 그 그룹의 사람들이 최근 ‘요리’ 관련 영상을 많이 보기 시작했다면, 어느 날 제 유튜브 홈 화면에 ‘백종원 레시피’ 영상이 불쑥 나타날 수 있어요. 이것이 바로 저의 직접적인 행동뿐만 아니라, 저와 비슷한 사람들의 행동을 기반으로 새로운 관심사를 추천해주는 사용자 기반 필터링의 힘이랍니다.
***
두 번째 발견: 서로를 끌어당기는 ‘단짝 책’ 찾기
<어린 왕자>와 <연금술사>의 비밀
이번엔 지혜 씨의 시선이 책에 머물렀습니다. 유독 <어린 왕자>를 빌려 가는 사람들은 얼마 뒤에 <연금술사>를 빌려 가는 경우가 많다는 사실을 발견했어요. 반대로 <연금술사>를 감명 깊게 읽은 사람들은 <어린 왕자>를 찾아 읽곤 했죠.
Advertisement
마치 두 책이 “우리는 서로 잘 어울리는 친구예요!“라고 말하는 것 같았어요.
그 후, 어떤 사람이 <어린 왕자>를 빌려 가면 지혜 씨는 자연스럽게 물어봤어요. “혹시 파울로 코엘료의 <연금술사>는 읽어보셨어요? 이 책을 좋아하셨다면 분명 마음에 드실 거예요.” 이 추천은 놀랍게도 대부분 성공적이었답니다.
이것이 바로 ‘아이템 기반 협업 필터링’
지혜 씨의 두 번째 발견은 아이템 기반(Item-based) 협업 필터링의 원리를 보여줍니다. 이번엔 사람이 아니라 콘텐츠, 즉 아이템들 사이의 관계에 주목하는 거예요. **‘당신이 좋아했던 그것과 비슷한 다른 것들’**을 추천해주는 방식이죠.
- 넷플릭스 적용 사례: 넷플릭스의 “‘이 콘텐츠와 비슷한 콘텐츠’” 목록이 대표적인 예시입니다. 제가 <기묘한 이야기>를 정주행했다면, 넷플릭스는 <기묘한 이야기>를 본 수많은 사람들이 연이어 시청한 다른 콘텐츠들을 분석해요. 그 결과 <엄브렐러 아카데미>나 <블랙 미러> 같은 시리즈가 함께 시청되는 경향이 높다는 것을 발견하죠. 그래서 저에게 이 시리즈들을 추천해줍니다. 이는 감독이나 배우가 같아서가 아니라, 순수하게 ‘소비 패턴’ 데이터만으로 두 콘텐츠 사이의 강한 연관성을 찾아낸 결과입니다.
- 유튜브 적용 사례: 유튜브에서 특정 영상 시청을 마치면 바로 오른쪽에 뜨는 ‘다음 동영상’ 목록이나, 영상 밑에 나타나는 추천 영상 목록이 아이템 기반 필터링을 적극적으로 활용합니다. 예를 들어, 제가 ‘아이유의 라이브 클립’ 영상을 봤다면, 시스템은 이 영상을 본 사람들이 곧바로 시청한 다른 영상들, 즉 ‘태연의 라이브 클립’, ‘다른 가수가 커버한 아이유 노래’ 등을 분석하여 저에게 다음 볼 영상으로 추천해주는 식입니다. ‘아이유 라이브’라는 아이템과 ‘태연 라이브’라는 아이템이 사용자들의 시청 기록 속에서 단짝 친구가 된 셈이죠.
***
우리 곁의 보이지 않는 사서
이처럼 지혜 씨와 같은 똑똑한 사서는 우리 주변 어디에나 있답니다. 넷플릭스와 유튜브는 이 두 가지 협업 필터링 방식을 정교하게 섞어서 사용해요. 때로는 나와 비슷한 ‘영혼의 단짝’을 찾아 그들의 선택을 빌려오고(사용자 기반), 때로는 내가 본 콘텐츠의 ‘단짝 친구’를 소개해주는(아이템 기반) 방식으로 말이죠.
이제 ‘협업 필터링’이라는 단어를 들으면, 나와 취향이 비슷한 누군가를 찾아주거나, 내가 좋아한 책의 단짝 친구를 찾아주는 친절한 도서관 사서 ‘지혜 씨’를 떠올려보는 건 어떨까요? 기술의 이름은 조금 차갑게 들릴지 몰라도, 그 본질은 이처럼 사람들의 즐거움과 만족을 연결해주려는 따뜻한 마음에서 시작되었으니까요.