딥러닝 2

[ML] 추천시스템 평가 데이터 구성 방법: Leave-One-Out, Negative Sampling 실전 가이드

이번 포스팅에서는 추천시스템의 평가를 위해서 어떤 전략을 사용해서 학습 데이터와 평가 데이터를 나누는지에 대해서 설명해보고자 한다.  그중에서도 암묵적 피드백으로 이루어진 데이터와 모델을 활용할 때 자주 사용하는 Leave-one-out과 Negative sampling 방법에 대해서 알아보고자 한다. 이를 설명하기 위해서 필수적인 개념들을 한번 더 정리하고, 본격적인 이야기들을 순서대로 설명해보고자 한다. 1. 명시적 피드백 (Explicit Feedback)과 암묵적 피드백 (Implicit Feedback) 이란?추천시스템에서는 사용자의 선호도를 측정하기 위한 피드백 정보를 사용한다.그 종류에는 크게 두 가지가 존재하는데, 명시적 피드백 (Explicit Feedback), 암묵적 (Implicit..

[ML] 추천시스템 파헤치기 : 알고리즘 종류 및 기본 개념 정리

오늘은 추천시스템에 대해서 정리해보고자 한다.  추천시스템이란 사용자에게 선호할만한 아이템을 자동으로 추천하는 시스템을 말한다. 그 기본적인 아이디어는 다양한 데이터 소스를 활용해 고객의 관심을 추론하는 것이다. 따라서 과거의 관심사와 성향이 미래의 선택에 대한 방향성을 제시해주고 있기 때문에, 추천 결과는 과거의 상호작용에 기반할 수 있다. 예를 들어, 공통된 관심사를 가진 유저에게 비슷한 아이템을 추천해 줄 수도 있고, 유저가 기존에 구매했던 비슷한 물건을 찾아 추천해 줄 수도 있다. 이는 아주 단순한 추천 알고리즘에 기초해서도 만들 수 있다. 물론 더욱 많은 데이터들을 활용해서 더 고도화된 모델들을 만들 수도 있다.  어쨌든 이제부터, 간단한 알고리즘부터 다양하게 추천시스템 알고리즘들의 기본 개념들..