ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [추시 질문 모음] Predictions and Recommendations
    Deep Learning/Recommender System 2021. 2. 3. 19:13

    출처 : 미네소타 대학교 Recommendar System

     

     

    복습할 때 보라고 헷갈리는거 위주로 정리,,

     


    Introducing Recommendar Systems

    Q. Prediction과 Recommendation을 구분하는

    best definition은?

    A. Prediction은 어떤 item에 대하여 한 사람의 rating(좋아요 개수, 소비량 등); recommendation은 큰 셋으로부터 어떤 사람이 아이템을 선택하(여 보여주)는 것.

     

    Q. Prediction과 Recommendation을 same interface에 합치는 것은 가능하다?

    A. False;

     

    ++) Explicit prediction

    결점 중 하나가 잘못될 수 있다는 점, 심각하게 잘못된다면 사용자들은 시스템의 신뢰도를 잃게 됨.

     

     


    Content-based Filtering

    Q. (그냥 내가 든 의문) TF-IDF에서 너무 많은 korpus가 생겨나는 문제점이 존재하는데, 그럼에도 불구하고 embedding 방법보다 인기있는(?) 이유?

    A. CF로 가면 대부분의 veterizing에 embedding 방법이 사용됨. 그래서 다소 고전적이라고 할 수 있는 Content-based에서는 상대적으로 고전적인 TF-IDF가 많이 소개되는 것이 아닐까? 하는 답변을 받음. 맞는 것 같다. CF 공부 열심히 하자.

     

     


    User-user Collaborative Filtering Recommenders

    날아갔음. 하.

     

     


    Item-Item Collaborative Filtering Recommenders

    Q. Item-Item이 User-User보다 대부분 좋은 결과 내는 것 인정. 그런데 상대적으로 weak한 부분?

    A. 상대적으로 적은 고객들과 많은 item들이 있을 때 user-user CF는 강함. 반대로 item-item은 item보다 고객이 많을 때 강함.

     

    Q. vector를 rating할 때 (mean-centered 아이템) 코사인 유사도를 사용하는 이유?

    A. missing value를 0으로 처리할 때, item에 대하여 rating은 많지만 user가 부족한 상황에서 적절한 효과를 내어주기 때문, 또한 pearson correlation과 동일하기 때문에 통계적으로 의미가 있음

     

    Q. 식당을 추천할 때, user의 거리를 고려하고자 한다면 어떻게 item-item CF를 확장시켜야 할까?

    A. user와 위치는 독립적이기 때문에 유사도 단계에서 처리하기 어려움. user의 현재 위치와 식당의 거리에 대한 함수로 가중치를 주면 됨.


    Basic prediction and recommendation metrics

    Q. Offline evaluation이 수행하는 것은?

    A. 상(기존의 데이터를 가지고) 유저의 과거 행동, behavior를 예측함으로서 추천의 효과를 평가하는 것.

     

    Q. Rec. training 과정에서 test data를 숨기는 것이 중요한 이유?

    A. 아Rec.가 유저의 behavior를 기억해 cheating하는 것을 방지하기 위해.

     

    Q. RMSE가 MAE와 MSE에 비해 나은 점?

    A. scale 측면에서 해석이 용이, 또한 RMSE와 MSE는 모두 MAE에 비해 larger error를 강조해줌 (error에 weight를 줌)

     

    Q. Decision-support metrics의 basic idea?

    A. Rec.가 유저로 하여금 bad decision보다는 right decision을 하도록 더 잘 접근하도록 평가하는 것

    cf) Prediction Accuracy metrics(MSE,,,) : 정확한 예측은 better decision을 가져올 것이므로 각 item의 예측 정확도를 높이는 것

     


     

    (계속 써야지..)

Designed by Tistory.