전체 글
-
[백준 알고리즘 / 파이썬] 2217번 : 로프PS 2022. 1. 25. 20:18
Greedy Alg 문제다. n개의 최대 하중이 주어지고, 몇 개의 로프를 쓰던지 상관없이 "최대 하중"만을 구하는 것이 목표이다. 사용하는 로프의 개수를 정하면 그에 따른 최대 하중을 바로 계산할 수 있기 때문에, 1, 2, ,,,n-1, n개의 로프를 쓰는 모든 경우의 수를 따져 보면 된다. - 1개의 로프 사용 : 1*(1번 째 큰 값) - 2개의 로프 사용 : 2*(2번 째 큰 값) ... - n개의 로프 사용 : n*(n번 째 큰 값) 이 계산한 하중들을 리스트에 넣어서 max로 뽑아내면 끝! n = int(input()) weight = [] for _ in range(n): weight.append(int(input())) weight.sort(reverse=True) # 내림차순 compu..
-
[백준 알고리즘 / 파이썬] 1764번 : 듣보잡PS 2022. 1. 17. 20:45
배열로 저장하고 set 함수만 쓰려다가 몇 번의 삽질 끝에 set 자료형으로 해결했다 (괜히 자료형이 있는게 아녀) n , m = map(int,input().split()) listen = set() see = set() for i in range(n): listen.add(input()) for i in range(m): see.add(input()) result = sorted(list(listen & see)) print(len(result)) for i in result: print(i)
-
[Python/Crawling] 네이버 증권 주식 뉴스 크롤링Deep Learning/NLP 2021. 10. 29. 15:17
미래에셋 금융 빅데이터 페스티벌에 참여하여 너무 감사하게도 본선에 진출하게 되었습니다. 김정우(연예인 아님, 우리 팀 이름입니다) 사랑해~ "키워드"를 이용하여 펀드를 보다 쉽게 이해시키는 과제를 받았고, 해당 키워드를 논리적으로 뽑아내기 위해 받았던 데이터 속 펀드명과 관련한 뉴스 데이터를 이용하기로 했습니다. 네이버 증권 뉴스 홈페이지에서 펀드 이름을 검색한 후, 뉴스 제목과 내용을 가져와 LDA 토픽모델링을 진행하는 것이 목적입니다. 군말말고 들어가보겠습니다. 일단 필요한 패키지를 불러와 주고요. 저희는 검색과 클릭 기능을 사용한 동적 방법이 필요하기 때문에 크롬드라이버를 열어줍니다. import pandas as pd from selenium import webdriver from selenium..
-
[추천시스템/뉴스추천] KDD-2019 NPA : Neural News Recommendation with Personalized Attention 논문 리뷰Deep Learning/Recommender System 2021. 9. 17. 00:15
2019년 KDD에 실린 논문으로, 뉴스 추천에 있어서 서로 다른 사용자는 단어와 뉴스를 다르게 받아들임을 반영하여 주목을 받았다. 논문 리뷰 스터디에서 해당 논문을 맡아 발제하였고 그 내용을 정리하려고 합니다. INTRO 서로 다른 사용자는 단어와 뉴스를 다르게 받아들임 이전의 추천은 이러한 사용자 개별의 선호는 반영되지 않았고, 단지 text 안에서의 중요한 단어에 가중치를 부여하는 방식을 사용하였음 → 이것을 추천에 반영한다면 더욱 향상된 personalized 뉴스 추천이 가능할 것이라는게 논문의 핵심 APPROACH 위 아키텍처를 크게 세 부분으로 나누면, 1. News encoder : 뉴스 벡터 학습 2. User encoder : 유저 벡터 학습 3. Click predictor : 후보 ..
-
[Python/Crawling] 네이버 플레이스(네이버 지도) 리뷰 크롤링Deep Learning/NLP 2021. 9. 15. 23:30
사실 selenium이 편하니까 머릿속으로는 웬만하면 뷰숲써야지 하면서도 (selenium은 라이브러리 자체가 굉장히 무겁기도 하고 잘 막힌다는 단점이 있다.) 굳이 막히지만 않으면 동적으로 크롤링하는 버릇(?)이 있었다. 하지만 내가 적은 코드 명령들을 전혀 먹어주지 않는 네이버와 근 몇 달 간 함께하면서 뷰숲과 많이 친해졌다. 종강하고 좀만 여유로워지면 올릴게욥.. 찬찬히 뜯어보겠음.. 크롤링하게 된 이유 빅데이터 동아리 ADV 프로젝트로 "식당 추천 시스템"을 하게 되면서, 팀원들이 네이버/카카오/구글맵 리뷰 데이터를 각자 분배하여 크롤링하기로 했다. 사다리 탔는데 네이버가 걸렸다. 네이버는 크롤링이 자주 막힌다.. F12를 누르면 훤히 보이는 소스들을 파이썬에다가 순순히 보내주지 않는다. 작업 환..
-
[시계열/time-series analysis] ARMA와 ARIMA의 차이NOTE 2021. 6. 2. 20:53
아,, 시계열 개강했는데 쉽지 않음,, 0. intro White Noise (백색잡음과정) : serially uncorelated인 이상적인 모형의 오차항, 평균 = 0, 분산 일정 AR(AutoRegressive) 모형 : 확률적 추세를 제거하기 위한 모형. 여기서 확률적 추세란 인접한 자료들 간 강한 상관관계로 인해 어떤 추세가 있는 것처럼 보이는 경우. 과거의 상태를 이용 MA(Moving Average) 모형 : 불규칙한 변동을 제거하기 위한 모형, 항상 stationary. 과거의 오차값을 이용 1. ARMA 말 그대로 AR모형과 MA 모형을 합친 것. 2. ARIMA ARMA 모형에서 i가 추가되었는데, 여기서 i는 integrated. (차분하는 이유? -> stationarity를 위해..