목록분류 전체보기 (94)
Gaegul's devlog
Solution 1. Buffer 늘리기 이런 경우는 git의 post buffer 사이즈 문제이기 때문에 버퍼 사이즈를 늘려줌니다. git config --global http.postBuffer 1048576000 만약, 그런데도 올라가지 않는다고 하면 많은 용량을 차지하는 파일을 gitignore 파일로 제외시켜서 업로드해줘야 합니다. Solution 2. 불필요한 pretrained 모델 .pth 제외하고 올리기 (.gitignore file 만들기) 1) .gitignore 파일 만들기 git remote 가 되있는 프로젝트에 .gitignore 파일을 생성합니다. touch .gitignore 2) 특정 파일을 버전 관리에서 제외 echo "*.pth" >> .gitignore cat .git..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/eaWwCM/btrCLleL0wi/WSKAQlhmQl0fvdosIkBve1/img.png)
Greedy 알고리즘 ? 1. 현재 상황에서 지금 당장 좋은 것만 고르는 방법. 2. 문제를 풀기위한 최소한의 아이디어를 떠올릴 수 있는 능력을 요구 3. 정당성 분석이 중요. 단순히 가장 좋아 보이는 것을 반복적으로 선택해도 최적의 해를 구할 수 있는지 검토. 문제 . 1이 될때까지 n , k = map(int, input().split()) # N = 25, K = 3 res = 0 while True: #시간 복잡도 : O(log(n)) target = (n // k) * k res += (n - target) n = target if n < k : # 더이상 나눌 수 없으면 종료 break res += 1 # 횟수 count n //= k # 마지막으로 남은 수에 대해 1씩 빼기 res += (n..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bJTpso/btrBKp98Hf4/jxyM8mFmgyzBn3USfmg541/img.png)
DP(동적계획법)란? - 메모리를 적절히 사용하여 수행 시간 효율성을 비약적으로 향상시키는 방법. - 이미 계산된 결과는 별도의 메모리 영역에 저장하여 다시 계산하지 않도록 한다. - 일반적으로, 구현 방식은 탑다운(Top-down)과 보텀업(Bottom-up) 방식으로 구성된다. 1. DP 를 사용할 수 있는 조건 1) 최적 부분 구조 (Optimal Substructure) : 큰 문제를 작은 문제로 나눌 수 있으며 작은 문제의 답을 모아서 큰 문제를 해결할 수 있다. 2) 중복되는 부분 문제 (Overlapping Subproblem) : 동일한 작은 문제를 반복적으로 해결해야 함. 2. DP 종류 1) 탑다운 방식 : 메모이제이션 (Memoization) 메모이제이션은 다이나믹 프로그래밍을 구현하..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bfEmQc/btrBr5Z6hci/2fwwqWI382dzL2zpxKFqkK/img.png)
1. 정상성 (Stationary) 시계열 데이터의 특성이 시간의 흐름에 따라 변하지 않는다는 것을 의미. 정상 시계열은 장기적으로 예측 가능한 패턴을 갖지 않으며, 시계열 그래프는 일정한 변동폭(일정한 분산)을 가지며, 대체로 수평에 가까운 패턴(일정한 평균)을 보인다. 즉, 데이터가 정상성을 보인다는 것은 평균과 분산이 안정화 되어 있어 분석하기 쉽다는 것을 의미. 1) 비정상성(non-stationary) : 추세나 계절요인은 시간이 경과하면서 관측값에 영향을 미치기 때문에 추세 성분이나 계절 성분을 갖는 시계열 2) 정상성(stationary) : 불규칙 성분만으로 구성된 시계열은 정상적. 어느 시점에서 관찰하든 관측값은 불규칙한 변동을 제외하면 동일한 모습을 가짐. 추세나 계절 요인이 포함되어 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/qOSYM/btrBuyUhPHw/PxlJnFohQYMMI921OPFcPk/img.png)
1. 시계열 분석이란? 시계열 분석(time series analysis)는 시간의 흐름에 따라 일정한 간격으로 사건을 관찰하여 기록한 데이터를 바탕으로 미래의 관측값을 예측하는 분석 기법. 과거의 일련의 관측값을 분석하여 모델링하고, 이 예측모델을 바탕으로 미래의 관측값을 예측 시계열 데이터는 일반적으로 추세 성분(trend), 순환(cycle), 계절(seasonal) 성분, 불규칙(irregular) or 우연(random) 성분 등으로 구성되며, 이 성분들에 의해 변동된다고 가정. 시계열 데이터는 일반적으로 관측값의 전반적 상승 또는 하락 경향을 나타내는 추세 성분과 설명 안되는 오차(error)를 나타내는 불규칙 성분으로 구성. 1) 추세(Trend) 변동 시간이 경과함에 따라 관측값이 지속적으..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/PlanM/btrA6883Vfg/3JsiPxuaClswNsOMSAqt71/img.png)
안녕하세요! 오랜만에 돌아온 논문 리뷰 입니다. 오늘은 요즘 핫한 text to image generation task의 cvpr 21 에 어셉된 페이퍼인 TediGAN을 리뷰하고자 합니다! TediGAN의 주된 테스크는 다양한 가이드 (e.g. sketch, semantic label, textual description)를 컨디션으로 주면 이미지 synthesis에 포커싱하여 생성하는 것 입니다. 본격적으로 설명하기 앞서 TediGAN의 베이스 모델인 StyleGAN에 대해 살짝 알고 가면 좋을 것 같아 설명해보려 합니다! StyleGAN은 input vector z로 부터 직접 이미지를 생성하는 것이 아니라, mapping network을 거쳐 intermediate vector W로 먼저 변환한 ..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/bijLlO/btrBzUihuNI/2LZkGQSrxjfq6ukq1fUcQk/img.png)
2020 KAKAO BLIND RECRUITMENT > 문자열 압축 문제 설명 데이터 처리 전문가가 되고 싶은 "어피치"는 문자열을 압축하는 방법에 대해 공부를 하고 있습니다. 최근에 대량의 데이터 처리를 위한 간단한 비손실 압축 방법에 대해 공부를 하고 있는데, 문자열에서 같은 값이 연속해서 나타나는 것을 그 문자의 개수와 반복되는 값으로 표현하여 더 짧은 문자열로 줄여서 표현하는 알고리즘을 공부하고 있습니다. 간단한 예로 "aabbaccc"의 경우 "2a2ba3c"(문자가 반복되지 않아 한번만 나타난 경우 1은 생략함)와 같이 표현할 수 있는데, 이러한 방식은 반복되는 문자가 적은 경우 압축률이 낮다는 단점이 있습니다. 예를 들면, "abcabcdede"와 같은 문자열은 전혀 압축되지 않습니다. "어..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/q3YdP/btrAlfOufnH/Scw2ReyPWpil0hBPu8k2IK/img.png)
1. 확률변수와 확률분포 표본공간 : 통계적 실험이나 조사에서 모든 가능한 실현 결과들의 집합. 확률변수 : 표본공간 S 에서 정의된 실수값 함수 X 확률분포 : 확률변수 X와 확률을 대응시켜주는 관계 e.g. 동전을 3번 던지는 실험 S = {HHH, HHT, HTH, HTT, THH, THT, TTH, TTT} => 2의 3승 경우의 수 X = 앞면이 나올 수 있는 수 X = 0(아예 안나올 경우), 1, 2, 3(3번 다 나올 경우) P(X = 0) : 1/8 P(X = 1) : 3/8 P(X = 2) : 3/8 P(X = 3) : 1/8 1.1 이산 확률 변수 - 확률 질량 함수 이산 확률 변수 : 확룰변수 X가 취할 수 있는 값이 이산적인 값. e.g. 동전을 두번 던져서 나오는 앞면의 수, 주..
![](http://i1.daumcdn.net/thumb/C150x150/?fname=https://blog.kakaocdn.net/dn/xOL8O/btrviHW5ZsR/BUi8JSURjiwEtuBMJNFxK0/img.png)
오랜만에 논문 리뷰로 돌아왔다! (최근 블로그에 너무 소홀했음,, 이제 다시 열심히 정리해야겠다! 앗짜!!!) 최근 Transformer가 Vision분야로 넘어와서 다양한 task에서 SOTA를 찍었고, Transformer의 가장 핵심적인 아이디어인 self-attention이 이미지의 중요한 feature 정보를 파악하는데 용이하고, 또 cnn보단 조금 더 멀리 있는 feature 정보까지 파악할 수 있다는 점에서 많은 주목을 받았다. 그리고 이 후, self attention의 효과를 다양한 방법으로 시도하려는 연구가 많이 나오고 있다. 본 논문은 MLP 기반의 논문이며 self attention 대신에 fc(mlp)로만 self attention의 효과를 입증하는 논문이다. CycleMLP가 나..
사실 무한 매수법이라는 용어를 알게된건 구독하여 메일로 경제레터를 받아볼 수 있는 어피티에서 본 방법인데 요 전략을 만든 저자의 책이 따로 있었다! ( 책은 추후 기회가 되면 읽어볼 예정이고, 무한 매수법이라는 무한히 매수하여 꾸준히 수익률을 얻을 수 있다(?) 라는 매력적인 용어에 끌렸다. 그래서 이렇게 블로그에 살짝쿵 정리를 하기 위해서 끄적거린다. ) 일단, 많은 사람들이 투자를 하는 방법은 크게 두가지로 분류할 수 있다. 1. 시세차익 : 낮은 가격에 매수해서 높은 가격에 매도. (가장 제너럴한 방법) 2. 배당금 : 주식 소유자에게 주는 회사의 이익 분배금. 일반적으로 많은 개미 투자자들이 하는 방법이 낮은 가격에 주식을 매수해서 올랐을 때 매도하는 방법으로 투자를 한다. 하지만, 요즘 같은 주..