목록전체 글 (94)
Gaegul's devlog
문제는 완전 탐색으로 푸는 문제이다. 처음에 bfs 로 풀릴 줄 알았으나 같은 행, 열에 대한 부분만 탐색해야 하기에 완전 탐색으로 푸는 문제이다. 문제 체스에서 룩이라는 기물은 막혀있지만 않으면 룩의 위치에서 같은 행, 같은 열에 해당하는 칸 중 하나로 한 번 이동할 수 있다. 단, 특정 칸이 막혀있다면 그 칸에서부터 더 나아갈 수는 없다. 만약 룩이 아래 그림과 같이 5행 4열에 존재하고 같은 행열에 기물이 없다면 5행이나 4열에 존재하는 칸 중 어디로든 갈 수 있다. 예를 들어, 5행 2열 혹은 1행 4열로 움직일 수 있다. 차례에 주어진 이동 횟수는 한 번이므로 이동이 완료되었다면 상대방의 차례로 넘어간다. 입력 8줄에 걸쳐 8x8 체스판의 상태가 주어진다. 이때 0은 기물이 없는 상태이고, 1은..
sql 문제가 나오는 기업의 코딩 테스트를 준비하느라 다~~~ 까먹어버렸던 sql 공부를 다시 해본다.. https://school.programmers.co.kr/learn/courses/30/parts/17044 프로그래머스 코드 중심의 개발자 채용. 스택 기반의 포지션 매칭. 프로그래머스의 개발자 맞춤형 프로필을 등록하고, 나와 기술 궁합이 잘 맞는 기업들을 매칭 받으세요. programmers.co.kr 프로그래머스 SQL KIT 에서 충분히 연습을 해볼 수 있기 때문에 그리 어렵지는 않지만, 그래도 모르는 기초 문법은 없어야 하기에 이렇게 정리로 끄적여 본다 😂 공부하면서 가장 어렵게 느껴졌던 GROUP BY 파트와 JOIN 파트로 나눠서 정리해 볼것이다. 가장 일반적으로 사용하는 문법 : SE..
라벨의 불균형을 확인하고 불균형을 처리하는 방법은 다음과 같습니다! print(train['Class'].value_counts()) print(train['Class'].value_counts() / train['Class'].value_counts().sum() * 100) 방법은 크게 두가지가 있는데요! 샘플링 방법과 StratifiedKFold를 통해 라벨을 균일하게 한 뒤 학습을 시키는 방법입니다. 1. Sampling 방법 그중에 Oversampling 방법인 SMOTE 와 hybrid 방법인 SMOTE+ENN 방법이 있습니다. 저는 SMOTE+ENN 방법을 택하였습니다. 선택 이유: 데이터 클래스 비율이 너무 차이가 나면(highly-imbalanced data) 단순히 우세한 클래스를 택하..
이상치 처리 방법은 다양하지만 이번 시간에는 3sigma 기준으로 이상치를 처리해볼껍니당! (IQR로 구할 수 도 있지만 이번 시간에는 3sigma 방법을 볼꺼예요 ☺️) 3sigma 란? 일변량 자료들 중 평균 ± 3*표준편차를 벗어나는 것들을 비정상이라 규정(정규분포 기반) #이상치 처리 def outlier(data): threshold = 3 outlier = [] for i in range(len(data)): if (data[i]>data.mean()+3*data.std())|(data[i]
모델 성능 향상에는 다음과 같은 방법들이 존재합니다! 저같은 경우는 빠르게 분석하기 위해 3개의 방법을 이용하는데요! 1. 모델 하이퍼 파라미터 튜닝 2. Coef를 통해 영향이 큰 피처 이상치 제거 3. 모델 앙상블 (보팅/스태킹) 1. Hyper Params Tuning Gridsearch 를 이용해 최적의 하이퍼파라미터를 찾는다. 엔지니어링하는 것 보다 최적의 파라미터를 구할 수 있는 장점이 있지만 찾는 데 오래걸리는 단점이 있다. gb_reg = GradientBoostingRegressor() gb_reg.get_params().keys() # 모델 파라미터 확인 #Regressor : Gradient Boosting Regressor params = {'n_estimators': [200,40..