TIL( Today I Learned)
22-07-04 월
-
WORKPLACE
-
PHASE 1 9-12 / 6
-
데이터 변형하기 | 2 ?
- 어노말 스코어를 각각의 RCF 에서 돌리고
- 데이터 분석하기 | 4 |
-
-
PHASE 2 13-16 / 6
- 정답 데이터 만들어 보기 | 4 |
-
PHASE 3 16-18 / 4
-
22-07-05 화
-
WORKPLACE
-
PHASE 1 9-12 / 6
- 정규 분포 코드 읽기 | 2 | 2
-
정규 분포 맞는지 확인하기
- Normality 검정
-
PHASE 2 13-16 / 6
- 이상치 비교해보기
-
인코더 테스트
- OneHot, Standardization, Binary Encoder
- 개별 진행 묶음 테스트
-
PHASE 3 16-18 / 4
- 데이터 비교 해보기
- 오정답 데이터 만들어 보기 | 4 | 4
-
22-07-06 수
-
WORKPLACE
-
PHASE 1 9-12 / 6
-
데이터 비교 해보기 | 2 | 4
- 칼럼별 데이터 수치 비교
- 데이터별 유의미한 숫자 확인해보기
-
-
PHASE 2 13-16 / 6
- 4가지 영역 잘라서 데이터 작업 해보기 | 4 |
- 오정답 데이터 만들어 보기 | 4 | 4
-
밑그림 및, 사전 편찬 내용 | 4 |
- - 가드듀티 참조
-
PHASE 3 16-18 / 4
- 더미 데이터 만들기
-
22-07-07 목
-
WORKPLACE
-
PHASE 1 9-12 / 6
- 파워포인트 작업 | 3 | 3
-
전 칼럼 데이터 이상치 비교 해보기 다시 검증 | 2 | 패스
- 칼럼별 데이터 수치 비교
-
PHASE 2 13-16 / 6
- 어제 작업 내용, 함수 분리 및 정리
- 4가지 영역별 RCF에 임의 데이터 넣을시 튀는 데이터 확인해보기
-
PHASE 3 16-18 / 4
-
22-07-08 금
-
WORKPLACE
-
PHASE 1 9-12 / 6
- 어제 작업 내용, 함수 분리 및 정리
-
PHASE 2 13-16 / 6
- 컨플 주간 업무 정리함
-
임의 데이터 인코딩 전략
- 인코딩 되는 갯수에 따라, 인코딩 칼럼의 숫자가 달라질 수 있다!!!!
-
상대적으로 한다면, 어차리 비교 군도 같이 돌리기 때문에 큰 의미는 없다.
- 아니다.. 트리 인덱스 데이터 자체가 달라진다.
- 인덱스 문제 생긴다 ---
-
함수에서 처리한 forest tree ndim이 안맞는다.
- 안 맞았는데 맞아짐
-
점수가 기대대로 나오지 않았다.
-
왜 그럴까?
- 인덱스 insert 위치가 이상??
- 점수 계산이 어떻게 되는지 잘 알고 있지 못하다
-
점수 계산 어떻게 하는지 이해가 필요하다
-
Feature p를 선택할 때 uniform random하게 뽑는 대신, 각 feature가 갖는 값의 범위에 따라 확률을 다르게 부여하여 선택합니다.
- 근데, 값의 범위가 다 0 - 1 이다.
- 연속된 값이 아닌데 연속된 값으로 넣고 있다.
-
- 이것도 알게 된것
-
-
PHASE 3 16-18 / 4
- 깃 코드 -> 빗버켓 이전
-
-
22-07-09 토
- 나만의 아이젠아워 루틴 페이지에 만들어보기
- 나와의 만남 이력서 갱신
-
22-07-10 일
- 나와의 만남
- 이력서정리
-
엘프화가님 블로그 읽어보기
- 나의 목적은?
- Transno Mindmap 그려보기
TEL (Trial and Error Log)
22-07-04
- ERROR:
-
ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 2 dimension(s) and the array at index 1 has 3 dimension(s)
-
SITUATION:
- np.concatenate
-
REASON:
- 다른 차원의 데이터 합치면 이상해짐
-
SOLUTION:
- 차원 통일
-
22-07-06
-
ERROR: ValueError: probabilities contain NaN
-
SITUATION:
- rrcf 구현체 작업중
-
REASON:
- 동일한 값으로 채워져 있음 -> encoding 결과 다 동일 -> 다른 값이 없으면 값에 따른 이상 확률 계산이 안됨
-
SOLUTION:
- 이상한 칼럼들 제외하기
-
-
ERROR: TypeError: first argument must be an iterable of pandas objects, you passed an object of type “DataFrame”
-
SITUATION:
- pd.concat()
-
REASON:
- 사용법 파악 제대로 안함
-
SOLUTION:
- pd.concat( [df1, df2 …] ) <= pd.concat( df1, df2 )
-
22-07-07
-
ERROR: TypeError:
() missing 1 required positional argument: ‘x’ -
SITUATION:
- defaultdict -> return 0
-
REASON:
- args 없이 동작하는 함수를 넣어야 하는데 인자를 넣었다.
-
SOLUTION:
- lambda : 0 <=+ lambda x: 0
-
22-07-08
-
ERROR: pandas data_frame 동작이 원하는 대로 동작안함
-
SITUATION:
-
REASON:
- function Param이 변경되었는데 신경 안쓰고 있었다.
-
SOLUTION:
- param: str <= param: list
-