TIL( Today I Learned)
22-06-27 월
-
Event
- WORKPLACE
-
PHASE 1 9-12 / 6
-
데이터 eda 검사법 찾아보기
- 적용할만한 내용 있느지 찾아보고 적용하기
- 트레일 데이터 PCA
- 고릴라 파싱 => EventName 동사만 구분해보기
-
-
PHASE 2 13-16 / 6
- 트레일이벤트 뽀개기 | 3 | 3
-
PHASE 3 16-18 / 4
- 랜덤 컷 포레스트 찾아보기 | 2 |
22-06-28 화
-
WORKPLACE
-
PHASE 1 9-12 / 6
- 데이터 normalization
-
how??
- one - hot
- 참고
- 랜덤 컷 포레스트 찾아보기 | 2 |
-
-
PHASE 2 13-16 / 6
-
procstat 수집 동작
- process_name => pattern
-
procstat_ 안쓰는 metric off
- 통계 기반 count 기반 이상 행위 판별 찾아보기
-
22-06-29 수
-
WORKPLACE
-
PHASE 1 9-12 / 6
-
시큐어 코딩 가이드
- sql injection 방어
- 검즘 없는 실행 방어
- 랜덤 컷 포레스트 이해 적용하기| 3 |
-
-
PHASE 2 13-16 / 6
- 통계 기반 count 기반 이상 행위 판별 찾아보기
-
22-06-30 목
-
WORKPLACE
-
PHASE 1 9-12 / 6
-
encoding-of-categorical-variables-with-high-cardinality | 4 | 6
-
링크
- python package category_encoders
- cardinality
- OneHot, Hashing, LeaveOneOut, and Target encoding. Avoid OneHot for high cardinality columns.
- one hot
-
Binary
- column 수 대폭 줄임,
- True / False 아님,
-
이진수로 표기 하면서 칼럼을 표현함
- 이진수 자리가 칼럼이됨
-
BaseN
- One hot or Binary
-
묶음
- target
- LeaveOneOut
- 연결된 지표를 가지고 계산해서 구한다.
-
-
-
PHASE 2 13-16 / 6
- 데이터 normalization | 6 | 8
-
pandas멀티 컨디셔널 변경
| ? | 2
-
PHASE 3 16-18 / 4
- 랜덤 컷 포레스트 이해 적용하기 | 6 | 4
-
22-07-01 금
-
WORKPLACE
-
PHASE 1 9-12 / 6
- 어제 결과물 df 랑 합치기
- 결과물 만들기 과정 검토 필요
- 결과 분석하기
- 바이너리 인코딩
-
PHASE 2 13-16 / 6
- 튜닝 인자들 정리하기
-
PHASE 3 16-18 / 4
- 이상이 있는 데이터 만들어보기
-
데이터 중요도 뽑기
- 가중치 넣기
- 통계 기반 보다 나은 이유가 무엇인가?
-
22-07-02 토
- 함께 자라기 노트 정리
- 주간 블로그 쓰기
- 영화보러 가기
TEL (Trial and Error Log)
22-06-30
-
ERROR: UFuncTypeError: Cannot cast ufunc ‘truedivide’ output from dtype(‘float64’) to dtype(‘int64’) with casting rule ‘samekind’
-
SITUATION:
- df calculation
-
REASON:
- type error
-
SOLUTION:
- df.astype(‘type’)
-
22-07-01
-
ERROR: ValueError: Cannot merge a Series without a name
-
SITUATION:
- df.merge(series)
-
REASON:
- 서로 다른 타입을 합치려고 하고 있기 때문
-
SOLUTION:
- s.toframe(), leftindex=True, right_index=True
-