TIL&TEL 22.07.04~22.07.10

TIL( Today I Learned)

22-07-04 월

WORKPLACE
- PHASE 1 9-12 / 6
  - 데이터 변형하기 | 2 ?
    - 어노말 스코어를 각각의 RCF 에서 돌리고
  - 데이터 분석하기 | 4 |
- PHASE 2 13-16 / 6
  - 정답 데이터 만들어 보기 | 4 |
- PHASE 3 16-18 / 4

22-07-05 화

WORKPLACE
- PHASE 1 9-12 / 6
  - 정규 분포 코드 읽기 | 2 | 2
  - 정규 분포 맞는지 확인하기
    - Normality 검정
- PHASE 2 13-16 / 6
  - 이상치 비교해보기
  - 인코더 테스트
    - OneHot, Standardization, Binary Encoder
  - 개별 진행 묶음 테스트
- PHASE 3 16-18 / 4
  - 데이터 비교 해보기
  - 오정답 데이터 만들어 보기 | 4 | 4

22-07-06 수

WORKPLACE
- PHASE 1 9-12 / 6
  - 데이터 비교 해보기 | 2 | 4
    - 칼럼별 데이터 수치 비교
  - 데이터별 유의미한 숫자 확인해보기
- PHASE 2 13-16 / 6
  - 4가지 영역 잘라서 데이터 작업 해보기 | 4 |
  - 오정답 데이터 만들어 보기 | 4 | 4
  - 밑그림 및, 사전 편찬 내용 | 4 |
    - - 가드듀티 참조
- PHASE 3 16-18 / 4
  - 더미 데이터 만들기

22-07-07 목

WORKPLACE
- PHASE 1 9-12 / 6
  - 파워포인트 작업 | 3 | 3
  - 전 칼럼 데이터 이상치 비교 해보기 다시 검증 | 2 | 패스
    - 칼럼별 데이터 수치 비교
- PHASE 2 13-16 / 6
  - 어제 작업 내용, 함수 분리 및 정리
  - 4가지 영역별 RCF에 임의 데이터 넣을시 튀는 데이터 확인해보기
- PHASE 3 16-18 / 4

22-07-08 금

WORKPLACE
- PHASE 1 9-12 / 6
  - 어제 작업 내용, 함수 분리 및 정리
- PHASE 2 13-16 / 6
  - 컨플 주간 업무 정리함
  - 임의 데이터 인코딩 전략
    - 인코딩 되는 갯수에 따라, 인코딩 칼럼의 숫자가 달라질 수 있다!!!!
    - 상대적으로 한다면, 어차리 비교 군도 같이 돌리기 때문에 큰 의미는 없다.
      - 아니다.. 트리 인덱스 데이터 자체가 달라진다.
      - 인덱스 문제 생긴다 ---
  - 함수에서 처리한 forest tree ndim이 안맞는다.
    - 안 맞았는데 맞아짐
  - 점수가 기대대로 나오지 않았다.
    - 왜 그럴까?
      - 인덱스 insert 위치가 이상??
      - 점수 계산이 어떻게 되는지 잘 알고 있지 못하다
      - 점수 계산 어떻게 하는지 이해가 필요하다
        
        Feature p를 선택할 때 uniform random하게 뽑는 대신, 각 feature가 갖는 값의 범위에 따라 확률을 다르게 부여하여 선택합니다.
        
        근데, 값의 범위가 다 0 - 1 이다.
        
        연속된 값이 아닌데 연속된 값으로 넣고 있다.
    - 이것도 알게 된것
- PHASE 3 16-18 / 4
  - 깃 코드 -> 빗버켓 이전
22-07-09 토
- 나만의 아이젠아워 루틴 페이지에 만들어보기
- 나와의 만남 이력서 갱신
22-07-10 일
- 나와의 만남
- 이력서정리
- 엘프화가님 블로그 읽어보기
  - 나의 목적은?
  - Transno Mindmap 그려보기

TEL (Trial and Error Log)

22-07-04

ERROR:
ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 2 dimension(s) and the array at index 1 has 3 dimension(s)
- SITUATION:
  - np.concatenate
- REASON:
  - 다른 차원의 데이터 합치면 이상해짐
- SOLUTION:
  - 차원 통일

22-07-06

ERROR: ValueError: probabilities contain NaN
- SITUATION:
  - rrcf 구현체 작업중
- REASON:
  - 동일한 값으로 채워져 있음 -> encoding 결과 다 동일 -> 다른 값이 없으면 값에 따른 이상 확률 계산이 안됨
- SOLUTION:
  - 이상한 칼럼들 제외하기
ERROR: TypeError: first argument must be an iterable of pandas objects, you passed an object of type “DataFrame”
- SITUATION:
  - pd.concat()
- REASON:
  - 사용법 파악 제대로 안함
- SOLUTION:
  - pd.concat( [df1, df2 …] ) <= pd.concat( df1, df2 )

22-07-07

ERROR: TypeError: () missing 1 required positional argument: ‘x’
- SITUATION:
  - defaultdict -> return 0
- REASON:
  - args 없이 동작하는 함수를 넣어야 하는데 인자를 넣었다.
- SOLUTION:
  - lambda : 0 <=+ lambda x: 0

22-07-08

ERROR: pandas data_frame 동작이 원하는 대로 동작안함
- SITUATION:
- REASON:
  - function Param이 변경되었는데 신경 안쓰고 있었다.
- SOLUTION:
  - param: str <= param: list

Published 10 Jul 2022

개발로 세상을 발전시키는 개발!