All Articles

TIL&TEL 22.07.04~22.07.10

TIL( Today I Learned)

22-07-04 월

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 데이터 변형하기 | 2 ?

        • 어노말 스코어를 각각의 RCF 에서 돌리고
      • 데이터 분석하기 | 4 |
    • PHASE 2 13-16 / 6

      • 정답 데이터 만들어 보기 | 4 |
    • PHASE 3 16-18 / 4

22-07-05 화

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 정규 분포 코드 읽기 | 2 | 2
      • 정규 분포 맞는지 확인하기

        • Normality 검정
    • PHASE 2 13-16 / 6

      • 이상치 비교해보기
      • 인코더 테스트

        • OneHot, Standardization, Binary Encoder
      • 개별 진행 묶음 테스트
    • PHASE 3 16-18 / 4

      • 데이터 비교 해보기
      • 오정답 데이터 만들어 보기 | 4 | 4

22-07-06 수

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 데이터 비교 해보기 | 2 | 4

        • 칼럼별 데이터 수치 비교
      • 데이터별 유의미한 숫자 확인해보기
    • PHASE 2 13-16 / 6

      • 4가지 영역 잘라서 데이터 작업 해보기 | 4 |
      • 오정답 데이터 만들어 보기 | 4 | 4
      • 밑그림 및, 사전 편찬 내용 | 4 |

        • - 가드듀티 참조
    • PHASE 3 16-18 / 4

      • 더미 데이터 만들기

22-07-07 목

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 파워포인트 작업 | 3 | 3
      • 전 칼럼 데이터 이상치 비교 해보기 다시 검증 | 2 | 패스

        • 칼럼별 데이터 수치 비교
    • PHASE 2 13-16 / 6

      • 어제 작업 내용, 함수 분리 및 정리
      • 4가지 영역별 RCF에 임의 데이터 넣을시 튀는 데이터 확인해보기
    • PHASE 3 16-18 / 4

22-07-08 금

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 어제 작업 내용, 함수 분리 및 정리
    • PHASE 2 13-16 / 6

      • 컨플 주간 업무 정리함
      • 임의 데이터 인코딩 전략

        • 인코딩 되는 갯수에 따라, 인코딩 칼럼의 숫자가 달라질 수 있다!!!!
        • 상대적으로 한다면, 어차리 비교 군도 같이 돌리기 때문에 큰 의미는 없다.

          • 아니다.. 트리 인덱스 데이터 자체가 달라진다.
          • 인덱스 문제 생긴다 ---
      • 함수에서 처리한 forest tree ndim이 안맞는다.

        • 안 맞았는데 맞아짐
      • 점수가 기대대로 나오지 않았다.

        • 왜 그럴까?

          • 인덱스 insert 위치가 이상??
          • 점수 계산이 어떻게 되는지 잘 알고 있지 못하다
          • 점수 계산 어떻게 하는지 이해가 필요하다

            • Feature p를 선택할 때 uniform random하게 뽑는 대신, 각 feature가 갖는 값의 범위에 따라 확률을 다르게 부여하여 선택합니다.

              • 근데, 값의 범위가 다 0 - 1 이다.
              • 연속된 값이 아닌데 연속된 값으로 넣고 있다.
        • 이것도 알게 된것
    • PHASE 3 16-18 / 4

      • 깃 코드 -> 빗버켓 이전
  • 22-07-09 토

    • 나만의 아이젠아워 루틴 페이지에 만들어보기
    • 나와의 만남 이력서 갱신
  • 22-07-10 일

    • 나와의 만남
    • 이력서정리
    • 엘프화가님 블로그 읽어보기

      • 나의 목적은?
      • Transno Mindmap 그려보기

TEL (Trial and Error Log)

22-07-04

  • ERROR:
  • ValueError: all the input arrays must have same number of dimensions, but the array at index 0 has 2 dimension(s) and the array at index 1 has 3 dimension(s)

    • SITUATION:

      • np.concatenate
    • REASON:

      • 다른 차원의 데이터 합치면 이상해짐
    • SOLUTION:

      • 차원 통일

22-07-06

  • ERROR: ValueError: probabilities contain NaN

    • SITUATION:

      • rrcf 구현체 작업중
    • REASON:

      • 동일한 값으로 채워져 있음 -> encoding 결과 다 동일 -> 다른 값이 없으면 값에 따른 이상 확률 계산이 안됨
    • SOLUTION:

      • 이상한 칼럼들 제외하기
  • ERROR: TypeError: first argument must be an iterable of pandas objects, you passed an object of type “DataFrame”

    • SITUATION:

      • pd.concat()
    • REASON:

      • 사용법 파악 제대로 안함
    • SOLUTION:

      • pd.concat( [df1, df2 …] ) <= pd.concat( df1, df2 )

22-07-07

  • ERROR: TypeError: () missing 1 required positional argument: ‘x’

    • SITUATION:

      • defaultdict -> return 0
    • REASON:

      • args 없이 동작하는 함수를 넣어야 하는데 인자를 넣었다.
    • SOLUTION:

      • lambda : 0 <=+ lambda x: 0

22-07-08

  • ERROR: pandas data_frame 동작이 원하는 대로 동작안함

    • SITUATION:

    • REASON:

      • function Param이 변경되었는데 신경 안쓰고 있었다.
    • SOLUTION:

      • param: str <= param: list