All Articles

TIL&TEL 22.06.27~22.07.03

TIL( Today I Learned)

22-06-27 월

  • Event

    • 노트 토크 모임

      • “노션을 활용한 제텔카스텐 방식의 프로젝트 관리”

  • WORKPLACE
  • PHASE 1 9-12 / 6

    • 데이터 eda 검사법 찾아보기

      • 적용할만한 내용 있느지 찾아보고 적용하기
      • 트레일 데이터 PCA
      • 고릴라 파싱 => EventName 동사만 구분해보기
  • PHASE 2 13-16 / 6

    • 트레일이벤트 뽀개기 | 3 | 3
  • PHASE 3 16-18 / 4

    • 랜덤 컷 포레스트 찾아보기 | 2 |

22-06-28 화

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 데이터 normalization
      • how??

        • one - hot
        • 참고
        • 랜덤 컷 포레스트 찾아보기 | 2 |
  • PHASE 2 13-16 / 6

    • procstat 수집 동작

      • process_name => pattern
      • procstat_ 안쓰는 metric off

    • 통계 기반 count 기반 이상 행위 판별 찾아보기

22-06-29 수

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 시큐어 코딩 가이드

        • sql injection 방어
        • 검즘 없는 실행 방어
      • 랜덤 컷 포레스트 이해 적용하기| 3 |
    • PHASE 2 13-16 / 6

      • 통계 기반 count 기반 이상 행위 판별 찾아보기

22-06-30 목

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • encoding-of-categorical-variables-with-high-cardinality | 4 | 6

        • 링크

          • python package category_encoders
        • cardinality
        • OneHot, Hashing, LeaveOneOut, and Target encoding. Avoid OneHot for high cardinality columns.
        • one hot
        • Binary

          • column 수 대폭 줄임,
          • True / False 아님,
          • 이진수로 표기 하면서 칼럼을 표현함

            • 이진수 자리가 칼럼이됨
        • BaseN

          • One hot or Binary
        • 묶음

          • target
          • LeaveOneOut
          • 연결된 지표를 가지고 계산해서 구한다.
    • PHASE 2 13-16 / 6

      • 데이터 normalization | 6 | 8
      • pandas멀티 컨디셔널 변경

        | ? | 2

    • PHASE 3 16-18 / 4

      • 랜덤 컷 포레스트 이해 적용하기 | 6 | 4

22-07-01 금

  • WORKPLACE

    • PHASE 1 9-12 / 6

      • 어제 결과물 df 랑 합치기
      • 결과물 만들기 과정 검토 필요
      • 결과 분석하기
      • 바이너리 인코딩
    • PHASE 2 13-16 / 6

      • 튜닝 인자들 정리하기
    • PHASE 3 16-18 / 4

      • 이상이 있는 데이터 만들어보기
      • 데이터 중요도 뽑기

        • 가중치 넣기
      • 통계 기반 보다 나은 이유가 무엇인가?

22-07-02 토

  • 함께 자라기 노트 정리
  • 주간 블로그 쓰기
  • 영화보러 가기

TEL (Trial and Error Log)

22-06-30

  • ERROR: UFuncTypeError: Cannot cast ufunc ‘truedivide’ output from dtype(‘float64’) to dtype(‘int64’) with casting rule ‘samekind’

    • SITUATION:

      • df calculation
    • REASON:

      • type error
    • SOLUTION:

      • df.astype(‘type’)

22-07-01

  • ERROR: ValueError: Cannot merge a Series without a name

    • SITUATION:

      • df.merge(series)
    • REASON:

      • 서로 다른 타입을 합치려고 하고 있기 때문
    • SOLUTION:

      • s.toframe(), leftindex=True, right_index=True