본문 바로가기

BE/머신러닝(ML)

[머신러닝] 데이터 전처리 ( 이상치, 중복 데이터, 문자 데이터 )

 

 

 

 

 

데이터 전처리 ( 이상치, 중복 데이터, 문자 데이터 )

 

이상치

• 다른 데이터보다 아주 작거나 큰 값을 말한다

• 데이터를 분석할 때 이상치는 의사결정에 영향을 미칠 수 있다

• 그러므로 이상치는 제거하거나 치환처리한다

 

4분위수

 

새 파일 생성 및 2 둘 esc 후 m 눌러서 마크다운 형식으로 변경 후 내용 작성 > Ctrl + Eneter

 


이상치 데이터 처리

2. 이상치.html
0.32MB
2. 이상치.ipynb
0.05MB

 

2. 이상치

 

 


중복 데이터 처리

3. 중복데이터.html
0.27MB
3. 중복데이터.ipynb
0.01MB

 

3. 중복데이터

 

 


문자 데이터 처리

4. 문자 데이터.html
0.29MB
4. 문자 데이터.ipynb
0.03MB

 

4. 문자 데이터

 

 


728x90

 

728x90