본문 바로가기

일찍 퇴근을 위한 Step

Excel 대신 Python : 데이터 간단하게 조작/변경(?)하기

  • 주제 : 파일을 열어서 데이터 조작/변경(?)하기


엑셀로 데이터를 정리한다는게 어떤 배열이 있을때

잘못된 값이 들어있을수 있잖아요

그래서 엑셀 UI상에서는 (1,3)의 14라는 값을 3으로

쉽게 바꿀수 있습니다.

 

앞의 글에서 설명은 안했지만 numpy라는 패키지를 

살짝 코드에 섞어 놓았는데요

numpy라는 패키지를 이용해서 값을 바꿔보도록 할게요

저번과 마찬가지로 엑셀파일을 불러오구요

np.array

pandas로 읽은 데이터를 Array로 변경해주겠어요

data에는 DataFrame 형식으로 숫자들이 들어가있구요 

ndata에는 Array 형태로 숫자들이 들어가있습니다.

DataFrame에서 각 셀을 변경하거나 어떤 수식을 적용하는것보다

저한테는 Array가 조금 편리해서 Array로 변경을 해주었어요.

데이터는 3X7 배열로 보여지네요

저는 14,15,12가 문제가 있는 값으로 생각되어서

그 값을 3으로 변경하려고 합니다.

 

위의 행렬주소를 보면 X좌표는 0이고 Y좌표는 2일때 값이 14입니다.

좌표가 왜 2,0인지를 살펴보면 

수학책에서 아래의 행렬처럼 좌표를 매기죠???

값을 바꾸는 방법은 해당좌표에

값을 넣어주면 됩니다. ㅎㅎ

간단하네요

그래서 ndata를 확인해보면 14였던 값이 

3으로 변경된 것을 확인할 수 있습니다.

 

너무 아날로그적인 방법이지만 여기서 출발해서

점점더 고급(?)적인 방법까지 사용해봐야겠습니다.