[python(파이썬)]dataframe 특정 컬럼의 값만 바꾸기(replace specific columns)

간혹 가다 dataframe의 값들중 빈칸인데도 Nan이 아닌 ""로 되어 있는 경우가 있다.

그렇다고 fillna를 써서 모든 Nan값을 빈칸으로 만들고 싶지 않은 경우가 있다. 그럴경우에는 어떻게하는지 기록한다.

ex)요런 df(temp_df)가 있다고 가정했을때

import numpy as np

temp_dict={"" : np.nan}

temp_df=temp_df.replace({"col_2": temp_dict})

위와 같이 작성하면 아래와 같이 "col_2"의 값들중 ""으로 된 부분들만 Nan으로 변경해준다.

이걸 응용하면 아래와 같이 여러개의 컬럼들의 특정 값만 변경가능하다.

temp_dict={np.nan:"", 1:10 }

temp_df=temp_df.replace({"col_5": temp_dict})

col_5의 1은 10으로 np.nan인 값은 빈 String으로 변경이 가능하다.

끝.

728x90

[GCP]Bigquery로 데이터 전송하기(Dataframe / Python / pandas_gbq) (0)	2022.08.10
[python(파이썬)]dataframe 호출시 na 살리기 (0)	2022.07.22
[python(파이썬)]비속어 제거하기(better-profanity) (0)	2022.06.27
[Pandas(판다스)] 특정 row(index)만 범위 삭제하기 (0)	2022.06.08
[Python].ipynb to .py (Window, Linux) / convert .ipynb to .py (0)	2022.04.11

Aminora 블로그