반응형
Dataframe은 데이터를 처리하는데 간편하고 성능이 나쁘지 않는 라이브러리다.
Dataframe중 어떤 특정 조건을 만족하는 데이터만을 조회할 때는 아래와 같은 문법을 사용하면 된다.
//my_df에서 컬럼명이 0이 아닌 데이터만 뽑아오기
my_df = pd.read_csv('CSV 경로.csv')
my_df[my_df['컬럼명']!=0]
//문제는 여러가지 조건을 만족하는 값을 찾을때가 문제인데
//my_df에서 컬럼명이 0 또는 1이 아닌 데이터만 뽑아오기
my_df[my_df['컬럼명']!=0 | my_df['컬럼명']!=1]
이렇게 하면 TypeError: Cannot perform 'rand_' with a dtyped [object] array and scalar of type [bool]
라는 에러가 발생 하는데, 해결 방법은 간단하다,
my_df[(my_df['컬럼명']!=0) | (my_df['컬럼명']!=1)]
이렇게 각 조건을 ()로 감싸주면 된다.
끝.
728x90
반응형
'프로그래밍 > Python' 카테고리의 다른 글
[Python]specified google ads api version "V{}" does not exist -Solved (0) | 2023.02.07 |
---|---|
[Python] pandas NaN값 처리하기 (0) | 2023.01.16 |
[Pandas(Dataframe)]Delete Header(columns) for Hive2 insert (0) | 2022.12.12 |
[jupyter notebook]requirement already satisfied no module named pip install python version (0) | 2022.11.25 |
[jupyter notebook]kernel starting please wait, connection failed 에러 해결하기 (0) | 2022.10.04 |