Python을 처음 사용합니다.
R에서는 dim (…)을 사용하여 행렬의 차원을 얻을 수 있습니다. 데이터 프레임에 대한 Python Pandas의 해당 기능은 무엇입니까?
답변
df.shape
, df
DataFrame은 어디에 있습니까?
답변
DataFrame 또는 Series의 크기에 대한 정보를 얻는 모든 방법 요약
DataFrame 또는 Series의 속성에 대한 정보를 얻는 방법에는 여러 가지가 있습니다.
샘플 DataFrame 및 시리즈 생성
df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df
a b
0 5.0 9
1 2.0 2
2 NaN 4
s = df['a']
s
0 5.0
1 2.0
2 NaN
Name: a, dtype: float64
shape
속성
이 shape
특성은 DataFrame의 행 수와 열 수의 두 항목 튜플을 반환합니다. Series의 경우 한 항목 튜플을 반환합니다.
df.shape
(3, 2)
s.shape
(3,)
len
함수
DataFrame의 행 수를 얻거나 Series의 길이를 얻으려면 len
함수를 사용하십시오 . 정수가 반환됩니다.
len(df)
3
len(s)
3
size
속성
DataFrame 또는 Series의 총 요소 수를 얻으려면 size
특성을 사용하십시오 . DataFrames의 경우 이것은 행 수와 열 수의 곱입니다. 시리즈의 경우 다음 len
함수 와 동일 합니다.
df.size
6
s.size
3
ndim
속성
ndim
속성은 DataFrame 또는 시리즈의 차원의 수를 반환합니다. DataFrames의 경우 항상 2이고 Series의 경우 1입니다.
df.ndim
2
s.ndim
1
까다로운 count
방법
이 count
메서드는 DataFrame의 각 열 / 행에 대해 누락되지 않은 값의 수를 반환하는 데 사용할 수 있습니다. 대부분의 사람들은 일반적으로 count를 각 행의 길이로 생각하기 때문에 이것은 매우 혼란 스러울 수 있습니다. DataFrame에서 호출되면 인덱스의 열 이름과 값으로 누락되지 않은 값의 수와 함께 Series가 반환됩니다.
df.count() # by default, get the count of each column
a 2
b 3
dtype: int64
df.count(axis='columns') # change direction to get count of each row
0 2
1 2
2 1
dtype: int64
시리즈의 경우 계산할 축이 하나뿐이므로 스칼라 만 반환합니다.
s.count()
2
info
메타 데이터 검색 방법 사용
이 info
메서드는 각 열의 비결 측값 수와 데이터 유형을 반환합니다.
df.info ()
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a 2 non-null float64
b 3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes