태그 보관물: pandas

pandas

Python-데이터 프레임의 차원 처음 사용합니다. R에서는 dim (…)을 사용하여 행렬의 차원을

Python을 처음 사용합니다.

R에서는 dim (…)을 사용하여 행렬의 차원을 얻을 수 있습니다. 데이터 프레임에 대한 Python Pandas의 해당 기능은 무엇입니까?



답변

df.shape, dfDataFrame은 어디에 있습니까?


답변

DataFrame 또는 Series의 크기에 대한 정보를 얻는 모든 방법 요약

DataFrame 또는 Series의 속성에 대한 정보를 얻는 방법에는 여러 가지가 있습니다.

샘플 DataFrame 및 시리즈 생성

df = pd.DataFrame({'a':[5, 2, np.nan], 'b':[ 9, 2, 4]})
df

     a  b
0  5.0  9
1  2.0  2
2  NaN  4

s = df['a']
s

0    5.0
1    2.0
2    NaN
Name: a, dtype: float64

shape 속성

shape특성은 DataFrame의 행 수와 열 수의 두 항목 튜플을 반환합니다. Series의 경우 한 항목 튜플을 반환합니다.

df.shape
(3, 2)

s.shape
(3,)

len 함수

DataFrame의 행 수를 얻거나 Series의 길이를 얻으려면 len함수를 사용하십시오 . 정수가 반환됩니다.

len(df)
3

len(s)
3

size 속성

DataFrame 또는 Series의 총 요소 수를 얻으려면 size특성을 사용하십시오 . DataFrames의 경우 이것은 행 수와 열 수의 곱입니다. 시리즈의 경우 다음 len함수 와 동일 합니다.

df.size
6

s.size
3

ndim 속성

ndim속성은 DataFrame 또는 시리즈의 차원의 수를 반환합니다. DataFrames의 경우 항상 2이고 Series의 경우 1입니다.

df.ndim
2

s.ndim
1

까다로운 count방법

count메서드는 DataFrame의 각 열 / 행에 대해 누락되지 않은 값의 수를 반환하는 데 사용할 수 있습니다. 대부분의 사람들은 일반적으로 count를 각 행의 길이로 생각하기 때문에 이것은 매우 혼란 스러울 수 있습니다. DataFrame에서 호출되면 인덱스의 열 이름과 값으로 누락되지 않은 값의 수와 함께 Series가 반환됩니다.

df.count() # by default, get the count of each column

a    2
b    3
dtype: int64


df.count(axis='columns') # change direction to get count of each row

0    2
1    2
2    1
dtype: int64

시리즈의 경우 계산할 축이 하나뿐이므로 스칼라 만 반환합니다.

s.count()
2

info메타 데이터 검색 방법 사용

info메서드는 각 열의 비결 측값 수와 데이터 유형을 반환합니다.

df.info ()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3 entries, 0 to 2
Data columns (total 2 columns):
a    2 non-null float64
b    3 non-null int64
dtypes: float64(1), int64(1)
memory usage: 128.0 bytes

답변