Pandas 3

요약통계 = df.describe(include='all')

pandas의 DataFrame에서 기본적으로 describe() 함수는 숫자 데이터에 대한 통계 정보를 보여주지만, include 옵션을 all로 설정하면 문자나 범주형 데이터도 함께 요약해줘요. 초등학생도 쉽게 이해할 수 있도록 자세히 설명해볼게요!1. 기본 describe() 함수와 숫자 데이터 요약기본 동작:그냥 describe()를 쓰면 숫자로 이루어진 열(예를 들어, 나이, 키 등)에 대해 count, mean, std, min, 25%, 50%, 75%, max 등의 정보를 보여줘요.2. include='all' 옵션의 역할범주형 데이터도 요약:include 옵션을 all로 설정하면, 숫자뿐만 아니라 문자열이나 범주형 데이터(예: 이름, 성별 등)에 대해서도 요약 통계 정보를 계산해요.범주형..

describe 함수

1. pandas의 describe 함수 기본 개념pandas의 DataFrame에서 describe() 함수를 사용하면, 데이터의 여러 통계치를 자동으로 계산해서 표 형태로 보여줘요. 예를 들어, 숫자로 이루어진 데이터에 대해 아래와 같은 정보들을 제공해요.count: 데이터의 개수 (숫자가 몇 개 있는지)mean: 평균값 (모든 숫자를 더해서 개수로 나눈 값)std: 표준편차 (데이터가 평균값 주위에서 얼마나 퍼져 있는지)min: 가장 작은 값25%: 1사분위수 (전체 데이터를 4등분했을 때, 첫 번째 부분의 끝 값)50%: 중앙값 (전체 데이터를 반으로 나눈 중간값)75%: 3사분위수 (전체 데이터를 4등분했을 때, 세 번째 부분의 끝 값)max: 가장 큰 값 예제 코드import pandas as..

04. pandas

1. 사용 이유더보기1) Numpy array의 한계가독성이 떨어짐정보에 대한 레이블 삽입 불가한 가지 데이터 타입만 사용 가능2) Pandas로 가능한 작업데이터 불러오기데이터 가공데이터 분석데이터 시각화3) Numpy vs Pandas- Numpy: 복잡한 수학 연산을 할 때- Pandas: 표 형태의 데이터를 간편하게 다루고 싶을 때2. Pandas 축약형 import pandas as pd 3. 형식#데이터프레임 표형식df = pd.DataFrame(#dictionary 삽입)#예시df = pd.DataFrame({ 'category': ['skirt', 'sweater', 'coat', 'jeans'], #카테고리 목록의 리스트 'quantity': [10, 15, 6, 11], ..