데이터 분석을 위한 Pandas: 1. 데이터 구조 생성 및 변환

Pandas는 Python에서 데이터 분석을 위한 강력한 라이브러리로, 주로 Series(1차원)와 DataFrame(2차원) 두 가지 데이터 구조를 제공합니다. 이러한 구조를 사용하여 데이터를 효율적으로 처리하고 분석할 수 있습니다.

Series 생성

Series는 1차원 데이터 구조로, 다음과 같이 생성할 수 있습니다:

# python
import pandas as pd
import numpy as np

# 딕셔너리로부터 생성
d = {'a': 1, 'b': 2, 'c': 3}
ser = pd.Series(data=d, index=['a', 'b', 'c'])

# NumPy 배열로부터 생성
ser = pd.Series(np.random.rand(3), index=['a', 'b', 'c'])
#

DataFrame 생성

DataFrame은 2차원 데이터 구조로, 여러 가지 방법으로 생성할 수 있습니다:

1. NumPy 2D 배열로부터 생성:

# python
df = pd.DataFrame(np.random.rand(10, 3), columns=['A', 'B', 'C'])
#

2. 리스트로부터 생성:

# python
data = [['Choi', 22], ['Kim', 48], ['Joo', 32]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
#

3. 딕셔너리로부터 생성:

# python
data = {'Name': ['Choi', 'Kim', 'Joo'], 'Age': [22, 48, 32]}
df = pd.DataFrame(data)
#

4. Series로부터 생성:

# python
df = pd.DataFrame({
    "one": pd.Series(np.random.rand(3), index=['a', 'b', 'c']),
    "two": pd.Series(np.random.rand(4), index=['a', 'b', 'c', 'd'])
})
#

JSON과 DataFrame 변환

JSON 데이터와 DataFrame 간의 변환도 쉽게 할 수 있습니다:

1. JSON을 DataFrame으로 변환:

# python
import json
json_data = '''[
    {"name": "John", "age": 28, "city": "New York"},
    {"name": "Sarah", "age": 25, "city": "London"},
    {"name": "Bob", "age": 32, "city": "Paris"}
]'''
data = json.loads(json_data)
df = pd.DataFrame(data)
#

2. DataFrame을 JSON으로 변환:

# python
df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
json_str = df.to_json(orient='records')
#

이러한 데이터 구조와 변환 방법을 사용하면 다양한 형태의 데이터를 효과적으로 다룰 수 있으며, 데이터 분석 작업을 보다 효율적으로 수행할 수 있습니다.

#파이썬 #Python #데이터분석 #dataanalysis #데이터구조생성 #데이터변환 #pandas #dataframe #series

데이터 분석을 위한 Pandas: 1. 데이터 구조 생성 및 변환

Series 생성

DataFrame 생성

1. NumPy 2D 배열로부터 생성:

2. 리스트로부터 생성:

3. 딕셔너리로부터 생성:

4. Series로부터 생성:

JSON과 DataFrame 변환

1. JSON을 DataFrame으로 변환:

2. DataFrame을 JSON으로 변환:

0 댓글

신고하기

문의하기 양식

이 블로그 검색

Most Popular

데이터 분석의 마법 지팡이, 미적분: 기초부터 실전 응용까지 🧙‍♂️📊

🚀 파이썬 데이터 과학의 보물창고: scikit-learn과 seaborn 데이터셋 완전 정복!

KT AICE 자격증: AI 시대의 필수 역량을 증명하는 새로운 기준 🚀

Tags

데이터 분석을 위한 Pandas: 1. 데이터 구조 생성 및 변환

Series 생성

DataFrame 생성

1. NumPy 2D 배열로부터 생성:

2. 리스트로부터 생성:

3. 딕셔너리로부터 생성:

4. Series로부터 생성:

JSON과 DataFrame 변환

1. JSON을 DataFrame으로 변환:

2. DataFrame을 JSON으로 변환:

관심 있을 만한 글

0 댓글

신고하기

문의하기 양식

이 블로그 검색

Social Plugin

Most Popular

데이터 분석의 마법 지팡이, 미적분: 기초부터 실전 응용까지 🧙‍♂️📊

🚀 파이썬 데이터 과학의 보물창고: scikit-learn과 seaborn 데이터셋 완전 정복!

KT AICE 자격증: AI 시대의 필수 역량을 증명하는 새로운 기준 🚀

Tags