Pandas는 Python에서 데이터 분석을 위한 강력한 라이브러리로, 주로 Series(1차원)와 DataFrame(2차원) 두 가지 데이터 구조를 제공합니다. 이러한 구조를 사용하여 데이터를 효율적으로 처리하고 분석할 수 있습니다.
Series 생성
Series는 1차원 데이터 구조로, 다음과 같이 생성할 수 있습니다:
# python
import pandas as pd
import numpy as np
# 딕셔너리로부터 생성
d = {'a': 1, 'b': 2, 'c': 3}
ser = pd.Series(data=d, index=['a', 'b', 'c'])
# NumPy 배열로부터 생성
ser = pd.Series(np.random.rand(3), index=['a', 'b', 'c'])
#
DataFrame 생성
DataFrame은 2차원 데이터 구조로, 여러 가지 방법으로 생성할 수 있습니다:
1. NumPy 2D 배열로부터 생성:
# python
df = pd.DataFrame(np.random.rand(10, 3), columns=['A', 'B', 'C'])
#
2. 리스트로부터 생성:
# python
data = [['Choi', 22], ['Kim', 48], ['Joo', 32]]
df = pd.DataFrame(data, columns=['Name', 'Age'])
#
3. 딕셔너리로부터 생성:
# python
data = {'Name': ['Choi', 'Kim', 'Joo'], 'Age': [22, 48, 32]}
df = pd.DataFrame(data)
#
4. Series로부터 생성:
# python
df = pd.DataFrame({
"one": pd.Series(np.random.rand(3), index=['a', 'b', 'c']),
"two": pd.Series(np.random.rand(4), index=['a', 'b', 'c', 'd'])
})
#
JSON과 DataFrame 변환
JSON 데이터와 DataFrame 간의 변환도 쉽게 할 수 있습니다:
1. JSON을 DataFrame으로 변환:
# python
import json
json_data = '''[
{"name": "John", "age": 28, "city": "New York"},
{"name": "Sarah", "age": 25, "city": "London"},
{"name": "Bob", "age": 32, "city": "Paris"}
]'''
data = json.loads(json_data)
df = pd.DataFrame(data)
#
2. DataFrame을 JSON으로 변환:
# python
df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})
json_str = df.to_json(orient='records')
#
이러한 데이터 구조와 변환 방법을 사용하면 다양한 형태의 데이터를 효과적으로 다룰 수 있으며, 데이터 분석 작업을 보다 효율적으로 수행할 수 있습니다.
#파이썬 #Python #데이터분석 #dataanalysis #데이터구조생성 #데이터변환 #pandas #dataframe #series
0 댓글