데이터 분석을 위한 Pandas: 1. 데이터 구조 생성 및 변환

 Pandas는 Python에서 데이터 분석을 위한 강력한 라이브러리로, 주로 Series(1차원)와 DataFrame(2차원) 두 가지 데이터 구조를 제공합니다. 이러한 구조를 사용하여 데이터를 효율적으로 처리하고 분석할 수 있습니다.


 Series 생성


Series는 1차원 데이터 구조로, 다음과 같이 생성할 수 있습니다:


# python

import pandas as pd

import numpy as np


# 딕셔너리로부터 생성

d = {'a': 1, 'b': 2, 'c': 3}

ser = pd.Series(data=d, index=['a', 'b', 'c'])


# NumPy 배열로부터 생성

ser = pd.Series(np.random.rand(3), index=['a', 'b', 'c'])

#


 DataFrame 생성


DataFrame은 2차원 데이터 구조로, 여러 가지 방법으로 생성할 수 있습니다:


1. NumPy 2D 배열로부터 생성:

# python

df = pd.DataFrame(np.random.rand(10, 3), columns=['A', 'B', 'C'])

#


2. 리스트로부터 생성:

# python

data = [['Choi', 22], ['Kim', 48], ['Joo', 32]]

df = pd.DataFrame(data, columns=['Name', 'Age'])

#


3. 딕셔너리로부터 생성:

# python

data = {'Name': ['Choi', 'Kim', 'Joo'], 'Age': [22, 48, 32]}

df = pd.DataFrame(data)

#


4. Series로부터 생성:

# python

df = pd.DataFrame({

    "one": pd.Series(np.random.rand(3), index=['a', 'b', 'c']),

    "two": pd.Series(np.random.rand(4), index=['a', 'b', 'c', 'd'])

})

#


 JSON과 DataFrame 변환


JSON 데이터와 DataFrame 간의 변환도 쉽게 할 수 있습니다:


1. JSON을 DataFrame으로 변환:

# python

import json

json_data = '''[

    {"name": "John", "age": 28, "city": "New York"},

    {"name": "Sarah", "age": 25, "city": "London"},

    {"name": "Bob", "age": 32, "city": "Paris"}

]'''

data = json.loads(json_data)

df = pd.DataFrame(data)

#


2. DataFrame을 JSON으로 변환:

# python

df = pd.DataFrame({'name': ['Alice', 'Bob'], 'age': [25, 30]})

json_str = df.to_json(orient='records')

#


이러한 데이터 구조와 변환 방법을 사용하면 다양한 형태의 데이터를 효과적으로 다룰 수 있으며, 데이터 분석 작업을 보다 효율적으로 수행할 수 있습니다. 




#파이썬 #Python #데이터분석 #dataanalysis #데이터구조생성 #데이터변환 #pandas #dataframe #series


0 댓글