안녕하세요. JGP입니다.
요즘 한창 데이터 분석에 대해 공부하고 있는데요, 이번 시간에서는 Pandas를 사용하여 데이터프레임의 문자열 칼럼을 다루는 기본적인 방법에 대해 살펴보겠습니다.
| 데이터프레임 생성
import pandas as pd
# 샘플 데이터프레임 생성
data = {'이름': ['John', 'Alice', 'Bob', 'Charlie'],
'직업': ['Engineer', 'Doctor', 'Teacher', 'Artist'],
'도시': ['New York', 'San Francisco', 'Chicago', 'Los Angeles']}
df = pd.DataFrame(data)
print(df)
| 문자열 칼럼 선택
# '이름' 칼럼 선택
names = df['이름']
print(names)
| 문자열 메서드 활용
| 대소문자 변환
# 대문자로 변환
df['이름'] = df['이름'].str.upper()
print(df)
| 문자열 분할
# '도시' 칼럼을 공백을 기준으로 분할
city_split = df['도시'].str.split(' ', expand=True)
df['도시_1'] = city_split[0]
df['도시_2'] = city_split[1]
print(df)
| 문자열 치환
# '직업' 칼럼에서 'Teacher'를 'Instructor'로 변경
df['직업'] = df['직업'].str.replace('Teacher', 'Instructor')
print(df)
| 문자열 검색 및 필터링
# '이름' 칼럼 선택
names = df['이름']
print(names)
| 문자열의 길이 계산
# '이름'의 길이를 나타내는 새로운 칼럼 추가
df['이름_길이'] = df['이름'].str.len()
print(df)